오픈소스로 공개된 구글의 AI 텍스트 워터마킹 도구 SynthID

구글의 AI 텍스트 워터마킹 도구 공개

구글은 최근 AI 생성 텍스트를 식별할 수 있는 워터마킹 도구인 SynthID를 오픈소스로 공개했습니다. 이 도구는 텍스트, 이미지, 오디오, 비디오에 보이지 않는 워터마크를 추가하여 AI 생성 콘텐츠를 식별할 수 있도록 돕습니다. 이는 AI 정보 왜곡, 비합의적 성적 콘텐츠 생성 등 악의적인 목적으로부터 사용자를 보호하기 위한 중요한 도구입니다.

SynthID의 기능과 작동 원리

SynthID는 텍스트 생성 시 추가 정보가 포함된 보이지 않는 워터마크를 넣는 방식으로 작동합니다. AI 모델이 텍스트를 생성할 때 각 단어의 확률 점수를 조정하여 워터마크를 생성합니다. 이 방식은 텍스트의 품질, 정확성, 창의성, 속도를 저하시키지 않으면서도 효과적으로 워터마크를 삽입할 수 있습니다.

실험 결과와 성능

구글 DeepMind는 SynthID의 성능을 평가하기 위해 대규모 실험을 진행했습니다. 수백만 명의 사용자로부터 수집한 데이터를 분석한 결과, 워터마크가 포함된 텍스트와 포함되지 않은 텍스트 사이에서 품질의 차이를 느끼지 못했습니다. 이는 워터마크가 텍스트의 품질에 영향을 미치지 않음을 보여줍니다.

제한 사항

그러나 SynthID에도 한계가 있습니다. 예를 들어, 짧은 텍스트나 번역된 텍스트에서는 워터마킹이 잘 작동하지 않습니다. 또한, 사실적 질문에 대한 응답에서는 정확성을 해치지 않기 위해 워터마킹을 적용하기가 어렵습니다.

오픈소스화와 기대 효과

SynthID가 오픈소스로 공개됨에 따라 다른 AI 개발자들도 이 기술을 사용하여 자신의 모델에서 AI 생성 텍스트를 식별할 수 있게 되었습니다. 이는 AI 기술의 신뢰성을 높이고 악의적인 사용을 방지하는 데 중요한 역할을 할 것으로 기대됩니다.

사용법

SynthID: LLM에서 생성된 텍스트를 워터마킹하고 감지하는 도구 | Responsible Generative AI Toolkit | Google AI for Developers

Hugging Face Transformer 나 Synthid Text - a Hugging Face Space by google 를 통해 사용해 볼 수 있습니다. (허깅 페이스 스페이스는 현재 queue가 많아 바로 동작은 안되는 상태)

오픈소스로 공개된 구글의 AI 텍스트 워터마킹 도구 SynthID image 1

결론

구글의 SynthID는 AI 생성 콘텐츠를 식별하는 데 중요한 도구로 자리 잡을 것입니다. 품질을 저하시키지 않으면서도 효과적으로 워터마크를 삽입할 수 있는 이 기술은 앞으로 AI 기술의 신뢰성을 높이고, 사용자에게 더 안전한 환경을 제공하는 데 기여할 것입니다.