728x90

 

 

 

생성형 AI로 작성한 글과 영상, 가끔은 구별하기 어려울 정도로 정교할 때가 많다. 아직 영상의 경우에는 구별이 쉽지만 생성형 AI로 작성한 글은 이제는 사람이 작성한 것인지 AI가 작성한 것인지 알기 어려울 때가 더 많아지고 있다. 특히 5월 초 발표된 chatGPT의 GPT4o를 통해서 글을 작성해 보면, 생성형 인공지능의 수준이 헛웃음 나올 정도로 완벽한 글쓰기를 자랑한다. 

 

매우 유익할 수도 있는 반면에 이렇게 인공지능으로 작성한 글을 어떻게 식별할 수있는가에 대한 문제제기가 많아지는 때에 Google 딥러닝에서 SynthID를 출시했다. Synth ID는 인공지능 생성 콘텐츠에 워터마크를 삽입하기 위한 구글의 새로운 툴킷이다.

 

Google이 만든 Gemini의 서비스를 이용한 인공지능 생성 텍스트는 SynthID를 통해 워터마킹이 되고, 앞으로 다른 gpt로 작성된 글들 또한 인공지능 감지를 할 수 있도록 확장할 계획이라 덧붙였다. 

 

어떻게 작동하는가?

 

 그렇다면 텍스트 워터마크는 어떤 방식으로 작동할까? Synth ID에서 텍스트 워터마크를 단다는 것은 단순하게 생성된 텍스트에 라벨을 붙히는 방식이 아니다. LLM이 텍스트를 제작하는 방식을 본떠서 '얼마나 LLM이 쓴 글과 비슷한 성향을 띠는가'에 대한 점수를 매기고, 이 예상 점수 패턴을 통해서 패턴 자체가 워터마크로 간주되는 것이다. 그렇기 때문에 SynthID의 텍스트 워터마크는 SynthID 툴에서 LLM으로 제작된 글인지 파악하는 데에 더 많은 예시를 제공하는 긴 글에서 가장 잘 작동된다.

 

 

글을 손본다면? 그래도 AI가 감지할 수있을까?

 

일부 글을 변경해서 쓰거나, 잘라내는 등의 약간의 정리만 해서 글을 다시 썼다면 이런 변화에도 불구하고 SynthAI는 작동 가능하다. 하지만 생성형 AI가 작성한 글을 참고하여 처음부터 사람이 다시 썼다거나 다른 언어로 번역하게 되면 SynthAI의 가동 신뢰 점수가 낮아질 수 있다.

 

또 생성형 AI로 작성한 글 중 '창의성'을 발휘해 작성하기보다 사실에 대한 기술만 있는 글이라면 SynthAI가 인공지능 탐지할 수 있는 확률은 현저히 낮아진다. 사실에 기반한 글이기 때문에 변수가 많은 토큰 분포를 확인하기 어렵기 때문에 "피카추의 색깔은 무슨 색인가요?"라던가 "한국의 수도는?"과 같은 질문에서 인공지능이 쓴 글을 구분하기 힘들다는 것이다.

 

이미 많은 Humanizer, DetectAI 프로그램이 있는데?

이를 왜 보완해야 하는가?

 

현재 사용 가능한 대부분의 생성형 인공지능 감지 서비스는 데이터를 라벨 화해서 정렬하는 'sort'분류의 방법을 사용한다. 이런 분류의 경우 특정 작업에만 작동하는 경우가 많기 때문에 글을 탐지해 내는 데에 유연성이 떨어지고, 그 성능을 신뢰할 수 있는 기반을 알기 어렵다. 그렇기 때문에 A라는 웹사이트의 AI 탐지기와 B라는 웹사이트의 AI 탐지 결과가 다르게 나올 수있는 것이다.

 

구글 딥러닝에서는 오는 여름에 텍스트 워터마크 기술에 대해 자세히 다른 연구 논문을 게시할 예정이며,  최신 Responsible Generative AI Toolkit을 통해 SynthID 텍스트 워터마킹을 오픈 소스로 공개할 것이라 전했다.  어떤 방식으로 AI가 탐지되는지 더 자세히 알아볼 수있는 결과이기도 하고, 무수히 많이 포진되어 있는 생성형 인공지능 탐지 서비스 앱들의 생태계가 어떻게 변화할지 기대되기도 한다.

728x90
728x90

오늘 이야기할 generative AI는 Voice.ai이다.

 

보통 구글 상위에 랭크되면 어느 정도 신뢰도가 있기 때문에 다운로드를 하고 회원 가입을 하는데에 많이 고민되지 않는 게 현실이다.

 

나도 일레븐랩스보다 더 좋은 다른 서비스가 있는지 서칭을 하기 위해 찾다가 Voice.ai를 보게 되었는데.

서치 엔진에 상위 랭크도 되어있고 홈페이지 자체도 잘 되어있어서 다운을 받으려 했었다.

 

이런 나를 멈춰준건 바로 아래에 뜬 Youtube영상 덕분이었다.

 

영상에서는 많은 광고를 하는 voice.ai가 생각보다 믿을만한 서비스를 제공하는 앱이 아니라는 것을 이야기한다. 실제로 voice.ai의 사이트에 접속하게 되면 메인 페이지가 꽤나 깔끔한 걸 확인할 수 있다. 하지만 가격이나 멤버십에 대한 안내가 전혀 없고 그저, Get Started for Free 버튼만 보인다.

 

 

혹시나 가격표가 있는 랜딩페이지가 나올까 싶어 버튼을 눌러보니.

 

voice.ai의 프로그램이 자동으로 받아진다는 문구와 함께 프로그램이 다운되었다. 이런 프로그램의 특징이 원치 않는 멀웨어나 바이러스를 함께 받을 위험성이 있다는 것인데. 특히 사전 경고 없이 바로 다운로드 버튼을 연결해 두는 수법은 예전부터 있었던 것이라 이건 안될 서비스다 하고 바로 삭제해 버렸다.

 

실제로 해당 프로그램을 다운로드한 사람들이 이 프로그램에 대한 안 좋은 리뷰를 남겨두기도 했다. 공짜인 줄 알고 다운로드하여봤더니 실상은 15초 밖에 변환되지 않는 프로그램이라는 후기도 있었다. 아무래도 수많은 generative AI제품이 나오기 시작했고, 물밀듯이 쏟아지는 상황에서 정신을 제대로 차리지 않으면 나도 정보를 해킹당할 수 있겠구나 라는 생각이 문득 들었다.

 

새로운 AI를 이용할 때는 무조건

 

1. 리뷰를 확인해 볼 것. 아래의 TrustPilot 웹사이트의 리뷰를 추천한다.

 

voice.ai is rated "Poor" with 1.9 / 5 on Trustpilot

Do you agree with voice.ai's TrustScore? Voice your opinion today and hear what 76 customers have already said.

www.trustpilot.com

2. 멤버십을 유도하거나, 공짜로 쓸 수 있다는 점을 너무 강조하면 의심해 볼 것.

3. 프로그램을 다운로드, 실행하도록 유도한다면 바로 삭제 조치/ 버튼을 열어보지도 말 것.

 

꼭 이 세 가지를 명심하기를 바란다.

 

728x90

+ Recent posts