챗GPT 표절 잡자…’GPT제로’에 120만명 몰렸다

유니콘팩토리 2023.05.09 조회수

학교에서 챗봇 오용 방지, AI 생성 허위정보도 구별…

1월 이후 가입자 120만명, ‘저널리즘 수호’ 목표도

미국 워싱턴DC 오픈AI 사무실의 챗GPT 로고 /AFPBBNews=뉴스1

챗GPT 등 인공지능(AI) 기계가 작성한 텍스트와 사람이 쓴 텍스트를 가려내 표절을 막아주는 앱을 4개월 새 120만명이 내려받았다. 스물두살 프린스턴대 재학생이 만든 ‘GPT제로'(GPTZero) 얘기다.

블룸버그는 9일 프린스턴대학교에서 컴퓨터과학과 저널리즘을 공부하는 에드워드 티안이 지난 1월 선보인 GPT제로 앱을 소개했다. 챗GPT 등 AI를 이용해 리포트나 논문을 작성하는 오용 사례를 막기 위한 서비스로 사용자가 이미 120만명을 넘었다.

오픈AI가 GPT 테스트 버전을 일반에 공개한 게 지난해 12월 1일인데 불과 한 달 후 저작권 침해를 우려한 탐지 서비스가 출시됐던 것. 에드워드 티안은 온라인 미디어에서 AI가 생성한 허위정보를 사실(fact)과 구별해 저널리즘을 살리는 ‘오리진’ 서비스까지 준비 중이다. 티안은 네오캐피탈, 언코크캐피탈 등 벤처캐피탈(VC)로부터 350만달러(46억원)의 투자금도 유치했다.

GPT제로는 난해성(perplexity)으로 알려진 텍스트의 임의성과 텍스트 내 이러한 임의성의 균일성(burstiness)을 분석해 AI가 사용된 문장을 식별한다. 회사에 따르면 GPT제로의 정확도는 사람이 쓴 텍스트를 가려내는 데는 99%, AI 텍스트의 경우 85%다.

10명으로 구성된 티안의 팀은 BBC 같은 대형 미디어 조직 및 뉴욕타임스 전 CEO인 마크 톰슨을 비롯해 업계 경영진과 협력해 AI 탐지 및 분석을 위한 파트너십을 논의하고 있다. 회사는 신뢰 및 안전, 정부, 저작권, 금융, 법률 등의 분야에도 이 기술을 사용할 것으로 보고 있다.

프랑스 툴루즈 오픈AI 사무실의 챗GPT 로고 /AFPBBNews=뉴스1

챗GPT를 개발한 오픈AI도 비슷한 서비스를 내놨지만 정확도가 떨어진다. 오픈AI의 감지 도구는 AI가 작성한 텍스트의 26%만 “AI가 작성했을 가능성이 있다”고 평가한다. 반면 사람이 작성한 텍스트는 9%가량을 AI가 작성한 텍스트로 잘못 식별한다. 영어 이외의 언에서는 특히 판별력이 현저히 떨어지는 것으로 알려진다.

오픈AI도 회사 웹사이트에 “우리 분류기엔 여러 중요한 한계가 있다”고 인정하며 “주요 의사결정 도구로 사용해선 안 되고, 텍스트의 출처를 결정하는 다른 방법을 보완하는 데 사용돼야 한다”고 밝히고 있다.

AI 텍스트와 사람이 쓴 텍스트를 판별하는 것은 학교 교사들에겐 당장 시급한 과제다. AI가 생성했을 가능성이 70%로 표시된 과제물을 발견하더라도 정확도가 100%가 아닌 한 교사가 해당 학생에게 결정적 조치를 취하기는 어렵다.

표절의 정의도 AI의 등장과 함께 진화하고 있다. 잭 쿠시먼 하버드 도서관 혁신랩 소장은 “한 두 문장을 추천하거나 인용을 돕는 도구를 갖는 것은 계산기를 사용해 수학 작업을 하는 것과 마찬가지로 합법적일 것이기 때문에 ‘학문적 정직성’의 전체 개념에 대한 도전이 될 것”이라고 말했다.

한편 지금까지 기계 텍스트를 탐지하는 서비스는 기술적 한계와 함께 수익창출 경로가 마땅치 않아 투자 유치가 어려웠다. AI 신생기업에 중점을 둔 VC, 톨라캐피탈의 쉐일라 굴라티 전무이사는 “현재의 탐지 도구는 일시적인 제품이고 궁극적으로는 훨씬 더 정교해질 것”이라고 말했다.