“신사임당의 남편은 누구였나요?”
“신사임당의 남편은 이순신 장군입니다.”
구글을 대체할 것이라 평가받으며 혁신의 아이콘으로 떠오른 AI(인공지능) 언어모델 ‘챗GPT’. 그러나 가끔 챗GPT는 이렇게 말도 안 되는 소리를 사실인 양 늘어놓는다.
26일 업계에 따르면 최근 인터넷에서 이같은 챗GPT의 황당한 답변을 모은 밈(meme)이 유행하고 있다. 국내에서는 유튜버 침착맨(웹툰작가 이말년)의 ‘AI는 삼국지를 알까?’ 영상을 중심으로 챗GPT의 창의적인 ‘헛소리’가 퍼지고 있다. 해당 영상에서 챗GPT는 주유가 오나라의 통치자라는 잘못된 사실을 고집하며 침착맨과 기싸움을 한다.
국내에서 가장 유명한 밈은 ‘세종대왕의 맥북프로 던짐 사건’이다. 해당 사건에 대해 챗GPT는 “세종대왕이 새로 개발한 훈민정음(한글)의 초고를 작성하던 중, 문서 작성 중단에 대한 담당자에게 분노해 맥북프로와 함께 그를 방으로 던진 사건”이라고 자세하게 설명한다. 세종대왕이 맥북프로를 이용했을 리가 없음에도 챗GPT는 자신 있게 대답한다.
또 다른 사례는 ‘역사적으로 꼽히는 비극적 사건 10개’ 중 하나인 ‘대동여지도 연금술사들의 폭동(1392)’ 이야기다. 이용자가 “대동여지도 연금술사들의 폭동에 대해 자세히 알려줘”라고 물으니 챗GPT는 과세에 반발한 연금술사들이 태조의 성곽인 화성을 둘러싸고 일으킨 반란이라고 설명한다. “거북선의 라이트닝 볼트 발사 매커니즘”을 물으면 6가지 단계로 설명해주거나, “1553년에 있었던 티라노사우루스 대탈출 사건”에 대해서도 역사적 배경과 그에 따른 영향까지 덧붙여 말해준다.
사람들은 챗GPT의 헛소리 밈에 “어처구니가 없지만 재미있다”, “헛소리를 당당하게 하니까 웃긴다”, “대화해 주려고 참 노력한다” 등의 반응을 보였다. 국내 최대 챗GPT 사용자 모임 ‘ChatGPTers 커뮤니티’에도 ‘AI 밈/유머방’과 같은 파생 커뮤니티가 생겨나기도 했다.
챗GPT가 말도 안 되는 소리를 진실처럼 이야기하는 이유는 ‘할루시네이션(환각)’ 때문이다. 할루시네이션은 AI가 처음부터 잘못된 데이터로 학습하거나, 라벨링(분류)이 제대로 안 된 데이터로 학습해서 발생하는 문제다. 챗GPT가 학습한 데이터 중 한국어 데이터는 1%가 채 되지 않는다. 챗GPT가 한국어로 된 질문을 하면 이상한 답변을 늘어놓는 경우가 많은 것도 부족한 학습량 때문이다.
그런데 챗GPT는 왜 모르는 사실까지 아는척하며 거짓말을 해댈까. 이는 챗GPT가 ‘인간 피드백을 통한 강화 학습(RLHF, Reinforcement Learning from Human Feedback)’을 했기 때문이다. RLHF는 AI가 내놓은 답변을 인간이 얼마나 선호하는지를 평가해 최대한 올바른 답변을 하도록 유도하는 것이다. 대화를 이끌어가는 능력을 중시했다는 의미다. 미 매사추세츠 공대(MIT) 테크놀로지 리뷰는 AI가 너무 신중하게 답변하도록 설정하면 아예 답변하지 않는 경우가 많이 발생해 오픈AI가 RLHF를 택했다고 설명한다. 이 때문에 챗GPT는 아예 답변하지 않기보다 어떤 내용이든 답변하는 방향으로 발전하게 됐다.
전문가들은 챗GPT의 헛소리가 밈이 된 이유를 ‘안도감’ 때문이라고 설명했다. 챗GPT 등 생성 AI의 급부상으로 러다이트 운동·알파고 쇼크와 같은 충격이 덮쳐오는 가운데, 챗GPT를 희화화 두려움을 떨친다는 것이다. 구정우 성균관대 사회학과 교수는 “기술이 아직까지 우리를 완벽하게 제압하지는 못한다는 데서 오는 희열과 만족감이 있을 것”이라고 설명했다.
일각에서는 챗GPT의 허점을 소비하는 문화가 AI에 대한 오해를 불러일으킬 수 있다는 지적도 나온다. 김동환 포티투마루 대표는 “인공지능 스피커나 메타버스처럼 무르익지 않은 상태에서 시장의 관심을 받았으면 실망이 커지면서 산업이 힘을 받지 못하는 경우가 많았다”며 우려를 표했다. 김 대표는 이어 “챗GPT도 엄밀히 말하면 언어모델 중 조금 더 채팅에 특화된 것이기 때문에, 정보나 지식을 찾는 방식으로는 제한적이다”며 “이슈몰이처럼 헤게모니 싸움만 하려고 하는 것은 피해야 할 것”이라고 덧붙였다.
댓글 많은 뉴스