미국 유명 배우 스칼렛 요한슨이 오픈AI가 내놓은 멀티 모달(텍스트뿐 아니라 이미지, 음성 등 다양한 형태로 소통 가능한 기술) 인공지능(AI) 비서 챗GPT-4o(포오)가 자신의 목소리를 도용했다고 주장했다. 이에 오픈AI는 챗GPT-4o의 일부 목소리 사용을 일시 중단하겠다고 했다.
20일(이하 현지시간) IT전문매체 더 버지에 따르면 전날 챗GPT 개발사 오픈AI는 신규 AI모델 GPT-4o의 스카이(sky)라는 음성비서 목소리가 유명 배우 스칼렛 요한슨과 상당히 유사하다는 지적이 일자 해당 목소리를 일시중단하고 요한슨 측에 연락을 취했다고 밝혔다.
오픈AI의 음성 모델 책임자인 조앤 장은 “서로 오해가 있는 것 같아 요한슨 측과 대화를 나눴다. 우리는 피드백을 진지하게 받아들이고 우려 사항을 듣고 싶다”고 전했다.
오픈AI는 지난 13일 사람과 자연스럽게 대화할 수 있는 새 AI모델 ‘GPT-4o’를 내놨다. 총 5개 버전으로 음성 서비스를 제공하는데, 그중 스카이의 음성이 2013년 개봉한 영화 ‘그녀'(Her)의 음성비서 ‘사만다’ 역을 맡은 유명 배우 스칼렛 요한슨과 유사하다는 지적이 나왔다.
오픈AI는 자사가 의도적으로 요한슨의 목소리를 따라 한 건 아니라고 밝혔다. 오픈AI는 19일 자사 블로그에 “스카이의 목소리는 스칼렛 요한슨을 모방한 게 아니라 그녀만의 자연스러운 말투를 사용하는 다른 전문 배우의 목소리”라고 주장했다. 다만 개인정보 보호를 위해 성우의 이름을 공유할 수는 없다고 덧붙였다.
오픈AI는 스카이를 포함한 5개 목소리를 선정하기 위해 총 5개월 동안 캐스팅과 녹음 과정을 거쳤다고 설명했다. 성우와 영화배우로부터 약 400개 음성 샘플을 받은 뒤 이를 14개로 추리고 최종적으로 5개를 선정했다는 것이다.
하지만 요한슨 측은 이에 동의하지 않고 있다. 그는 이날 CNBC와 인터뷰에서 “지난해 9월 샘 올트먼 오픈AI 최고경영자(CEO)로부터 챗GPT 음성대역을 해달라는 제안을 받았다”며 “많은 고민 끝에 개인적 이유로 제안을 거절했다”고 말했다. 올트먼은 이후 GPT-4o 발표 이틀 전 제안을 다시 생각해 달라고 요청했으나 조핸슨 측은 재차 거절했다고 한다.
요한슨은 오픈AI가 출시한 GPT-4o의 스카이 음성과 본인 목소리가 너무 닮아 깜짝 놀랐다고 했다. 그는 “공개된 영상을 들었을 때 가까운 친구들과 미디어조차 구분하지 못할 정도로 내 목소리와 너무 흡사해 충격과 분노를 느꼈다”고 강조했다. 이어 “심지어 올트먼은 ‘그녀’라는 한 단어를 트윗해 목소리의 유사성이 의도적인 것임을 암시하기도 했다”고 지적했다.
요한슨은 변호사를 고용해 대응에 나선 상태라며 올트먼과 오픈AI 측에 스카이가 만들어진 과정을 상세히 설명해 달라는 취지로 편지를 보냈다고 밝혔다. 이어 그는 “모두가 딥페이크 문제와 자신의 초상권을 보호하기 위해 고군분투하고 있는 시대에 이것이 가치가 있는 질문이라고 믿는다”고 덧붙였다.
CNN은 이번 음성비서 도용 논란과 관련해 “주로 백인 남성이 주도하거나 자금을 지원하는 기술 회사가 설계한 기술의 편향성에 대한 광범위한 사회적 우려가 일고 있다”고 분석했다. 특히나 오픈AI는 이번 발표 전후로 AI 기술의 안전성을 전담하는 임원인 젠 레이크가 회사 리더십의 ‘핵심 우선순위’에 동의하지 않는다며 퇴사하기도 했다. 그가 맡던 안전성 팀도 해체된 걸로 알려진 가운데 오픈AI는 안전 목표를 달성하기 위한 별도 체계를 구축하고 있다고 CNN에 해명했다.
댓글0