챗GPT 개발사 오픈AI가 새로운 AI모델 GPT-4o를 공개했다. 이번 모델은 GPT-4 터보 대비 처리 속도가 2배로 높아졌으며 사람과 자연스럽게 대화를 나눌 수 있다.
오픈AI는 13일(현지시각) ‘스프링 업데이트’ 행사를 온라인으로 개최하고 GPT-4o를 처음 선보였다.
GPT-4o는 챗GPT-4에서 업그레이드된 신규 생성형 인공지능(AI)이다. 지난해 11월 GPT-4 터보가 선보여진지 6개월 만이다. GPT-4o에서 ‘o’는 ‘모든’을 뜻하는 ‘옴니’에서 차용됐다. 즉 텍스트를 넘어 음성까지 아우른다는 의미다.
기존 모델이 주로 텍스트를 통해 대화할 수 있었다면 GPT-4o는 이용자와 실시간 음성 대화를 통해 질문하고 답변을 요청할 수 있다. 또 음성 대화와 이미지를 입력해 답변을 이미지로도 받을 수 있다. 성능은 속도와 효율성 측면에서 GPT-4 터보 대비 두배 향상됐다. 한국어 포함 50개 언어를 지원한다.
오픈AI는 “GPT-4o에 음성으로 질문하면 반응 속도가 최소 232ms(밀리초·1000분의1초), 평균 320ms로 구현할 수 있다”고 설명했다. 이는 사람이 실제 대화할 때와 비슷한 수준이다. 앞서 GPT-3.5는 반응속도가 평균 2.8초, GPT-4가 응답에 5.4초가 소요됐다.
미라 무라티 오픈AI 최고기술책임자(CTO)는 “신규 모델은 전 버전보다 훨씬 더 빨라지고, 텍스트, 이미지, 오디오 전반의 기능이 향상됐다”면서 “모든 사용자에게 무료로 제공되며, 유료 사용자는 무료 사용자보다 최대 5배의 용량 제한을 확보해 이용할 수 있다”고 말했다.
더 버지는 “현재 음성모드는 한번에 하나의 프롬프트에만 응답해 제한적이다”라며 “GPT-4o은 영화 ‘허(Her)’에 등장한 것과 같은 음성 비서 역할을 해 실시간으로 응답하고 주변 세계를 관찰할 수 있다”라고 평가했다.
씨넷은 “챗GPT와 상호작용하는 다른 방법으로 비디오가 포함됐다는 점이 달라졌다”며 “막힌 수학문제의 실시간 영상을 공유하고 문제 해결에 도움을 요청할 수 있다”고 분석했다.
이선율 기자 melody@chosunbiz.com
댓글0