오픈AI가 무게와 비용을 줄인 멀티모달 인공지능(AI) 모델 ‘GPT-4o 미니’를 공개했다. 지난 5월 GPT-4o를 공개한지 2개월 만에 출시한 경량 모델이다. 멀티모달은 텍스트뿐만 아니라 이미지, 음성, 영상 등 다양한 데이터를 인식할 수 있는 AI 모델 방식이다.
최근 사용자들이 대형 언어모델(LLM)에 대한 비용 부담을 느끼면서 AI 모델 개발 기업들이 소형 언어모델(SLM)에도 집중하는 모습을 보이고 있다. 오픈AI는 소형 모델을 멀티모달 영역으로 넓히면서 AI 모델 분야에서의 영향력을 더욱 확고히 하는 모습이다.
이번 GPT-4o 미니의 가장 큰 특징은 가격이다. 입력 토큰 100만 개당 15센트(약 200원), 출력 토큰 100만 개당 60센트로, GPT-3.5 모델보다 60% 이상 저렴하다. 100만 토큰은 약 2500페이지의 책 분량이다.
성능 측면에서는 GPT-4를 능가한다. 텍스트 지능 및 추론 벤치마크인 MMLU에서는 82%를 기록했으며 이는 제미나이 플래시(77.9%), 클로드 하이쿠(73.8%) 등의 소형 AI 모델보다 높다. 이 외에 수학 및 코딩 능력(MGSM), 멀티모달 추론 평가(MMMU) 등에서도 제미나이 플래시, 클로드 하이쿠, GPT-3.5 터보보다 높은 점수를 보였다.
GPT-4o 미니는 현재 텍스트와 비전을 지원하며 앞으로 이미지, 비디오, 음성 등의 입출력을 지원할 예정이다. 이번 모델은 12만8000개의 토큰을 입력할 수 있고, 출력은 최대 1만6000토큰까지 지원한다. 오픈AI는 GPT-4o 미니에 대한 미세 조정을 출시할 계획이다.
조상록 기자 jsrok@chosunbiz.com
댓글0