[비즈톡톡] 미스트랄·메타 ‘최신 AI’ 내놓았지만… ‘챗GPT’ 못 넘어서는 이유는

조선비즈 2024.07.26 조회수

프랑스 인공지능(AI) 스타트업 미스트랄이 최신 AI 모델을 지난 24일(현지시각) 선보였습니다. ‘라지(Large) 2′라고 불리는 이 모델에 대해 미스트랄은 “코드 생성, 수학, 추론 측면에서 오픈AI와 메타의 최신 모델과 동등한 수준의 성능을 갖췄다”고 주장했습니다. 미스트랄이 지난 2월 대규모언어모델(LLM) 라지를 출시한 지 9개월 만에 새 버전을 내놓으며 AI 경쟁이 가속화되고 있는 모양새입니다.

라지 2의 경우 AI의 데이터 처리 능력과 연관되는 매개변수(파라미터)가 1230억개입니다. 하루 전날 메타가 출시한 ‘라마(LLaMA) 3.1′의 가장 큰 버전인 4500억개 대비 3분의 1 수준이지만, 코드 생성 및 연산 능력은 비슷한 수준이라고 평가 받습니다. 라지 2는 영어, 프랑스어, 독일어 등 12개 언어를 지원하고, 80개 코딩 언어를 지원합니다. 특히 AI의 가장 큰 단점으로 꼽히는 ‘환각 증상(잘못된 정보를 지어내거나 조작)’을 최소화했다고 미스트랄은 설명했습니다.

메타와 미스트랄이 최신 AI 버전을 내놓았지만, AI 열풍을 이끈 오픈AI ‘챗GPT’를 뛰어넘을 수 있을지는 의문입니다. 오픈AI의 강력한 강점인 ‘멀티모달(Multi modal)’ 기능을 구현하지 못했기 때문입니다. IT매체 테크크런치는 “미스트랄 라지 2와 메타 라마 3.1 버전에도 없는 것이 바로 멀티모달 기능”이라며 “오픈AI는 멀티모달 AI 시스템과 관련해 경쟁사보다 훨씬 앞서 있다”고 평가했습니다.

멀티모달은 ‘여러 개’를 의미하는 멀티(Multi)와 ‘양식’을 뜻하는 모달(Modal)의 합성어로, 텍스트를 넘어 영상, 음성, 이미지 등 다양한 형태의 데이터를 분석하고 생성할 수 있는 시스템을 의미합니다. 기존 AI는 대부분의 정보를 텍스트로 배우고 처리했지만, 멀티모달 AI는 여러 가지 정보를 한꺼번에 받아들여 더 정확한 결과물을 만들어낼 수 있습니다. 사람처럼 스스로 글과 영상, 사진을 해석할 수 있는 것이죠.

사실 멀티모달 AI 시대를 연 건 구글의 AI 모델 제미나이입니다. 구글은 작년 12월 ‘현존하는 가장 뛰어난 AI’라며 처음부터 멀티모달로 설계된 AI ‘제미나이(Gemini)’를 공개했습니다. 당시 구글이 공개한 제미나이는 오렌지와 쿠키를 보여주면 “오렌지가 쿠키보다 건강에 더 좋다”는 판단까지 내놓을 정도로 사람과 같은 사고가 가능했습니다. 이후 올 2월 오픈AI가 문자 명령어를 영상으로 변환해주는 새로운 AI 모델 ‘소라(Sora)’를 출시하며 멀티모델 경쟁이 가속화됐습니다.

업계에서는 현재까지 멀티모달 AI의 선두주자로 오픈AI를 꼽습니다. 오픈AI는 지난 5월 다양한 형태의 데이터를 동시에 인식하고 처리할 수 있는 대규모 멀티모달 모델(LMM) GPT-4o(포오)를 공개했습니다. 최근에는 챗GPT 소형 모델인 ‘GPT-4o 미니’를 공개하며 멀티모달 AI의 소형화도 추진하고 있습니다. 이 모델의 사용료는 일반 모델인 GPT-3.5 터보보다도 60% 저렴하지만, 성능은 최신 모델인 ‘GPT-4o’와 비교해 크게 밀리지 않습니다.

메타도 지난해 11월 블로그를 통해 텍스트를 입력하면 그림을 그려주는 ‘에뮤 비디오’를 공개하긴 했지만, LLM인 라마에는 아직 적용되지 않은 상태입니다. 메타 대변인은 지난 17일 인터넷 매체 악시오스(Axios)에 보낸 성명에서 “우리는 앞으로 몇 달 안에 멀티모달 라마 모델을 출시할 예정”이라고 밝혔습니다. 사실상 오픈AI와 구글의 ‘투톱’ 체제인 멀티모달 AI 경쟁에서 다른 AI 기업들이 존재감을 키울 수 있을지 관심이 모아지고 있습니다.