IBM은 최근 메타에서 발표한 ‘라마3.1’과 미스트랄 AI에서 발표한 ‘미스트랄 라지(Mistral Large) 2’ 등 최신 오픈소스 거대언어모델(LLM)을 왓슨x.ai에서 제공한다고 1일 발표했다. 이로써 왓슨x 사용 기업들은 더욱 다양한 오픈소스 AI 모델을 필요에 따라 자유롭게 선택하고 맞춤화해 사용할 수 있게 됐다.
‘라마 3.1’은 각각 80억 개(8B), 700억 개(70B), 4050억 개(405B)의 매개변수를 가진 사전 학습된 오픈소스 생성형 AI 모델들로 구성됐다. 특히 현재 사용 가능한 가장 크고 강력한 오픈소스 언어 모델로 평가받고 있는 라마 3.1-405B 모델은 한번에 처리할 수 있는 문맥의 길이가 토큰 8192개에서 12만8000개로 16배 늘어났고, 오픈AI의 GPT-4o 등의 독점적 모델들에도 뒤지지 않는 성능을 보여주는 것으로 알려져 있다.
또한, 강력한 성능을 제공하는 405B 모델은 추론 및 텍스트 생성과 같은 일반적인 AI 활용 사례 외에도 AI의 사전 학습이나 미세 조정을 위한 합성 데이터 생성 및 더 작은 모델로 만드는 지식 증류와 같은 작업에도 사용할 수 있다.
1230억 개의 매개변수를 가진 미스트랄 라지 2는 코딩과 수학 부문에서 뛰어난 성능을 발휘하고 80가지가 넘는 코딩 언어를 지원하며, 오픈AI의 GPT-4o, 앤트로픽(Anthropic)의 클로드 3 오푸스, 메타 라마 3.1 405B와 같은 최첨단 모델과 동등한 수준의 성능을 제공한다. 그리고, 향상된 추론 능력을 통해 환각이나 그럴듯하게 들리는 거짓 답변들을 최소화했다.
한편, IBM 왓슨x는 라마 3.1이나 미스트랄 라지 2, IBM 그래니트와 같은 광범위한 최신 오픈 소스 AI 모델을 제공해, 고객이 용도와 목적, 가격과 성능의 최적의 균형을 가진 가장 적합한 AI 모델을 선택해 각 기업에 가장 잘 맞는 방식으로 구현해 보다 쉽게 사용할 수 있도록 지원한다. 또한 IBM 왓슨x에서는 ‘미스트랄 라지 2’ 모델을 ‘미스트랄 커머셜 라이센스’ 없이도 상업적 목적으로도 자유롭게 사용할 수 있다.
권용만 기자 yongman.kwon@chosunbiz.com
댓글0