구글이 Gemini 1.5 라는 새로운 딥 마인드 AI 모델을 출시하며 AI 전쟁에서 더욱 치열한 경쟁을 만들어내 한 걸음 앞장서고 있다. 구글은, Gemini 1.5라는 새로운 대형 언어 모델이 개발 중이라고 발표했으며, 이 기술의 첫 번째 버전인 Gemini 1.5 pro가 조만간 초기 테스트을 위해 출시될 예정이라고 밝혔다.
해당 소식은 구글과 Alphabet CEO인 순다 피차이와 구글 딥마인드 CEO인 데미스 하사비즈가 작성한 회사 블로그 게시물에서 공개되었으며, 이는 OpenAI의 GPT-4를 비롯해 다른 스타트업 및 대형 기술 회사들이 만들고 있는 LLM에 대한 구글의 대응 수단으로 의미된다.
구글의 Gemini는 차세대 AI 모델로, 이미지, 텍스트, 오디오, 비디오, 코딩 언어를 포함한 여러 유형의 데이터를 처리할 수 있다. 이 기술은 비즈니스 도구와 개인 비서로 사용되도록 설계되었으나, Gemini는 구글이 AI에 첫 발을 디딘 기술은 아니다. 구글은 계속해서 다양한 AI 도구를 만들어왔지만, 이를 모두 합쳐 Gemini로 이름을 바꾸어 지속적인 개발을 진행 중에 있다.
Gemini 1.5에서는 새로운 기술에 대해 보다 훨씬 더 많은 개선사항을 반영한 것으로 확인되었다. 지금까지 알려진 내용은 다음과 같다.
‘전문가의 혼합’ 모델 사용
Gemini 1.5는 “Mixture–of-Experts”(MoE)라고 알려진 특수화 기법 덕분에 매번 전체 모델을 실행하는 대신 쿼리를 받을 때마다 처리 능력의 관련 부분만을 사용하여 좋은 답변을 생성할 수 있는 기능으로, 더욱 빠르고 효율적인 서비스 제공이 가능해진다.
더 큰 컨텍스트 창
AI 모델의 힘은 정보를 처리하는 데 사용되는 구성 요소로 만들어진 컨텍스트 창에 의해 결정된다. Gemini 1.5의 컨텍스트 창은 단어, 이미지, 비디오, 오디오, 또는 코드를 포함할 수 있다.
기존 Gemini는 최대 32,000개의 토큰을 처리할 수 있었다. 그러나, Gemini 1.5 Pro의 컨텍스트 창은 최대 1백만 개의 토큰을 처리할 수 있다. 이는 새로운 LLM이 이전 버전보다 더 많은 데이터를 분석할 수 있다는 것을 의미한다. 따라서 Gemini 1.5는 1시간의 비디오, 11시간의 오디오, 30,000줄 이상의 코드 또는 700,000단어 이상을 분석할 수 있다.
이전 버전에 비해 성능이 향상
새로운 AI 모델을 이전 버전과 비교 테스트 했을 때, Gemini 1.5 프로는 구글의 대규모 언어 모델(LLM) 개발 시 사용된 벤치마크에서 기존 Gemini 1.0 프로보다 87% 더 향상된 성능을 보였다. 또한, Gemini 1.0 울트라와 동일한 벤치마크 비교 시에는 전반적으로 거의 비슷한 수준의 성능을 나타냈다.
특정 사실이나 진술이 포함된 작은 텍스트 조각을 긴 텍스트 블록 안에 의도적으로 배치하는 NIAH(Needle In A Haystack) 평가에서 Gemini 1.5 프로는 100만 토큰 길이의 데이터 블록에서 99%의 정확도로 해당 문구가 포함된 텍스트를 찾아냈다.
Gemini 1.5는 사용자가 쿼리를 추가로 세밀하게 조정하는 데 많은 시간을 들이지 않아도 대량의 쿼리로부터 퀄리티 있는 응답을 생성하는 데 더욱 능숙해지고 있다. 구글은 테스터들이 Gemini 1.5에게 알려지지 않은 언어의 문법 매뉴얼을 제공하였고, LLM은 문법 매뉴얼을 영어로 번역하는 능력을 인간 학습 수준에 근접하게 보여주었다고 말했다.
강화된 안전 테스트 거쳐
AI 기술이 강해질수록, 기술이 윤리와 안전 문제에 미치는 역할에 대한 우려도 커지기 마련이다. 구글은 Gemini 1.5를 출시하면서 광범위한 윤리 및 안전 테스트를 거쳤다고 전했다. 또한, AI 연구를 통해 잠재적인 위험을 완화하는 기술을 개발하였다고 밝혔다.
댓글0