구글 연례 개발자 컨퍼런스 ‘구글 I/O 2024’ 개막
구글 제품 전반에 제미나이 탑재…최신 6세대 TPU ‘트릴리움’도 발표
추론·기획·기억 가능한 AI 에이전트의 미래, ‘프로젝트 아스트라’ 공개
구글이 자사의 생성형 AI(인공지능) 제미나이를 탑재한 검색 엔진을 정식으로 출시했다. 사람처럼 대화하는 비서(assistant)와 같은 AI 기능도 선보였다.
연합뉴스에 따르면 구글은 14일(현지시간) 미 캘리포니아주 마운틴뷰 쇼어라인 엠피씨어터에서 ‘구글 연례 개발자 회의(I/O)’를 열고 자사의 최신 AI 모델인 제미나이(Gemini)를 통해 AI의 미래를 현실화하기 위한 비전을 발표했다.
‘AI 개요'(AI Overview)는 제미나이를 이용해 검색 결과를 빠르게 요약하고 관련 링크를 제공받을 수 있는 기능이다. 대화 형태로 검색할 수 있고, 사진뿐만 아니라 동영상으로도 검색이 가능해진다.
구글은 작년부터 AI를 이용해 질문에 대한 답변 초안을 작성하기 시작했지만 실험용 버전이었다.
제미나이가 탑재된 새 검색 기능은 미국을 시작으로 수 개월 안에 다른 국가에도 제공된다. 구글은 연말까지 10억명 이상에게 제공할 계획이다.
구글은 또 제미나이와 구글의 음성 모델을 기반으로 하는 새로운 ‘프로젝트 아스트라'(Project Astra)도 선보였다. 이는 미래 AI 어시스턴트 구현을 위한 구글의 비전으로, AI가 사람처럼 보고 들을 수 있고 음성으로 대화하면서 이용자의 개인 비서 역할을 하는 기능이다.
데미스 허사비스 구글 딥마인드 CEO는 “우리는 오랫동안 일상 생활에서 도움이 될 수 있는 범용(universal) AI 에이전트를 만들고 싶었다”며 “휴대전화나 안경과 같은 폼팩터를 통해 전문(expert) 비서를 곁에 둘 수 있는 미래를 쉽게 상상할 수 있다”고 강조했다.
시연 영상에는 휴대전화 카메라로 주변 상황을 보여주고 안경이 어디에 있는지를 묻자 이를 알려주고, 현재 위치를 묻자 정확하게 파악하고 음성으로 이를 알려주는 AI 비서의 모습이 담겼다.
구글은 또 프로젝트 아스트라 구현을 위한 스마트안경을 착용하고 AI와 대화하는 영상도 공개했다.
구글은 프로젝트 아스트라 비전을 위한 전 단계로 ‘제미나이 라이브’를 선보였다. 이 기능은 사람처럼 대화하고 이미지는 업로드를 통해 인식한다. 구글은 ‘제미나이 라이브’를 수개월 내에 출시하고 이후 실시간 시각과 청각 등 프로젝트 아스트라를 위한 기능도 추가할 계획이다.
구글은 또 지난 2월 공개한 멀티모달 AI 모델 제미나이 1.5 프로를 이날부터 한국어를 포함해 35개 언어로 출시한다고 밝혔다.
제미나이 1.5 프로는 제미나이 1.0 울트라의 업그레이드 버전이다. 100개의 이메일을 단 몇 초 만에 요약하고 1시간 분량의 동영상을 한 번에 처리할 수 있다.
AI 모델이 한 번에 처리할 수 있는 정보의 양을 ‘콘텍스트 윈도’라 하는데, 이는 단어·이미지·영상·오디오·코드 등의 의미를 가진 ‘토큰’으로 구성된다. 제미나이 1.5 프로는 최대 100만개의 토큰 처리 능력을 갖췄다. 200만 개의 토큰 처리 능력을 갖춘 버전도 곧 출시할 예정이다.
제미나이 1.5 프로보다 가벼우면서도 같은 멀티모달 추론 기능과 긴 콘텍스트 기능을 갖춘 제미나이 1.5 플래시도 선보였다.
텍스트 투 이미지 AI인 이마젠의 최신 버전인 이마젠3와 함께 텍스트를 입력하면 1분 이상의 영상을 만들어주는 AI 모델 비오(Veo)도 공개했다.
또 서버용 AI 반도체인 TPU 6세대인 트릴리움(Trillium)도 발표했다. 이전 모델 대비 칩당 최대 컴퓨팅 성능이 4.7배 향상됐다고 구글은 설명했다.
구글은 이와 함께 AI로 생성한 이미지에 눈에 띄지 않는 워터마크를 삽입하는 ‘신스ID(SynthID)’ 기술을 텍스트와 동영상에도 확대 적용하기로 했다.
순다르 피차이 최고경영자(CEO)는 “제미나이 생태계에 상상 가능한 AI의 모든 것을 담았다”며 “이번 주부터 미국 내 모든 이용자에게 완전히 개편된 경험인 ‘AI 개요’를 시작한다는 것을 발표하게 돼 기쁘다”고 말했다.
댓글0