엔비디아는 메타의 오픈소스 인공지능(AI) 모델 컬렉션인 라마 3.1(Llama 3.1)을 기반으로 기업의 생성형 AI를 강화하는 ‘엔비디아 AI 파운드리(NVIDIA AI Foundry)’ 서비스와 엔비디아 NIM(NVDIA Inference Microservices) 추론 마이크로서비스를 발표했다고 25일 밝혔다.
‘엔비디아 AI 파운드리’는 라마 3.1과 엔비디아 소프트웨어, 컴퓨팅, 전문성을 활용해 도메인별 산업 사용 사례에 맞는 맞춤형 ‘슈퍼모델’ 구현을 지원한다. 또한 엔비디아 AI 파운드리는 세계 엔비디아 DGX 클라우드(DGX Cloud) AI 플랫폼으로 구동돼, 조직에 AI 수요 변화에 따라 쉽게 확장할 수 있는 방대한 컴퓨팅 리소스를 제공한다.
기업은 자체 데이터는 물론, 라마 3.1 405B와 엔비디아 네모트론(Nemotron) 리워드 모델에서 생성된 합성 데이터로 슈퍼모델을 훈련할 수 있다. 여기에는 허깅 페이스 리워드 벤치에서 1위를 차지한 엔비디아 네모트론-4 340B 리워드 모델이 포함된다.
이렇게 생성된 맞춤형 모델은 기업이 선호하는 클라우드 플랫폼과 글로벌 서버 제조업체의 엔비디아 인증 시스템에서 원하는 머신러닝옵스(MLOps)와 인공지능옵스(AIOps) 플랫폼을 통해 사용할 수 있다. 이와 함께, 엔비디아 AI 엔터프라이즈전문가와 글로벌 시스템 통합 파트너는 AI 파운드리 고객과 협력해 개발부터 배포에 이르는 전체 프로세스를 가속화한다.
엔비디아는 현재 프로덕션 AI용 라마 3.1 모델의 엔터프라이즈 배포를 강화하기 위해 홈페이지를 통해 라마 3.1 모델용 엔비디아 NIM 추론 마이크로서비스를 제공한다. NIM 마이크로서비스는 프로덕션 환경에서 NIM 없이 추론을 실행하는 것보다 최대 2.5배 더 높은 처리량을 제공한다.
또한 라마 3.1 NIM 마이크로서비스를 새로운 엔비디아 네모 리트리버(NeMo Retriever) NIM 마이크로서비스와 결합하면, AI 코파일럿, 어시스턴트, 디지털 휴먼 아바타를 위한 최첨단 검색 파이프라인을 구축할 수 있다.
도메인별 모델을 만들기 위해 추가 훈련 데이터가 필요한 기업은 라마 3.1 405B와 네모트론-4 340B를 함께 사용해 합성 데이터를 생성, 모델 정확도를 높일 수 있다. 자체 훈련 데이터를 보유한 고객은 도메인 적응형 사전 훈련(DAPT)을 위해 엔비디아 네모로 라마 3.1 모델을 맞춤화해 모델 정확도를 더욱 높일 수 있다.
아울러 엔비디아와 메타는 개발자가 생성형 AI 애플리케이션을 위한 소규모 맞춤형 라마 3.1 모델을 구축하는 데 사용할 수 있는 라마 3.1의 증류 레시피를 제공하기 위해 협력하고 있다. 이를 통해 기업은 AI 워크스테이션과 노트북 같은 광범위한 가속 인프라에서 라마 기반 AI 애플리케이션을 실행할 수 있다.
라마 3.1 다국어 거대언어모델(LLM) 컬렉션은 8B, 70B, 405B 파라미터 크기의 생성 AI 모델 모음이다. 이는 1만6000개 이상의 엔비디아 H100 텐서 코어 그래픽처리장치(GPU)에서 훈련되고, 데이터센터, 클라우드, 엔비디아 RTX GPU가 탑재된 워크스테이션이나 지포스 RTX GPU가 탑재된 PC에서 엔비디아 가속 컴퓨팅과 소프트웨어에 최적화됐다.
또한 검색 증강 생성(RAG)을 위한 새로운 엔비디아 네모 리트리버 NIM 추론 마이크로서비스는 맞춤형 라마 슈퍼모델과 라마 NIM 마이크로서비스를 프로덕션에 배포할 때 응답 정확도를 향상시킬 수 있다.
라마 3.1 NIM과 네모 리트리버 NIM 마이크로서비스에 대한 프로덕션 지원은 엔비디아 AI 엔터프라이즈를 통해 제공된다. 엔비디아 개발자 프로그램 회원은 선호하는 인프라에서 연구, 개발, 테스트를 위해 NIM 마이크로서비스에 무료로 액세스할 수 있다.
젠슨 황 엔비디아 창립자 겸 CEO는 “라마 3.1은 모든 기업과 업계가 최첨단 생성형 AI 애플리케이션을 구축할 수 있는 문을 열었다. 엔비디아 AI 파운드리는 라마 3.1을 전체적으로 통합했으며, 기업이 맞춤형 라마 슈퍼모델을 구축하고 배포할 수 있도록 지원할 준비가 돼있다”고 말했다.
마크 저커버그(Mark Zuckerberg) 메타 창립자 겸 CEO는 “새로운 라마 3.1 모델은 오픈소스 AI에 있어 매우 중요한 단계이다. 기업들은 엔비디아 AI 파운드리를 통해 사람들이 원하는 최첨단 AI 서비스를 쉽게 만들고 맞춤화하며, 엔비디아 NIM을 통해 배포할 수 있다. 이러한 서비스를 사람들에게 제공할 수 있게 돼 기쁘다”고 말했다.
권용만 기자 yongman.kwon@chosunbiz.com
- 효성인포메이션시스템, AMD 기반 하이브리드 클라우드 솔루션 선보여
- [인사] 과학기술정보통신부
- [유통가 투데이] 롯데마트, 올림픽 맞춰 프랑스 먹거리 선봬 外
- 보안 전문기업 지엔, 2024 서울형 강소기업 선정
- 우리카드, 상반기 순익 838억 전년比 2.3% 증가
댓글0