“최근 ‘AI 확장 법칙’에 대한 업계 전반의 요구사항에 부응해 만들어진 것이 ‘블랙웰’이다. 현재 완전한 대량 생산 중이며 다양한 형태의 시스템 구성이 고객에 공급되고 있다.”
젠슨 황 엔비디아 CEO는 6일(현지시각) 미국 네바다주 라스베이거스에서 열린 CES 2025의 기조연설을 통해 최신 세대 ‘블랙웰(Blackwell)’ 아키텍처 기반 GPU에 대해 이와 같이 말했다.
엔비디아는 이번 CES 2025의 기조연설에서 현재 데이터센터용 ‘블랙웰’ GPU가 순조롭게 생산, 공급되고 있다는 점을 강조했다. ‘블랙웰’ 아키텍처를 기반으로 한 새로운 제품으로 200억개 파라미터 모델을 실행 가능한 초소형 AI 슈퍼컴퓨터 ‘프로젝트 디지츠’도 공개했다. 이 외에도 엔비디아는 PC와 데이터센터에서 ‘에이전트 AI’ 시대를 위한 지원을 확장했다.
블랙웰 기반 시스템 대량 생산 중, AI 확장 법칙 지속 지원
젠슨 황 엔비디아 CEO는 “AI의 확장 법칙은 이제 세 가지가 존재한다”고 말했다. 이 중 기존의 ‘프리 트레이닝 스케일링’과 달리 ‘포스트 트레이닝 스케일링’은 훈련 성과에 사람의 피드백 등이 반영되는 ‘강화학습’ 유형이다. 마지막 단계는 ‘테스트 타임 스케일링’이라 불리며 추리(reasoning)로도 불린다. 오픈AI의 o1 등이 대표적이다. 젠슨 황 CEO는 “업계 전반이 AI의 발전을 위해 이러한 단계를 따라 움직이고 있다”고 언급했다.
이러한 변화에 따라 필요한 컴퓨팅 역량 또한 더욱 커지고 있다. 젠슨 황 CEO는 “업계 전반의 이러한 변화에 따른 요구에 부응해 만든 것이 ‘블랙웰’이다”라고 말했다. 이어 “블랙웰은 현재 완전한 대량 생산 중(Full Production)이다”라며 “15개 제조사에서 200개 이상의 모델이 다양한 형태로 구성돼 고객에 공급되고 있다”고 언급했다.
엔비디아의 블랙웰 기반 시스템 구성 중 잘 알려진 것으로는 ‘GB200’ 슈퍼칩을 사용한 ‘GB200 NVL72’가 있다. 젠슨 황 CEO는 이 ‘GB200 NVL72’에 대해 “이 ‘GB200 NVL72’ 시스템은 이전 세대보다 전력 효율은 4배, 비용 효율은 3배 높아졌다. 이는 모델당 훈련 비용을 1/3로 줄이거나, 3배 더 큰 모델을 같은 비용으로 훈련시킬 수 있게 한다”고 밝혔다.
또한 “이 시스템은 현재 AI 시대에 필요한 ‘토큰’을 만든다. 데이터센터의 전력 문제에 직면한 상황에서 이전 세대 대비 4배 개선된 전력 효율은 데이터센터로 만들 수 있는 비즈니스 기회를 4배 확장시킬 수 있다”고 설명했다.
이어 젠슨 황 CEO는 “이 ‘AI 팩토리’ 시스템은 하나의 ‘거대 칩’처럼 동작할 수 있다. 1.4엑사플롭스(ExaFLOPS) 성능을 가진 72개의 블랙웰 GPU와 14테라바이트(TB) 메모리, 2592개 그레이스 CPU 코어 등이 모두 긴밀히 연결돼 하나의 거대한 GPU처럼 동작한다. 이러한 특징은 더 크고 복잡한 모델을 다룰 수 있게 하고 비용을 낮추고 AI의 확장을 지속적으로 지원할 수 있게 할 것이다”라고 말했다.
PC에서 데이터센터까지 에이전트 구축 위한 지원 확장
엔비디아는 이번 기조연설을 통해 에이전트 AI 애플리케이션 구축을 위한 새로운 AI 블루프린트를 통해 기업들이 업무 자동화를 실현할 수 있도록 지원한다고 소개했다. 엔비디아는 기업들이 AI를 더 쉽게 사용할 수 있게 돕는 여정의 일환으로 ‘라마(Llama) 3.1’ 모델 기반의 ‘엔비디아 라마 네모트론’ 언어 파운데이션 모델’을 발표했다. 이 모델은 엔비디아가 최적화했으며 ‘오픈 모델’이고 규모에 따라 나노, 슈퍼, 울트라의 세 가지로 나뉜다.
엔비디아는 지포스 RTX GPU 등을 장착한 ‘RTX AI PC’에서 NIM 마이크로서비스와 다양한 AI 기술을 활용해 ‘AI 에이전트’ 환경을 구현할 수 있게 지원하는 ‘프로젝트 R2X’를 프리뷰 형태로 공개했다. 흥미로운 점은 이 환경이 윈도에서 NIM 마이크로서비스를 이용하기 위해 윈도 환경에서 리눅스 환경을 통합 구현하는 ‘WSL(Windows Subsystem for Linux)’을 사용하고 있다는 점이다.
개인용 AI 슈퍼컴퓨터 ‘프로젝트 디지츠’ 선보여
엔비디아는 이번 CES 2025의 기조연설을 통해 ‘개인용 AI 슈퍼컴퓨터’의 콘셉트로 구현된 ‘프로젝트 디지츠(Project DIGITS)’를 발표했다. 젠슨 황 CEO는 이 ‘프로젝트 디지츠’에 대해 “예전의 DGX급 슈퍼컴퓨터가 제공하던 성능을 이제 이 작은 시스템에서 제공할 수 있게 됐다”고 말했다.
프로젝트 디지츠는 새로운 엔비디아의 ‘GB10 그레이스 블랙웰’ 슈퍼칩을 탑재해 대규모 AI 모델을 다룰 수 있는 페타플롭스 급의 AI 컴퓨팅 성능을 작은 크기의 시스템에서 제공한다. 사용자는 이 시스템을 통해 모델에서 추론을 개발하고 실행한 다음, 클라우드나 데이터센터 인프라에 모델을 원활히 배포할 수 있다. 이 ‘프로젝트 디지츠’는 작은 크기에도 시스템간 연결로 확장 가능한 구조를 가진 것도 눈에 띈다.
‘프로젝트 디지츠’에 탑재된 GB10 슈퍼칩은 엔비디아 그레이스 블랙웰 아키텍처 기반의 시스템온칩(SoC)으로, FP4 정밀도에서 최대 1페타플롭스(PFlops)의 AI 연산 성능을 제공한다. 프로세서 내부는 ‘블랙웰 GPU’와 20코어 ‘그레이스’ CPU가 ‘NV링크-C2C’ 인터페이스로 연결된 구조로 칩 설계에는 미디어텍도 참여한 것으로 알려졌다.
‘프로젝트 디지츠’는 128GB 통합 메모리와 최대 4TB 스토리지를 갖춰 최대 2000억 파라미터의 거대언어모델(LLM)도 다룰 수 있다. 이와 함께 엔비디아 ‘커넥트X’ 네트워킹도 갖춰 두 대의 ‘프로젝트 디지츠’를 연결해 두 배 큰 규모의 모델까지 다룰 수 있다. 엔비디아는 이 ‘프로젝트 디지츠’를 5월에 출시할 예정이다. 가격은 3000달러(약 434만원)이다.
라스베이거스=권용만 기자
yongman.kwon@chosunbiz.com
댓글0