“차세대 ‘루나 레이크’는 중앙처리장치(CPU), 그래픽처리장치(GPU), 신경망처리장치(NPU)까지 모두 새로운 아키텍처를 도입해 성능과 효율 모두 높아졌다. 특히 인공지능(AI) 성능에서는 GPU에서 3.5배, NPU에서 4배 높아져, 전체 AI 성능은 기존 코어 울트라 대비 3배 높아졌다.”
팻 겔싱어(Pat Gelsinger) 인텔 CEO는 4일(현지시각) 대만 타이베이 난강 국제전시장에서 열린 ‘컴퓨텍스 2024’의 기조연설을 통해 이와 같이 언급했다.
이 자리에서 인텔은 데이터센터와 PC를 위한 중요한 신제품을 공개했다. 먼저, 데이터센터용 제품으로는 차세대 ‘제온 6’ 제품군의 첫 제품인 ‘제온 6 E 코어 6700E 시리즈’ 제품을 발표했다. 이 제품은 최대 144코어 구성으로 클라우드와 스케일아웃 워크로드에 최적화됐다.
또한 차세대 AI PC를 위한 코드명 ‘루나 레이크’는 기존 코어 울트라 대비 크게는 세 배 이상 높아진 AI 성능을 제공하며, 마이크로소프트 ‘코파일럿+ PC’ 기준도 충족시킨다.
AI 시대 혁신 가속화하는 새로운 조합, ‘제온 6’와 ‘가우디 3’
팻 겔싱어 인텔 CEO는 이번 컴퓨텍스의 기조연설에서 “이제 AI 시대에 모든 디바이스는 ‘AI 디바이스’고, 모든 회사는 ‘AI 회사’다” 라고 강조하며 “인텔은 이러한 AI 시대에 필요한 모든 것을 갖춘 특별한 위치에 있다”고 말했다. 특히, ‘AI 에브리웨어(Everywhere)’를 표방하는 폭넓은 제품 포트폴리오는 물론이고, 반도체 제조 ‘파운더리’도 실리콘의 위탁 생산을 넘어선 ‘시스템 파운더리’로의 포지셔닝과 경쟁력을 강조했다.
AI 시대의 중요한 축인 ‘데이터센터’에서 인텔 제온 프로세서는 핵심 제품으로 꼽힌다. 이날 인텔은 데이터센터에서 요구되는 성능과 밀도, 효율 등의 요건을 충족시킬 수 있는 새로운 ‘제온 6’ 프로세서 제품군 중 E(Efficient)-코어 기반으로 설계된 ‘제온 6 E-코어 6700E 시리즈’ 제품을 공식 발표했다.
이번에 출시된 6700E 시리즈는 최대 144코어 구성을 지원하는 것이 특징이다. ‘인텔 3’ 공정을 사용하는 첫 제품이기도 하며, 많은 코어 수를 바탕으로 고밀도 스케일아웃 워크로드에 최적화됐다.
인텔은 이 ‘제온 6 E-코어’ 기반 시스템이 이제 교체 시기가 된 2세대 제온 프로세서 대비 미디어 트랜스코딩 작업에서 4.2배의 랙 레벨 성능 향상, 2.6배의 와트당 성능 향상을 제공하고, 200개 랙을 66개 랙으로 3:1 비율로 통합할 수 있어 전력소비량 절감 효과는 4년간 8만메가와트시(MWh) 전력량 절감이 가능하다고 제시했다. 또한 글로벌 커머스 플랫폼 이베이(Ebay)는 새로운 제온 6 E-코어 기반 시스템을 통해 기존 3세대 제온 기반 시스템 대비 전력 효율을 25% 높였다고 언급했다.
한편, 인텔은 이후 3분기 중 코드명 ‘그래나이트 래피즈(Granite Rapids)’로 알려진 ‘제온 6 P-코어 6900P’ 제품군을 발표할 예정이고, 2025년 1분기에 최대 288코어 구성의 ‘제온 6 E-코어 6900E’ 제품군과 ‘제온 6 P-코어 6700P/6500P/6300P’ 제품군 등을 선보인다는 계획이다.
제온 6 제품군은 6700 시리즈와 6900 시리즈가 물리적으로 서로 다른 패키지를 사용하며, 각 시리즈마다 P-코어 제품과 E-코어 제품이 모두 존재한다. 6700 시리즈의 경우 E-코어 제품에서는 최대 144코어를 지원하며 최대 2소켓 구성이 가능하고, 소켓당 열설계전력은 350W다. 플랫폼에서는 8채널 DDR5 메모리와 88레인 PCIe 5.0, CXL 2.0을 제공한다.
최근 ‘생셩형 AI’의 열풍 이후 오픈소스 모델과 기업의 데이터를 안전하게 연결하고 활용도를 높이는 방법으로 ‘검색증강생성(RAG)’가 주목받고 있다. 팻 겔싱어 CEO는 “인텔 제온 6 프로세서와 가우디 시리즈 가속기 조합으로 기술 활용의 가치를 극대화할 수 있다”고 강조했다. 현재 가우디 2는 생성형 AI를 위한 비용 효율적인 고성능 솔루션으로, 국내에서는 네이버가 도입한 것을 포함해 국내외의 많은 기업들이 도입했다고 언급했다.
팻 겔싱어 CEO는 가우디 3에 대해 “시장에서 엔비디아의 GPU에 경쟁 가능한 유일한 제품”이라고 강조했다. 가우디 3는 8192개 클러스터 구성에서 엔비디아 H100 대비 학습 시간이 최대 40% 빠르며, 64개 가속기 클러스터에서 라마2(Llama2)-70B 모델의 추론 성능은 엔비디아 H100 대비 최대 15% 높다고 제시했다. 또한, 주요 거대언어모델의 추론에서는 엔비디아 H100 대비 평균 최대 2배 높은 성능을 제공한다고 덧붙였다.
가우디 시리즈의 ‘비용 효율’ 측면에서 인텔은 현재 시스템 공급업체에 제공되는 8개의 인텔 가우디 2 가속기와 범용 베이스보드가 포함된 표준 AI 키트가 6만 5000달러(약 8960만원)로 동급 경쟁 플랫폼 가격의 3분의 1 수준이라고 말했다. 또한 8개의 인텔 가우디 3 가속기와 범용 베이스보드가 포함된 키트는 동급 경쟁 플랫폼 가격의 약 3분의 2 수준인 12만5000달러(약 1억7200만원)에 판매되고 있다고 언급했다.
데이터센터 뿐만 아니라 엣지 AI 또한 향후 중요성이 높아질 것으로 기대되는 영역으로, 2026년에는 엣지의 50% 이상에서 AI 워크로드가 운영될 것으로도 예상되고 있다. 이 부분에서 주목할 만한 사례로는 삼성메디슨과 인텔의 협력으로, 의료용 초음파 이미지 분석에 인텔 코어 울트라 프로세서와 오픈비노(OpenVINO) 툴킷을 활용해 기존 솔루션 대비 20% 이상 성능을 높인 바 있다고 소개했다.
차세대 AI PC 위한 ‘루나 레이크’, AI 성능 대폭 높아져
팻 겔싱어 CEO는 “AI PC 시대는 새로운 큰 변화의 계기다. 인텔은 이미 코어 울트라 프로세서 기반 제품을 800만대 이상 공급했으며, 올해 4000만대 이상의 제품 공급을 목표로 한다”고 제시했다.
차세대 AI 노트북 PC를 위한 플래그십 제품인 ‘루나 레이크(Lunar Lake)’는 올해 3분기에 시장에 출시될 예정이다.
차세대 코어 울트라 프로세서로 선보일 ‘루나 레이크’는 CPU, GPU, NPU까지 주요 구성 요소들의 아키텍처가 모두 바뀌었다. CPU의 경우는 P 코어에 ‘라이언 코브(Lion Cove)’, E 코어에는 ‘스카이몬트(Skymont)’ 아키텍처가 적용돼, 같은 동작 속도에서 P코어는 이전 세대 대비 약 14% 성능이 높아졌고, E코어는 이전 메테오레이크의 LP E코어 대비 정수에서 38%, 부동소수점 연산에서는 68%까지 성능이 높아진 것으로 알려졌다.
루나 레이크의 NPU는 ‘4세대’ 아키텍처를 기반으로 이전 세대 대비 최대 4배 성능이 높아진 48TOPS(초당 48조회 연산) 성능을 제공한다. 또한 마이크로소프트의 ‘코파일럿+ PC’ 기준인 40TOPS 성능 기준도 충족한다. GPU는 차세대 Xe2 ‘배틀메이지(Battlemage)’ 기반이 처음 적용됐으며, 행렬연산 성능을 높이는 XMX(Xe Matrix Extension)를 지원해 그래픽 성능은 이전 세대 대비 1.5배, AI 성능은 3.5배까지 향상됐다. 인텔은 이러한 특징들을 통해, 시스템 수준에서는 최대 120TOPS 수준의 AI 성능을 제공할 수 있을 것으로 소개했다.
20개 이상의 PC 제조사들은 3분기부터 80개 이상의 다양한 ‘루나 레이크’ 기반 제품을 선보일 예정이다. ‘루나 레이크’는 컴퓨트 타일까지 TSMC의 공정을 사용해, 인텔 역사상 처음으로 인텔의 x86 아키텍처 기반 컴퓨트 코어 설계가 인텔이 아닌 다른 제조사를 통해 생성되는 사례라는 기록도 있다.
팻 겔싱어 CEO는 ‘루나 레이크’에 대해 “새로운 루나 레이크 기반 AI PC는 대폭 높아진 AI 성능을 통해, 기존의 x86 기반 생태계를 유지하면서 사용할 수 있는 완벽한 업그레이드 옵션이다”라고 강조했다.
이어 “올해 하반기에는 데스크톱 폼팩터의 AI PC를 위한 ‘애로우 레이크(Arrow Lake)’가, 2025년에는 노트북 PC용 ‘팬저 레이크(Panther Lake)’가 준비되고 있다. 팬저 레이크는 인텔 18A 공정을 활용하며, 이를 통해 ‘4년 내 5개 공정 개발’ 목표도 달성하게 될 것이다”라고 밝혔다.
타이베이=권용만 기자 yongman.kwon@chosunbiz.com
댓글0