엔비디아의 지포스 RTX 5090은 지포스 RTX 50 시리즈의 모든 기술을 활용할 수 있는 기함급 모델로, 하위 모델들과는 차별화되는 ‘빅 칩’ 구성을 사용한다. 지포스 RTX 50 시리즈에서 RTX 5090에 탑재되는 칩의 코드명은 ‘GB202’로, RTX 5080의 ‘GB203’과는 쿠다 코어 수 등에서 두 배 가까운 차이가 있다. 이전 세대와 비교해도 이번 ‘지포스 RTX 5090’은 칩의 규모 면에서 제법 규모를 많이 키운 모습이다.
지포스 RTX 5090은 11개의 그래픽 프로세싱 클러스터(GPC)와 85개의 텍스처 프로세싱 클러스터(TPC), 170개의 스트리밍 멀티프로세서(SM)가 탑재됐다. 이전 세대와 비교하면 GPC 수는 같지만 TPC 수는 64개에서 85개로 늘었고 SM 수는 128개에서 170개로 늘었다. 이에 쿠다 코어 수는 이전 세대의 1만6384개보다 33% 정도 많아진 2만1760개가 됐다. SM당 한 개씩 장착되는 RT 코어는 총 170개, 4개씩 장착되는 텐서 코어와 텍스쳐 유닛은 총 680개다.
메모리는 512비트 버스 폭의 32GB 28Gbps GDDR7 메모리를 탑재했다. 이전 세대보다 메모리 동작 속도와 버스 폭 모두 크게 늘어 최대 메모리 대역폭은 이전 세대보다 80% 가량 높아진 1.8TB/s에 이른다. GPU 제조 공정은 이전 세대와 비슷한 TSMC의 4N 기반 커스텀 공정을 사용했고 트랜지스터 수는 이전 세대보다 21%정도 늘어난 922억개다. 다이 면적은 이전 세대 대비 23% 정도 늘어난 750mm2다. 최대 소비전력은 이전 세대보다 크게 늘어난 575W로, 그래픽카드의 보조 전원 입력에 사용하는 12V-2×6 커넥터의 공급 전력 한계에 근접한다.
![이전 세대보다 칩 구성이 30% 확장된 엔비디아 지포스 RTX 5090 FE / 권용만 기자](https://contents-cdn.viewus.co.kr/image/2025/02/CP-2023-0274/image-33a18082-6562-4d37-844c-78f95d57724b.jpeg)
엔비디아의 공식 사양에서 제시된 성능을 보면 지포스 RTX 5090의 FP32 기준 연산 성능은 104.8테라플롭스(TFLOPS)로 이전 세대보다 27%가량 높다. 이는 GPU 규모는 쿠다 코어 기준 33%정도 늘었지만 아키텍처가 바뀌고 동작 속도가 소폭 낮아진 영향으로 보인다. 아키텍처가 바뀜에도 이전 세대 대비 기능 구성별 면적비도 크게 바뀌지는 않은 것으로 보인다. 텐서 코어를 사용하지 않는 기존 방식에서는 새로운 GPU가 단지 구 아키텍처의 ‘확장’에 그칠 수도 있을 부분이다. 하지만 쿠다 코어 기반의 INT32 연산 성능은 2.53배 높아진 부분이 눈에 띈다.
새로운 블랙웰 아키텍처의 개선사항은 텐서 코어와 RT 코어 등에 집중됐다. 지포스 RTX 5090의 RT코어 연산 성능은 317.5테라플롭스로 이전 세대 대비 66% 높다. RT코어 수 자체가 33% 늘어난 것을 고려하면, RT 코어당 성능은 25% 정도 개선으로 볼 수 있겠다. 텐서 코어의 경우 FP4 형식을 지원해서 최대 실효 성능 3352테라플롭스를 제공한다. 이는 정확히 FP8 연산 성능의 두 배다. 한편, 같은 FP8 연산 성능을 기준으로 하면 이전 세대와의 성능 차이는 27% 정도고 칩 규모가 커진 것을 고려하면 텐서 코어당 성능 차이는 거의 없는 모습이다.
그래픽의 기본 성능에서는 아예 전 세대보다 역전되는 상황도 있다. 픽셀 필레이트 성능은 초당 423.6기가픽셀로 이전 세대의 초당 443.5기가픽셀보다 소폭 낮아졌다. 하지만 텍셀 필레이트는 1636.8기가픽셀로 27% 정도 성능이 높아졌다. 하지만 쉐이더 중심으로 움직이는 오늘날의 그래픽 처리에서 순수 픽셀과 텍셀 필레이트 성능의 비중은 제한적이다. 현재 시점에서 지포스 RTX 시리즈의 90급 모델이 이러한 성능에서 문제가 될 수준은 아닌 것으로 보인다.
![엔비디아 앱을 통해 기존 게임에도 최신 DLSS 모델을 강제 적용할 수 있다. / 권용만 기자](https://contents-cdn.viewus.co.kr/image/2025/02/CP-2023-0274/image-e0bf30e6-c845-42d1-a1e4-63b8c1294f54.jpeg)
이러한 점들에서 볼 때 지포스 RTX 50 시리즈와 지포스 RTX 5090은 이전 세대 대비 순수한 처리 성능보다는 텐서 코어의 FP4 활용과 RT 코어 성능 향상을 얼마나 잘 활용하느냐에 따라 성능 향상의 가치가 결정될 것으로 짐작할 수 있다. 엔비디아가 ‘AI 그래픽 렌더링 시대’를 제시하면서 DLSS 4 기술에서 ‘다중 프레임 생성’을 선보인 것도 지포스 RTX 50 시리즈의 텐서 코어의 장점인 FP4 형식 연산의 성능을 최대한 활용하는 모습이다.
엔비디아는 기존의 DLSS 지원 게임에서도 지포스 RTX 50 시리즈의 장점을 극대화하기 위해 ‘엔비디아 앱’에서 기존 DLSS 모델이 적용된 게임들에 최신 DLSS 모델을 강제 적용할 수 있는 옵션을 제공한다. 이를 통해 기존 구형 CNN 기반 모델을 최신 트랜스포머 모델로 바꿔 성능과 품질을 높일 수도 있지만 강제 적용에 따른 문제가 발생할 수도 있다. 엔비디아는 이러한 설정을 철저히 사용자 책임 하에 사용할 수 있게 제공한다는 입장인데, 문제가 생겨도 원래 상태로 복원은 쉽게 된다.
한편, 지포스 RTX 5090의 최대 전력 소비량은 575W로, 이전 세대보다 27.7% 높아졌다. 이는 전반적인 칩 규모 확장이나 연산 성능 향상 수준과도 비슷한 수준으로, 공정이나 아키텍처 모두에서 이전 세대 대비 전력 효율이 개선된 부분은 크게 발견되지 않는다. PCI익스프레스(PCI Express) 버스 규격은 5.0 규격을 사용하는데, 현재까지는 PCIe 4.0 기반 시스템에서 사용하더라도 성능에 크게 문제가 생길 수준은 아닌 것으로 보인다.
![3DMark 테스트 결과, 높을수록 좋다. / 권용만 기자](https://contents-cdn.viewus.co.kr/image/2025/02/CP-2023-0274/image-b90e4c39-90ec-4748-bc83-fabc37e2752a.jpeg)
![3DMark(DirectX Raytracing feature test) 테스트 결과, 단위 ‘초당 프레임 수(fps)’, 높을수록 좋다. / 권용만 기자](https://contents-cdn.viewus.co.kr/image/2025/02/CP-2023-0274/image-64817928-bdba-4f24-abc3-5899e8d55aee.jpeg)
![3DMark(NVIDIA DLSS feature test) 테스트 결과, 단위 ‘초당 프레임 수(fps)’, 높을수록 좋다. / 권용만 기자](https://contents-cdn.viewus.co.kr/image/2025/02/CP-2023-0274/image-1b876fb9-795e-4745-8dac-f413687aae86.jpeg)
테스트 시스템은 인텔 코어 울트라 9 285K 프로세서와 에이수스 ROG 스트릭스 Z890-E 게이밍 와이파이 메인보드, 64GB DDR5-5600 메모리를 사용했다. 파워 서플라이는 한미마이크로닉스의 클래식 2 골드 풀모듈러 850W ATX 3.1 모델을 사용했고 엔비디아의 권장 용량인 1000W에는 미치지 않지만 테스트 전반에서 전력 공급으로 인한 문제는 없었다.
드라이버는 정식 출시 전의 베타 버전과 정식 출시 버전을 교차 테스트했는데, 테스트 시나리오에서 성능에 의미 있는 변화는 없었다. 운영체제는 윈도11 24H2에 2025년 1월 최신 업데이트를, 전력 관리 프로파일은 ‘고성능’을 적용했다.
기본적인 게이밍 성능을 알아볼 수 있는 3D마크(3DMark) 테스트에서 지포스 RTX 5090은 이전 세대 대비 제법 훌륭한 성능 향상을 보여주지만, 이 성능 향상의 가치는 바라보는 관점에 따라 달라질 수 있다. 래스터 성능 위주로 측정하는 ‘타임 스파이’나 ‘타임 스파이 익스트림’은 이전 세대와 비교하면 대략 GPU 규모와 전력 소비량이 커진 만큼 성능이 올랐다. 즉, 새로운 아키텍처로 인한 성능 향상은 이러한 조건에서는 확인되지 않는다.
레이트레이싱이 반영된 ‘포트 로열(Port Royal)’ 성능에서는 이보다는 좀 더 큰 성능 향상을 확인할 수 있다. 또한 3D마크의 레이트레이싱 기능 테스트에서는 이전 세대 대비 엔비디아가 발표한 66%의 성능 향상을 달성하는 인상적인 모습도 보여준다.
가장 인상적인 부분은 ‘DLSS 4’다. 지포스 RTX 5090에서는 이전 세대와 같은 조건에서 GPU 성능이 오른 것 뿐만 아니라, 새로운 GPU에서 지원하는 새로운 기술을 통한 성능 향상도 있다. 일단 비슷한 프리셋과 단일 프레임 생성 설정에서도 DLSS 3와 4 사이에는 큰 품질 차이와 함께 약간의 성능 차이도 있다.
DLSS 4의 ‘다중 프레임 생성’을 사용하면 DLSS 4 퍼포먼스 기준 단일 프레임 생성보다 68%, 퀄리티 기준으로는 73% 더 높은 초당 프레임 수를 기록한다. DLSS 3 퍼포먼스의 단일 프레임 생성과 DLSS 4 퍼포먼스의 다중 프레임 생성 모드 사이의 성능 차이는 76%에 이른다. DLSS를 사용하지 않은 네이티브 4K 렌더링과 DLSS 4 퍼포먼스의 다중 프레임 생성 모드와의 성능 차이는 5.4배에 달한다.
![Cyberpunk 2077(4K RT Ultra: Path tracing ON) 테스트 결과, 단위 ‘초당 프레임 수(fps)’, 높을수록 좋다. / 권용만 기자](https://contents-cdn.viewus.co.kr/image/2025/02/CP-2023-0274/image-e5007f24-91e6-420f-8f36-dc64e1b47d11.jpeg)
![Hogwarts Legacy(4K Ultra : RT Ultra) 테스트 결과, 단위 ‘초당 프레임 수(fps)’, 높을수록 좋다. / 권용만 기자](https://contents-cdn.viewus.co.kr/image/2025/02/CP-2023-0274/image-535edcd2-010c-4f41-b925-17f5b51cb5d1.jpeg)
![Shadow of the Tomb Raider(4K Very High) 테스트 결과, 단위 ‘초당 프레임 수(fps)’, 높을수록 좋다. / 권용만 기자](https://contents-cdn.viewus.co.kr/image/2025/02/CP-2023-0274/image-7560041b-4f1c-4e47-8abf-145de119245c.jpeg)
DLSS 4의 다중 프레임 생성을 지원하는 게임에서의 결과도 인상적이다. 먼저 ‘사이버펑크 2077(Cyberpunk 2077)’의 경우 4K 해상도에 RT 울트라 옵션, 패스 트레이싱 활성화 시 DLSS를 사용하지 않으면 32프레임 정도가 나온다. 이 상태에서 DLSS를 쓰지 않아도 ‘프레임 생성’ 기능을 활용할 수 있는데 4X 다중 프레임 생성 모드에서는 120프레임 가량을 기록했다.
이 때, ‘DLSS 퍼포먼스’ 모드를 적용하면 대략 성능이 2X 프레임 생성에서는 2.5배, 4X 프레임 생성에서는 2.3배 정도 성능이 오르는 모습을 확인할 수 있다. 이는 DLSS 퍼포먼스 모드를 사용하면서 렌더링 해상도가 낮아져 레이 트레이싱과 패스 트레이싱의 부담이 크게 줄기 때문이다. 이 때 CNN과 트랜스포머 모델 간 성능 차이는 없었고 프레임 생성 2X와 4X 간 성능 차이는 81% 정도로 나타났다.
‘호그와트 레거시(Hogwarts Legacy)’도 DLSS를 사용하지 않은 4K 게이밍 성능은 79프레임 정도지만 DLSS 퍼포먼스 모드와 프레임 생성, 광선 재구성 기능 등을 사용하면 성능은 2.6배까지 오르고, 4X 다중 프레임 생성을 사용하면 4.5배 가까이 높은 프레임 수를 보여준다. DLSS 퍼포먼스 모드에서 일반 프레임 생성과 다중 프레임 생성 간 성능 차이는 70% 정도로 나타났다.
한편, 구 버전의 DLSS를 사용하는 게임에서 최신 DLSS 모델을 적용하는 경우에도 어느 정도 성능과 품질 차이를 기대할 수 있다. 구 버전의 DLSS 초해상도(Super Resolution) 기술만을 사용하는 ‘쉐도우 오브 더 툼레이더(Shadow of the Tomb Raider)’의 경우 4K 해상도에서 DLSS 사용 여부에 따른 성능 차이는 9% 정도다. 그리고 이 게임에 최신 모델의 DLSS를 적용할 경우 3% 정도의 추가 성능 향상을 얻을 수 있고, DLSS 사용 여부에 따른 성능 차이는 12% 정도로 커진다.
![UL Procyon(Photo/Video Editing) 테스트 결과, 높을수록 좋다. / 권용만 기자](https://contents-cdn.viewus.co.kr/image/2025/02/CP-2023-0274/image-c77f77a0-cd31-414b-8a16-1a0f7e052709.jpeg)
![UL Procyon(AI Text Generation : ONNX-DirectML) 테스트 결과, 높을수록 좋다. / 권용만 기자](https://contents-cdn.viewus.co.kr/image/2025/02/CP-2023-0274/image-b629a18f-fb33-4dbe-be5d-51b1a5e77b60.jpeg)
![UL Procyon (AI Image Generation Benchmark : ONNX) 테스트 결과, 높을수록 좋다. / 권용만 기자](https://contents-cdn.viewus.co.kr/image/2025/02/CP-2023-0274/image-a99237c6-314e-4d41-bedd-91f30e368881.jpeg)
![전력 소비량, 단위 ‘와트(W)’, 낮을수록 좋다. / 권용만 기자](https://contents-cdn.viewus.co.kr/image/2025/02/CP-2023-0274/image-fd92e6c5-f5e6-46b6-beb2-7b3046f9ab4c.jpeg)
지포스 RTX 5090은 인공지능(AI)과 콘텐츠 제작 환경에서도 현재 선택할 수 있는 가장 강력한 도구 중 하나다. 먼저, 최신 어도비 크리에이티브 클라우드 기반의 작업 성능을 확인할 수 있는 ‘UL 프로시온(Procyon)’의 애플리케이션 테스트에서, 테스트 시스템은 이전 세대보다 제법 향상된 성능을 보인다. 특히 GPU 가속된 비디오 편집 성능에서 최신 어도비 프리미어 프로와 지포스 RTX 5090의 조합은 이전 세대에서의 성능과 상당한 격차를 보인 점이 인상적이다.
AI 성능에서는 체급에서 오는 뛰어난 성능과 초기 지원 미비에 따른 아쉬움이 교차한다. 먼저, UL 프로시온의 ‘AI 텍스트 생성 벤치마크’에서는 여타 지포스 RTX 40 시리즈 카드 대비 뛰어난 성능을 선보인다. AI 이미지 생성 벤치마크에서도 지포스 RTX 5090은 같은 조건이라면 이전 세대 대비 높아진 성능을 보인다.
하지만 테스트 시점에는 주요 벤치마크에서 지포스 RTX 5090은 엔비디아 GPU 기반 환경의 장점인 ‘텐서RT’ 기반 테스트가 실행되지 않는 모습이 있었다. 이전 세대까지는 ONNX와 다이렉트ML 기반 환경에서의 성능과 텐서RT 기반 성능의 격차가 제법 큰 편이었고, 이전 세대의 텐서RT 기반 결과가 최신 세대의 다이렉트ML 기반 환경의 결과보다 높을 수도 있다. 이러한 부분은 소프트웨어 지원이 개선돼 양쪽 모두 ‘텐서RT’를 사용할 수 있을 때 다시 평가할 필요가 있겠다.
전력 소비량은 아무래도 다소 부담이 느껴질 법 하다. 지포스 RTX 5090은 4K 60Hz 모니터를 사용하는 상황에서 유휴 상태의 전력 소비량은 10~20W 수준으로 전력 관리가 잘 되지만, 유튜브 4K나 8K급 영상을 시청할 때의 소비전력은 대략 70W까지 오른다. 그리고 게이밍 환경시에는 3D마크나 사이버펑크 2077서 최대 소비 전력량을 빠듯하게 채우는 모습이다. 한편, DLSS 퍼포먼스 모드의 다중 프레임 생성 기능은 더 부드러운 움직임을 제공하면서도 소비전력량을 500W 정도로 줄여 주는 효과가 있다.
![미래 지향적 방향성을 경쟁력으로 갖춘 지포스 RTX 5090 / 권용만 기자](https://contents-cdn.viewus.co.kr/image/2025/02/CP-2023-0274/image-01fc2cf8-f277-43f6-b61c-973313095ed4.jpeg)
엔비디아 지포스 RTX 5090은 단순히 최고 사양의 게이밍용 GPU가 아니라 데이터센터와 PC, 워크스테이션 시장 모두에 있어 새로운 아키텍처의 가능성과 접근성을 제시하는 전략적 위치에 있다. 이는 엔비디아가 책정한 가격대에서도 볼 수 있다. 엔비디아가 제시한 1999달러(약 289만원)이나 서드파티 카드의 300~400만원대 가격은 일반적인 게이머들에겐 접근하기 어려운 수준에 이르렀지만 AI나 콘텐츠를 다루는 워크스테이션 시장에서 보면 최신 기술에 접근할 수 있는 가장 빠르고 저렴한 방법으로 보일 수도 있을 것이다.
엔비디아가 데이터센터에서부터 선보인 ‘블랙웰’ 아키텍처는 연산 성능에서 큰 기대를 받았지만 이를 제대로 활용하기 위해서는 기존과는 다른 방향성이 필요해 보인다. 이는 엔비디아가 ‘AI 그래픽 렌더링 시대’를 선언한 이유에서도 중요한 부분을 차지할 것으로 짐작된다. 이제 무작정 네이티브 렌더링을 고집하기보다는 AI 기반 기술을 활용해 체감 만족도를 높이는 것이 더 현실적일 수 있을 것이다. 이에 지포스 RTX 50 시리즈는 아키텍처 측면에서도 GPU의 중심이 ‘그래픽’에서 ‘연산’으로 넘어가는 계기를 만들 것으로도 기대된다.
블랙웰 아키텍처 기반의 ‘그래픽카드’인 지포스 RTX 5090은 이제 전통적인 ‘그래픽처리장치(GPU)’와 ‘AI 그래픽 연산 가속기’의 사이에 선 모습이다. 사실 전통적인 ‘래스터’ 그래픽 성능을 기준으로 하면 이전 세대보다 카드 단위의 성능은 분명 좋아졌지만, 아키텍처 단위에서는 의문 부호가 붙는다. 텐서 코어의 성능에서도 성능 향상은 ‘FP4’에 집중된 모습으로 소프트웨어의 최적화가 전제되어야 한다. 이런 점들은 사실 십수년 전부터 ‘CPU’ 업계의 아키텍처 개선에 따른 고민이었고 이제는 ‘GPU’도 이 고민을 받아든 모양새다.
지포스 RTX 5090을 마주하는 사용자의 만족도는 ‘상황’에 따라 달라질 것으로 보인다. GPU에서도 예전의 원시 연산 성능 기준으로는 기존의 성능 향상 추이를 더이상 이어갈 수 없는 상황에 이른 것은 분명해 보인다. 하지만 새로운 AI 기반 기술들로 즉각적인 돌파구를 찾아냈고 지포스 RTX 50 시리즈는 이러한 방향성에 집중하고 있다. 이 방향성을 어떻게 평가하느냐에 따라 지포스 RTX 50 시리즈는 혁신적일 수도, 아닐 수도 있다. 소프트웨어의 적극적 지원을 어떻게 이끌어내느냐도 지포스 RTX 50 시리즈의 미래에 중요한 관전 포인트가 될 것이다.
권용만 기자
yongman.kwon@chosunbiz.com
댓글0