엔비디아의 최신 지포스 RTX 4090 GPU를 깊이 있게 리뷰합니다. 4K 게이밍 성능의 혁신, 뛰어난 레이 트레이싱 성능, Ada 러브레이스 아키텍처의 강력한 성능을 소개합니다. 고급 게이머와 크리에이터를 위한 최적의 선택, RTX 4090의 모든 것을 확인하세요.
장점 | 단점 |
4K 게이밍 성능의 비약적인 향상 | 매우 비싼 가격 |
뛰어난 레이 트레이싱 성능 | DLSS 3 이미지 품질에 약간의 작업이 필요함 |
높은 전력과 발열, 하지만 관리 가능한 수준 | |
DLSS 3 성능은 차트에서 벗어남 |
엔비디아의 새로운 Ada 러브레이스 아키텍처를 탑재한 RTX 4090은 논란에 휩싸여 GPU 가격 상승의 대표 주자로 꼽히고 있습니다. 하지만 가격만큼이나 뛰어난 성능, 특히 DLSS 3의 향상된 기능을 제공합니다. 돈을 아끼고 자동차를 팔아서 이 괴물 같은 GPU를 구입해야 할까요? 아마 아닐 겁니다. 하지만 이 기술이 실제로 얼마나 멀리 갈 수 있는지를 보여주는 흥미로운 쇼케이스임에는 분명합니다.
MSI 지포스 RTX 4090 슈프림X D6X 24GB 트라이프로져3S | 에이수스 TUF Gaming 지포스 RTX4090 O24G OC D6X 24GB | [emTek] GeForce RTX 4090 GAMEROCK D6X 24GB 이엠텍 |
상세스펙 보기 | 상세스펙 보기 | 상세스펙 보기 |
엔비디아 RTX 4090 사양
앞서 언급했듯이 RTX 4090은 엔비디아의 새로운 에이다 러브레이스 아키텍처와 칩 제조업체 TSMC의 보다 효율적인 N4 제조 공정을 도입했습니다. RTX 4090을 이전 세대와 사양별로 비교하는 것은 불가능하지만, 엔비디아가 Ada 러브레이스를 설계할 때 무엇을 우선시했는지에 대한 몇 가지 인사이트를 얻을 수 있습니다.
주요 초점은 클럭 속도입니다. RTX 3090 Ti의 최고 클럭은 약 1.8GHz였지만, RTX 4090은 2.52GHz의 부스트 클럭으로 새로운 노드의 효율성을 보여줍니다. 이는 450와트의 동일한 보드 전력을 사용하지만 더 많은 코어에서 실행됩니다. RTX 3090 Ti는 CUDA 코어가 11,000개에 조금 못 미쳤지만, RTX 4090은 16,384개의 CUDA 코어를 제공합니다.
RTX 4090 | RTX 3090 | |
아키텍처 | Ada 러브레이스 | 암페어 |
프로세스 노드 | TSMC N4 | 8nm 삼성 |
CUDA 코어 | 16,384개 | 10,496개 |
레이 트레이싱 코어 | 144 3세대 | 82 2세대 |
텐서 코어 | 576 4세대 | 328 3세대 |
기본 클럭 속도 | 2235MHz | 1394MHz |
부스트 클럭 속도 | 2520MHz | 1695MHz |
V RAM GDDR6X | 24GB | 24GB |
메모리 속도 | 21Gbps | 19.5Gbps |
버스 폭 | 384비트 | 384비트 |
TDP | 450W | 350W |
특히 게임에서 추가 코어가 얼마나 중요한지 말하기는 어렵습니다. 스택 아래로 내려가면 16GB RTX 4080은 RTX 4090에 비해 코어 수가 절반이 조금 넘고, 12GB RTX 4080은 그보다 더 적습니다. 클럭 속도는 여전히 빠르지만, 현재 RTX 40 시리즈 제품군의 사양을 보면 적어도 게임에서는 코어 수 증가가 주요 판매 포인트가 되지는 않을 것으로 보입니다.
합성 및 렌더링
전체 벤치마크 제품군을 살펴보기 전에 성능을 개략적으로 살펴보겠습니다. 3D Mark의 포트 로얄과 타임 스파이는 엔비디아의 최신 플래그십이 어떻게 잘 확장되는지 보여주며, 타임 스파이에서는 RTX 3090 Ti에 비해 58%, 포트 로얄에서는 RTX 3090에 비해 102% 향상된 성능을 보여줍니다.
3DMark는 대부분의 게임보다 CPU를 훨씬 더 많이 고려하기 때문에(특히 4K에서) 성능을 판단하는 가장 좋은 방법은 아니라는 점에 유의하는 것이 중요합니다. 하지만 RTX 4090의 경우 3DMark는 스케일링을 잘 보여줍니다. 실제로 실제 게임에서의 결과는 적어도 레이 트레이싱을 제외하면 이 합성 벤치마크가 제시하는 것보다 약간 더 높습니다.
또한 RTX 4090으로 몇 가지 콘텐츠 제작 작업을 측정하기 위해 Blender를 테스트했는데, 그 개선은 놀라웠습니다. Blender는 엔비디아의 CUDA 코어를 통해 가속화되며, RTX 4090은 몬스터 및 정크샵 장면에서 RTX 3090 및 RTX 3090 Ti의 두 배 이상의 점수를, 교실 장면에서는 두 배 미만의 점수를 기록하는 등 이러한 유형의 워크로드에 특히 최적화되어 있는 것으로 보입니다. CUDA가 없는 AMD의 GPU는 이에 근접하지도 못합니다.
4K 게임 성능
핵심적인 부분으로 넘어가겠습니다. 모든 테스트는 야외 테스트 벤치에서 Ryzen 9 7950X와 32GB DDR5-6000 메모리로 수행되었습니다. 테스트 내내 크기 조정 가능 바를 켜두거나 AMD GPU의 경우 스마트 액세스 메모리를 켜두었습니다.
RTX 4090은 물리적으로도 괴물이지만 4K 게이밍 성능에 있어서도 괴물입니다. 데이터가 불완전한 브라이트 메모리 인피니트 및 호라이즌 제로 던을 제외한 모든 테스트에서 RTX 4090은 RTX 3090 Ti보다 68% 더 빨랐습니다. RTX 3090과 비교하면 거의 89%나 빨라진 것입니다.
이는 RTX 3080 출시 당시 세대 간 30% 향상보다 훨씬 더 큰 폭의 향상입니다. 그리고 이 수치에는 업스케일링이 고려되지 않았습니다. 이는 레이 트레이싱을 포함한 원시 성능이며, RTX 4090은 이전 세대에 비해 크게 앞서고 있습니다.
아마도 가장 인상적이었던 것은 사이버펑크 2077이었을 것입니다. RTX 4090은 4K에서 최대 설정으로 RTX 3090 Ti보다 50% 이상 빠르며, 이는 충분히 인상적인 수치입니다. 하지만 RTX 4090이 초당 60프레임(fps)을 구현한다는 점이 가장 눈에 띄었습니다. 이전 세대의 가장 강력한 그래픽 카드조차도 딥 러닝 슈퍼 샘플링(DLSS)의 도움 없이는 60fps를 넘지 못했습니다. RTX 4090은 모든 픽셀을 렌더링하면서 그 장벽을 깰 수 있으며, 상당히 앞서 있습니다.
기어스 택틱스에서도 RTX 4090은 73%의 우위를 점하며 RTX 3090 Ti를 제치고 승리했습니다. 레드 데드 리뎀션 2와 같은 벌칸 타이틀에서는 이득이 더 적지만, 테스트 결과 RTX 4090은 여전히 52%의 선두를 유지했습니다. 이는 한 세대를 뛰어넘는 엄청난 성능 향상이지만, Nvidia가 원래 약속했던 성능에는 여전히 미치지 못합니다.
엔비디아는 RTX 4090이 RTX 3090 Ti보다 "2~4배 더 빠르다"고 마케팅했지만 이는 사실이 아닙니다. 이전 최고 제품보다 훨씬 빠르긴 하지만, 엔비디아의 주장은 DLSS 3를 고려할 때만 의미가 있습니다. DLSS 3는 인상적인데, 이 리뷰의 뒷부분에서 다룰 것입니다. 하지만 모든 게임에서 사용할 수 있는 것은 아니며 아직 보완해야 할 부분이 있습니다. 다행히도 RTX 4090의 기본 성능으로 인해 DLSS는 "있으면 좋은 기능"이 아니라 "꼭 필요한 기능"이 되었습니다.
어쌔신 크리드 발할라, 포르자 호라이즌 5와 같은 AMD가 홍보하는 타이틀에서 RTX 4090은 여전히 강력한 성능을 보여주지만, 이제는 AMD의 RX 6950 XT와 비교해야 합니다. 4K 발할라에서 RTX 4090은 RX 6950 XT보다 63% 앞섰습니다. 포르자 호라이즌 5에서는 그 격차가 더 좁아졌는데, 이는 AMD의 현재 제품과 매우 잘 어울리는 것으로 보입니다. 하지만 이보다 적은 차이에도 불구하고 RTX 4090은 RX 6950 XT보다 48% 앞섰습니다.
이러한 비교는 인상적이지만, RTX 4090은 경쟁사와 동등한 위치에 있지 않습니다. 1,600달러인 엔비디아의 최신 플래그십 제품은 현재 사용 가능한 가장 비싼 GPU보다 훨씬 더 비쌉니다. 하지만 RTX 4090이 제공하는 성능을 고려하면 더 저렴한 RTX 3090 또는 RTX 3090 Ti보다 오히려 더 나은 선택입니다.
프레임당 비용 측면에서 보면, RTX 3080 10GB와 거의 같은 가격인 700달러입니다. 이는 애초에 RTX 4090을 구매할 여윳돈이 있다는 가정 하에 계산된 가격이며, DLSS 3와 같은 기능을 고려하지 않은 가격이기 때문에 가치를 판단하는 최선의 방법은 아니지만, 미친 소리처럼 들리겠지만 1,600달러는 RTX 4090이 제공하는 4K 성능에 비하면 꽤 합리적인 가격입니다.
이제 출시 후유증이 가라앉았으니, RTX 4080 리뷰와 RX 7900 XTX 리뷰를 읽고 RTX 4090이 다른 하이엔드 GPU와 어떻게 비교되는지 확인해 보세요.
1440p 게이밍 성능
1440p를 위해 RTX 4090을 구매하는 것은 돈을 낭비하는 것입니다(대신 최고의 1440p 그래픽 카드에 대한 가이드를 읽어보세요). 이전 세대에 비해 여전히 큰 향상을 제공하지만, 마진은 훨씬 더 적습니다. RTX 3090 Ti에 비해서는 48%, RX 6950 XT에 비해서는 68% 상승했습니다. 여전히 세대 간 차이가 크지만, RTX 4090은 4K에서 정말 빛을 발합니다.
1440p에서 CPU가 약간 제한되기 시작하고 1080p로 내려가면 결과는 더욱 타이트해집니다. 그리고 솔직히 1440p에서의 추가 성능은 4K에서처럼 눈에 띄지 않습니다. 예를 들어, 기어스 택틱스에서 RTX 4090은 RTX 3090 Ti보다 36% 더 빠르며, 이는 엔비디아의 최신 카드가 4K에서 보여준 73%보다 낮은 수치입니다. 실제 프레임 속도도 그다지 인상적이지 않습니다. 물론 RTX 4090이 RTX 3090 Ti보다 훨씬 빠르긴 하지만, 500달러 더 저렴한 GPU가 이미 160fps를 넘어서는데 기어스 택틱스에서 200fps 이상을 필요로 하는 사람은 상상하기 어렵습니다.
4K에서 RTX 4090은 사이버펑크 2077에서 DLSS 없이 60fps 이상, 어쌔신 크리드 발할라에서 고주사율 모니터의 144Hz에 근접하는 등 중요한 이정표를 달성했습니다. 1440p에서는 RTX 4090이 확실히 더 높은 수치를 보이지만, 이 수치는 실제 화면에서보다 종이에서 훨씬 더 인상적입니다.
레이 트레이싱
엔비디아는 튜링 세대부터 레이 트레이싱의 챔피언이었지만, 에이다 러브레이스는 레이 트레이싱이 대대적으로 개편된 첫 세대입니다. RTX 4090의 핵심은 성능을 향상시키고 셰이더 실행 재정렬(SER)을 도입하는 재설계된 레이 트레이싱 코어입니다. SER은 기본적으로 레이 트레이싱 연산을 처리하는 더 효율적인 방법으로, 병목 현상이 발생할 수밖에 없는 직선이 아닌 GPU 성능을 사용할 수 있을 때 실행할 수 있도록 합니다. 또한 Windows에서 하드웨어 가속 GPU 스케줄링을 켜야 합니다.
그리고 작동합니다. 레이 트레이싱의 마진은 일반적으로 훨씬 더 얇지만, RTX 4090은 실제로 레이 트레이싱을 켰을 때 더 높은 이득을 보여줍니다. 예를 들어, 사이버펑크 2077에서 RTX 4090은 울트라 RT 프리셋을 사용하는 RTX 3090 Ti보다 거의 71% 더 빠릅니다. 이는 DLSS를 고려하기 전의 수치입니다. 레이 트레이싱 성능에서 훨씬 뒤처지는 AMD의 GPU는 훨씬 더 큰 차이를 보입니다. 이 벤치마크에서 RTX 4090은 RX 6950 XT보다 무려 152% 더 빠릅니다.
마찬가지로 메트로 엑소더스 인핸스드 에디션에서는 RTX 4090이 RTX 3090 Ti보다 80% 향상되었고, 브라이트 메모리 인피니트에서는 RTX 4090이 RTX 3090보다 93% 앞서는 것으로 나타났습니다. RTX 3090 Ti보다 "2~4배 빠르다"는 엔비디아의 주장은 DLSS 3 없이는 성립되지 않을 수 있지만, 레이 트레이싱 성능은 그 수치에 훨씬 가까워졌습니다.
그리고 4K 성능과 마찬가지로 RTX 4090은 레이 트레이싱을 켰을 때 실제로 차이를 만드는 성능 향상을 보여줍니다. 브라이트 메모리 인피니트에서 RTX 4090은 높은 주사율을 활용하는 것과 간신히 60fps를 유지하는 것의 차이를 보여줍니다. 그리고 사이버펑크 2077에서 RTX 4090은 말 그대로 플레이 가능과 불가능의 차이입니다.
DLSS 3 테스트
DLSS는 지난 몇 세대 동안 RTX GPU의 슈퍼스타 기능이었지만, DLSS 3는 이 기술의 큰 변화입니다. 여기에는 광학 흐름 AI 프레임 생성이 도입되어 AI 모델이 매 프레임마다 완전히 고유한 프레임을 생성하는 것으로 요약됩니다. 이론적으로는 CPU에 의해 100% 제한을 받고 해상도가 낮아도 아무런 이점이 없는 게임도 두 배의 성능을 발휘할 수 있다는 뜻입니다.
실제 상황은 그렇지 않지만 DLSS 3는 여전히 매우 인상적입니다. 저는 먼저 DLSS를 껐다가 켠 상태에서 Port Royal 벤치마크를 실행하는 3DMark의 DLSS 3 테스트로 시작했습니다. 이 기능을 최대한 활용하는 것이 목표였기 때문에 DLSS를 울트라 성능 모드로 설정하고 해상도는 8K로 설정했습니다. 이 기술은 프레임 속도를 578%까지 끌어올리며 DLSS 3의 성능을 가장 잘 보여줍니다. 정말 대단하죠.
실제 게임에서는 그다지 큰 차이가 나지 않지만, DLSS 3는 여전히 인상적입니다. 엔비디아는 전염병 이야기: 레퀴엠의 초기 빌드를 제공했는데, DLSS는 설정을 최대로 설정한 상태에서 4K에서 평균 프레임 속도를 128%까지 끌어올렸습니다. 그리고 이는 DLSS의 자동 모드를 사용했을 때였습니다. 더 공격적인 화질 프리셋을 사용하면 이보다 더 높은 성능을 얻을 수 있습니다.
전염병 이야기: 레퀴엠은 DLSS 3의 중요한 측면을 드러냈는데, 바로 상당한 양의 오버헤드가 발생한다는 점입니다. DLSS 3는 두 부분으로 구성되어 있습니다. 첫 번째 부분은 DLSS 고해상도로, 이전 세대의 RTX에서 보셨던 것과 동일한 DLSS입니다. RTX 20 시리즈 및 30 시리즈 GPU에서 계속 작동하므로 이전 세대 카드가 있는 게임에서도 DLSS 3 Super Resolution을 사용할 수 있습니다.
DLSS 프레임 생성은 두 번째 부분으로, RTX 40 시리즈 GPU에서만 사용할 수 있습니다. AI는 매 프레임마다 새로운 프레임을 생성하지만, 이는 계산 비용이 많이 듭니다. 그렇기 때문에 프레임 생성을 켤 때마다 Nvidia Reflex가 강제로 켜지고 끌 수 없습니다.
프레임 제너레이션의 작동 원리를 이해한다면 슈퍼 해상도만 사용했을 때보다 두 배의 프레임 속도를 제공해야 하지만 실제로는 그렇지 않습니다. 아래 사이버펑크 2077에서 볼 수 있듯이 프레임 생성 결과를 보면 GPU는 약 65개의 프레임만 렌더링하고 나머지는 AI에서 렌더링합니다. 슈퍼 해상도를 단독으로 사용하면 이 결과는 30프레임 가까이 증가합니다. 이것이 바로 DLSS 프레임 생성 오버헤드입니다.
프레임 제너레이션이 최고의 성능을 제공하는 것은 분명하지만, 그렇다고 해서 슈퍼 해상도를 쓸모없는 것으로 간주해서는 안 됩니다. 프레임 생성은 DLSS 프레임 속도를 두 배로 높여주는 것처럼 보이지만, 실제로는 그 자체로 슈퍼 해상도에 훨씬 더 가깝습니다.
이미지 품질을 떼어놓고 DLSS에 대해 이야기할 수는 없으며, DLSS 3은 인상적이지만 이미지 품질 부문에서는 여전히 약간의 작업이 필요합니다. 다른 모든 프레임은 GPU에서 생성되어 디스플레이로 바로 전송되기 때문에 HUD와 같은 요소를 우회할 수 없습니다. 아래 사이버펑크 2077에서 볼 수 있듯이 이러한 요소는 생성된 프레임의 일부이며, 아티팩트가 발생하기 쉽습니다. 움직이는 퀘스트 마커가 화면을 가로질러 움직일 때 AI 모델이 픽셀을 어디에 배치해야 할지 잘 모르기 때문에 픽셀이 튀어나옵니다. 일반적으로 HUD 요소는 DLSS의 일부가 아니지만, 프레임 생성에서는 이를 고려해야 합니다.
실제 씬에서도 동일한 동작이 나타납니다. 전염병 이야기: 레퀴엠을 예로 들면, 풀밭을 달리면 AI가 풀을 어디에 배치하고 다리를 어디에 놓을지 고민하면서 픽셀 연옥의 얇은 층이 생성되는 것을 볼 수 있습니다. 마찬가지로 포트 로얄은 부드러운 가장자리와 많은 픽셀 불안정성을 보였습니다.
이러한 아티팩트는 움직일 때 가장 잘 보이기 때문에 아래에서 볼 수 있는 4K 영상을 120fps로 캡처했습니다. 최대한 많은 프레임을 볼 수 있도록 DLSS 비교 속도를 50% 낮췄지만, YouTube의 압축과 게임플레이를 캡처할 때 실제 화질과 비교하기 어렵다는 사실을 염두에 두세요. 실제로 보는 것이 가장 좋습니다.
게임을 플레이하는 동안 DLSS 3로 인해 발생하는 이미지 품질 저하가 성능 향상으로 인해 쉽게 상쇄됩니다. 하지만 프레임 생성은 항상 켜두어야 하는 설정은 아닙니다. 레이 트레이싱과 모든 시각적 효과를 극대화할 때 가장 효과적입니다. 앞으로 개선되기를 바랍니다. 저는 엔비디아가 프레임 생성 측면을 계속 개선할 것이라고 확신하지만, 현재로서는 여전히 가장자리가 약간 닳아 없어 보입니다.
전원 및 발열
RTX 4090이 발표되기 전, 루머 공장에서는 음란한 전력 수요에 대한 추측이 난무했습니다. RTX 4090은 파운더스 에디션의 경우 450W, 에이수스 ROG Strix RTX 4090과 같은 보드 파트너 카드의 경우 그보다 더 많은 전력을 소비하지만, RTX 3090 Ti가 소비한 전력보다 더 많지는 않습니다. 그리고 제 테스트에 따르면, RTX 4090은 실제로 전력 소모가 조금 더 적었습니다.
아래 차트는 테스트 중 측정한 최대 전력 소모량을 보여줍니다. 이것은 최대 전력이 아니며, 전용 스트레스 테스트에서는 RTX 4090이 더 높은 전력을 소비하지만, 게임은 스트레스 테스트가 아니며 항상 최대 전력에 도달하거나 그에 근접하지는 않습니다. 다른 파운더스 에디션 모델과 비교했을 때, RTX 4090은 실제로 RTX 3090 Ti보다 약 25W를 더 적게 소비했습니다. 하지만 오버클럭된 보드 파트너 카드는 더 높아질 수 있으므로 이를 염두에 두시기 바랍니다.
열의 경우, RTX 4090은 제 테스트 스위트에서 섭씨 64도에서 정점을 찍었는데, 이는 적정 온도에 근접한 수치입니다. 클럭 속도와 코어 수가 더 작은 RTX 3080 Ti는 78도에서 최고치를 기록하며 가장 높은 열 결과를 보여주었습니다. 하지만 이 수치는 모두 야외 테스트 벤치에서 수집한 것이므로, RTX 4090을 케이스에 넣으면 온도가 더 높아질 것입니다.
엔비디아 RTX 4090을 구매해야 할까?
GPU에 1,600달러가 있다면 RTX 4090을 구매해야 합니다. 하지만 대부분의 사람들은 그래픽 카드에 1,600달러를 쓸 여유가 없기 때문에 RTX 4090이 까다로워집니다.
RTX 4090이 얼마나 강력한지, 1,600달러가 비교적 합리적인 가격인지, DLSS 3가 게임 성능을 어떻게 크게 향상시키는지 차트를 통해 보여드릴 수 있습니다. 하지만 RTX 4090은 많은 풀 게이밍 PC보다 비싸다는 사실은 변함이 없습니다. 이는 대부분의 사람들이 구매할 수 있는 그래픽 카드와는 거리가 멀다. 대부분의 매니아를 위한 그래픽 카드도 아닙니다.
RTX 4090은 그만한 가치가 있지만, 그렇다고 해서 반드시 구매해야 한다는 의미는 아닙니다. RTX 4080 모델은 11월에 출시될 예정이며, AMD는 11월 3일에 RX 7000 GPU를 출시할 예정입니다. 대부분의 사람들에게 최선의 선택은 기다리는 것입니다. 우리는 또 다른 GPU 부족 사태로 향하고 있지 않으므로, 이 카드가 출시되면 RTX 4090이 더 비싸질 것이라고 믿을 이유가 없습니다.
단순히 최고라는 이유만으로 최고를 원하는 소수의 사람이라면, RTX 4090이 그 타이틀을 굳건히 지키고 있습니다. RTX 4090은 평균적인 PC 게이머가 지출하고자 하는 비용보다 훨씬 비싸지만, 평균적인 그래픽 카드보다 훨씬 더 비쌉니다.
'IT 지식' 카테고리의 다른 글
삼성 갤럭시 S24 체험 후기: AI 기능 강화 및 디스플레이 업그레이드 (0) | 2024.01.25 |
---|---|
삼성 갤럭시 S24 울트라 리뷰 - AI 혁신과 티타늄 디자인의 결합 (0) | 2024.01.25 |
2024년 4K 게이밍을 위한 최고의 그래픽카드 GPU 추천 (0) | 2024.01.24 |
삼성 갤럭시 모드 및 루틴 앱 기능 5가지 활용법 (0) | 2023.05.18 |
2022년 최고의 게임(게이밍 모니터) 및 업무용 모니터 (0) | 2022.09.05 |