모든 RTX 50 시리즈 GPU에 영향을 미치는 핫스팟 문제 발견 - 수명을 저하
본문
Igor"s Lab, 모든 RTX 50 시리즈 GPU에 영향을 미치는 핫스팟 문제 발견 - 그래픽카드 수명을 저하시킬 수 있다고 밝히다
Igor"s Lab은 RTX 5060 Ti와 같은 저가형 GPU를 포함한 모든 엔비디아 블랙웰 RTX 50 시리즈 그래픽 카드에서 우려스러운 현상을 발견했습니다. 해당 매체가 게시한 장문의 블로그 게시물에 따르면, 거의 모든 RTX 50 시리즈 AIB 파트너 카드의 전원 공급 영역에서 고온 핫스팟이 발생하기 쉬운 것으로 알려졌으며, 이는 장시간 집중적인 사용 후 그래픽 카드를 손상시킬 수 있습니다.
문제는 해당 그래픽 카드의 전원 공급 시스템 구조에 있습니다. Igor"s Lab은 FET, 코일, 드라이버, 그리고 모든 부품을 연결하는 배선 등 전원 공급 시스템을 구성하는 여러 부품들이 너무 가까이 모여 있어 온도가 상승하여 카드 수명 동안 전원 공급 시스템을 저하시킬 수 있으며, 단 몇 년 만에 카드가 고장날 수도 있다고 밝혔습니다.
예를 들어 PCB는 전원 플레인과 연결된 여러 개의 얇은 구리 층으로 구성됩니다. 이로 인해 보드, 특히 전압 변환기 주변의 열 밀도가 높아집니다. GPU의 전원 레일에 전력을 공급하는 전원 공급 부품(앞서 언급한 FET, 코일, 드라이버 등)은 설계를 최대한 컴팩트하게 유지하기 위해 PCB에서 서로 너무 가깝게 배치되는 경우가 많으며, 이는 열 성능 저하로 이어집니다.
이러한 PCB의 매우 컴팩트한 특성은 전원 공급 시스템의 온도 출력을 증가시켜 RTX 50 시리즈 그래픽 카드의 수명을 저하시킬 수 있는 핫스팟을 발생시키는 것으로 알려져 있습니다. 보드 파트너는 서버 및 산업용 GPU에 흔히 사용되는 내구성이 뛰어난 소재를 사용하여 이 문제를 해결할 수 있습니다. 그러나 이러한 소재의 생산 비용이 너무 높아 보드 파트너가 소비자용 그래픽 카드에 이러한 소재를 적용하기에는 무리가 있다는 의견이 있습니다.
Igor"s Lab이 지적하는 또 다른 문제는 엔비디아의 열 설계 가이드(TDA)의 결함입니다. 이 가이드는 모든 엔비디아 애드인 보드 파트너를 위해 제작된 문서로, 엔비디아 레퍼런스 PCB 설계를 위한 열 계획 문서 역할을 하며, AIB(엔비디아 그래픽 카드 설계자)가 적절하게 냉각되는 엔비디아 그래픽 카드를 개발할 수 있도록 지원합니다. Igor"s Lab은 엔비디아 RTX 40 시리즈 가이드의 결함을 지적하며, 이 문서의 많은 매개변수가 최악의 시나리오에 최적화된 것이 아니라 이상적인 환경 조건에서 지정되었음을 밝혔습니다.
Igor"s Lab은 PNY RTX 5070과 Palit RTX 5080 Gaming Pro OC를 열 카메라 아래에 배치하여 앞서 언급한 열 문제를 시연했습니다. RTX 5080 Gaming Pro OC는 후면 디스플레이 출력과 GPU 다이 사이에 위치한 주요 NVVDD 바로 위에 80.5°C의 핫스팟 영역이 있는 것으로 확인되었습니다. 반면 GPU 코어는 70°C였습니다.
PNY RTX 5070은 훨씬 더 심각했는데, PCB가 훨씬 짧아 같은 면적에서 107.3°C를 기록했습니다(GPU 코어는 69.7°C로 훨씬 더 낮았음). 모든 전원 공급 구성 요소가 디스플레이 출력과 GPU 사이에 위치하여 핫스팟이 RTX 5080(전원 공급 구성 요소가 PCB의 오른쪽, 위, 왼쪽에 분산되어 있음)보다 더 뜨거웠습니다. 가장 큰 문제는 PNY의 RTX 5070이 Palit RTX 5080보다 위상이 적어 전체 전원 공급 시스템이 더 높은 전류 밀도를 감당해야 하며, 이로 인해 온도가 상승한다는 것입니다.
두 카드 모두의 가장 큰 문제는 전원 공급 시스템을 최대한 냉각(또는 최소한 수명을 보장할 만큼 냉각)하기 위한 냉각 시스템이 제대로 작동하지 않는다는 것입니다. 두 카드 모두 핫스팟이 위치한 PCB의 전원 공급 부분을 각 GPU의 백플레이트에 연결하는 데 어떠한 종류의 써멀 패드도 사용하지 않았습니다.
이고르는 두 그래픽 카드 모두에 열 보정을 적용하여 온도가 크게 낮아졌음을 확인했으며, 특히 RTX 5070에서 두드러졌습니다. RTX 5080의 전원 공급 핫스팟 온도는 핫스팟 주변 백플레이트에 서멀 퍼티를 도포한 후 80.5°C에서 70.3°C로 낮아졌습니다. RTX 5070도 107.3°C에서 "95°C보다 훨씬 낮은" 수준으로 유지되었지만, 여전히 상당히 높은 수준입니다.
Igor"s Lab의 연구 결과는 RTX 50 시리즈 그래픽 카드의 전원 공급 영역에서 개선할 수 있는 주요 사항들을 보여줍니다. 이러한 그래픽 카드 중 다수는 VRM 주변에 GPU 다이 자체의 온도를 훨씬 초과할 수 있는 핫스팟 영역을 가지고 있습니다. 80°C는 장기적인 일렉트로마이그레이션 및 "노화 효과"가 발생할 수 있는 한계에 가깝다고 알려져 있으며, 이는 결국 이러한 그래픽 카드가 수년간 사용되면서 고장을 일으킬 수 있습니다.