Radeon Vega : un point chaud mystère, des cartes mal montées ?

Un point chaud sur certaines cartes

Image 1 : Radeon Vega : un point chaud mystère, des cartes mal montées ?Une chose est claire, nous avions bien senti le coup avant même le lancement des cartes graphiques Radeon RX Vega d’AMD, grâce à nos informations. Dans cette actualité, nous expliquions la panique des fabricants face à un montage trop complexe, particulièrement au niveau de la pression du dissipateur sur le GPU et sa mémoire HBM, à cause de packages différents, et d’un support (interposer) qui surélève la puce par rapport au PCB. Aujourd’hui, après avoir testé presque une vingtaine de Vega, nous pouvons confirmer qu’il est préférable de vérifier soi-même le montage de sa carte graphique… Notre testeur Igor Wallossek explique pourquoi.

Après avoir testé plus de 18 Radeon RX Vega, (certaines plusieurs fois, pour évaluer les améliorations apportées par le constructeur), il nous est apparu un certain nombre de problèmes récurrents, et nous avons pu aussi en discuter avec des contacts ingénieurs de l’industrie. La manière d’appliquer la pâte thermique, son degré de viscosité, mais aussi la manière d’opérer pour fixer le système de refroidissement au PCB, ainsi que la pression nécessaire, jouent en effet un rôle central dans l’apparition de points chauds, et surtout sur la stabilité de la carte. 

Le mystérieux point chaud, ou comment surchauffer au repos

Confronté à de nombreuses reprises à des arrêts brutaux et inexplicables causés des problèmes de refroidissement, nous avons démonté un nombre important de cartes et comparé les différences de performance obtenues en effectuant un remontage dans un ordre différent, et différentes méthodes d’application de la pâte thermique. La quantité de pâte utilisée joue d’ailleurs un rôle crucial, comme nous le verrons plus tard. Mais commençons avec un graphique illustrant le problème auquel nous étions confrontés sur certaines cartes.

Les ventilateurs de toutes les cartes réagissent à la mesure de la température que l’on peut aussi lire dans Wattman et GPU-Z comme étant la « température GPU ». Nous avons pourtant eu affaire à des cartes qui, malgré une température GPU annoncée très basse, avec parfois même les ventilateurs à l’arrêt, souffraient d’arrêts d’urgence. Alors d’où peut venir ce comportement curieux ?  Voici les résultats obtenus lors de nos mesures sur une de ces cartes à problèmes :

Image 2 : Radeon Vega : un point chaud mystère, des cartes mal montées ?

Outre le capteur GPU et celui de la mémoire HBM2, il existe également un capteur pour le point chaud mystérieux (hotspot), sans qu’on sache exactement où il se trouve. Nous soupçonnons sa présence entre l’interposer et le package du GPU, plutôt du côté des deux blocs de mémoire HBM2.

À cause du montage du package, il peut se créer un espace sous l’interposer. Si la pression n’est pas assez importante, il peut se créer localement une accumulation de chaleur, qui n’est que partiellement retranscrite par la sonde de température GPU. Nous avons pu mesurer un point chaud montant à 106°C, et même 110°C en test de torture, juste avant l’activation de l’arrêt d’urgence !

Mais ces températures extrêmes peuvent aussi avoir lieu au repos quand les ventilateurs sont à l’arrêt. Certains constructeurs, de peur qu’un pourcentage trop important de cartes ne soit affecté par ce problème de montage délicat, ont tout simplement décidé de supprimer le mode semi-passif. Mais c’est masquer les symptômes plutôt que de traiter le mal… Une vraie solution se fait attendre.

Image 3 : Radeon Vega : un point chaud mystère, des cartes mal montées ?

La photo ci-dessus montre une carte Vega assemblée sur une chaîne de montage. On constate que la couche homogène de pâte thermique peut se craqueler, de sorte que la surface de contact avec le bloc de refroidissement est inégalement répartie. Ce problème existe même avec une pâte thermique appropriée, et en quantité suffisante. D’autres facteurs jouent ici un rôle, comme la surface plus ou moins lisse du GPU, mais aussi la main humaine responsable du montage final du dissipateur… Du coup, le problème peut arriver de manière assez aléatoire, selon certains exemplaires, comme nous avons pu le constater à plusieurs reprise.

Nos solutions

Bien appliquer la pâte thermique

Les fabricants ont massivement recours à une pâte thermique assez visqueuse pour la RX Vega, en raison des problèmes d’underfill : l’écart entre la hauteur du GPU et de la RAM HBM, que la pâte thermique doit combler. La couche de pâte thermique, plus importante que de coutume, est ensuite pressée et comble ainsi les creux éventuels à la surface.

Image 4 : Radeon Vega : un point chaud mystère, des cartes mal montées ?

Nous avons comparé nous-mêmes plusieurs pâtes thermiques, allant du très liquide au très visqueux, pour aboutir au même constat que les constructeurs : il faut recouvrir complètement la surface d’une couche de pâte visqueuse. Ce n’est pas si facile, car ce type de pâte ne se laisse pas appliquer uniformément, et il n’est pas question non plus de vider son tube !

Un conseil donc avant application : réchauffer la pâte à un peu plus de 50°C. À cette température, elle devient bien plus facile à manipuler et à appliquer. La Gelid GC Extreme est un excellent choix pour qui ne souhaite pas se ruiner. Les plus ambitieux se tourneront vers la Kryonaut de Thermal Grizzly, gagnante de notre comparatif de pâtes thermiques, qui permettra peut-être de gagner encore un degré. Les deux pâtes ont un degré de viscosité similaire.

Bien appliquer le dissipateur

L’étape suivante est tout aussi cruciale. Il s’agit d’appliquer le PCB sur le radiateur de la manière la plus parallèle possible et d’éviter tout mouvement superflu. Il ne faut pas non plus appliquer de pression sur la carte : c’est le vissage qui s’en chargera plus tard. Le vissage d’une carte classique a lieu généralement en diagonale (en croix) à l’aide d’un tournevis dynamométrique, afin d’exercer une pression adéquate et uniforme… Mais pas sur la RX Vega.

Image 5 : Radeon Vega : un point chaud mystère, des cartes mal montées ?

Le montage de la carte a lieu en plusieurs étapes chez la plupart des fabricants. Observons l’image ci-dessus, utile pour les explications qui suivent. Le GPU est placé ici en haut du package, la mémoire HBM2 (et le fameux point chaud) un peu plus bas. Il faut donc d’abord visser les deux vis du haut (en jaune) alternativement jusqu’à ce qu’une légère pression soit nécessaire. On répète ensuite le même procédé pour les deux vis du bas (en violet).

Une fois toutes les vis en place, on peut fixer plus fermement les vis du haut, puis celles du bas. Après ce montage, nous avons coutume d’effectuer un tour de chauffe de la carte jusqu’à environ 70°C, puis de débrancher la prise d’alimentation, afin d’éviter que les ventilateurs ne refroidissent trop la carte et la pâte thermique. Tout de suite après, nous vissons une dernière fois les vis du haut, puis celles du bas. Attention tout de même à ne pas forcer ! Windows 10 devrait survivre à cette maltraitance si elle ne reste que ponctuelle. Ce protocole achevé, on a une carte parfaitement montée, et le risque de point chaud est écarté.

Résultat

Image 6 : Radeon Vega : un point chaud mystère, des cartes mal montées ?

Comme on le voit sur ce graphique, le jeu en vaut la chandelle, puisque sur la même carte, on obtient des résultats complètement différents ! Les ventilateurs tournent bien moins vite (ayant certes pour conséquence une température GPU un peu supérieure), la fréquence Boost augmente de 80 MHz et le point le plus chaud a surtout perdu presque 20 degrés, à 78°C ! En test de torture, on n’atteint pas les 80°C, soit 30°C de moins ! Ça vaut bien un (re)montage en bonne et due forme ! La carte est alors totalement stable, évidemment.
 
Pour l’application de la pâte thermique, à tous les adeptes du grain de riz, du petit ou du gros pâté, de la ligne droite ou de la croix : oubliez cela avec la RX Vega ! L’énorme package à base de composants très différents a besoin de soins tout particuliers. Notre méthode peut sembler un peu compliquée, mais elle a fait ses preuves au point que certains fabricants suivent déjà cette procédure lors du vissage de leurs cartes. Nous nous excusons à ce titre auprès des visseurs et visseuses des chaînes de montage, qui aimeraient bien un peu moins de monotonie dans leur tâche. Quant aux joueurs, ils vous remercient !

Moralité de l’histoire :

Image 7 : Radeon Vega : un point chaud mystère, des cartes mal montées ?