Test : étude de la RX Vega 64 sous watercooling extrême

Introduction, système de test

On a beaucoup spéculé ces derniers temps sur les gains potentiels obtenus sur la Radeon RX Vega 64 en combinant overclocking et baisse manuelle de tension. Cet article se propose de tester ce qui se passe au niveau du couple fréquence-tension une fois qu’on élimine complètement le facteur température. Histoire d’en avoir le coeur net !

Des mesures nombreuses à interpréter

Mais comment allons-nous nous y prendre ? Afin de mieux comprendre comment ces paramètres interagissent, il nous faut d’abord rappeler un peu de théorie et se souvenir de la manière dont AMD PowerTune fonctionne. Ce système contrôle en temps réel les principaux facteurs influençant la performance du GPU, en se basant sur les températures communiquées par les sondes thermiques et les infos fournies par le régulateur de tension. Ces données sont traitées puis transmises au gestionnaire DPM (Digital Power Management Arbitrator), un contrôleur qui va faire la part de choses.

Cet arbitre se base sur les limites en termes de consommation, température et tension maximales du GPU présentes dans le BIOS, les pilotes et les programmes de contrôle. Il modifie alors les tensions, fréquences et la vitesse de rotation des ventilateurs afin d’obtenir la performance maximum possible tout en restant dans les limites fixées. Si une température dépasse l’une des limites, le système peut dont automatiquement diminuer la tension et/ou la fréquence.

Image 1 : Test : étude de la RX Vega 64 sous watercooling extrême

L’enjeu de ce système complexe, c’est de pouvoir répondre en temps réel (ou quasiment) aux besoins en courant à l’aide de VRM adaptés. Pour communiquer avec ces contrôleurs, AMD utilise le protocole SVI2 qui est maintenant maîtrisé par la plupart des acteurs et est aussi présent sur les APU de la marque (la partie CPU étant elle gérée par le Northbridge de la carte mère).

En refroidissant la carte à l’aide de notre système de refroidissement spécial (composé de notre compresseur Alphacool Eiszeit 2000 Chiller et d’un bloc de watercooling EK-FC Radeon Vega d’EKWB) avec une eau dont la température reste constante à 20°C, nous pouvons donc éliminer la température comme élément limitant.

Pour nos tests, nous utiliserons The Witcher 3 : Wild Hunt en 4K, qui représente une sorte de « scénario du pire » de ce qu’on peut attendre d’un benchmark de jeu. La fréquence maximale ne dépend plus alors que des limites électriques en termes de tension, d’intensité et bien sûr de consommation totale, laquelle est calculée par le Power Estimation Engine.

Gestion de la tension : AMD PowerTune face NVIDIA Boost

Tout comme sur les derniers APU, la RX Vega 64 utilise le système AVFS (Adaptive Voltage and Frequency Scaling) qui, à l’instar du système NVIDIA Boost, s’adapte à chaque puce quelle que soit sa qualité de fabrication pour en tirer le meilleur parti. Chaque GPU possède donc une courbe d’évolution de la tension qui lui est propre.

Par contre, à la différence du système Boost de NVIDIA, où les modifications de tension ne sont possibles qu’à travers un offset (même un éditeur de courbe ne donne jamais le plein contrôle sur les tensions), l’outil Wattman d’AMD permet de fixer la tension à chaque niveau de charge. C’est une option à double tranchant comme on va le voir, car la tension fixe se heurte au système AVFS ce qui conduit parfois au plantage de la carte.

Nous avons pu mesurer directement sur la carte le comportement des tensions avec les réglages manuels et sans limite de consommation. Les résultats obtenus ne doivent cependant pas alimenter le mythe d’une carte otage d’une trop haute tension, puisque c’est uniquement sur des cartes refroidies par air qu’un gain de fréquence a été obtenu via une diminution manuelle de la tension. Et ce gain avait pour cause la baisse de température. Si on exclue la température comme facteur limitant, on constate que la logique « baisse de tension = hausse de la fréquence » tient en réalité de la légende urbaine.

Image 2 : Test : étude de la RX Vega 64 sous watercooling extrême

Les différents cas de figure que nous voulons tester

Nous avons décidé de tester cinq cas de figure typiques afin d’illustrer la plus large palette possible d’éventualités. Les voici :

  • réglage par défaut avec le profil « équilibré »
  • undervolting à 1 V avec le Power Limit (limite de consommation) standard
  • overclocking uniquement via l’augmentation du Power Limit de 50%
  • overclocking via augmentation du Power Limit de 50% + augmentation de 3% de la fréquence GPU
  • overclocking via augmentation du Power Limit de 50% + augmentation de 3% de la fréquence GPU + undervolting à 1 V.

Un undervolting sous les 1 V avait pour résultat une instabilité du système. Une tension de 0,95 V fonctionnait encore la plupart du temps, mais la fréquence diminuait alors de manière disproportionnée. Par contre, le système crashait systématiquement lorsqu’on lançait des programmes 3D s’approchant du Power Limit.

Système de test

Image 3 : Test : étude de la RX Vega 64 sous watercooling extrêmeImage 4 : Test : étude de la RX Vega 64 sous watercooling extrême

Plateforme
Intel Core i7-6900K @4,3 GHz
MSI X99S XPower Gaming Titanium
Corsair Vengeance DDR4-3200
1x 1 TByte Toshiba OCZ RD400 (M.2, System SSD)
2x 960 GByte Toshiba OCZ TR150 (Storage, Images)
Be Quiet Dark Power Pro 11, 850-Watt-Netzteil
Dissipation GPU
EK Water Blocks EK-FC Radeon Vega
Alphacool Eiszeit 2000 Chiller
Pâte thermique Thermal Grizzly Kryonaut
Température ambiante
22°C
Boitier
Lian Li PC-T70 modifié
EcranEizo EV3237-BK
Outils de mesures
Point de mesure sans contact sur le slot PCIe, via un riser PCIe
Point de mesure sans contact sur les connecteur PCIe d’alimentation
Mesure directe au niveau de l’alimentation
4x oscilloscopes Rohde & Schwarz HMO 3054 multicanaux, 500 MHz avec fonction mémoire
4x pinces ampèremétriques Rohde & Schwarz HZO50 (de 1 mA à 30 A, 100 KHz, courant continu)
4x sondes de test Rohde & Schwarz HZ355 (10:1, 500 MHz)
1x multimètre numérique Rohde & Schwarz HMC 8012, avec fonction mémoire
Imagerie thermique
Caméra infrarouge Optris PI640
Logiciel PI Connect

Installation et détails du waterblock

Un refroidissement optimal

Image 5 : Test : étude de la RX Vega 64 sous watercooling extrêmePour parvenir à nos fins, il nous faut donc tout d’abord réaliser un système de refroidissement capable de fournir une température constante tout en absorbant jusqu’à 400 W de chaleur. Seul un système watercooling personnalisé est capable d’une telle performance et nous avons eu à nouveau recours à notre Chiller associé à un waterblock adapté pour garantir une température de l’eau à 20°C.

Nous utilisons donc un refroidisseur Alphacool Eiszeit 2000 Chiller en combinaison avec une plaque de refroidissement EK-FC Radeon Vega de EK Water Blocks. Il s’agit d’une plaque en cuivre nickelée qui refroidit mémoire, convertisseurs de tension et bobines. Pour tout dire, le système a fonctionné à merveille.Image 6 : Test : étude de la RX Vega 64 sous watercooling extrême

Pour que le système single slot de watercooling n’ait pas l’air trop bizarre, nous remplaçons l’équerre PCI originale par une plus petite fournie avec le bloc. Seul petit souci, les vis dépassent un peu de l’équerre de remplacement, mais rien de dramatique.

Image 7 : Test : étude de la RX Vega 64 sous watercooling extrême

Une fois que l’on a soigneusement débarrassé le GPU de la pâte thermique d’origine (attention à ne pas l’endommager !) on peut appliquer une fine couche de la nouvelle pâte thermique à l’aide d’une petite spatule. Il vaut mieux laisser un peu de l’ancienne pâte thermique entre les puces plutôt que de s’acharner pour tout enlever, au risque d’endommager les fragiles composants.

Image 8 : Test : étude de la RX Vega 64 sous watercooling extrême

Contrairement à ce que préconise la notice, nous préférons appliquer les pads thermiques sur le bloc de refroidissement et pas directement sur les composants du PCB. Pour le montage, nous plaçons le PCB sur le bloc de refroidissement (et pas l’inverse), ainsi, nous sommes sûrs qu’aucun pad ne se décolle pendant la manœuvre.

Image 9 : Test : étude de la RX Vega 64 sous watercooling extrême

Une fois vissée, la carte graphique est en quelques minutes prête à l’emploi. Le montage n’est vraiment pas compliqué, pour peu qu’on fasse attention aux propriétés physiques du GPU.

Image 10 : Test : étude de la RX Vega 64 sous watercooling extrême

La face arrière du PCB révèle les nombreuses vis de fixation utilisées, il n’y en a pas moins de sept tout autour du package. Les vis reposent sur des lamelles en polyamide pour éviter toute pression excessive.

Image 11 : Test : étude de la RX Vega 64 sous watercooling extrême

Notez que pour nos tests thermiques par caméra infrarouge, nous avons enlevé la plaque arrière pour ne pas avoir à la percer aux endroits de mesures.

Image 12 : Test : étude de la RX Vega 64 sous watercooling extrême

Tensions et fréquences

Tension et fréquence

Comme nous l’avons vu, la Radeon RX Vega 64 profite grandement d’AVFS qui lui permet de garder l’équilibre entre les différents paramètres grâce à ses nombreuses mesures. On voit que dans les deux cas de figure où la limite de puissance (Power Limit) est augmentée sans toucher à la tension, cette dernière est quasiment identique. Les autres cas de figure sont plus intéressants.

Image 13 : Test : étude de la RX Vega 64 sous watercooling extrême

Nous avons donc isolé ces données dans un second graphique pour mieux les comparer. En mode « équilibré », quand le système AVFS peut à loisir adapter les différents paramètres, on voit que l’amplitude de la tension est assez grande. Intéressons-nous maintenant aux deux cas de figure où la tension a été manuellement fixée à 1 V (undervolting).

Alors qu’avec le Power Limit augmenté, la carte se contente réellement d’une tension de 1 V en moyenne, lorsque le Power Limit est laissé par défaut, la tension est clairement plus élevée ! La carte augmente la tension à un niveau nettement supérieur au mode automatique et a aussi du mal à gérer les brusques changements de charge. La tension réelle sur l’ensemble du test est donc non seulement largement au dessus du 1 V fixé, mais aussi de la tension moyenne du mode équilibré !

Image 14 : Test : étude de la RX Vega 64 sous watercooling extrême

Et pourtant, cela a des conséquences négatives sur la fréquence. On voit très clairement que lorsque la tension de la carte est fixée à 1 V sans que le Power Limit ne soit relevé, le système de télémétrie s’affole, ce qui a pour conséquence une nette baisse de la fréquence. Au contraire, une fois le Power Limit relevé, la fréquence augmente nettement et se montre très stable. Dans ce mode, la fréquence est presque aussi élevée que lorsque la tension n’est pas fixée, alors que la consommation reste nettement inférieure.

Image 15 : Test : étude de la RX Vega 64 sous watercooling extrême

La première conclusion de notre test, c’est qu’un undervolting sans augmentation du Power Limit n’apporte aucune performance supplémentaire si on ne fait pas entrer le facteur température dans l’équation.

Dans ce cas où la température n’est pas un facteur limitant, la diminution du Power Limit sans baisse manuelle de la tension est donc à privilégier dans tous les cas (par exemple en activant le mode « économies d’énergie »). Le reste n’est que superstition.

Tensions et consommation

Fort de ce premier constat sur les tensions et la fréquence, observons maintenant la consommation. On voit tout d’abord qu’AMD a enfin réussi à diminuer la consommation de la carte au repos. On relève seulement 11 W, ce qui la place au niveau de la GeForce GTX 1080 FE et constitue une nette amélioration par rapport à la consommation de repos au moment du lancement de la carte (merci aux mises à jour de pilotes).

Le graphique illustre par ailleurs aussi l’inutilité d’une baisse manuelle de la tension avec le Power Limit laissé par défaut : on économise à peine deux watts alors que la fréquence baisse dramatiquement. On reviendra plus tard sur les conséquences de ce comportement sur la performance en jeu et l’efficacité énergétique.

Image 16 : Test : étude de la RX Vega 64 sous watercooling extrême

Ce graphique montre enfin l’appétit relatif de la carte lorsque l’on combine undervolting et augmentation du Power Limit, ce qui nous confirme dans notre opinion que l’undervolting n’a de sens que lorsque le Power Limit est nettement relevé. La raison pour laquelle AMD a fixé une tension un peu trop élevée sur ses cartes est probablement économique : le fabricant maximise ainsi le nombre de GPU aptes à être vendus.

Courbes d’évolution de la consommation

Nous récapitulons ci-dessous les cinq courbes d’évolution de la consommation dans l’ordre indiqué à la première page.

Image 17 : Test : étude de la RX Vega 64 sous watercooling extrême

Image 18 : Test : étude de la RX Vega 64 sous watercooling extrême

Image 19 : Test : étude de la RX Vega 64 sous watercooling extrême

Image 20 : Test : étude de la RX Vega 64 sous watercooling extrême

Image 21 : Test : étude de la RX Vega 64 sous watercooling extrême

Températures, l’effet surprise

Des capteurs de température farceurs ?

La RX Vega 64 n’aime pas le froid. Si on la couple avec un système de refroidissement tel que celui que nous avons décrit avec une eau à 20°C, les capteurs du GPU indiquent au repos une température de seulement 16°C. Une température ressentie bien éloignée de la température réelle…

Comme on l’a vu avec les CPU Ryzen, la mesure précise de température n’est pas une des forces d’AMD, mais on se demande tout de même ce qu’il a bien pu arriver entre temps, puisque les anciennes Radeon ne posaient pas ces problèmes.

Même chose pour les 24°C relevés en pleine charge avec Power Limit et overclocking pour une charge de plus de 400 W… On aurait tendance à penser que le différentiel de température serait un peu plus élevée que 4 petits degrés.

Nous avons donc, dans un premier temps, récapitulé les prétendues « températures  GPU » communiquées dans Wattman ou GPU-Z. Pour mieux lire le graphique, nous avons regroupé le cas de figure 1 V et Power Limit standard avec celui du mode « équilibré », les deux montrant un comportement exactement identique.

Image 22 : Test : étude de la RX Vega 64 sous watercooling extrême

A la recherche des véritables températures

Pour être honnêtes, nous n’accordons aucun crédit aux températures communiquées. Après discussions avec quelques fabricants de cartes ainsi que les concepteurs du programme GPU-Z, nous aurions plutôt tendance à croire que ce que GPU-Z nomme « Hotspot GPU » se rapproche le mieux de la température réelle. AMD n’a malheureusement pas expliqué à quoi cette valeur se référait, et l’étude des valeurs obtenues ne nous permet pas non plus de tirer cela parfaitement au clair. Ces valeurs nous semblent tout de même nettement plus plausibles :

Image 23 : Test : étude de la RX Vega 64 sous watercooling extrême

Nous obtenons en effet des valeurs similaires sur d’autres GPU avec notre Chiller et un waterblock de qualité. Le graphique suivant montre les écarts de températures relevés à différents endroits par les capteurs lorsque le mode « équilibré » est activé :

Image 24 : Test : étude de la RX Vega 64 sous watercooling extrême

On peut aussi en conclure qu’au sein du package règnent des températures nettement supérieures à celles annoncées, ce qui pour des cartes refroidies par air peut signifier des températures dépassant largement les 80°C traditionnellement considérés comme la limite raisonnable pour un GPU. AMD utilise des condensateurs X6S MLCC, dont la température maximale spécifiée est de 105°C. Si les cartes refroidies à air n’atteignent pas encore cette valeur, leur capacité au-delà de 90°C peut nettement diminuer (jusqu’à 22%), ce qui peut mener à une instabilité du système.

L’utilisation de condensateurs de type X7S ou R aurait été un choix plus adapté à ces températures sur le long terme. De plus, lorsque le bruit électrique augmente (ripple), la plage de température optimale de ces composants diminue rapidement. Une raison de plus pour investir dans un refroidissement adapté et d’envisager de passer à une solution watercooling.

Le fait que les températures indiquées soient inférieures aux températures réelles explique peut-être aussi pourquoi, lorsque la mémoire HBM2 est overclockée, la performance diminue parfois nettement, alors qu’aucune erreur au niveau des images n’est à signaler. La température réelle pourrait être plus haute qu’annoncée par les outils de monitoring et entrainer ces dysfonctionnements. Nous avons posé la question à plusieurs fabricants de cartes partenaires d’AMD sans obtenir de réponse formelle, mais nous pouvons affirmer de source sûre que les températures au sein du package dépassent largement les 90°C.

Un autre indice confortant l’idée que derrière ces températures « Hotspot » se cachent en fait la véritable température GPU est apporté par la mesure des températures à l’arrière du PCB. Si les températures diffèrent lorsque la consommation est au maximum, jusqu’à 310 W environ, la température arrière est étrangement similaire à la température « Hotspot ».

Les valeurs inférieures dans les cas extrêmes peuvent être mises sur le compte de la capacité de refroidissement propre du PCB, dont les circuits électriques en cuivre peuvent aussi bien dissiper la chaleur, et dont l’importance croit à mesure que la température augmente.

Image 25 : Test : étude de la RX Vega 64 sous watercooling extrême

Images infra-rouge

Comme de coutume, nous avons, à l’aide de notre caméra thermique, documenté la manière dont la carte chauffe, selon les cas de figure. Il faut rendre ici hommage au bloc de refroidissement EKWB qui refroidit la carte parfaitement, même dans les situations les plus difficiles. A l’heure actuelle, c’est le top du top de ce qu’on peut obtenir en termes de refroidissement.


Image 26 : Test : étude de la RX Vega 64 sous watercooling extrême

Image 27 : Test : étude de la RX Vega 64 sous watercooling extrême

Image 28 : Test : étude de la RX Vega 64 sous watercooling extrême

Image 29 : Test : étude de la RX Vega 64 sous watercooling extrême

Image 30 : Test : étude de la RX Vega 64 sous watercooling extrême

Undervolting et efficacité énergétique

L’undervolting améliore-t-il l’efficacité énergétique ?

La réponse est très claire : oui et non. Non, tant que le Power Limit n’est pas relevé au maximum ; oui, si on l’a poussé à fond. C’est seulement dans ce cas de figure que le système de télémétrie est en mesure de considérer la tension comme un élément limitant et d’adapter la fréquence à la charge graphique de manière optimale.

On se situe alors à peine au-dessus du mode « équilibré ». On voit aussi que la baisse de la tension à 1 V sans augmentation du Power Limit peut aussi diminuer la performance énergétique.

Image 31 : Test : étude de la RX Vega 64 sous watercooling extrême

Certes, nous n’avons effectué nos tests que sur un seul jeu (The Witcher 3), mais sur l’ensemble des 30 min de test, la charge était constante et reproductible. Nous avons effectué un test de plausibilité avec Doom, et si la fréquence était un poil supérieure et la consommation légèrement inférieure, on restait sur le même comportement.

Si on convertit ces valeurs en pourcents, alors, les différences s’estompent et on peut considérer le graphique suivant comme généralisable pour l’ensemble des jeux tournant sur la Vega 64 :

Image 32 : Test : étude de la RX Vega 64 sous watercooling extrême

Sur ce graphique, on voit une fois encore que l’undervolting sans augmentation du Power Limit est contre-productive.

Conclusion

Il est donc possible de configurer la RX Vega 64 de manière plus efficace que par défaut. En raison des particularités de fonctionnement du système AVFS, un changement manuel de la tension n’a d’effet positif que lorsque l’on relâche simultanément la pression au niveau du Power Limit, afin que le système puisse retrouver un équilibre. La limitation de fréquence devient alors un des facteurs limitants parmi d’autres, comme la température. Les limites sont propres à chaque carte et il faudra expérimenter pour trouver le meilleur compromis, lequel dépend fortement de la qualité du GPU embarqué.

Même si nous ne sommes pas pas parvenus à améliorer l’efficacité énergétique de la carte, notre overclocking manuel permettant d’obtenir 5% de performance en plus pour seulement 7% de consommation supplémentaire (soit 20 W) constitue une très bonne performance si on la compare aux 41% de conso en plus pour seulement 11% de performance supplémentaire que les réglages sans diminution de la tension permettent. Il faut donc baisser la tension pour overclocker de manière efficace. C’est l’une des particularités de l’architecture Vega.

Capteurs de températures à corriger

On apprécierait beaucoup qu’AMD revoie un peu sa copie au niveau des températures, tant au niveau de leur mesure que de leur communication. En l’état, nous ne pouvons que conseiller de privilégier les températures « Hotspot » communiquées par des outils tels que GPU-Z, car ce qui est indiqué par Wattman, du moins lorsque les températures sont basses, n’est absolument pas crédible.

Image 33 : Test : étude de la RX Vega 64 sous watercooling extrêmeLe bloc de refroidissement EK-FC Radeon Vega de EK Water Blocks mérite quant à lui un grand bravo : montage sans accroc, performance de refroidissement tout simplement excellente… Il n’y a vraiment rien à lui reprocher et nous ne saurions que trop le recommander à tous les possesseurs de Vega 56 ou 64 en recherche d’une solution de refroidissement efficace.

Certes, la plaque arrière est un nid à traces de doigts… mais convenablement manipulée et installée (gants de coton ou petit chiffon indispensables), elle est d’une grande élégance !