Introduction… et prix !
Avant d’entrer dans le vif du sujet, précisons l’angle de cet article : il n’est pas question de rapport performances/prix, de configuration accessible au plus grand nombre ou encore de comparaison entre AMD et NVIDIA.
La firme au caméléon ayant officiellement abandonné la gestion du tri-SLI et quad-SLI pour les jeux, le but est de voir le degré de performances ultime avec l’architecture Pascal en cette fin d’année 2016, en partant du principe que le budget est illimité. D’autre part, nous avons souhaité nous amuser avec des composants très haut de gamme en overclockant nos deux Titan X en SLI, en observant leur comportement en réalité virtuelle et en vérifiant à quel point l’absence de mémoire HBM2 (NVIDIA ayant opté pour de la GDDR5X à la place) pouvait être un vrai sujet.
Acheter deux TITAN X Pascal ? Bonne chance !
Afin de mettre la main le plus tôt possible sur une paire de TITAN X, l’un d’entre nous a noté la date du 2 août dans son agenda avant d’aller vérifier la disponibilité de la carte sur le site américain de NVIDIA. Le jour J à minuit, rien à se mettre sous la dent. À défaut de mieux, une alerte de disponibilité par mail a été programmée.
Le lendemain matin, toujours pas d’email jusqu’à ce que le bouton « ajouter au panier » finisse par apparaitre à 09h15. Deux cartes ont été commandées dans la foulée, tandis que l’alerte de disponibilité est arrivée sans pression une heure après. Quelques heures plus tard, le stock était écoulé sur la boutique en ligne américaine de NVIDIA. Mi-août, les plus pressés devaient alors passer par le marché secondaire (comme eBay) et être prêts à débourser 1500 euros au bas mot pour s’offrir une TITAN X. Aujourd’hui, les cartes semblent bien disponibles chez NVIDIA, en stock.
Dans l’euphorie, nous avons même zappé le pont SLI « HD » haut débit, il nous a fallu faire une commande supplémentaire ! Si on est assez fou pour s’offrir une paire de Titan X moyennant la bagatelle de 2600 euros, le pont SLI HB à 40 euros ne doit pas être oublié !
SLI limité = SLI amélioré ?
Comme nous l’avons déjà évoqué lors du test de la GeForce GTX 1080, NVIDIA a significativement réduit la voilure en matière de SLI : la GTX 1060 en est tout simplement privée, tandis que GTX 1070 et 1080 ne gèrent que les configurations à deux cartes maximum en jeu. Il en va de même pour la TITAN X. Pour le tri-SLI et le quad-SLI, il faudra passer une série d’obstacles, tout en sachant que les configurations de ce genre ne fonctionneront que sur une poignée de benchmarks officiellement compatibles, mais aucun jeu.
Nouveau pont SLI haut débit
Pour activer du SLI à plus de deux cartes, il faut avant toute chose générer une signature matérielle unique via un logiciel de NVIDIA, ce dernier permettant de demander une clé de « déverrouillage ». Encore une fois, cette démarche ne permet pas d’exploiter les configurations tri-SLI et quad-SLI en jeu.
Enfin, les cartes Pascal sont accompagnées d’un nouveau pont SLI baptisé « Pont SLI GeForce GTX haut débit », qui double le débit offert par les anciens ponts SLI, d’après la firme au caméléon. Précisons que rien n’empêche d’utiliser de vieux ponts souples sur les cartes Pascal.
Pour mémoire, la bande passante de ces ponts est depuis longtemps annoncée à 1 Go/s (maximum). Lors de la présentation de Pascal, NVIDIA a expliqué que les nouveaux ponts SLI fonctionnaient à 650 MHz (contre 400 MHz pour les anciens modèles) tout en permettant une connexion dual-link, offrant ainsi une bande passante disponible aux alentours de 3 Go/s pour les configurations SLI à deux cartes. À titre de comparaison, ce débit est inférieur à ce que proposent trois lignes PCIe 3.0.
NVIDIA demande 39,90 € par pont SLI (quel que soit le modèle) sur son propre site, tarif qui a tendance à gonfler chez les revendeurs partenaires. Notons qu’EVGA produit également ces nouveaux ponts.
Tri et Quad-SLI : bon débarras
D’un point de vue ingénierie, l’abandon du tri-SLI et quad-SLI nous laisse complètement indifférents. Compte tenu de la technologie de rendu multi-GPU la plus couramment utilisée (AFR, soit Alternate Frame Rendering), les PC munis de plusieurs cartes graphiques doivent faire face à une latence plus importante, avec une augmentation des performances qui diminue au-delà de deux cartes. Sans oublier les problèmes de compatibilité, tout particulièrement sur les jeux qui viennent de sortir, et surtout avec la réalité virtuelle.
Ce qui était déjà une réalité auparavant est devenu une évidence avec le niveau de performances offert par Pascal : le seul intérêt des configurations tri-SLI et quad-SLI se trouve du côté des benchmarks synthétiques. Espérons seulement que ce changement de politique conduira NVIDIA à en faire plus pour le SLI à deux cartes.
En parallèle, NVIDIA continue de travailler sur le VR SLI comme complément de l’AFR dédié aux configurations monoécrans : à moins d’avoir plus de deux yeux, le VR SLI ne nécessite pas plus de deux cartes pour parvenir au meilleur rendement possible.
Configuration de test
OS | Windows 10 professionnel 64 bits — Version 1511 (Build 10586.494) |
---|---|
Carte mère | Asus Z170 Deluxe |
Processeur | Intel Core i7-6700K @ 4.2 GHz |
DRAM | 2x 8 Go Corsair DDR4-1600, CL 16, dual-channel [CMK16GX4M2B3200C16] |
Périphérique de stockage | SSD Samsung SM951 512 Go M.2 NVMe @ 4x PCIe 3.0 [MZVPV512HDGL] |
Cartes graphiques | 2x EVGA GTX 980 SC [Maxwell, GM204] @ x8 PCIe 3.0 [04G-P4-2983-KR] 2x NVIDIA Titan X [Pascal, GP102] @ x8 PCIe 3.0 |
Pilotes | NVIDIA 369.05 |
Il aurait été idéal de pouvoir comparer deux Titan X Maxwell à nos deux Titan X basées sur le GP102 (Pascal), mais nous n’avons malheureusement plus les premières au labo. En revanche, il nous restait une paire d’EVGA GTX 980 SC.
Naturellement, le gain de performances entre nos deux 980 et la paire de Titan X est énorme sur les tests synthétiques (+101,6 % mesurés avec le second test graphique de 3DMark Fire Strike), raison pour laquelle nous nous sommes plutôt penchés sur la progression des performances avec le nombre de cartes, l’overclocking et d’autres aspects relatifs à la Titan X (Pascal).
SLI et réalité virtuelle
Rappelons que le rendu SLI s’appuie dans la plupart des cas sur l’AFR, approche qui nécessite deux images ou une queue d’images afin d’offrir une amélioration nette de performances. Si les quelques millisecondes de délai qui en résultent ne sont pas franchement pénalisantes sur un moniteur classique, il y a clairement de quoi altérer l’expérience de jeu avec 17 ms de lag supplémentaires entre ses mouvements et l’affichage du casque de réalité virtuelle.
Une carte par oeil
La solution de contournement pour la réalité virtuelle consiste à assigner une carte graphique par œil, offrant ainsi un rendu accéléré en stéréo. Ceci nécessite évidemment une optimisation du côté développeur, c’est notamment pourquoi la plupart des titres VR ne prennent pas en charge le SLI pour le moment.
Nous avons donc effectué des tests de l’Oculus Rift avec le seul jeu que l’on sait à même de « punir » une carte graphique comme la GTX 980, à savoir Elite : Dangerous. Sont rapportées ci-dessous les performances basées sur l’utilitaire de debug visible via l’Oculus : nous avons sollicité la marque américaine afin de pouvoir enregistrer sur disque les données de leur utilitaire, mais celle-ci ne nous a jamais répondu. Dans ces conditions, il est difficile de quantifier l’expérience à l’aide de graphiques.
Le SLI est désactivé pour ces tests. Il est toujours possible de le laisser activé, mais l’application n’utilisera qu’un seul GPU de toute manière.
Notons qu’une TITAN X Pascal est tout juste capable de tenir la distance avec un niveau de détails Ultra, puisqu’elle affiche environ 10 % de marge par rapport au niveau de performances minimum. En toute logique, la GTX 980 n’est pas au niveau, parvenant ainsi à 73,1 ips en moyenne (la cible étant à 90 ips) tout en souffrant d’une latence doublée entre mouvement et photon. À vrai dire, dans ce jeu en Ultra, même la TITAN X ne parvient à rester sous le seuil de 20 ms décrit par John Carmack comme étant le juste équilibre pour la réalité virtuelle. Autrement dit, il faut baisser les réglages pour une expérience optimale d’Elite : Dangerous en RV, même avec ce monstre !
Overclocking conseillé… du CPU !
Nous avons commencé à utiliser 3DMark Fire Strike comme benchmark synthétique dès sa sortie en 2013. En mode « basic », ses deux tests graphiques sont assez lourds pour les GPU, tandis que les deux autres sont plutôt limités par les ressources CPU.
Il ressort des benchmarks que deux Titan X (Pascal) en SLI sont bridées par notre processeur dans le premier test graphique de Fire Strike, sachant que l’on parle tout de même d’un Core i7-6700K capable d’atteindre 4,2 GHz en Turbo ! Unigine Valley comme d’autres benchmarks plus datés ne sont pas à même de faire souffrir nos Titan X puisque le taux d’utilisation GPU se stabilise à environ 50 %. Le goulet d’étranglement réside donc clairement au niveau du processeur.
Nous sommes finalement parvenus à un overclocking stable des cartes en SLI, +190 MHz pour leur GPU et +160 MHz pour la mémoire, soit un gain d’environ 10 %. Les fréquences des cartes étant synchronisées en SLI, la marge de manœuvre est bien entendu limitée par la carte ayant le moins de potentiel d’OC.
Pas de RAM HBM ? Pas un problème
Vu le déploiement de l’HBM sur les cartes d’AMD, on peut se demander pourquoi NVIDIA n’a pas fait le même choix avec sa Titan X. En effet, la firme a opté pour 12 Go de GDDR5X offrant une bande passante mémoire nominale de 480 Go/s, soit 42 % de plus que la Titan X-Maxwell qui plafonnait à 337 Go/s.
S’il est vrai que le HBM2 offre davantage de bande passante que la GDDR5X, on sentirait uniquement une différence dans les cas où le débit mémoire limite les performances. Cette situation est semblable à celle des liaisons PCIe 3.0/2.0/1.1 entre CPU et GPU : on peut faire tourner n’importe quelle carte graphique récente sur quatre lignes PCIE 3.0 sans mesurer de pertes de performances, ou presque. Le fait de passer à huit ou seize lignes ne permet de grappiller qu’un à deux pour cent en moyenne et au-delà, les gains seraient infinitésimaux.
On peut voir ci-dessous deux Titan X en SLI exécutant une brève séquence sous The Witcher 3 en définition 5K (5120x2880p). Et on remarque vite que le goulet d’étranglement se situe comme prévu du côté GPU. Les contrôleurs mémoire sont occupés 50 à 60 % du temps, indiquant ainsi que les modules de GDDR5X ont encore une marge de manœuvre considérable dans ces conditions. Que se passerait-t-il si la Titan X était munie de RAM HBM2 et non pas de GDDR5X ? Nous avons abaissé la fréquence mémoire de 20 % pour observer une dégradation de 4 % en termes de performances sous 3DMark. On peut donc en conclure qu’une bande passante supérieure ferait gagner 1 voire 2 % dans le meilleur des cas.
Performances, pont SLI, et conclusion
Bon pour du 5K, démesuré en 1440p
Avec les jeux correctement optimisés SLI, on peut s’attendre à un gain de 70 à 80 % lorsque l’on ajoute une deuxième TITAN X. Il s’agit de valeurs assez classiques pour des tâches limitées par les ressources GPU.
Effectivement, le SLI de Titan X se situe dans cette fourchette … sauf si l’on joue en 2560×1440, auquel cas nos deux cartes à GP102 sont ralenties par le CPU. Le gain de performances dû au SLI se limite alors à +43 % sous Total War: Warhammer (un titre Gaming Evolved) et +54% sous The Witcher 3 (un titre GameWorks).
En 5K (2440p), les gains de performances sont respectivement de +83% et +70%. Le SLI de TITAN X en 2560×1440 est donc clairement démesuré : ce couple est fait pour jouer en 4K ou 5K.
Pont SLI haut débit : utile ou pas ?
On s’imagine mal pinailler sur un pont à 40 euros lorsque l’on est prêt à dépenser 2600 euros en cartes graphiques, surtout quand ce même pont est censé doubler (voire tripler) la bande passante disponible, mais qu’en est-il réellement ?
Pour en avoir le cœur net dans le cas de la Titan X comme des GTX 1080/1070, nous avons donc fait quelques tests avec un pont souple de première génération en comparaison.
Les résultats sont intéressants : si Total War: Warhammer est complètement indifférent au fait que l’on utilise le pont souple fourni avec notre carte mère Asus, les performances sous The Witcher 3 baissent de 25 % en 1440p et 35 % en 2880p.
Conclusion : il est l’or de se réveiller !
En partant du principe que l’on roule sur l’or, il suffit de 2640 euros (soit deux TITAN X et un pont haut débit) pour parvenir aux meilleures performances possible à l’heure actuelle.
L’échelonnement des performances en SLI est assez bon : on peut s’attendre à 70-80% de performances supplémentaires par rapport à une seule carte en 5K selon les jeux. En revanche, le gain sera vraisemblablement limité à 40-50 % en 1440p (ou moins) en raison des limitations induites par le processeur.
L’overclocking est pour l’instant limité à environ 10 % faute d’utilitaires fiables pour modifier la tension administrée aux cartes. Nos benchmarks montrent également que le nouveau pont SLI haut débit n’est pas un luxe, ce qui vaut pour la Titan X comme pour les GTX 1080 et 1070 : l’utilisation d’un pont ancienne génération peut se traduire par des performances amputées de 25 à 35 % suivant les titres.
En ce qui concerne la réalité virtuelle, mieux vaut se contenter d’une seule carte pour le moment. De l’eau coulera sous les ponts avant que les développeurs tirent parti des possibilités de rendu multi-GPU, surtout quand on voit le rythme auquel les choses progressent. Ceci étant dit, une seule Titan X permet de faire tourner Elite Dangerous en Ultra avec 90 ips stables sur l’Oculus Rift (bien que la latence « mouvement à photon » de 27 ms ne soit pas encore optimale).
Que l’on possède une configuration à 500 euros assemblée avec des composants d’occasion ou une machine de guerre à 10 000 euros, l’inscription que l’on trouve dans la boite de la TITAN X résume l’essentiel : GL HF, c’est-à-dire bonne chance et amusez-vous bien !