Le grand test de la GeForce GTX 1080 : la nouvelle reine

Chris Angelini , le 17 mai 2016

GeForce GTX 1080 8 Go : architecture du GP104

Voilà donc les cartes les plus attendues de l’année chez Nvidia : les GeForce GTX 1080 et 1070 ! Elles utilisent un processeur graphique GP104, le deuxième GPU pascal, le premier étant celui de la carte graphique Tesla P100. Pascal utilise une nouvelle finesse de gravure : du 16 nm FinFET Plus en provenance de TSMC. Le fondeur promet des performances 65 % plus élevées, une densité deux fois plus importante ou une consommation réduite de 70 % comparativement à son 28 nm. NVIDIA choisit une combinaison de tous ces avantages.

Image 2 : Le grand test de la GeForce GTX 1080 : la nouvelle reine

Gigabyte GeForce GTX 1080 Founders Edition

€

gigabyte geforce gtx 1080 founders…

470€
470€

Voir l’offre

Caractéristiques records

La première puce de NVIDIA en 28 nm (GK104) date de 2012, et elle contenait 3,5 milliards de transistors. Les Maxwell GM204 intégraient 5,2 milliards de transistors dans un die de 398 mm² de surface. Le GPU GP104 dispose aujourd’hui de 7,2 milliards de transistors sur une surface de 314 mm². Les nouvelles GeForce GTX ont quatre Graphics Processing Cluster (GPC). Chaque GPC intègre cinq Thread/Texture Processing Cluster (TPC) et une unité de rastérisation. Chaque TPC offre un Streaming Multiprocessor (SM) et une unité PolyMorph. Le SM intègre 128 coeurs CUDA en simple précision, un fichier de registre de 256 Ko, 96 Ko de mémoire partagés, 48 Ko de cache L1/texture et huit unités de texture. Le moteur PolyMorph inclut quant à lui un nouveau bloc logique qui se situe à la fin du pipeline géométrique et juste avant l’unité de rastérisation. Il rend ainsi possible la technologie Simultaneous Multi-Projection. Au final, on trouve 20 SM, 2 560 coeurs CUDA et 160 unités de textures.

Huit contrôleurs mémoire 32 bits offrent un bus total d’une largeur de 256 bits. On trouve aussi huit ROP et 256 Ko de cache L2 associé à chacun d’entre eux. On retrouve donc de nombreuses similarités avec le GM204. L’architecture Maxwell avait donné la priorité au rendement, sans bouleverser les atouts des Kepler et Pascal utilisent la même philosophie.

Ajouter quatre SM ne semble pas être la solution pour accroître les performances de façon importante, mais la GP104 a plus d’un tour dans son sac. L’un d’entre eux fonctionne à une fréquence nettement plus élevée. La fréquence de base est de 1 607 MHz, comparativement au 1 126 MHz de la GM204. Le Boost atteint 1 733 MHz et nous avons pu atteindre 2 100 MHz sur notre carte de test en utilisant la version bêta de l’utilitaire PrecisionX d’EVGA. Selon Jonah Alben, vice-président et responsable de l’ingénierie des GPU, NVIDIA s’est concentré sur l’optimisation des timings et des circuits qui auraient pu causer une baisse de la fréquence. En conséquence, l’architecture GP104 atteint 8,228 TFLOPS en simple précision comparativement au 4,612 TFLOPS de la GTX 980, et le texel fill rate passe de 155 GT/s à 277,3 GT/s.

	GeForce GTX 1080 (GP104)	GeForce GTX 980 (GM204)
SM	20	16
Cœurs CUDA	2560	2048
Fréquence de base	1607 MHz	1126 MHz
Fréquence GPU Boost	1733 MHz	1216 MHz
GFLOP Fréquence de base	8228	4612
Unités de texture	160	128
Texel Fill Rate	277,3 GT/s	155,6 GT/s
Bus mémoire	256 bits	256 bits
Mémoire	GDDR5X 10 Gbit/s	GDDR5 7 Gbit/s
Bande passante RAM	320 Go/s	224 Go/s
ROP	64	64
Cache L2	2Mo	2Mo
TDP	180W	165W
Transistors	7,2 milliards	5,2 milliards
Surface du die	314 mm²	398 mm²
Gravure	16 nm	28 nm

Mémoire GDDR5X

De plus, même si la nouvelle carte utilise toujours 64 ROP et un bus de 256 bits, l’utilisation de la GDDR5X accroît la bande passante. NVIDIA a tenté de faire oublier la mémoire HBM utilisée par AMD ou la HBM2 des Tesla P100. Il semblerait qu’il n’y ait pas assez de HBM2 pour en avoir sur toutes les cartes et la firme ne voulait pas être limitée par l’HBM qui n’empile que des dies de 1 Go, ce qui aurait été problématique si NVIDIA avait empilé huit dies. Les volumes de la GDRR5x sont aussi faibles, puisque la GeForce GTX 1070 utilise de la GDDR5. Pour rappel, les 7 Gbit/s de la GDDR5 sur le bus 256 bits de la GeForce GTX 980 offraient une bande passante de 224 Go/s. La GDDR5X a un débit de 10 Gbit/s ce qui permet d’avoir un débit de 320 Go/s (une augmentation de 43 % environ). Selon NVIDIA, cette augmentation a lieu sans augmentation de la consommation, mais demande de repenser le circuit imprimé.

Tout comme Maxwell à son arrivée, Pascal promet une meilleure utilisation de la bande passante à l’aide de cache optimisé et d’algorithmes de compression. La technique de compression des delta des couleurs de la GP104 réduit de moitié la place que prennent ces informations et un nouveau mode 4:1 permet de réduire les ressources nécessaires lorsque les informations entre plusieurs pixels sont très légèrement différentes. Il y a aussi un mode 8:1 qui utilise la compression 4:1 sur des blocs de 2×2 pixels, en offrant une compression de 2:1 sur les différences entre eux.

L’image ci-dessus montre une capture d’écran non compressée de Project CARS et l’image suivante montre les éléments (en magenta) qui pourraient être compressé par une architecture Maxwell. Enfin, on peut voir ce que Pascal peut compresser. Selon NVIDIA, cela se traduit par une réduction de 20 % des informations qui ont besoin d’être puisées dans la mémoire pour rendre chaque image.

Démontage de la GTX 1080 Founders Edition

NVIDIA utilise maintenant une nouvelle terminologie. Au lieu de parler de design de référence, la firme utilise le terme « Founder’s Edition » qui est plus sophistiqué. La carte dispose aussi d’un design plus moderne, même si le système de refroidissement reste le même depuis plusieurs années.

Finition haut de gamme

La GeForce GTX 1080 pèse 1 020 grammes et a une longueur de 27 cm. La finition est excellente, grâce à l’utilisation d’une enveloppe en aluminium entourant la carte. Il faut noter que les parties en argent mat sont laquées, ce qui les rend prônes aux rayures.

Le panneau arrière a deux parties et il a un objectif purement esthétique. Il n’aide pas au refroidissement de la carte et peut même toucher certains composants de la carte mère, comme le dissipateur du chipset ou les ports SATA. NVIDIA recommande d’ailleurs de le retirer lorsque l’on utilise deux GeForce GTX 1080 en SLI.

Pas de SLI de plus de deux cartes

On trouve un seul connecteur d’alimentation PCI-Express à huit broches en haut de la GeForce GTX 1080. Au regard des caractéristiques techniques de la carte, et du fait que l’on dispose de 60 W grâce au rail 12 V de la carte mère, ce connecteur est suffisant pour une consommation de 180 W.

Il y a aussi deux connecteurs SLI. NVIDIA introduit de nouveaux ponts à haut débit avec ces cartes Pascal qui utilisent les deux ports pour un SLI à deux cartes. Selon ses explications, la firme ne tient pas à avoir des SLI de plus de deux cartes à l’avenir.

La carte dispose de trois ports DisplayPort 1.2 qui sont censés être compatibles avec les standards DisplayPort 1.3 et 1.4. On trouve aussi un port HDMI 2.0 et deux connexions DVI-D. Enfin, on notera la présence de trois trous à l’arrière de la carte. Ils sont utilisés dans des stations de travail pour la maintenir en place.

Système de refroidissement et alimentation

Une fois le capot du système de refroidissement retiré, nous observons pas moins de 51 pièces individuelles, en comptant les vis. Il faut en compter 12 de plus pour le ventilateur. NVIDIA est revenu à un système traditionnel avec un dissipateur vissé sur la carte et placé au-dessus du GPU. Le ventilateur aspire l’air pour le rejeter sur les ailettes du dissipateur et la sortie d’air au bout de la carte. L’enveloppe permet enfin de stabiliser la carte et refroidir certains composants, comme le régulateur de tension.

NVIDIA utilise une alimentation à six phases, qui est différente des anciennes solutions. Cinq phases sont destinées à l’alimentation du GPU et une phase offre un courant constant à la GDDR5X. On remarque aussi sur la carte qu’il y a un emplacement vide pour une autre phase.

On remarque à l’arrière de la carte qu’il y a un espace vide pour un deuxième connecteur d’alimentation PCI-Express. Un partenaire pourra donc offrir un deuxième connecteur ou le placer à l’arrière de la carte au lieu d’utiliser celui présent à l’avant, ce qui est coutumier sur les cartes destinées aux stations de travail.

GPU et mémoire

Le GPU est nettement plus petit que les anciens à 317 mm². On remarque aussi que les circuits autour du GPU ont besoin d’être plus courts et bien espacés en raison de la plus grande fréquence de fonctionnement. Les fréquences plus élevées signifieront aussi qu’il faudra attendre un peu avant que les partenaires de NVIDIA commercialisent leurs cartes personnalisées.

La mémoire 6HA77 fait référence à de la GDDR5X par Micron. La mémoire vient de commencer à être produite en masse. On trouve huit modules connectés à un bus de 256 bits. La fréquence de base de 1 251 MHz offre une bande passante de 320 Go/s. Cette configuration offre aussi une marge intéressante pour de l’overclocking.

Micron utilise un package à 170 broches pour leurs modules de GDDR5X au lieu des 190 broches de la GDDR5. Ils sont aussi un peu plus petits à 14 mm x 10 mm au lieu de 14 mm x 12 mm. Cela signifie que les modules sont plus denses et demandent un meilleur refroidissement.

Les condensateurs sont placés sous le GPU pour atténuer les pics de soudures et le modulateur de largeur d’impulsion est passé à l’arrière, ce qui permet aux partenaires de NVIDIA d’ajouter leurs propres circuits en haut de la carte, une solution qui s’est avérée populaire par le passé.

Le modulateur de largeur d’impulsion destiné au régulateur de tension satisfait les caractéristiques du Boost 3.0 de NVIDIA. Ce nouveau standard a causé quelques changements. On s’attendait à ce que le contrôleur R3536A de International Rectifier soit utilisé avec un design classique 5+1, mais ce n’est pas le cas. NVIDIA utilise un µP9511P, ce qui est une mauvaise nouvelle pour les fans d’overclocking parce que les utilitaires MSI Afterburner et Gigabyte’s OC Guru ne fonctionneront pas avec cette carte. Le passage au nouveau contrôleur est surement dû à des raisons techniques, mais il n’est pas encore bien documenté.

NVIDIA utilise le 53603A , une commande de grille à électrolyte solide, pour permettre au modulateur de tension de contrôler la puissance, puisqu’il ne peut pas directement accéder à chaque convertisseur de phases. On trouve aussi le 4C85N qui prend en charge les six phases de l’alimentation. Il sera intéressant de voir comment Boost 3.0 et le nouveau design de l’alimentation influencent la consommation.

Simultaneous Multi-Projection et Async Compute

Simultaneous Multi-Projection

Pascal offre quelques fonctionnalités qu’il n’est pas possible de démontrer dans les jeux commercialisés aujourd’hui, mais qui ont un avenir prometteur. L’une d’entre elles est le Simultaneous Multi-Projection Engine qui est rendu possible grâce à l’ajout d’un bloc dans l’unité PolyMorph. Ce bloc est un circuit qui prend les données géométriques et les traite en simulant 16 projections depuis un point de vue. Le bloc peut aussi remplacer le point de vue d’applications stéréo, reproduisant matériellement la géométrie jusqu’à 32 fois, sans coût important sur les performances.

Dans un système à trois écrans, avec les deux écrans de côtés tournés vers le joueur, un jeu affiché sur les trois moniteurs va avoir des coins déformés. Une table située au coin de l’écran de droite aura l’air déformée, par exemple. Pour corriger cela, il faudrait avoir une projection normal pour l’écran en face de l’utilisateur, une projection orientée vers la gauche pour l’écran de gauche et une projection orientée vers la droite pour l’écran de droite. Il n’y aurait ainsi plus de déformation et le champ de vision serait aussi plus vaste. Le problème est que la scène a besoin d’être calculée. Le Simultaneous Multi-Projection évite de calculer la même scène trois fois d’affilée en économisant les ressources grâce à l’utilisation de ce nouveau bloc dans le moteur PolyMorph.

Le problème est que les développeurs doivent prendre en charge la technologie de champ de vision large dans les paramètres et utiliser des API spéciales. Nous ne savons s’il y aura un réel désir d’accommoder les quelques joueurs utilisant plusieurs écrans, mais ce genre d’applications pourra être utilisé sur plusieurs types d’applications.

Par exemple, la réalité virtuelle demande une projection pour chaque oeil. Aujourd’hui, les jeux sont obligés d’avoir un rendu différent pour chaque écran, ce qui est très inefficace. Le Simultaneous Multi-Projection permettrait d’économiser des ressources pour rendre les deux images en une seule passe, ce que NVIDIA appelle le Single Pass Stereo. Le GPU s’occuperait de calculer les polygones et le Simultaneous Multi-Projection (SMP) produirait une projection pour chaque oeil.

Le SMP peut aussi être utilisé pour faire du Lens Matched Shading, une technique qui consiste à produire une image déjà déformée pour être correctement perçue au travers des lentilles du casque de réalité virtuelle. Ainsi, au lieu de rendre d’abord une image droite qui sera ensuite déformée, ce qui est un gâche beaucoup de ressources, le Lens Matched Shading crée une approximation déjà déformée. La différence avec une image droite ensuite déformée pour être ajustée à la lentille est souvent imperceptible

Combiner Single Pass Stereo et Lens Matched Shading permettent d’accroître les performances par deux comparativement à un GPU sans Simultaneous Multi-Projection, selon NVIDIA. En effet, utiliser le Lens Matched Shading pour éviter de calculer des bouts d’informations qui seront de toute façon abandonnés permet de réduite la charge de travail de 4,2 mégapixels/s sur un Oculus Rift à 2,8 mégapixels/s. Le Single Pass Stereo permet ensuite de calculer les images pour les deux yeux en une seule passe au lieu de faire une passe par oeil.

Asynchronous Compute

Sous Maxwell, NVIDIA avait introduit un système de partition statique qui permettait de dédier une partie du GPU aux calculs graphiques et une partie aux calculs généralistes. C’était une bonne façon d’optimiser les ressources, à condition que les partitions soient correctement utilisées. Si par exemple 75 % du processeur était utilisé pour les graphismes, le système devait attendre que les calculs généralistes soient terminés sans pouvoir utiliser le reste de la puce qui n’avait plus rien à traiter. Pascal tente de résoudre ce problème en offrant une gestion dynamique des ressources. Il est donc toujours possible de partager les ressources de son GPU entre calculs graphiques et calculs généralistes, mais si l’une des partitions est sous-utilisée, les pilotes pourront allouer plus de ressources à l’autre partition.

Pascal améliore aussi son système de préemption qui permet d’interrompre une tâche pour traiter une charge de travail urgent tout en maintenant une latence assez faible. Les architectures graphiques sont extrêmement parallèles et disposent de gros caches qui permettent d’optimiser l’utilisation des ressources. C’est pour cela que les pilotes auront tendance à aligner les calculs de shaders pour continuer à alimenter les pipelines. Néanmoins, certains calculs sont moins urgents que d’autres.

L’exemple parfait est celui de l’Asynchronous TimeWarp (ATW) de l’Oculus Rift. Dans les cas où la carte graphique ne peut pas rendre une image toutes les 11 ms sur un écran de de 90 Hz, l’ATW peut générer une image intermédiaire en utilisant les travaux les plus récents de la carte tout en corrigeant pour la position de la tête. Le problème est que la carte doit pouvoir créer cette image, mais les anciennes architectures ont du mal avec la préemption. Par exemple, Fermi, Kepler et Maxwell ne tolèrent qu’une préemption lorsqu’il est temps de rendre l’image, ce qui pourrait retarder le moment où l’ATW est possible.

Il faut que les requêtes obligeant le GPU d’arrêter ce qu’il fait pour traiter l’ATW soient acceptées assez tôt pour que le GPU ait le temps de rendre l’image avant que l’écran ne se rafraichisse. Pour arriver à cette fin, Pascal propose un système de préemption au niveau du pixel. Le GP104 peut donc arrêter le traitement du pixel, sauvegarder l’état du pipeline dans une mémoire hors die, et passer à une autre tâche. Concrètement, cela signifie que les préemptions ne demandent plus qu’une centaine de microsecondes au lieu de plusieurs millisecondes. Les pilotes ne sont pas encore compatibles avec cette fonctionnalité, mais NVIDIA devrait bientôt les mettre à jour.

Display Pipeline et SLI

H.265 4K 12 bits à 60 ips

Les Maxwell avaient le contrôleur d’affichage 12 bits, la gestion d’un large gamut des couleurs reproductibles BT.2020, et le HDMI 2.0b avec HDCP 2.2. Pascal reprend tout cela et ajoute le décodage matériel du HEVC en 4K à 60 ips et en 10/12 bits. NVIDIA offrait auparavant un décodage hybride logiciel et matériel sur seulement 8 bits.

La nouvelle architecture permet aussi d’encoder en HEVC en 10 bits en 4K à 60 ips et de faire du streaming en HDR. La firme compte d’ailleurs sortir son propre logiciel nommé GameStream HDR qui permettra de faire du streaming en HDR vers un terminal Shield ou vers un téléviseur compatible HDR. Pour mémoire, les appareils Shield sont équipés d’un décodeur HEVC 10 bits, ce qui permet de garder la fidélité de l’image d’un bout à l’autre du streaming.

La GeForce GTX 1080 est certifiée DisplayPort 1.2 et elle pourra accueillir des ports DisplayPort 1.3 et 1.4. Le design de référence pourra gérer quatre moniteurs à la fois pour une définition maximale de 7 680 x 4 320 à 60 Hz.

	GeForce GTX 1080	GeForce GTX 980
Encodage H.264	Oui (2x 4K60p)	Oui
Encodage HEVC	Oui (2x 4K60p)	Oui
Encodage 10-bit HEVC	Oui	Non
Décodage H.264	Oui (4K120p jusqu’à 240 Mbit/s)	Oui
Décodage HEVC	Oui (4K120p/8K30p jusqu’à 320 Mbit/s)	Non
Décodage VP9	Oui (4K120p jusqu’à 320 Mbit/s)	Non
Décodage 10/12-bit HEVC	Oui	Non

SLI à deux GPU

Auparavant, les cartes de NVIDIA possédaient deux connecteurs SLI pour des configurations à deux, trois ou quatre cartes. Les passionnés savent néanmoins que les performances sont vraiment optimisées pour deux cartes. Au-delà, les gains sont bien moins importants. Afin privilégier les configurations qui offrent le plus de rendement, la GeForce GTX 1080 ne sera compatible qu’avec des configurations à deux cartes. Voici les différents ponts SLI en présence et leurs capacités.

	1920×1080	2560×1440 @ 60Hz	2560×1440 @ 120Hz+	4K	5K	Surround
Pont standard (souple)	x	x
Pont LED	x	x	x	x
Nouveau pont High-Bandwidth	x	x	x	x	x	x

Pourquoi la carte a-t-elle donc deux connecteurs ? Parce que les nouveaux ponts SLI utilisent deux liens simultanés pour proposer un mode dual-link. La fréquence du lien passe, quant à elle, de 400 MHz à 650 MHz. Au final, la bande passante du lien SLI fait plus que doubler, ce qui sera réellement perçu sur les très hautes définitions et les taux de rafraîchissement élevés. Les tests de NVIDIA montraient ainsi le jeu Middle earth: Shadow of Mordor sur une configuration possédant trois écrans de 4K. L’utilisation de l’ancien pont SLI signifiait que l’image était saccadée alors que le jeu était plus fluide avec le nouveau pont.

Techniquement, les plus fous pourront toujours concevoir des configurations à trois ou quatre cartes, mais il faudra utiliser d’anciens logiciels, générer une signature unique pour chaque carte en utilisant des logiciels de NVIDIA pour ensuite créer une clé qui permettra de débloquer le système. Le nouveau pont SLI ne fonctionnera pas, mais il sera possible d’utiliser un pont à LED pour atteindre les 650 MHz. On doute néanmoins que le prix et la complexité de cette solution vaillent vraiment la peine.

Introduction rapide au GPU Boost 3.0

Soucieux d’extraire la moindre performance de ses GPU, Nvidia a encore peaufiné son GPU Boost, qui consiste à augmenter la fréquence de la puce graphique tant que possible. Dans la précédente génération GPU Boost 2.0, une fréquence fixe pouvait être réglée, afin de basculer les courbes de tension et de fréquence dans des valeurs définies. Ce système perdait toutefois quelques opportunité de grappiller encore quelques MHz.

GPU Boost 2.0

Le nouveau GPU Boost 3.0 permet de définir les fréquences pour chaque tension, pour augmenter les fréquences jusqu’à une certaine température de fonctionnement. Et plutôt que de vous forcer à expérimenter vous-mêmes la stabilité de la carte, c’est Nvidia qui va ajuster l’overclocking dans une procédure automatique adaptée au comportement unique de votre GPU.

Méthode de test

Au lieu de notre Haswell-E Core i7-5930K à 3,5 GHz, nous avons utilisé un Skylake Core i7-6700K à 4 GHz, ce qui nous a permis de sauter une architecture et gagner 500 MHz. Nous avons donc dû changer de carte mère pour passer à une MSI Z170A Gaming M7 et nous avons utilisé 16 Go de DDR4-3000 sous la forme des G.Skill F4-3000C15Q-16GRR. Nous gardons notre SSD Crucial MX200, le ventilateur Noctua NH-12S et l’alimentation be quiet! Dark Power Pro 10 850W. Nous avons enfin formaté le support de stockage et installé Windows 10 Professionnel ainsi qu’une nouvelle série de jeux DirectX 11 et DirectX 12.

La GeForce GTX 1080 est le haut de gamme de NVIDIA et ses concurrents se limitent donc aux cartes les plus performantes. Nous avons choisi les GeForce GTX Titan X, 980 Ti, et 980, ainsi que les Radeon R9 Fury X, Fury et 390X. Ce sont tous des designs de référence à l’exception de la Nitro Radeon R9 Fury de Sapphire et la R9 390X Gaming 8G de MSI.

Pilotes et benchmarks

Les cartes Maxwell utilisent les derniers pilotes au moment des tests à savoir les GeForce Game Ready 365.10. La GeForce GTX 1080 utilise les pilotes fournis par NVIDIA à la presse, à savoir les 368.13. Les trois cartes AMD utilisent les Radeon Software Crimson Edition 16.5.2 Hotfix publiés le 10 mai dernier.

Notre batterie de tests inclut d’anciens favoris comme Battlefield 4, Grand Theft Auto V and The Witcher 3. Nous ajoutons aussi Hitman, Project CARS, Rise of the Tomb Raider, The Division et Ashes of the Singularity.

Les résultats sous Ashes représentent les performances sous DirectX 12 lorsque l’on utilise le benchmark intégré. Hitman et Tomb Raider ont été testés sous DirectX 11 et Direct X 12. Comme nous le verrons, les performances tombent lorsque l’on utilise la nouvelle API. Le reste utilise Fraps.

– Ashes of the Singularity : DirectX 12, détail Extreme, benchmark inclus.
– Battlefield 4 : DirectX 11, détail Ultra, benchmarks de Tom’s Hardware (Tashgar, conduite de la jeep), enregistrement Fraps de 100 secondes.
– Grand Theft Auto V : DirectX 11, détail Very High, 4x MSAA, benchmark inclus (test 5), enregistrement Fraps de 110 secondes.
– Hitman : DirectX 11, détail Ultra, FXAA, texture haute qualité, benchmark inclus, enregistrement Fraps de 100 secondes.
– Project CARS : DirectX 11, détail Ultra, anti-aliasing High, résolution des textures High, Nürburgring Sprint, Fraps enregistrement de 100 secondes.
– Rise of the Tomb Raider : DirectX 11, détail Custom, paramètres Very High, benchmark inclus, enregistrement Fraps de 80 secondes.
– The Division : DirectX 11, détail Custom, paramètre Ultra, Supersampling temporal AA, benchmark inclus, enregistrement Fraps de 90 secondes.
– The Witcher 3 : DirectX 11, détail Highest, HairWorks désactivé, benchmarks de Tom’s Hardware, enregistrement Fraps de 100 secondes.

Résultats : Ashes, Battlefield et GTAV

Ashes of the Singularity

Avant l’arrivée de la GeForce GTX 1080, les cartes de NVIDIA étaient largement battues par les Radeon R9 Fury X et Fury sous ce benchmark. La GP104 reprend le dessus, mais l’avantage n’est pas particulièrement important pour une nouvelle carte haut de gamme sur une nouvelle architecture et une nouvelle finesse de gravure. Le taux d’image par seconde minimum n’est que 10 ips plus élevé que celui de la Fury X.

La 1080 a un impact sur la fluidité (la différence de temps entre l’apparition de chaque image), comparativement aux cartes Maxwell de NVIDIA. La GTX 980 Ti, en particulier, a des pics élevés, ce qui ne se reflète pas si l’on regarde seulement le taux d’images par seconde, mais ce qui se manifeste à l’écran par des micro-saccades.

À 3840 x 2160, la GTX 1080 maintient son avantage alors que les deux cartes Fiji d’AMD écrasent les cartes de NVIDIA. Les problèmes de rendement des images sur la 980 Ti sont clairement visibles et ils deviennent apparents sur la Titan X. Le taux d’images par seconde de la GTX 1080 est par contre stable.

Battlefield 4

La GTX 1080 est presque 68 % plus rapide que l’ancienne GTX 980 et presque 34 % plus rapide que la 980 Ti. Il n’est donc pas surprenant que la firme facture cette carte 700 dollars. À 2560 x 1440, il n’est pas nécessaire de dépenser autant pour avoir une bonne expérience. Une Radeon R9 390X permet d’atteindre 60 images par secondes et un taux d’image par seconde stable.

AMD et NVIDIA ne peuvent pas faire grand-chose d’autre pour optimiser leurs pilotes lorsque l’on passe en 4K. Nous ne sommes pas fan du taux moyen d’images par secondes, mais il est possible de jouer en 3840 x 2160 sur une GTX 980 Ti ou une R9 Fury X. Néanmoins, la GTX 1080 devance la GTX 980 Ti de 33 %, ce qui permet de jouer à Battlefield 4 en 4K en mode Ultra.

Grand Theft Auto V

La GTX 1080 est 67 % plus rapide que la GTX 980 et la R9 Fury X. De plus, le taux d’image par seconde sur les cartes AMD est assez varié, ce qui se traduit par des micro saccades visibles.

Le passage à la 4K a un impact important. Quatre des sept cartes ont une moyenne en dessous de 30 images par secondes et les deux qui restent ont tout de même un taux d’image par seconde minimum de seulement un peu plus de 20 ips. La GTX 1080 a un avantage de plus de 30 % sur la GTX 980 Ti et c’est la seule carte qui permet de correctement jouer à cette définition et à ce niveau de détail.

Résultats : Hitman, CARS et Rise of the Tomb Raider

Hitman

Les cartes d’ancienne génération étaient largement suffisantes pour jouer en QHD, même avec un niveau de détail maximum et la GTX 1080 continue sur la même lancée en offrant un gain de 27 % sur la 980 Ti et de 59 % sur la 980. NVIDIA avait d’ailleurs besoin de cette victoire alors que les Radeon R9 Fury X et Fury devancent la GeForce GTX Titan X qui coûte plus de mille euros.

L’histoire se répète en 4K où la GTX 1080 rattrape les cartes Fiji qui devançaient les Maxwell. On remarque aussi que la GTX 980 a un taux d’image par seconde instable qui se traduit par un manque de fluidité.

Project CARS

Le test est difficile à réaliser, parce qu’il demande de reproduire exactement les mêmes conditions de test, mais les résultats confirment ce que l’on a pu voir jusqu’à maintenant. Avec un taux d’image par seconde minimum de 40 ips et une moyenne avoisinant les 50 ips, toutes ces cartes sont largement suffisantes pour jouer en 2 560 x 1 440. Les R9 390X et GTX 1080 offrent le taux d’image par seconde le plus stable.

Le passage en 4K a un impact important. AMD était déjà en dessous de la GTX 980, mais maintenant la GTX 1080 offre des performances deux fois supérieures à celles de la Fury X. La carte est aussi 76 % plus rapide que la GTX 980.

Pour rappel, le développeur du jeu, Slightly Mad Studios, a démenti avoir bridé les performances sur les cartes d’AMD et le fabricant avait affirmé travailler sur des pilotes rectifiant la situation. Ces tests montrent qu’il y a encore du travail à faire.

Rise of the Tomb Raider

Les cartes de NVIDIA ont aussi un avantage sur ce jeu. La GTX 1080 est 71 % plus performante que la 980.

Malgré nos efforts qui consistaient à désactiver les optimisations GameWorks pour que les deux fabricants soient au même niveau, les cartes d’AMD sont loin derrière celles de NVIDIA et les Radeon ont un taux d’images par seconde nettement plus instable.

En 4K, le jeu tourne à 20 ips ou moins avec une Radeon R9 Fury X, Fury, 390X ou une GTX 980. Il est possible que la mémoire de la carte graphique ait un rôle important sur les résultats puisque la GTX 1080 est 101 % plus performante.

Résultats : The Division et The Witcher 3

The Division

AMD et NVIDIA étaient à égalité, la GTX Titan X étant équivalente à la Radeon R9 Fury X. la GTX 1080 rentre néanmoins en scène et bouleverse tout en étant 32 % plus performante que la GTX 980 Ti et en offrant un taux d’image par seconde extrêmement stable.

À 3840×2160, la GTX 1080 se maintient à environ 40 ips en moyenne, mais tombe à 24 ips à un moment.

The Witcher 3

Le jeu a des performances parfois étranges. Nous avons désactivé le vsync, mais nous subissons maintenant la limite interne à 60 ips du moteur graphique. Cela explique pourquoi les cartes les plus performantes ne dépassent pas ce seuil. Nous sommes néanmoins récompensés par une fluidité exemplaire.

Les chiffres sont plus intéressants en 4K parce qu’aucune carte n’atteint les 60 ips. Même la GTX 1080 qui est 34 % plus rapide que la GTX 980 Ti reste en dessous des 50 ips. La 1080 offre néanmoins une stabilité exemplaire, contrairement aux autres cartes de NVIDIA.

Résultats : applications professionnelles

Nous avons conçu une station de travail avec la compagnie Happyware située à Hambourg en Allemagne. Elle est censée représenter les performances de ce que l’on trouve généralement en entreprise. Nous utilisons ainsi un processeur Xeon E3-1280V5 à 3,7 MHz.

Tom’s Hardware Crossover Workstation
Système de test	Intel Xeon E3-1280V5 3,7 GHz 4 x 4 Go Kingston DDR4-2133 ECC Asus P10 WS 2 x Samsung SM863 (3D V-NAND) Seagate Constellation Server HDD Windows 10 Enterprise (toutes les mises à jour)
Drivers	Catalyst Pro 15.201.2401 Quadro ODE 362.56 WHQL (ODE Drivers) GeForce 368.13

Nous soulignons que de nombreuses applications requièrent des pilotes et composants certifiés. Néanmoins, de plus en plus de compagnies, telles qu’Autodesk, sont passées d’OpenGL à DirectX, ce qui signifie que les applications peuvent tourner sur des composants grand public bien moins chers. Ces benchmarks permettent donc de mieux comprendre le niveau de performance que l’on peut atteindre si la station de travail utilise une carte grand public.

AutoCAD 3D Performance

Nous nous concentrons seulement sur les performances d’AutoCAD 3D, puisque les performances en 2D sont uniquement dues au CPU. La GTX 1080 dépasse la Quadro M6000 de 2,5 %. La Quadro a la même puce que la GTX Titan, mais une fréquence plus basse de 10 MHz lorsqu’elle atteint sa température maximale. Toutes les cartes sont néanmoins proches les unes des autres, le CPU étant le goulot d’étranglement.

Maya 2013

En utilisant la suite de test SPECviewperf12, on peut voir à quoi ressemblent les performances de la GTX 1080 lorsqu’elle n’est pas limitée par le processeur. Elle obtient un avantage de 44 % sur la Quadro M6000.

Showcase 2013

L’avantage de la GTX 1080 sur la Quadro M6000 n’est pas aussi important que lors du test précédent, mais 22 % de performance en plus est tout de même honorable. Le problème vient principalement du processeur qui est une nouvelle fois le facteur limitatif.

Creo 2

L’application n’aime pas les cartes grand public. La GTX 1080 n’a pas un score horrible, mais les pilotes optimisés des cartes professionnelles sont clairement visibles.

Catia V6 R2012

Idem pour Catia où les cartes grand public sont clairement désavantagées.

Solidworks 2013

L’avantage des cartes professionnelles est encore plus important dans ce benchmark.

La GeForce GTX 1080 a un excellent rapport qualité-prix à moins que les applications utilisées ne soient optimisées pour les pilotes des cartes pour professionnelles. Néanmoins, pour les autres logiciels, il n’y a aucune raison d’acheter une Quadro ou une FirePro.

Résultats : consommation

La configuration de test reste la même et ceux qui sont intéressés peuvent en savoir plus en lisant notre article sur notre méthodologie de test. Nous avons ajouté deux mesures de plus avec des intervalles de 500 ns et 10 ms pour mieux comprendre l’impact de Boost 3.0. Nous avons aussi recalibré nos équipements.

Consommation
Méthodologie	Mesure au slot PCIe Mesure au niveau du câble de l’alimentation Mesure à l’alimentation Enregistrement infra-rouge en temps réel
Équipement de test	2 x Rohde & Schwarz HMO 3054, 500 MHz Digital Multi-Channel Oscilloscope with Storage Function 4 x Rohde & Schwarz HZO50 Current Probe (1 mA – 30 A, 100 kHz, DC) 4 x Rohde & Schwarz HZ355 (10:1 Probes, 500 MHz) 1 x Rohde & Schwarz HMC 8012 Digital Multimeter with Storage Function 1 x Optris PI640 80Hz Infrared Camera + PI Connect

Nous tenons à rappeler que mesurer la consommation au repos est toujours difficile en raison des fluctuations sporadiques. En conséquence, nous réalisons une mesure à long terme et choisissons les deux minutes les plus représentatives.

Notez que les données maximums et minimums n’ont pas lieu au même moment, ce qui explique pourquoi les chiffres pour chaque rail ne correspondent pas forcément au total du rail.

Consommation au repos

La consommation au repos est excellente à 6,8 W. Une partie est dédiée au ventilateur, la mémoire, le convertisseur de tension, ce qui signifie que le GPU doit demander environ 5 W.

	Minimum	Maximum	Moyenne
Total PCIe	0 Watt	16 Watt	4 Watt
Carte mère 3.3V	0 Watt	0 Watt	0 Watt
Carte mère 12V	1 Watt	13 Watt	3 Watt
Total carte graphique	1 Watt	27 Watt	7 Watt

Consommation durant les jeux

Nous avons mesuré la consommation lors d’une simulation de jeu sous Metro: Last Light en Ultra HD. Après que la carte ait dépassé les 84 ºC, la consommation est descendue à 173 W, alors qu’elle était à 178 W auparavant. Concrètement, le TDP annoncé de 180 W est donc fidèle à la réalité.

Durant le même test, la GeForce GTX 980 consomme aussi 180 W. Boost 3.0 promet néanmoins une tension plus stable. Voici nos résultats :

Il est clair que les pics de plus de 300 W sont maintenant de l’histoire ancienne. la GeForce GTX 1080 n’en a presque plus alors que c’était un phénomène fréquent sur la GTX 980. Ainsi, même si les deux cartes ont une consommation moyenne identique, la GTX 1080 offre un graphe bien plus lisse et compact.

	Minimum	Maximum	Moyenne
Total PCIe	5 Watt	273 Watt	133 Watt
Carte mère 3.3V	0 Watt	0 Watt	0 Watt
Carte mère 12V	15 Watt	62 Watt	40 Watt
Carte graphique totale	24 Watt	311 Watt	173 Watt

Notre analyse montre que seulement 40 W proviennent de la carte mère. Le connecteur d’alimentation PCI-Express à 8 broches fournir 133 W, même s’il n’est certifié que pour 125 W. néanmoins, sur un plan purement électrique, on pourrait atteindre jusqu’à 400 W et la Quadro M6000 n’a jamais eu de problème alors qu’elle puisait 170 W.

Consommation durant les jeux et après overclocking

Si nous définissons la limite de consommation à 120 %, le choix le plus élevé, et augmentons la fréquence pour atteindre 2,1 GHz, la consommation croît sans surprise de 173 W à 206 W.

	Minimum	Maximum	Moyenne
Total PCIe	25 Watt	342 Watt	158 Watt
Carte mère 3.3V	0 Watt	0 Watt	0 Watt
Carte mère 12V	20 Watt	72 Watt	48 Watt
Total carte graphique	35 Watt	392 Watt	206 Watt

Consommation maximale

En situation de stress, le TDP moyen est juste en dessous de la limite annoncée. La carte doit néanmoins abaisser sa fréquence de fonctionnement en raison de la température élevée et du régulateur de tension.

	Minimum	Maximum	Moyenne
Total PCIe	10 Watt	172 Watt	128 Watt
Carte mère 3.3V	0 Watt	1 Watt	0 Watt
Carte mère 12V	21 Watt	64 Watt	48 Watt
Carte graphique totale	31 Watt	224 Watt	176 Watt

Le TDP moyen reste toujours de 180 W. Selon les ingénieurs que nous avons interrogés, ce serait d’ailleurs impossible. Nous avons vérifié plusieurs fois nos résultats et la seule mesure qui nous a donné quelque chose de plus élevé est la mesure à 10 ms d’intervalle, mais c’est probablement dû au fait qu’elle est moins précise que celles utilisant un intervalle plus long.

Résultats : température et bruit

Durant la conférence de presse, NVIDIA a expliqué que la carte était refroidie avec un système à air et qu’elle ne dépassait pas les 65 degrés. Les résultats en situation réelle d’utilisation sont différents. Après trois minutes, la GeForce GTX 1080 atteint son objectif thermique et se maintient entre 83 et 84 degrés. On atteint même 85 degrés en condition de stress.

La nouvelle carte graphique maintient sa température en abaissant la fréquence du GPU. Durant une simulation de jeu, la fréquence descend jusqu’à la fréquence par défaut, annulant tout overclocking. C’est encore pire en condition de stress puisque la fréquence descend en dessous des 1607 MHz.

La conclusion est que le système de refroidissement est efficace, mais les contraintes de la carte signifient qu’un overclocking est complètement inutile durant les charges de travail soutenu et complexe.

Mesure infrarouge au repos

La partie la plus chaude de la carte est l’emplacement des deux MOSFET de régulateur de tension, mais la température ne dépasse pas les 38 °C. Le reste de la carte est à 35 °C.

Mesure infrarouge durant un jeu

L’emplacement juste en dessous du GPU est deux à trois degrés plus bas que la mesure rapportée par le thermomètre à l’intérieur de la puce. Si la solution de refroidissement était un peu meilleure, la limite thermique ne serait pas un si grand problème. Les passionnés auront donc intérêt à essayer des solutions personnalisées.

Mesure en situation de stress

Il est intéressant de souligner que même en stress, les convertisseurs de tensions ne jouent pas vraiment un grand rôle dans les performances thermiques de la carte. La grosse source de température reste le GPU et l’emplacement sous le GPU, les deux ayant maintenant la même température. Cette chaleur s’étend d’ailleurs sur le reste de la carte pour arriver sur la mémoire qui atteint sa limite thermique sans la dépasser.

En pratique, très peu de personnes lancent des calculs extrêmement intensifs prolongés, ce qui signifie que la température ne sera pas un problème.

Ventilateur et bruit

Comme d’habitude, nous avons réalisé notre mesure dans notre chambre sonore en utilisant notre propre système silencieux. Nous avons ainsi mesuré un bruit minimum de 22 dB(A).

Configuration de test
Microphone	NTI Audio M2211 (avec fichier de calibration, Low Cut at 50 Hz)
Amplificateur	Steinberg UR12 (avec Phantom Power pour le microphone)
System Hardware	– Intel Core i7-5930K @ 4,2 GHz, Watercooling – Crucial Ballistix Sport, 4x 4 Go DDR4-2400 – MSI X99S XPower AC – 1x Crucial MX200, 500-GB SSD (systèmes) – 1x Corsair Force LS, 960-GB SSD (Applications, données) – Be Quiet! Dark Power Pro, 850W
Watercooling	– Alphacool VPP655 Pump (sous-alimentée) – Alphacool NexXxos CPU Cooler – Phobya Balancer – Alphacool 24-cm Radiator – 2x 12-cm Noiseblocker eLoop Fan @400 RPM
Logiciel	Smaart v.7
Chambre de test	Chambre personnalisée, 3.5 x 1.8 x 2.2 m (LxPxH)
Position de la mesure	Perpendiculaire au centre de la source, placé à 50 cm
Données mesurées	– Niveau du bruit en dB(A) (Lent), Analysateur de fréquences en temps-réel (RTA) – Spectre du bruit généré

Observons maintenant la nouvelle carte graphique lorsque l’on joue en boucle et après qu’elle ait atteint sa température maximale : à 41,6 dB(A), la GTX 1080 s’en sort bien, surtout si on la compare à la GeForce GTX 980 personnalisée. C’est aussi 2 dB(A) de moins que la GTX 980 de référence.

En situation de stress, la carte tourne à 46,8 dB(A), soit 3,2 dB(a) de moins que sur la GTX 980.

Le bruit du ventilateur est agréable. On n’entend presque jamais le bruit du moteur et il est nettement plus tolérable que celui des ventilateurs bon marché des design de référence d’AMD. En d’autres termes, la solution de refroidissement de la GTX 1080 est plutôt bonne. Les performances de la carte souffrent lorsque l’on atteint la limite thermique et nous attendons avec impatience les solutions des partenaires qui devraient être plus silencieuses ou plus efficaces.

Conclusion

La GeForce GTX 1080 offre des performances incroyables à une période très opportune. La GTX 980 Ti ou la R9 Fury X permettent d’atteindre un taux d’images par seconde correct en 4K, mais ces cartes demandent tout de même de faire des compromis ou d’ajouter une seconde carte graphique. La GeForce GTX 1080 offre un gain d’environ 34 % sur la 980 Ti à 3840 x 2160 pixels, ce qui est suffisant pour profiter confortablement des jeux à cette définition et à un niveau de détail élevé.

La carte sera aussi une excellente solution pour les casques de réalité virtuelle, à condition que les développeurs utilisent ses technologies. Le Single Pass Stereo et Lens Matched Shading ont un grand potentiel et l’Asynchronous TimeWarping est prometteur, mais il faudra que l’industrie adopte les technologies de NVIDIA, ce qui devrait se faire à coup de budget marketing et d’exclusivités.

La GeForce GTX 1070 offrira moins de performance dans les jeux et le 4K sera plus difficile à un niveau de détail élevé, mais à 450 dollars, il est possible d’en mettre deux pour un total qui reste moins cher qu’une Titan X. En ce qui concerne la GeForce GTX 1080, le design de référence (Founders Edition) à 700 dollars est très alléchant comparativement à une GTX 980 Ti ou deux GTX 980. Nous n’avons pas encore vu de cartes par des partenaires, mais des solutions de refroidissement tierces devraient offrir plus de marges pour l’overclocking que ce que nous avons pu voir par le passé.

GeForce NVIDIA

Les commentaires sont fermés.

Les derniers articles

Test Lexar NM 1090 : un SSD PCIe 5 performant avec ventilateur intégré et rétro-éclairé
21 novembre 2024 10:19
iOS 18.2 bêta 4 apporte ces nouveautés que l’on attendait depuis longtemps
21 novembre 2024 08:38
Microsoft présente un PC de la taille d’un Mac mini, qui n’est pas vraiment un PC
21 novembre 2024 07:10
Les ventes de processeurs repartent à la hausse en 2024 avec près de 8% de croissance
20 novembre 2024 09:21
Android 16 est disponible en version bêta développeur, voici le calendrier des mises à jour
20 novembre 2024 08:42
Les sauvegardes iCloud, c’est terminé pour tous les appareils qui tournent sous iOS 8
19 novembre 2024 09:57
Black Friday : Pourquoi faut-il éviter d’acheter sur des sites mobiles et préférer les applications ?
19 novembre 2024 08:34
Des utilisateurs entendent des voix effrayantes sortir de leur iPhone sans aucune raison apparente
18 novembre 2024 08:19
Le Wi-Fi 8 arrive, mais les améliorations par rapport au Wi-Fi 7 s’annoncent décevantes
18 novembre 2024 07:32
Final Cut Pro 11 intègre de nouvelles fonctionnalités, dont une très attendue des utilisateurs
15 novembre 2024 08:46