Introduction
Après des GeForce GTX 480 et GTX 470 qui nous avaient laissé un avis mitigé, la GTX 465 sortie fin mai a franchement déçu tout simplement parce que le rapport performances/prix n’était pas bon. Pourquoi mettre 280 euros dans une carte légèrement supérieure à une HD 5830 sachant qu’on trouve une HD 5850 plus performante pour moins que cela ?
La GTX 460 est là pour changer la donne, puisqu’il s’agit enfin du premier dérivé du GF104. NVIDIA aurait pu se contenter de diviser un GF100 par deux ce qui aurait abouti à 256 shader cores, 32 unités de texturing et un bus mémoire 192 bits, mais ceci l’aurait positionnée nettement en dessous de la GTX 465 (352 shader cores, 32 unités de texturing et bus 256 bits). Pire encore, une telle carte aurait tout juste été en mesure de rivaliser avec une HD 5770 tout en affichant une consommation significativement plus élevée.
Fort heureusement, NVIDIA a choisi de remanier l’architecture Fermi en réorganisant les ressources pour réduire sa complexité d’un tiers : on arrive ainsi à un GPU plus compact, émettant moins de chaleur et offrant plus de fonctionnalités (le GF104 marque le support des pistes Dolby TrueHD et DTS-HD Master Audio en bitstream). Si la GTX 465 était de toute façon trop chère pour rivaliser avec la HD 5830, la GTX 460 est plus que bien armée pour cela.
Le GF104
Comme on le verra au fil des benchmarks, la GTX 460 est plus performante que la GTX 465 dans la majorité des tests. Comment est-ce possible vu que la GTX 460 compte moins de shader cores et a été conçue pour un public bien plus large que le GF100 et ses trois milliards de transistors ?
La réponse tient au réagencement des ressources. Au niveau macro, le GF104 se focalise toujours sur le concept des Graphics Processing Clusters (GPC) qui contiennent chacun quatre Streaming Multiprocessors (SM).
C’est au sein des SM que l’on voit l’évolution : là où le GF100 embarquait 32 CUDA cores par SM, le GF104 en compte 48. Vu leur complexité accrue de 50 %, il fallait un débit d’instructions plus important et c’est là que l’on voit une seconde amélioration puisque les unités d’allocation de ressources (dispatch units) sont doublées. En outre, chaque SM voit son nombre d’unités de texturing passer de 4 à 8.
Un GF104 complet embarque 2 GPC et donc 8 SM. Sachant qu’il y a 48 CUDA cores par SM, le GF104 peut donc embarquer jusqu’à 384 shader cores, 64 unités de texturing et 8 PolyMorph engines dédiés aux opérations géométriques.
Le back-end du GPU a lui aussi évolué. Un GF100 complet contient 6 partitions de ROP indépendants des GPC, chacun capable de débiter 8 pixels 32 bits entiers par cycle (soit 48 au total). Ces 6 partitions sont également associées à 6 contrôleurs mémoire 64 bits qui constituent au final un bus de 384 bits. Le GF104 a quant à lui un maximum de quatre partitions, capables de 32 pixels par cycle ainsi qu’un bus 256 bits.
C’est assez impressionnant pour une puce qui est encore gravée en 40 nm et compte tout de même 1,95 milliard de transistors, mais peut être pas autant que le Cypress chez AMD et ses deux milliards de transistors … place aux benchmarks pour en avoir le cœur net.
GF104 : cas pratique avec la GTX 460
Nous avons jusqu’ici parlé du GF104 dans sa forme complète, mais à l’image du GF100, NVIDIA a choisi de désactiver des pans de ces deux GPU. La différence est que cette fois, on peut se demander si ce choix a été fait dans le but d’améliorer les rendements ou bien si le souci n’était pas plutôt d’éviter la mise à mort pure et simple de la GTX 465.
Ainsi, seuls 7 des 8 SM de la GTX 460 sont activés pour un total de 336 CUDA cores et 56 unités de texturing, que ce soit pour la version 1 Go comme la version 768 Mo. En revanche, la GTX 460 1 Go emploie les quatre partitions ROP qui débitent jusqu’à 32 pixels par cycle, bénéficie d’un bus mémoire 512 bits et enfin 512 Ko de cache L2. La GTX 768 Mo se contente de trois partitions ROP, d’un bus mémoire 192 bits et 384 Ko de cache L2.
Heureusement, la différenciation entre les deux cartes s’arrête là ce qui veut notamment dire que les fréquences d’origine sont les mêmes : 675 MHz pour le GPU, 1350 MHz au niveau des shaders et enfin 900 MHz pour la GDDR5 (soit 3600 MT/sec).
GeForce GTX 460 | GeForce GTX 465 | GeForce GTX 470 | GeForce GTX 480 | |
---|---|---|---|---|
Graphics Processing Clusters | 2 | 3 | 4 | 4 |
Streaming Multiprocessors | 7 | 11 | 14 | 15 |
CUDA Cores | 336 | 352 | 448 | 480 |
Unités de texturing | 56 | 44 | 56 | 60 |
Partitions ROP | 4/3 | 4 | 5 | 6 |
Fréquence GPU | 675 MHz | 607 MHz | 607 MHz | 700 MHz |
Fréquence Shader | 1350 MHz | 1215 MHz | 1215 MHz | 1401 MHz |
Fréquence mémoire | 900 MHz | 802 MHz | 837 MHz | 924 MHz |
Quantité mémoire | 1 Go/768 Mo | 1 Go | 1,25 Go | 1,5 Go |
Largeur du bus | 256/192 bits | 256 bits | 320 bits | 384 bits |
Bande passante | 115,2 GB/s/86,4 GB/s | 102,6 GB/s | 133,9 GB/s | 177,4 GB/s |
Débit filtrage textures | 37.8 GTexels/s | 26.7 GTexels/s | 34 GTexels/s | 42 GTexels/s |
Connectique de référence | 2 x DL-DVI, 1 x mini-HDMI | 2 x DL-DVI, 1 x mini-HDMI | 2 x DL-DVI, 1 x mini-HDMI | 2 x DL-DVI, 1 x mini-HDMI |
Encombrement | Double slot | Double slot | Double slot | Double slot |
Connecteurs PCI-E | 2 x 6 points | 2 x 6 points | 2 x 6 points | 1 à 6 et 1 à 8 points |
Alimentation recommandée | 450 Watts | 550 Watts | 550 Watts | 600 Watts |
TDP | 160/150 Watts | 200 Watts | 215 Watts | 250 Watts |
Limite thermique | 104°C | 105°C | 105°C | 105°C |
La première chose que l’on remarque sur la GTX 460, c’est son petit gabarit : nous avons reçu deux cartes de référence mesurant seulement 21 cm (autant que la HD 5770) soit 3 de moins qu’une HD 5830, mais aussi une Zotac et une Palit à ventirad modifié. La première a les mêmes dimensions que la carte de référence, tandis que la Palit est encore plus compacte : seulement 18,5 cm.
Au niveau des ventirads, Zotac a opté comme sur les GTX 470 et 480 de référence pour un ventilateur de type blower qui rejette l’air chaud en dehors du boîtier. Du côté de Palit, on retrouve une conception assez proche du design de référence avec un ventilateur 75 mm au centre mais les ailettes sont disposés à l’horizontale et non pas en spirale.
Le modèle de référence offre deux ports DVI dual-link ainsi qu’un mini-HDMI. Zotac fait exclusivement dans le numérique avec deux DVI dual-link, un HDMI et un DisplayPort, tandis que Gainward a opté pour une prise VGA en lieu et place du DisplayPort. Dans les deux derniers cas, on apprécie donc la présence d’un vrai connecteur HDMI.
Le TDP des cartes étant donné à 160 Watts pour la version 1 Go et 150 Watts pour la version 768 Mo, on retrouve deux prises PCI Express 6 points dans les deux cas. Notons que la présence d’un seul connecteur SLI ne permet pas de tri ou quad SLI.
En parlant de SLI, rappelons qu’il faut impérativement que les deux cartes aient la même quantité de mémoire comme par le passé et il n’est donc pas question de faire cohabiter un modèle 768 Mo avec un modèle 1 Go.
Tesselation et Bitstreaming
Comme nous l’avons déjà abordé, un GF104 avec 336 CUDA cores à 675 MHz est souvent plus performant qu’un GF100 avec 352 CUDA cores à 607 MHz. Au-delà de cette situation, les cartes dérivées du GF104 sont moins chères, dissipent moins de chaleur et affichent une consommation plus raisonnable. Qu’est-ce qui pourrait donc encore pousser qui que ce soit vers une GTX 465 à ce stade ?
La seule raison qui nous semble concevable est un pari sur l’avenir. NVIDIA a pu diminuer le nombre de SM sur le GF104 parce que le nombre de cores au sein des SM a augmenté par rapport au GF100. La baisse du nombre de SM signifie aussi une diminution des PolyMorph engines qui contribuent grandement aux performances géométriques et rendent la tesselation inhérente à DirectX 11 plus palpable.
Sur les 16 Polymorph engines du GF100, seuls 11 sont activés sur la GTX 465. Les GTX 460 n’en comptent que 7 quelle que soit la version, ce qui se ressent sous Unigine 2.1 lorsque l’on pousse la tesselation en mode Extreme :
On voit que l’échelonnement des performances est clairement lié au nombre de SM actifs ; même les GTX 460 pourtant pas les mieux dotées à ce niveau font nettement mieux que la HD 5850 qui souffre d’une évidente limitation.
Peut être que de futurs jeux feront appel à ce type de tesselation auquel cas la GTX 465 prendra le meilleur sur une GTX 460, mais ça n’est donc qu’une supposition à ce stade.
Alien vs Predator est un exemple concret de l’usage de la tesselation : GTX 465 et GTX 460 1 Go sont aux coudes à coudes, sachant que cette dernière à tendance à dominer une fois que l’anti aliasing est activé.
Le GF104 dans un PCHC
Les Radeon HD 5000 ont pour avantage de pouvoir envoyer sans traitement le signal Dolby TrueHD ou DTS-HD Master Audio d’un Blu-ray vers un ampli home cinéma pour qu’il le décode lui-même. Ceci nécessite des canaux audio – vidéo protégés, le but étant d’éviter une capture du flux sans DRM. On remarque d’ailleurs que Intel a suivi AMD pour les canaux audio – vidéo protégés (« PAVP » pour Protect Audio Video Path) avec ses Core i3/i5 Clarkdale et Arrandale.
NVIDIA arrive donc en retard, mais après avoir vu le GF100 débarquer sans PAVP, on ne s’attendait même pas à voir débarquer des cartes compatibles sur cette génération. Le fait est que le processeur audio-vidéo a évolué (bien qu’il soit encore nommé VP4) et permet donc à la GTX 460 de gérer des pistes audio HD en bitstream.
Manque de chance, si la compatibilité matérielle est là, les pilotes ne permettent pas encore de l’exploiter : nous avons ainsi pu avoir des flux Dolby Digital/DTS via HDMI, ainsi que du LPCM multi-canal, mais pas de Dolby TrueHD ou DTS-HD. De plus, lorsque cette fonctionnalité sera exploitable, il faudra aussi un logiciel compatible comme PowerDVD 10… la situation est franchement agaçante pour tous ceux qui ont acheté la version précédente et l’on croise donc les doigts pour qu’une mise à jour puisse résoudre le problème à moindres frais.
Précisons tout de même qu’il a fallu attendre plusieurs versions des Catalyst pour que le bitstream soit effectif sur les Radeon, on n’en fera donc pas un cheval de bataille dans l’immédiat. On attend même avec impatience de nouvelles déclinaisons de Fermi encore plus accessibles qui pourraient trouver leur place dans une configuration dédiée aux jeux et/ou orientée PCHC, même si nous avons pour le moment un penchant pour la HD 5770 en la matière.
Aperçu des performances en SLI
Bien qu’un article spécifique à la GTX 460 en SLI soit déjà prévu, impossible de résister à la tentation de faire quelques tests. Nous utilisons ici une carte de référence ainsi que la Zotac, toutes deux cadencées aux fréquences d’origine. Les tests sont réalisés en 2560*1600.
Comme on l’avait vu avec la GTX 480, le passage d’une à deux cartes apporte des gains impressionnants. Voyons plus précisément comment les performances s’échelonnent :
Certes, les performances ne sont pas multipliées par deux, mais on n’en est pas loin à l’exception de DiRT 2 dont les résultats relativement décevants pourraient s’expliquer par l’AA 8x.
Encore une fois, il ne s’agit que d’un aperçu pour aujourd’hui.
Configuration du test
Composants | |
---|---|
Processeur | Intel Core i7-980X (Gulftown) 3,33 GHz, 6.4 GT/s, 12 Mo de Cache L3, économies d’énergies et Turbo Boost activés. |
Carte mère | Gigabyte X58A-UD5 (LGA 1366) X58/ICH10, BIOS F5 |
DRAM | Kingston HyperX DDR3 (3 x 2 Go) KHX2000C8D3T1K3/6GX @ DDR3-1333 7-7-7-24 |
Stockage | Intel SSDSA2MH160G2C1 160 Go SATA 3 Gb/s |
Cartes graphiques | NVIDIA GeForce GTX 460 1 Go/768 Mo |
NVIDIA GeForce GTX 465 1 Go | |
NVIDIA GeForce GTX 470 | |
AMD Radeon HD 5850 | |
AMD Radeon HD 5830 | |
AMD Radeon HD 5770 | |
Alimentation | Cooler Master UCP 1100 Watts |
Dissipateur | Intel DBX-B |
Logiciels et pilotes | |
Os | Microsoft Windows 7 Ultimate x64 |
DirectX | DirectX 11 |
Chipset | Intel INF Chipset Update Utility 9.1.1.1019 |
Graphiques | ForceWare 258.80 |
Catalyst 10.6 |
Jeux | |
---|---|
Crysis | Very High, sans AA / sans AF, AA 4x / sans AF ni vsync, 1680×1050 / 1900×1200 / 2560×1600, DirectX 10, Patch 1.2.1, version 64 bits |
Just Cause 2 | Highest, No AA / AF 16x, AA 4x/ AF 16x, sans vsync, 1680×1050 / 1920×1200 / 2560×1600, filtre Bokeh et effets aquatiques GPU désactivés (pour les cartes NVIDIA), benchmark Desert Sunrise |
Call of Duty: Modern Warfare 2 | Ultra High, sans AA / sans AF, AA 4x / sans AF, 1680×1050 / 1920×1200 / 2560×1600, Second Sun, séquence de 45 secondes sous FRAPS |
DiRT 2 | Ultra High, sans AA / sans AF, AA 4x / sans AF ni vsync, 1680×1050 / 1920×1200 / 2560×1600, benchmark scripté Tom’s Hardware, DirectX 11. Version Steam. |
Aliens Vs. Predator Benchmark | Highest, SSAO, MSAA 1x/ AF 16x, MSAA 4x/ AF 16x, sans vsync, 1680×1050 / 1920×1200 / 2560×1600 |
Battlefield: Bad Company 2 | Custom (Highest), AA 1x/ sans AF, MSAA 8x/ sans AF ni vsync, 1680×1050 / 1920×1200 / 2560×1600, cinématique d’ouverture, séquence de 145 secondes sous FRAPS |
Call Of Duty : Modern Warfare 2 (DX9)
On commence avec un titre considéré comme plutôt léger pour les cartes graphiques. Les Radeon HD 5830 et HD 5850 commencent à s’exprimer en 2560 x 1600 tandis que les cartes NVIDIA dominent en général.
La GTX 465 finit devant les GTX 460 pour ce premier test, même si le jeu reste parfaitement jouable sur les trois cartes en 2560 x 1600 avec anti-aliasing et qu’elle ne justifie donc pas son prix.
Crysis (DX10)
La hiérarchie n’évolue pas en passant de 1680 x 1050 à 1920 x 1080 : la HD 5830 domine les deux GTX 460 comme la GTX 465. Cette dernière est systématiquement en retrait de la GTX 460 1 Go et devant la version 768 Mo avec des écarts assez faibles dans les deux cas, tout du moins jusqu’en 2560 x 1600.
Une fois arrivés à cette résolution avec anti-aliasing, la GTX 460 768 Mo coule en raison du manque de mémoire même s’il faut relativiser : aucune des cartes réunies ne permet de jouer avec ces réglages. Toutefois, c’est typiquement dans ces conditions qu’il faut 1 Go de mémoire ou plus dans le cas d’un SLI/CrossFire.
Aliens Vs. Predator (DX11)
Sans anti-aliasing, les cartes affichent des performances acceptables en 1680 x 1050 qui ne le sont plus vraiment en 1920 x 1080 et tout simplement insuffisantes en 2560 x 1600. La HD 5850 est aux coudes à coudes avec la GTX 470 tandis que la HD 5830 devance légèrement la GTX 465 suivie de très près par la GTX 460 1 Go. Cette dernière affiche des versions légèrement supérieures à celles de la version 768 Mo.
L’activation de l’anti-aliasing est lourde de conséquences : même la GTX 470 souffre dès 1680 x 1050. On voit en parallèle que la GTX 460 1 Go prend le meilleur sur la GTX 465 et la HD 5830 qui encaisse mal ce filtrage.
DiRT 2 (DX11)
Là encore l’activation de l’anti-aliasing se paye cher ; lorsque ce n’est pas le cas, toutes les cartes ou presque permettent de jouer jusqu’en 2560 x 1600 inclus. Les deux GTX 460 suivent la GTX 470 en 1680 x 1050 et 1920 x 1080 pour ne repasser derrière la HD 5850 qu’en 2560 x 1600, mais on retiendra surtout qu’elles devancent systématiquement la GTX 465.
Avec anti-aliasing, les GTX 460 se retrouvent entre la HD 5830 et la HD 5850. La GTX 465 prend le meilleur sur la GTX 460 768 Mo mais n’arrive pas pour autant au niveau de la version 1 Go.
Encore une fois, les 768 Mo de mémoire sont insuffisants en 2560 x 1600 et pas qu’un peu alors que le titre est presque jouable avec une seule GTX 460 1 Go.
Bad Company 2 (DX11)
Bien qu’étant un titre DirectX 11 particulièrement réussi visuellement parlant, Battlefield: Bad Company 2 n’a rien d’un tueur de GPU. Toutes les cartes permettent de jouer en 1680 x 1050 où l’on voit la GTX 465 s’intercaler entre les deux GTX 460, toutes trois se positionnant devant la HD 5830 mais derrière la HD 5850.
La situation est similaire en 1920 x 1200, mais la HD 5830 passe cette fois devant la GTX 465 et la GTX 460 768 Mo.
En 2560 x 1600, la HD 5830 prend aussi le meilleur sur la GTX 460 1 Go. Une constante se dégage au fil des trois résolutions : la GTX 465 trouve sa place entre la GTX 460 768 Mo et la version 1 Go, des cartes dont le prix annoncé est respectivement de 199 et 229 euros. Il ne serait pas illogique que son tarif se situe donc dans ce créneau.
Just Cause 2 (DX11)
Just Cause 2 a bénéficié du programme TWIMTBP, il n’y a donc rien de surprenant à voir trois GeForce mener la danse en 1680 x 1050. Bien que la GTX 465 devance la GTX 460 1 Go, l’écart de performances ne justifie en aucun cas la différence de prix entre les deux cartes.
En 1920 x 1200, la HD 5850 se rebiffe et passe devant toutes les GeForce à l’exception de la GTX 470.
Ce n’est qu’en 2560 x 1600 que la HD 5830 passe devant la GTX 460 768 Mo, mais elle reste devancée par la variante 1 Go.
Consommation et température
Toutes les cartes se comportent assez bien en veille, même si les GTX 465 et GTX 470 sont tout de même plus gourmandes que l’ensemble.
Les cartes issues du GF100 sont tout sauf des modèles de sobriété en charge, ce qui se vérifie une fois de plus. Suivent la HD 5830 puis la GTX 460 1 Go, tandis que la version 768 Mo nécessite 12 Watts de moins que la Radeon HD 5850. Enfin, la HD 5770 illustre à quel point Juniper est économe.
Si la relation entre dissipation thermique et nuisances sonores est évidente, il est en revanche plus surprenant de voir que les GTX 460 affichent les températures les plus basses sans pour autant être les cartes les moins gourmandes. De plus, leurs ventirads sont remarquablement silencieux. A vrai dire on n’entend presque pas de différence quand les GTX 460 sont sollicitées, ce qui les rend comparables à une HD 5770 si ce n’est le fait qu’elles affichent des températures bien plus basses.
Le plus impressionnant est peut-être de voir le chemin parcouru par NVIDIA entre le GF100 et le GF104.
Conclusion
Un milliard de transistors en moins et les cartes sont redistribuées : le GF104 est le dérivé de Fermi que l’on attendait depuis la sortie des GTX 480 et 470.
Tous ceux qui ont pu être tentés par une GTX 465 sans franchir le pas sont sûrement en train de sourire : la GTX 460 1 Go est globalement plus performante et se positionne comme le meilleur rapport performances/prix chez NVIDIA. Il faut ajouter à son actif un PCB plus compact (équivalent à celui d’une HD 5770), des températures de fonctionnement plus basses, une consommation mieux maitrisée ainsi que des nuisances sonores très bien contenues. Viennent ensuite quelques fonctionnalités qui n’ont pas vraiment d’équivalent chez AMD : 3D Vision, capacités Blu-Ray 3D, CUDA ainsi que PhysX.
La compétition a décidément du bon parce qu’elle rééquilibre la donne. Prenons le cas de la HD 5830 : lancée en février dernier à 230 euros, elle avait reçu un accueil plus que mitigé vu son mauvais rapport performances/prix par rapport à une HD 5770 ou une HD 5850. Sentant l’offensive sur le seul vrai point faible de sa gamme, AMD a anticipé le lancement de la GTX 460 en baissant considérablement le prix de la HD 5830 pour atteindre 170 euros. C’est précisément dans cette zone tarifaire qu’elle aurait toujours dû être et qu’elle devient intéressante, sans pour autant être incontournable : hormis Crysis et Aliens vs. Predator, elle finit systématiquement derrière la GTX 460 1 Go. Elle garde donc pour elle un prix attractif avant tout, ainsi que l’Eyefinity qui n’a pas d’équivalent chez NVIDIA.
Positionnée pour en découdre avec la HD 5830, la GTX 460 768 Mo est un peu moins attractive à nos yeux. La quantité de mémoire inférieure à 1 Go fait chuter les performances en 2560 x 1600 avec AA en plus de lui faire régulièrement perdre quelques ips aux résolutions inférieures. Compte tenu de la vingtaine d’euros qui sépare les deux versions, notre préférence va clairement à la version 1 Go.
Les GTX 460 ne sont pas parfaites pour autant : on ne peut pas exploiter le bitstreaming dans l’immédiat et même lorsque les ForceWare le permettront, il faudra acheter un logiciel prévu pour comme CyberLink PowerDVD 10. D’autre part nous sommes convaincus à titre personnel par l’utilité de trois écrans pour la bureautique, fonctionnalité propre aux Radeon HD 5xxx.
Il est difficile de trouver de vrais défauts à la GTX 460, tout simplement parce que NVIDIA a su corriger le tir sur la plupart voir tous les défauts que l’on trouvait aux GTX 480 et 470. Au final, la GTX 460 1 Go est donc une référence pour nous.