Introduction
Peu de temps après le début du nouveau millénaire, AMD a fait un énorme pari. Un pari nommé K8, mieux connu sous sa dénomination commerciale, à savoir Athlon 64, qui consistait à abandonner la course aux mégahertz pour se concentrer sur l’exécution d’un plus grand nombre d’opérations par cycle et sur l’introduction d’extensions 64 bits natives, et ce, alors qu’Intel misait tout sur la supériorité de son process de fabrication et de ses usines, tentant de pousser aussi loin que possible l’architecture NetBurst. À l’époque, on attendait à voir un jour les Pentium 4 atteindre les 10 GHz.
Évidemment, tout ne s’est pas passé comme prévu pour Intel : les lois de la physique étant ce qu’elles sont, l’augmentation quasi exponentielle de la consommation des Pentium 4 a fini par limiter leurs fréquences aux alentours des 4 GHz. Il est rapidement devenu inutile d’y regarder à deux fois si vous vouliez vous offrir le nec plus ultra en matière de processeur : les utilisateurs avisés ont commencé à se diriger vers les Athlon 64, à la fois moins chers et plus performants que les Pentium 4. Il a fallu un moment pour que le marché accepte la nouvelle réalité, mais pendant un moment, David/AMD s’est mis à battre Goliath/Intel.
Goliath, cependant, n’a pas abandonné ; il s’est réveillé. Après quelques atermoiements, Intel a fini par abandonner l’architecture NetBurst, vouée à l’échec, et est reparti de zéro avec l’architecture Core, dont la commercialisation a commencé en 2006. Encore que « repartir de zéro » ne soit probablement pas l’expression la plus adaptée : après tout, les bases de l’architecture Core avaient déjà été posées dans le segment des processeurs pour portables avec les Pentium M. Rien d’étonnant donc à ce que les premiers processeurs Intel Core aient été meilleurs, plus rapides et moins gourmands que tout ce qui les avaient précédé. Quelques années et plusieurs évolutions architecturales plus tard, nous nous retrouvons en 2011 avec les Sandy Bridge, des processeurs pour ordinateurs de bureau gravés en 32 nm dont les performances ne sont plus à démontrer et commercialisés sous les noms de Core i3, i5 et i7.
Pendant qu’Intel se renouvelait, AMD a laissé son avantage filer petit à petit puis disparaître totalement. C’est sans doute triste à dire mais aujourd’hui, le plus rapide des AMD Phenom II affiche des performances qui font plus penser à celles d’un Core 2 Quad qu’à celles d’un Core i7 moderne. Pire, l’Intel Core i3-2100, un dual-core d’entrée de gamme gravé en 32 nm et vendu une centaine d’euros, fait jeu égal dans de nombreux benchmarks avec l’AMD Phenom II X4 955, un quad-core gravé en 45 nm et dont le prix tourne généralement plus aux alentours des 130 €. Dans le segment des processeurs de bureau, AMD a plus d’une génération de retard en matière de performances et continue à exploiter un architecture lancée il y a plus de deux ans, la Stars. Certes, la firme de Sunnyvale nous sort tous les deux ou trois mois des modèles affichant quelques centaines de mégahertz supplémentaires et parvient ainsi à conserver un certain élan, mais lorsque votre principal rival lance nouvelle architecture sur nouvelle architecture, il devient rapidement illusoire d’espérer lui faire concurrence sur le long terme à l’aide de cette stratégie. Très franchement, à l’heure actuelle, il est difficile de recommander la plateforme AM3 comme base pour un nouveau PC.
Se rendant peut-être compte qu’elle ne disposait pas des mêmes ressources qu’Intel en matière de R&D, AMD a alors fait un autre pari risqué en 2006 : elle a racheté ATI, le fabricant des célèbres cartes graphiques Radeon puis, peu après l’opération, a annoncé son initiative Fusion, une puce devant combiner CPU et GPU sur le même die. Cela aura pris cinq ans, mais les premiers processeurs Fusion ont été commercialisés cette année, sur la plateforme Brazos ; les séries E et C se sont d’ores et déjà montrées tout à fait viables dans les segments portables et netbooks, à tel point qu’AMD affirme avoir été en rupture de stock pour le 1er trimestre 2011. De fait, sur le plan des performances graphiques, aucune machine à base d’Intel Atom ne peut se mesurer aux Brazos, qui se paient même le luxe de faire mieux que les Atom sur plateforme Nvidia Ion 2.
Mais si les netbooks et autres appareils de faible puissance représentent des cibles de choix pour les processeurs Fusion, l’histoire est toute autre dans les segments des ordinateurs portables et de bureau, où la concurrence est nettement plus féroce. Tous les Core i3/i5/i7 basés sur l’architecture Sandy Bridge contiennent un circuit graphique Intel HD Graphics, qui se débrouille plutôt bien quand il s’agit d’effectuer des tâches de bureautique sous Windows, de lire des vidéos et même de jouer à des titres pas trop exigeants. Si les Fusion veulent faire leurs preuves, ils vont devoir offrir quelque chose de spécial : des performances graphiques dignes d’une carte dédiée et des performances processeur à même de se mesurer à la concurrence.
Aujourd’hui, nous goûtons pour la première fois aux APU Llano, qui visent le marché des portables et des ordinateurs de bureau. C’est donc aujourd’hui que nous allons voir si ADM a réussi son pari. Non que l’entreprise ait réellement le choix : elle doit réussir, car les actuels Phenom II et Athlon II n’ont pas grand-chose à offrir par rapport à la concurrence au-delà de 100 €. Certes, on peut effectivement toujours trouver un usage aux Phenom II X6, que l’on trouve généralement à 160 € et plus, dans les applications fortement multithreadées, mais de manière générale, les processeurs Sandy Bridge se montrent nettement plus efficaces, que ce soit en termes de performances, de consommation ou de rapport qualité/prix.
Les portables d’abord
Pour attirer les clients, AMD doit se différencier d’Intel, et il est possible que le projet Fusion lui permette d’y parvenir dans le segment des ordinateurs portables. La firme indique en effet qu’à prix égal, les Llano offrent une meilleure autonomie et de meilleures performances graphiques que les plateformes à base de Sandy Bridge ; ajoutez à cela les capacités OpenCL de la puce Radeon intégrée et vous vous retrouvez effectivement avec une offre alléchante. AMD est très sérieux vis-à-vis de l’avenir du Fusion : plus de la moitié de ses processeurs pour portables sont d’ores et déjà des APU et ce chiffre devrait grimper à plus de 90 % d’ici un an (ce qui, en réalité, n’est guère surprenant quand on connaît la faible présence d’AMD sur le marché des portables à l’heure actuelle).
Selon toute vraisemblance, l’initiative Fusion devrait avoir un peu plus de difficultés à s’imposer sur le marché des ordinateurs de bureau, où il est en général très aisé d’ajouter une carte graphique séparée, ce qui limite en théorie l’intérêt des APU. Mais AMD a aussi un avantage à proposer dans ce segment : la capacité du moteur graphique des processeurs Llano à travailler en tandem avec la carte graphique en mode Dual Graphics, une sorte de CrossFire asymétrique et flexible grâce auquel les ressources graphiques de l’APU coopèrent avec une Radeon HD 5000 ou 6000 afin d’accroître le framerate.
Et bien entendu, il ne faut pas oublier la nouvelle microarchitecture d’AMD : Bulldozer. La relève de l’architecture Stars, qui devrait arriver au troisième trimestre de cette année, soit dans les trois mois à venir, représente la première refonte fondamentale des processeurs AMD depuis l’Athlon 64. Les jours du Llano, à peine sorti, sont donc déjà comptés, son successeur (dont le nom de code est Trinity) devant bénéficier d’un bloc CPU entièrement revu et plus performant.
Mais évitons de nous précipiter : les premiers processeurs Trinity ne seront pas commercialisés avant 2012, à supposer qu’ils n’arrivent pas en retard. Mieux vaut nous concentrer sur l’immédiat.
Quels sont les attributs les plus sexy du Llano ? Environ la moitié de son die est consacré à un processeur Phenom II X4 sans cache L3 mais avec deux fois plus de cache L2 (4 Mo au lieu de 2). L’autre moitié est occupée par un moteur graphique très proche d’une Radeon HD 5570, composé d’un maximum de 400 cores Radeon (anciennement dénommés « cores Stream », mais il semblerait que ce nom soit déjà passé de mode) et d’un bloc vidéo UVD3 mis à jour. L’ensemble tient sur une seule et unique puce gravée en 32 nm.
Voilà pour l’essentiel. Bien entendu, il s’agit là d’une explication extrêmement sommaire, que nous allons développer plus en détails au cours de cet article, mais si vous savez ce qu’un Phenom II X4 et un Radeon HD 5570 sont capables de faire ensemble, vous pouvez vous faire dès maintenant une petite idée des performances potentielles de l’ensemble.
Llano : produits et plateformes
Pour ce premier aperçu de l’APU Llano, nous allons nous concentrer sur la plateforme pour portables, dont le nom de code est Sabine, étant donné qu’il s’agit du produit qu’AMD lance aujourd’hui, sur un nouveau socket nommé FS1. La version desktop des Llano ne sera pas non plus compatible avec les sockets AM3 et AM3+ : elle nécessitera son propre écosystème, qui sera bien distinct des plateformes AMD habituelles et au centre duquel trônera un autre nouveau socket, le FM1.
Cette évolution constituera sans le moindre doute une déception pour les habitués d’AMD et les possesseurs actuels d’Athlon ou de Phenom qui espéraient remplacer leur processeur par un APU, mais il ne s’agit pas d’une surprise quand on se rappelle le moteur graphique qu’embarquent les Llano ; les chipsets AMD actuels ne sont tout simplement pas prévus pour le prendre en charge. Qui plus est, n’oublions pas que les Llano sont basés sur l’architecture Stars et qu’il n’y aurait donc que peu d’intérêt à remplacer un processeur existant par un APU de ce type ; il serait plus sensé d’attendre les Zambezi, qui devraient arriver d’ici environ trois mois et seront compatibles avec les cartes-mères AM3 actuelles.
Côté nomenclature, les APU Llano sont officiellement dénommés « Vision A ». Ils se déclinent actuellement en trois sous-séries en fonction de leurs performances graphiques et processeurs : A4, A6 et A8. Ce sera facile à retenir pour les fans d’Audi. Un petit tableau valant mieux qu’un long discours, voici les spécifications techniques des différentes séries de processeurs Vision A :
Les points de différenciation sont clairs. Les APU de la série A4 comprennent un processeur dual-core (dont la fréquence nominale et en mode Turbo Core variera selon le modèle) et 240 cores Radeon cadencés à 444 MHz ; Les A6 ont un processeur quad-core et 320 cores Radeon à 400 MHz ; les A8, enfin, ont un processeur quad-core et 400 cores Radeon à 444 MHz.
Notons que ces puces pour portables ont des TDP de 35 et 45 watts ; ceux des versions desktop seront de 65 et 100 watts. Les fréquences varient de 1,4 à 2,9 GHz pour la partie CPU et, d’après les prévisions, de 400 à 600 MHz pour la partie GPU. Étant donné que nous savons que les versions pour portables plafonnent à 444 MHz, nous supposons que les moteurs graphiques cadencés à 600 Hz équiperont les Llano pour ordinateurs de bureau.
L’ensemble de la gamme Vision A est réalisée à partir de deux dies. Le die quad-core s’appelle Llano 1 et se compose de 1,45 milliards de transistors. Les modèles A8 font appel à l’ensemble du die ; les A6 contienne le même morceau de silicium mais avec certaines parties désactivées, ce qui explique que seuls 320 des 400 cores Radeon soient actifs. Le die dual-core, quant à lui, s’appelle Llano 2 et comporte 758 millions de transistors. Dans un premier temps, les A4 contiendront en réalité des die Llano 1 handicapés artificiellement, mais le Llano 2 devrait être déployé assez rapidement afin de limiter les frais. AMD prévoit d’utiliser les mêmes dies dans les APU pour ordinateurs de bureau ; nous ne devrions donc pas tarder à revoir les Llano 1 et 2.
Il est intéressant de constater qu’AMD se contente initialement de commercialiser des modèles à deux (A4) et quatre cores (A6 et A8). Dans ces conditions, nous ne serions pas surpris de voir un A6 ayant la même enveloppe thermique qu’un A8 faire mieux que celui-ci dans les applications qui nécessiteront plus de puissance CPU : le GPU étant plus petit et consommant moins, il devrait logiquement rester plus de marge pour accélérer le processeur via la fonction Turbo Core. Quoi qu’il arrive, les fréquences se tiennent toutes dans un mouchoir de poche, ce qui signifie plus que probablement que les écarts de performances seront très limités dans les benchmarks traditionnellement employés pour tester les processeurs. AMD compte clairement sur les performances du moteur graphique pour différencier les A8 des A6. Franchement, nous sommes un peu surpris que les A6 ne soient pas des modèles tri-cores.
Amateurs d’overclocking, attendez-vous à une déception : les APU Llano ont un multiplicateur verrouillé et aucun modèle Black Edition n’est prévu.
Positionnement et prix
AMD n’a annoncé aucun prix concret mais a fourni des estimations concernant les ordinateurs portables qui seront équipés de l’APU Llano. Bien entendu, étant donné que les fabricants de portables fixeront leurs propres prix, ces estimations pourraient au final être très loin de la réalité. Mais à supposer que l’on puisse faire ne serait-ce qu’un peu confiance au graphique ci-dessous, les APU Vision A devraient modifier le paysage tarifaire actuel. Rien que par le nombre de cores Radeon qu’ils contiennent, les Llano devraient amener sur le marché des portables à moins de 700 € des performances qui en sont pour l’instant totalement absentes : comme vous le verrez dans la suite de cet article, les A8 et leurs 400 cores Radeon mettent littéralement la pâtée aux Intel HD Graphics 3000 dans les jeux (ce qui ne devrait pas surprendre grand monde).
Dual Graphics
Les cores Radeon des APU Llano sont capables de travailler en tandem avec les cartes graphiques Radeon, même si celles-ci n’ont pas les mêmes spécifications techniques.
Sur le papier, c’est absolument formidable, mais il y a toutefois des limitations fondamentales que nous nous devons de signaler. Premièrement, AMD a pris une décision marketing qui risque de semer la confusion chez les non initiés : les ordinateurs embarquant un APU et une carte graphique vont se voir assigner un numéro de modèle Radeon HD unique, basé sur le tableau ci-dessous.
La manière la plus simple d’expliquer la situation est de recourir à un exemple : si un portable contient un APU A6 (moteur graphique 6520G) ainsi qu’une carte graphique Radeon HD 6490M, la combinaison des deux s’appelle Radeon HD 6545G2.
L’idée n’est pas mauvaise sur un certain nombre de plans : premièrement, le suffixe G2 permet à l’acheter de savoir que le sous-système graphique fait appel à plusieurs moteurs différents ; et deuxièmement, le numéro donne une indication des performances de l’ensemble par rapport aux autres GPU mobiles du fabricant. Le problème est que cette indication des performances risque fort de se révéler trompeuse dans les applications qui ne sont pas en mesure de profiter des deux processeurs graphiques, lesquels sont encore trop souvent considérés comme indépendants ; comme nous allons le voir dans les tests, AMD a encore du pain sur la planche en ce qui concerne l’optimisation des pilotes.
Mémoire
Le bus mémoire double canal des Llano n’a rien de bien surprenant. Les modèles pour portables et socle FS1 peuvent gérer un maximum de 32 Go de DDR3-1600 (pour une bande passante maximale de 25,6 Go/s) réparties en deux barrettes SO-DIMM (une par canal) tandis que les modèles pour desktop et socle FM1 peuvent gérer un maximum de 64 Go de DDR3-1866 (pour une bande passante maximale de 29,8 Go/s) réparties en quatre barrettes SO-DIMM (deux par canal).
Malheureusement, ces chiffres ne valent que pour les Vision A6 et A8 : le contrôleur mémoire des A4 est limité à 1333 MT/s. En matière de tensions, la DDR3-1333 est officiellement prise en charge à 1,35 V, bien que la plateforme soit techniquement capable de supporter des modules de DDR3 allant de 1333 à 1866 MT/s à une tension de 1,5 V.
Nous détaillerons plus loin l’architecture mémoire, mais sachez pour l’instant que le GPU dispose d’un accès direct à la mémoire qui lui permet de bénéficier pleinement des 29,8 Go/s autorisés par la DDR3-1866. AMD a indiqué que la prise en charge de la GDDR5 et l’attribution exclusive de la mémoire side-band étaient deux des ajouts étudiés pour les versions ultérieures de la plateforme. La société est parfaitement consciente du fait que les problèmes de bande passante sont trop souvent ce qui grève les performances des sous-systèmes graphiques. Elle nous rassure toutefois en soulignant que les Llano possèdent quatre fois plus de bande passante entre GPU et mémoire que les IGP classiques sur carte-mère (comme le 880G), tout en éliminant les problèmes de latence et de consommation liés à ceux-ci.
Le southbridge, ou plutôt le Fusion Controller Hub
La plateforme Sabine est un produit à deux puces : l’APU doit en effet être couplé à un Fusion Controller Hub (FCH) afin de pouvoir bénéficier de toutes les options disponibles en matière d’entrées/sorties, un peu comme chez Intel avec le Platform Controller Hub. Deux modèles sont disponibles : une version premium dénommée A70M et capable de prendre en charge quatre ports USB 3.0, dix ports USB 2.0 et deux ports USB 1.1, et une version de base gérant 14 ports USB 2.0 et deux ports USB 1.1 mais pas l’USB 3.0.
Mis à part cela, les deux hubs sont identiques : prise en charge du SATA 6 Gbit/s, liaisons PCI Express 2.0, convertisseur numérique-analogique intégré pour les sorties VGA et générateur d’horloge intégré comme sur le P67/H67.
Affichage et E/S
Les blocs d’affichage et d’E/S comptent parmi les composants les plus complexes de l’APU. Le nombre de lignes PCI Express s’élève à 32 au total ; deux groupes de 4 lignes sont dédiés aux sorties DisplayPort, DVI et HDMI ; 16 autres lignes sont consacrées aux cartes graphiques et peuvent donc être subdivisées en 2×8 lignes en cas de CrossFire ; ce qui laisse 8 lignes pour d’autres usages.
AMD divise ces lignes restantes en deux liaisons de quatre lignes : une première nommée United Media Interface vers le Fusion Controller Hub et une deuxième pour d’éventuels périphériques gourmands en E/S, par exemple un contrôleur de stockage, un SSD en PCI Express ou encore un carte Ethernet Gigabit multi-ports.
À l’ouest : le CPU
La portion processeur du die du Llano est basée sur l’architecture Stars des premiers Phenom, que l’on retrouve également dans les Athlon II et Phenom II actuels, mais AMD lui a apporté quelques améliorations, la plus évidente étant l’affinement du procédé de gravure, qui passe de 45 à 32 nm. Dans un processeur normal, cela engendrerait automatiquement une série d’avantages en termes de consommation et de dissipation thermique, mais ce n’est évidemment pas le cas ici : l’ajout des composants supplémentaires qui sont au cœur du projet Fusion doublent pratiquement le nombre de transistors des Llano par rapport aux Deneb.
N’oublions toutefois pas que les processeurs Sandy Bridge sont déjà gravés en 32 nm et qu’Intel a l’intention de passer au 22 nm dès la fin de cette année, avec les Ivy Bridge. AMD sait très bien que son concurrent détient là un avantage technologique de taille, et cherche donc à compenser son retard autrement.
AMD affirme que les cores CPU du Llano exécutent correctement en moyenne 6 % d’instructions par cycle de plus que les processeurs Stars précédents ; ce chiffre peut varier de zéro dans certains cas à 15 % dans d’autres. Il y a deux raisons à cette amélioration moyenne : l’augmentation de la taille du cache L2 et l’amélioration du prefetcher matériel.
Comme vous l’avez sans doute remarqué, le cache L3 (6 Mo partagé par tous les cores) a entièrement disparu ; AMD espère compenser en faisant passer la taille des caches L2 à 4 Mo (1 Mo par core). Cela ressemble à première vue à un compromis, mais n’oublions pas que, si le cache L3 autorise le partage d’informations à haute vitesse entre les cores, il augmente également la latence et pose un problème de consommation. À l’inverse, l’augmentation de la taille du cache L2 représente un petit sacrifice en termes d’évolutivité, mais il accélère le multithreading et permet de contrôler plus finement la consommation de la puce. Étant donné qu’il s’agissait là de l’un des principaux objectifs de l’équipe qui a conçu le Llano, ce changement est loin d’être insensé. Enfin, chaque core conserve ses deux caches L1 (instructions et données) de 64 Ko chacun, comme sur les Athlon II et Phenom II conventionnels.
AMD a également consacré beaucoup de temps à l’amélioration de son prefetcher matériel. Normalement, le prefetcher matériel examine l’évolution des instructions en mémoire avec le temps et, s’il remarque une constante, peut décider qu’il serait avantageux de les mettre en cache. Le problème d’une telle approche réside dans le fait que bon nombre de logiciels rendent difficile toute extrapolation car ils intercalent d’autres instructions qui distraient l’algorithme. AMD affirme avoir rendu son prefetcher plus « intelligent » en basant son fonctionnement sur un pointeur d’instructions ; celui-ci comprend les instructions qui accèdent à la mémoire et utilise cette compréhension pour détecter les comportements réguliers.
AMD a également augmenté la taille des tampons : le tampon de classement s’agrandit de 20 % et les tampons de chargement/stockage sont deux fois plus grands qu’avant. La société affirme également avoir amélioré son multiplicateur matériel, mais nous n’avons pas plus de détails.
Au final, l’augmentation de 6 % précitée par rapport aux Phenom II reste cependant bien modeste, à supposer qu’elle soit quantifiable dans les tests. Mais il semble que l’amélioration des performances de la partie processeur ne faisait pas vraiment partie des objectifs de l’équipe de conception ; après tout, les Zambezi ne vont pas tarder à débarquer.
C’est la gestion de l’alimentation qui a été mise à l’honneur, ce qui est un choix intelligent, le Llano devant partager son enveloppe thermique entre un CPU et un GPU. Pour ce qui est des performances, il faudra vraisemblablement attendre la prochaine évolution du projet Fusion, à savoir le remplacement du CPU Stars par un modèle basé sur l’architecture Bulldozer, pour savoir si AMD va enfin parvenir à rattraper Intel. Rick Bergman, Vice-président et Directeur général d’AMD, a montré un APU Trinity au Computex de cette année a déclaré que les premières pièces étaient en test ; espérons que la firme n’aie pas de retard.
À l’est : le GPU
Quand on sait que la partie processeur du Llano repose beaucoup sur les technologies existantes, il n’est plus guère surprenant de constater que la partie GPU du die est très similaire aux cartes graphiques Radeon que l’on trouve aujourd’hui sur le marché : le core Sumo du Llano est essentiellement une version mise à jour du Redwood des cartes Radeon HD 5500 et 5600.
Comme vous pouvez le voir sur l’illustration ci-dessus, il n’y a pas grande différence entre les deux morceaux de silicium : le GPU du Llano accès à la mémoire via le northbridge intégré, mais dispose toujours d’un bus de 128 bits qui lui confère une bande passante comparable à celle d’une carte graphique équipée de mémoire DDR3. Il faut sortir du hub pour constater de réelles différences : l’APU Fusion possède deux contrôleurs d’affichage et un moteur vidéo UVD3 alors que le Redwood contient quatre contrôleurs et un moteur UVD2.
En termes de spécifications techniques brutes, les deux GPU sont pratiquement identiques : chaque processeur de thread (anciennement appelé processeur Stream) est basé sur l’architecture VLIW5 d’AMD, comme le reste de la gamme Radeon HD 5000, et contient quatre cores Radeon ainsi qu’un ALU dédié aux fonctions spéciales, un module de branchement et des registres spécifiques. Le Sumo se compose de cinq moteurs SIMD contenant chaque 16 processeurs de thread et quatre unités de textures. Si vous faites le calcul, cela donne un total de 400 cores Radeon et 20 unités de texture, le tout étant accompagné de deux back-end capables d’effectuer quatre opérations ROP couleur (huit au total, donc). Ce sont exactement les caractéristiques des Radeon HD 5570 et 5670.
Pourquoi ne pas avoir opté pour le matériel de la génération des Radeon HD 6000 ? AMD semble avoir eu des difficultés à aligner les agendas de l’équipe graphique et de celle responsable de la conception du Llano. Quoi qu’il en soit, la série Radeon HD 6000 est très proche de la 5000, donc nous ne perdons pas grand-chose dans l’histoire, d’autant plus que le moteur UVD a été mis à jour.
L’APU A8 tire pleinement parti des 400 shaders du GPU tandis que l’A6 voit l’un de ses moteurs SIMD désactivé, ce qui lui donne 320 cores Radeon et 16 unités de textures (comme une Radeon HD 5550). L’A4 a un autre moteur SIMD désactivé et compte donc 240 cores Radeon et huit unités de textures ; l’un des deux back-ends est également éteint, ce qui limite les capacités ROP de ce modèle à quatre opérations par cycle. Pour autant que notre mémoire ne nous fasse pas défaut, la seule Radeon moderne a n’avoir été dotée que de 240 cores était la Radeon HD 2900 GT, une version bridée de la Radeon HD 2900 XT.
Nous n’allons pas rappeler les détails techniques de l’architecture VLIW5 : nous l’avons déjà fait dans l’article consacré au lancement de la Radeon HD 5870. Nous allons toutefois passer en revue ce que le GPU du Llano fait autrement que ses prédécesseurs, car il existe des différences assez significatives.
Le moteur UVD, par exemple, est passé en version 3 et obtient donc les mêmes capacités que celui des Radeon HD 6000, à savoir l’accélération matérielle du MPEG-4 Part 2 (et donc du DivX et du Xvid), du MPEG-2 et du MVC (Multi-View Codec) utilisé par les Blu-ray 3D. Vous avez bien lu : le Llano accélère la lecture de la 3D en HDMI. Elle s’effectue même à l’aide du bloc UVD3 au lieu des shaders du GPU, ce qui économise énormément d’énergie ; d’après AMD, cette optimisation permet au Llano de lire deux Blu-ray en une seule charge de batterie.
Les interfaces mémoire et hôte ont nécessité des changements radicaux, l’APU communiquant avec la mémoire via le northbridge intégré. Le GPU peut maintenant écrire directement sur le cache auquel, traditionnellement, le processeur possède un accès exclusif ; il accède toutefois en priorité à la mémoire via une interface double canal 128 bits (soit la même largeur que les Radeon HD 5570 et 5670 et deux fois que celle des processeurs Fusion E et C, qui possèdent une interface 64 bits). La bande passante est par ailleurs limitée par la mémoire système, de la DDR3, qui est considérablement plus lente que la GDDR5.
L’APU Fusion possède une capacité unique que les cartes graphiques séparées ne peuvent pas avoir : l’accès direct à la mémoire unifiée entre le CPU et le GPU. Cela n’a l’air de rien, mais cela autorise une série d’accélérations comme le Zero Copy ou le Pin-in-Place. Pour bien comprendre cet avantage, il faut examiner comment fonctionnent les cartes graphiques actuelles : les maps de textures sont créées dans la mémoire système puis, sous Windows, transférées dans la mémoire virtuelle. Lorsque le système a besoin de la texture, il vérifie qu’elle se trouve bien dans la mémoire virtuelle, puis la copie dans la DRAM, avant que le DMA du bus PCI Express ne la transfère dans la mémoire graphique, où la carte graphique pourra y accéder. Tout cela représente énormément d’opérations de copie, ce qui provoque une latence non négligeable.
Un APU, par contre, n’a pas besoin de copier le contenu de la mémoire, car le GPU et le CPU ont un accès partagé à la même mémoire. La fonction Zero Copy permet d’accéder directement à la mémoire virtuelle ; il suffit donc de mettre à jour les tables de pages et de pointer vers la portion requise ; aucune copie n’est nécessaire. En cas de jeux de données très importants, les APU sont même parfois capables de prendre de vitesse les cartes graphiques conventionnelles (nous avons en fait déjà couvert une optimisation du même type, précédemment nommée Fast Copy, dans notre article sur l’AMD Fusion et la plateforme Brazos).
Malheureusement, il s’agit là d’un scénario exagérément optimiste : dans l’ensemble, le Llano reste 5 à 7 % plus lent qu’une carte graphique dédiée en raison des autres latences. Quand on gratte un peu, on se rend en effet compte que les CPU et les GPU ne sont pas si compatibles que cela : le GPU doit donner au processeur un accès à faible latence à la mémoire, réorganiser ses propres accès et gérer les latences que tout cela engendre. Mais AMD a clairement bien optimisé la gestion de la mémoire : si, au final, on note effectivement une légère perte d’efficacité, les performances de la portion graphique du Llano restent extrêmement proches de celles d’une carte graphique séparée possédant les mêmes spécifications techniques.
Outre ces différences, la partie GPU du Llano est identique à une carte Radeon HD 5000 classique. Elle est dotée de l’architecture de traitement unifié TeraScale 2, prend pleinement en charge DirectX 11 (contrairement aux Sandy Bridge, se plaît à nous répéter AMD), l’OpenGL 4.1, l’antialiasing MSAA, SSAA et MLAA, le filtrage anisotropique indépendant des angles et l’OpenCL 1.1. Certes, il ne s’agit pas d’une carte graphique haut de gamme, mais nous sommes très loin d’un GPU bridé ou au rabais : le Llano est capables des mêmes choses que n’importe quelle autre Radeon.
Dual Graphics
Les APU Vision A possèdent une fonction unique qui, au moins en théorie, vient compléter élégamment le GPU intégré : la capacité à collaborer avec une carte graphique dédiée afin d’augmenter les performances du système, dénommée Dual Graphics. Plus étonnant encore, la portion graphique du Llano est capable de coopérer avec un GPU plus rapide ou plus lent que lui-même : la fonction n’a pas besoin de GPU identiques pour fonctionner correctement et elle ne bride pas le GPU le plus rapide comme c’est le cas dans un CrossFire. Au contraire, on assiste à un équilibrage des charges en fonction des ressources graphiques disponibles : si, par exemple, la carte graphique est deux fois plus rapide que le moteur graphique intégré, le pilote donne une image à traiter à l’APU et deux images au GPU dédié.
Ce CrossFire asymétrique a l’air fantastique sur papier, mais il souffre malheureusement de limitations assez sérieuses. Premièrement, cela ne fonctionne qu’avec les applications DirectX 10 et 11. Pire : si vous tentez l’expérience avec un programme DirectX 9 ou plus ancien, Dual Graphics dégrade les performances car c’est le moteur graphique le plus lent qui est utilisé. Et même quand cela fonctionne, les résultats sont quelque peu incohérents : nous avons remarqué des problèmes de fluidité alors même que les benchmarks indiquent un framerate plus élevé. Enfin, le Dual Graphics ne fonctionne que si le rapport de performances entre les deux moteurs graphiques est de deux pour un au maximum ; si la carte graphique est trois fois plus rapide que le GPU du Llano, cela ne marche pas. Nous verrons plus loin les implications que peuvent avoir ces limitations sur les performances.
Ce n’est malheureusement pas la seule limitation de la plateforme Sabine (plateforme pour portables, rappelons-le) : les OEM devront en outre décider s’ils optent pour le Dual Graphics ou pour l’Eyefinity : en effet, les portables basés sur les Vision A utilisant les deux contrôleurs d’affichage en mode APU et en mode Dual Graphics, il faut utiliser les contrôleurs de la carte graphique dédiée pour pouvoir brancher trois écrans, ce qui rend de facto impossible le mode Dual Graphics. Gardons toutefois la tête froide : la perte de l’Eyefinity est généralement loin d’être un réel problème dans le segment des portables.
Malgré les quelques problèmes précités, il n’en reste pas moins que le mode Dual Graphics reste une excellente idée et possède un potentiel indéniable. Pour autant qu’AMD améliore ses pilotes et règle les quelques soucis que nous avons rencontrés, cette fonctionnalité pourrait devenir un élément à prendre sérieusement en compte lors de l’achat d’une machine. Avec un système Fusion, vous pourriez dépenser 50 € dans une carte graphique et vous retrouver avec les mêmes performances que celles offertes par un modèle à 80 €. Sur le marché des portables, l’intérêt est encore plus grand, car le sous-système graphique peut rester en mode APU pur lorsqu’on souhaite économiser la batterie puis activer les deux GPU lorsqu’une prise est disponible.
Notons enfin que, même si vous le couplez à une carte graphique trop puissante pour que le mode Dual Graphics puisse fonctionner, l’APU reste capable d’exécuter les fonctions OpenCL pendant que la carte graphique se charge du rendu 3D. Certes, ce genre de scénarios reste encore extrêmement rares, mais si les développeurs de jeux se mettent à profiter de ce type d’interactions pour, par exemple, la physique, les possibilités sont très certainement intéressantes.
CPU + GPU = APU
Comme nous avons pu le voir dans les pages qui précèdent, les portions CPU et GPU du Llano ne sont pas très différentes de ce qu’AMD propose déjà par ailleurs. Ce qui rend le projet Fusion unique, cependant, réside dans la combinaison de ces deux éléments au sein d’une même puce. Les représentants de la firme soulignent que le véritable challenge qui s’est présenté lors de la conception du Llano a été de faire en sorte que tout le matériel fonctionne de concert, et ce, de la manière la plus efficace et économe possible. Autrement dit, le plus difficile a été la tuyauterie.
Le Llano contient essentiellement cinq grands composants qui doivent communiquer entre eux : la portion CPU, la portion GPU, le northbridge, le bloc d’entrées/sorties traditionnel et le bloc d’entrées/sorties vers la mémoire DDR. La liaison processeur-northbridge n’a rien de nouveau ; nous allons donc nous concentrer sur ce que nous n’avons pas encore vu, à savoir les liaisons GPU-northbridge. Étant donné qu’il existe deux scénarios d’utilisation du GPU, il y a également deux liaisons dédiées.
La première liaison s’appelle « bus mémoire Radeon ». En matière de graphismes, une faible bande passante est synonyme de faibles performances ; le GPU ne peut donc se contenter de la même interface mémoire que le processeur. Le bus mémoire Radeon est une liaison allant du GPU à la mémoire via le northbridge et permettant au moteur graphique de bénéficier d’un accès prioritaire à la RAM pour les opérations nécessitant une bande passante élevée. Mike Goddard, ingénieur en chef chez AMD, a clairement indiqué que ce lien était absolument essentiel si l’on voulait que le Llano affiche des performances dignes d’une carte graphique normale.
Mais le GPU a également besoin d’une deuxième liaison, celle qui fait du Llano un véritable APU plutôt qu’une simple CPU+GPU juxtaposés sur le même die : la liaison Fusion Compute. Traditionnellement, les périphériques d’E/S accèdent au cache du processeur via l’interface PCI Express. Pour les opérations de traitement exécutées par le processeur graphique, cela représente toutefois un goulot d’étranglement ; AMD a donc amélioré cette liaison afin de donner au GPU un accès plus rapide aux données partagées avec le CPU et lui permettre d’extraire plus rapidement le contenu de cette mémoire. La liaison Fusion Compute est l’élément qui permet au Llano d’afficher des performances de traitement élevées sans faire enfler la consommation.
Gestion de la consommation
L’unes des trois grandes forces du Llano selon AMD réside dans ce que la firme appelle « AMD AllDay™ Power ». Le marché des portables étant idéal pour l’APU, il est effectivement assez logique d’axer les optimisations (et la communication) sur la consommation énergétique. En consiste donc cette fonctionnalité ?
La consommation du Llano est répartie sur deux rails de tension principaux : le rail VDD (qui alimente les cores du CPU) et le plan VDDNB (qui alimente le GPU, le bloc de décodage UVD, le contrôleur de mémoire graphique et le northbridge).
On pourrait se dire qu’alimenter les quatre cores du processeur à l’aide d’un seul et unique rail n’est pas ce qu’il y a de plus efficace en termes de consommation, surtout lorsque le système d’exploitation n’a besoin que d’un seul core. Mais cette source d’alimentation unique possède deux modes de fonctionnement distincts : Core C6 (CC6) et Package C6 (PC6). Le mode CC6 est capable d’éteindre les cores du CPU un par un, tandis que le mode PC6 peut réduire l’alimentation du rail tout entier. On bénéficie donc de la finesse nécessaire pour gérer toutes sortes de situations.
Le plan VDDNB est un peu plus complexe, ce qui est logique car il gère plus de composants. En termes d’efficacité pure, ce n’est pas une situation idéale, car le rail doit toujours fonctionner à la tension requise par le composant ayant les besoins les plus élevés. Cette décision a été prise afin d’éviter les coûts liés à l’ajout de régulateurs. Par conséquent, la tension et le P-state varie en fonction d’une série de facteurs : le P-state du northbridge, celui du GPU (qui est généralement contrôlé par le pilote mais également être altéré matériellement), la vitesse du bus PCI Express (les périphériques PCIe 2.0 nécessitent une tension plus élevée) et la charge de travail pensant sur le moteur UVD.
Mais si la tension est effectivement commune aux différents composants, ceux-ci peuvent être activés ou désactivés à loisir : le GPU peut être ralenti s’il est inutilisé (via un seuil programmable) ou si le pilote détecte que la charge de travail est confiée à la carte graphique, par exemple. Le contrôleur de mémoire graphique, potentiellement très gourmand, peut également être allumé ou éteint selon les besoins. Même chose pour le bloc UVD, qui est désactivé lorsqu’il n’est pas utilisé.
On note également plusieurs optimisations en matière de consommation liée à l’affichage et aux graphismes : la compression dans le frame buffer, bien entendu, mais également une technique nommée Adaptive Backlight Modulation (ABM), qui analyse les images à afficher et règle le niveau de rétroéclairage et de luminosité afin d’afficher des images aussi proches que possibles des originales en économisant un maximum d’énergie.
L’illustration ci-dessous permet de mieux se représenter la granularité de la consommation de l’APU : les composants actifs sont en vert, les éléments désactivés en bleu. Il ne s’agit cependant que de deux exemples : d’autres composants sont désactivables, par exemple, les cores de la partie CPU.
Turbo Core
Le Turbo Core n’a rien de neuf : AMD propose cette fonction, qui consiste à booster les fréquences lorsque l’enveloppe thermique le permet, depuis les Phenom II X6. La différence réside dans le fait que le Llano équilibre le comportement du CPU et du GPU afin de ne jamais dépasser le TDP.
Mike Goddard nous a confié qu’AMD avait pour l’occasion utilisé une approche novatrice, dans le sens où cette fonction est ici basée sur les performances et non sur des mesures analogiques de température. Le module APM (Advanced Power Management) numérique mesure l’activité de l’APU afin d’estimer sa consommation et modifie le P-state afin de ne pas dépasser le TDP de la puce. L’avantage d’une telle approche réside dans le fait que les performances devraient être plus cohérentes que lorsque le Turbo est uniquement basé sur les mesures de température ; le problème, bien entendu, est qu’il est possible que l’APM sous-estime la marge réellement disponible et n’exploite pas à fond les possibilités de la puce.
Quoi qu’il en soit, lorsque l’APM décide qu’il y a de la marge thermique, il invoque un P-state (invisible pour le système d’exploitation) nommé P-boost qui accroît les fréquences côté CPU. N’oublions pas que la portion GPU du Llano n’est pas accélérable au-delà de sa fréquence d’usine (bien qu’elle puisse être ralentie afin de limiter la consommation et la dissipation thermique si nécessaire) : tout cela ne concerne que le processeur. Il convient également de noter que le GPU a toujours la priorité : en cas de charge graphique, le processeur est donc moins susceptible de bénéficier du Turbo Core.
Reste un dernier point à mentionner : si la température n’est pas le principal facteur de modification du P-state, elle reste utilisée comme garde-fou. Il existe en effet un scénario dans lequel le CPU et le GPU sont susceptibles d’être mis à contribution au-delà du TDP du Llano : en cas de charge de travail OpenCL. Étant donné que le GPU est plus efficace pour ce genre de tâches, il se voit accorder la priorité, mais le CPU est également poussé dans ses derniers retranchements ; si la température dépasse un certain seuil, le processeur peut passer dans un état inférieur à P0 (P1 ou P2, par exemple) afin de la faire baisser. AMD nous a expliqué qu’il s’agissait du seul scénario dans lequel les cores CPU du Llano fonctionnaient en-deçà de leur vitesse nominale, mais comme vous le voyez, cela peut se produire.
Malheureusement, nous ne sommes pas en mesure de tester ces différents scénarios, car il n’existe aucun utilitaire capable de mesure la fréquence réelle des cores CPU d’un Llano. Même l’utilitaire fourni par AMD indique en permanence, et de manière incorrecte, que la fréquence du CPU est à son niveau nominal ; selon ce logiciel, le Turbo Core ne s’enclenche jamais, même lorsque le GPU est au repos, ce qui est évidemment faux. Nous souhaitons vérifier par nous-mêmes les affirmations de la firme et déterminer par nos propres moyens quels sont les scénarios qui forcent l’APU à réduire ses fréquences. Vous pouvez donc être certains que nous reviendront sur le sujet lorsque nous aurons trouvé le moyen de mesurer correctement ce qui se passe à l’intérieur du Llano lorsqu’on y applique différentes charges de travail.
Rappelons que le moteur graphique est pour l’instant incapable d’aller au-delà de sa fréquence d’usine, mais selon AMD, cela pourrait changer à l’avenir. Il est donc possible que l’architecture Trinity soit plus flexible sur ce point.
Pilotes et AMD Steady Video
Depuis la version 11.4 des pilotes Catalyst, si votre machine contient simultanément un processeur et une carte graphique AMD, le Catalyst Control Center devient l’AMD Vision Control Center. Rien ne change pour les utilisateurs possédant un processeur Intel.
Mais à part le nouveau nom, que trouve-t-on de neuf dans cet AMD Vision Control Center ? Pas grand-chose : il s’agit plus d’un coup marketing qu’autre chose. Le logiciel fonctionne de la même manière que sur les APU que nous avons déjà testés (les AMD-E et C) et permet de personnaliser la consommation des portions CPU et GPU de différentes manières, que ce soit via la fréquence ou via l’activation de l’APU, de la carte graphique ou des deux en mode Dual Graphics. Il contient une série de profils de consommation préconçus que l’utilisateur peut appliquer en fonction de sa situation, mais il est également possible de créer un profil personnalisé.
Dual Graphics
On note toutefois quelques nouvelles options liées à la fonction Dual Graphics. Si votre portable le permet, vous trouverez sous l’onglet Power une option qui n’y figurait pas auparavant : Switchable Graphics.
Cette option permet de régler le mode graphique utilisé par chaque application : High Performance pour le mode Dual Graphics, Power Saving pour l’APU uniquement. Vous avez également la possibilité de cocher une case activant un pop-up à chaque fois qu’une nouvelle application se lance pour vous rappeler d’en régler le mode graphique. Notez que, pour que le mode Dual Graphics fonctionne, il faut d’abord activer le CrossFire, que vous retrouverez à sa place habituelle dans le menu Performance.
AMD Steady Video
AMD est sur le point de lancer une fonction exclusive basée sur son projet Accelerated Parallel Processing (APP) et visant, selon les dires de la firme, à stabiliser les vidéos filmées en caméra à l’épaule ou par APN. Cette fonction s’appelle AMD Steady Video et devrait être activée à partir des Catalyst 11.6, donc en juin.
Si vous avez la moindre idée de l’ampleur du travail requis pour régler ce genre de problèmes, vous ne pouvez qu’être impressionné par le résultat : le matériel doit analyser les vecteurs vidéo et les tremblements, doit compenser les mouvements de la caméra et doit ajouter les pixels manquants. AMD Steady Video, qui fonctionne en post-processing et donc en temps réel, se montre extrêmement efficace lorsqu’il s’agit d’éliminer les tremblements de l’image : le résultat est absolument bluffant.
Il s’agit évidemment avant d’une démonstration des possibilités qu’offre le projet APP. Pour l’instant, les développeurs semblent encore se montrer frileux, mais nous espérons sincèrement que les applications faisant usage des capacités GPGPU des puces AMD vont se multiplier
Modifications mineures de l’interface
Vous l’aurez déjà remarque si vos pilotes Catalyst sont à jour : AMD a modifié quelque peu le style visuel de son Control Center et a remplacé bon nombre de cases à cocher par des interrupteurs colorés (vert pour activé, rouge pour désactivé). Mis à part ces quelques détails, l’interface reste pratiquement inchangée.
Le pilote proprement dit a toutefois lui aussi été modifié : AMD affirme avoir amélioré la technologie sous-tendant les modes de type Dual Graphics, ce qui signifie que sur le Llano, le passage de la carte graphique au GPU intégré se fait maintenant de manière transparente, sans aucun scintillement d’écran (ce que nous tests ont confirmé).
Configuration de test et benchmarks
Le Llano nous pose une série de problèmes que nous ne rencontrons généralement pas quand il s’agit de tester un nouveau processeur ou une nouvelle carte graphique. AMD n’a pas (ou à tout le moins, ne souhaite pas nous fournir) d’outil capable d’afficher les fréquences réelles de l’APU en fonctionnement. Nous n’avons donc aucun moyen pratique de déterminer si le Turbo Core fonctionne ou non ni dans quelle mesure il accélère l’exemplaire que nous avons reçu. Si vous vous souvenez bien, lors du lancement de l’architecture Nehalem, Intel a distribué un utilitaire permettant de surveiller en temps réel le Turbo Boost. AMD a besoin de quelque chose de semblable.
Pour tenter de combler ce manque, nous allons comparer notre système de test Llano à des Phenom II X4 cadencés à 1,5 GHz et 2,4 GHz, ce qui correspond aux fréquences nominale et maximale de la partie CPU de l’A8-3500M que nous testons aujourd’hui. Cela nous montrera non seulement si le Turbo Core fonctionne, mais cela nous donnera également une idée des performances de la nouvelle version du processeur Stars par rapport aux Phenom II actuels.
Nous allons par ailleurs doter cette machine à base de Phenom II X4 d’une Radeon HD 5570. Comme vous le savez maintenant, cette carte graphique contient le même nombre de cores que l’A8-3500M ; nous avons underclocké son GPU à 444 MHz GPU et sa mémoire DDR3 à 666 MHz afin de pouvoir comparer les performances de la partie graphique de l’APU à une carte graphique affichant les mêmes spécifications techniques.
Enfin, nous allons également tester un système à base d’Intel Core i5-2520M, un processeur pour portables. Cela devrait nous donner une bonne idée de ce que peut accomplir un portable Intel vendu à un prix comparable à l’offre AMD d’aujourd’hui (ou à tout le moins, comparable aux estimations d’AMD…).
Pour les jeux, nous allons nous concentrer sur les trois résolutions parmi les plus utilisées sur portables : 1280×800, 1600×900 et 1920×1080. Si un jeu donné pose problème en 1280×800, nous passons en 1024×600 pour voir si cela résout le problème.
Étant donné que la fonction Dual Graphics ne fonctionne que dans les titres DirectX 10 et 11, nous allons tester certains jeux plus d’une fois afin de voir ce qu’apporte ce CrossFire asymétrique. Les jeux en question sont Metro 2033, F1 2010 et HAWX 2.
Système de test | Système de test | Système de test | |
Processeur | AMD A8-3500M (Llano) | AMD Phenom II X4 (Deneb) |
|
Carte-mère | Inconnue | Gigabyte 880GMA-UD2H | ASRock HM65-HT |
Réseau | Contrôleur Ethernet Gigabit intégré | ||
Mémoire | 4 Go de DDR3 1333 MHz | 4 Go de DDR3 1333 MHz | 4 Go de DDR3 1333 MHz |
Moteurs graphiques | Radeon HD 6620G (intégrée) | Radeon HD 5570 | Intel HD Graphics 3000 |
Disque dur | Hitachi Travelstar | Western Digital Caviar Blue | Western Digital Scorpio Black |
Logiciels et pilotes | |||
OS | Microsoft Windows 7 x64 | ||
DirectX | DirectX 11 | ||
Pilote carte graphique | Système de test Intel Core i5-2520M : Intel Graphics Driver 8.15.10.2361 |
Benchmarks et paramètres | |
Jeux 3D | |
Metro 2033 | Version 1.0.0.1, DirectX 9 et 11, utilitaire de benchmark, détails faibles, |
Crysis 2 | Version 1.5, FRAPS |
H.A.W.X. 2 | Version 1.0.1, DirectX 9 et 10/11, |
F1 2010 | Version 1.1.1.129, DirectX 11, benchmark intégré |
Just Cause 2 | Version 1.0.0.2, DirectX 10, Benchmark Concrete Jungle |
StarCraft 2 | Version 2.1.2.2105, détails élevés |
Audio : benchmarks et paramètres | |
Benchmark | Détails |
iTunes | Version : 10.0.1.1 64 bits |
Lame MP3 | Version : 3.98.3 |
Vidéo : benchmarks et paramètres | |
Benchmark | Détails |
HandBrake CLI | Version : 0.94 |
MainConcept Reference 2 | Version : 2.0.0.1555 |
Applications : benchmarks et paramètres | |
Benchmark | Détails |
WinRAR | Version 4.0 Beta 4 |
WinZip 14 | Version 14.0 Pro (8652) |
7-Zip | Version 9.2 |
Autodesk 3ds Max 2010 | Version : 10 x64, rendu « Space Flyby Mentalray » (SPECapc_3dsmax9) |
Adobe Premiere Pro CS5 | Longueur de la vidéo : 2 min 21 s, exportation au format Blu-ray H.264 |
Adobe After Effects CS5 | Création d’une vidéo comprenant 3 flux |
Cinebench | Version 11.5 Build CB25720DEMO |
Blender | Version: 2.54 beta |
Adobe Photoshop CS 5 (64 bits) | Version: 11 |
ABBYY Finereader | Version : 10 Professional Build (10.0.102.82) |
Benchmarks synthétiques | |
Benchmark | Détails |
PCMark Vantage | Version : 1.0.2.0 Patch 1901 |
3DMark 11 | Version 1.0.1 |
SiSoftware Sandra 2011 | Version : 2010.1.16.10 |
Benchmarks graphiques synthétiques
Nous commençons les tests de la partie graphique par les benchmarks synthétiques et plus particulièrement par 3DMark Vantage :
Le score global suggère que la Radeon HD 6620G intégrée à l’A8-3500M est environ 50 % plus rapide que l’Intel HD Graphics 3000 et à égalité avec une Radeon HD 5570 cadencée à la même fréquence qu’elle.
Il s’agit d’une victoire fondamentale pour le Llano, pour autant que ces performances se reflètent dans les jeux. Notons que la carte graphique 6630M dispose d’un léger avantage sur l’APU, avantage que double le mode Dual Graphics. Ce que le graphique ne dit pas, toutefois, est nous avons rencontré des saccades et des anomalies visuelles lorsque nous avons activé le mode Dual Graphics dans 3DMark ; il semble qu’AMD doive encore optimiser ses pilotes.
Le score CPU est dominé par l’Intel i5-2520M ; seul le Phenom II X4 cadencé à 2,4 GHz s’en approche. Comme on peut le voir, l’A8-3500M se comporte de manière très similaire au Phenom II X4 à 1,5 GHz, ce qui tend à nous faire croire que le Turbo Core n’accroît pas la fréquence du processeur dans ce benchmark. Pour le coup, c’est relativement logique, dans la mesure où une charge de travail combinant opérations CPU et GPU laisse moins de marge thermique au CPU.
Sous 3DMark 11, l’A8-3500M fait légèrement mieux que la Radeon HD 5570 cadencée à la même fréquence, du moins au vu du score global et graphique ; sans surprise, tous deux font moins bien que la Radeon HD 6630M et que le mode Dual Graphics. Notez l’absence de résultats pour l’Intel Core i5-2520M : 3DMark 11 a en effet besoin d’un moteur compatible DirecX 11 pour fonctionner, ce qui n’est pas le cas de l’Intel HD Graphics.
Sous Unigine Heaven, l’AMD A8-3500M fait jeu égal avec la Radeon HD 5570 underclockée et le mode Dual Graphics apporte un énorme avantage. Une fois encore, l’Intel HD Graphics ne fonctionne pas par manque de compatibilité avec DirectX 11.
Crysis 2
Il est probablement exagéré de vouloir faire tourner Crysis 2 sur un moteur graphique pour ordinateurs portables, mais nous pensions que l’expérience pourrait être intéressante. Nous avons toutefois ajouté un test en 1024 x 600 afin d’obtenir, ne serait-ce qu’une fois, un framerate à moitié correct.
L’APU A8-3500M et sa Radeon HD 6620G intégrée permettent d’atteindre un framerate moyen de 30 images/s en 1024 x 600. Bien qu’il s’agisse clairement d’une résolution assez faible, il ne faut pas oublier que Crysis 2 est un titre particulièrement gourmand ; il convient donc de ne pas sous-estimer cette performance. À titre de comparaison, l’Intel HD Graphics 3000 n’atteint dans cette résolution que 23 images/s en moyenne, avec un minimum de 16 images/s.
La Radeon HD 6630M, une carte graphique dédiée, fait toutefois mieux et parvient à obtenir 30 images/s en 1280 x 800. En 1600 x 900, aucun des moteurs graphiques testés ne permet de jouer correctement.
Le mode Dual Graphics ne fonctionne pas ici : il nécessite en effet la prise en charge de DirectX 10 ou 11 alors que Crysis 2 n’est qu’un titre DirectX 9. Ce qui nous perturbe est que lorsqu’on tente de l’activer, les performances deviennent moindres que celles d’une carte graphique dédiée utilisée seule. Le représentant d’AMD auquel nous avons signalé le problème nous a indiqué que ce n’était pas ce que nous devrions constater et que le pilote était censé repasser automatiquement à la carte graphique dédiée ; espérons qu’il ne s’agisse que d’un bug du pilote.
StarCraft 2
StarCraft 2 constitue un benchmark intéressant car il fait énormément appel au processeur ; nous voulions voir si les performances graphiques supérieures du Llano parviendraient à faire pencher la balance en sa faveur malgré la supériorité de l’Intel Sandy Bridge en matière de CPU.
En 1280 x 800, l’A8-3500M et le Core i5-2520M sont très proches l’un de l’autre : le processeur Intel affiche un framerate minimal plus élevé mais l’AMD permet de bénéficier d’une meilleure moyenne. Lorsqu’on augmente la résolution, cependant, l’APU d’AMD prend petit à petit l’avantage sur celui d’Intel.
La Radeon HD 6630M laisse les autres concurrents loin derrière elle, mais le mode Dual Graphics n’apporte aucun avantage dans ce titre DirectX 9 ; au contraire, le framerate est une fois encore inférieur à celui de la carte dédiée.
Metro 2033
Nous testons Metro 2033 à deux reprises afin de vérifier ce dont le mode Dual Graphics est capable. Nous commençons par le mode DirectX 9, où cette fonctionnalité n’apporte aucun avantage.
Comme nous nous y attendions, le mode Dual Graphics n’apporte rien sous DirectX 9 ; ce qui est plus gênant, et qui ne devrait pas se produire, c’est qu’il pénalise les performances.
Quoi qu’il en soit, l’A8-3500M semble incapable d’atteindre les 30 images/s dans ce titre : il plafonne à 24,7 images/s en 1024 x 768 (le benchmark refusait de fonctionner en 1024 x 600), ce qui reste tout de même près de deux fois plus élevé que le score de l’Intel HD Graphics 3000.
Voyons si la donne change en mode DirectX 10.
Malheureusement, les résultats en DirectX 10 ne semble guère différents de ce que nous avons enregistrés précédemment. Le mode Dual Graphics semble n’avoir aucun effet en-dessous d’une résolution de 1920 x 1080, où il prend une légère avance sur la Radeon HD 6630M. L’Intel HD Graphics 3000 mord une fois de plus la poussière.
F1 2010
F1 2010 est notre deuxième titre prenant en charge plusieurs modes DirectX. Codemasters avait eu l’amabilité de nous fournir une copie du tout nouveau DiRT 3, mais nous avons rencontré quelques difficultés pour faire fonctionner le benchmark en ligne de commande. Peu importe : F1 2010 reste un titre très attrayant et, qui plus est, compatible DirectX 9 et 11. Commençons par le mode DX9.
Même en qualité visuelle moyenne, ce titre reste très agréable visuellement, et l’A8-3500M le gère sans problème jusqu’en 1920 x 1080. Le Core i5-2520M s’en tire également très bien, probablement parce que F1 2010 est un titre assez gourmand en puissance processeur. Ce qui n’empêche pas l’APU Llano de faire mieux.
Pour ne pas changer, la Radeon HD 6630M arrive en première position du classement et le mode Dual Graphics n’apporte rien en DirectX 9.
Voyons s’il fait mieux en mode DirectX 11.
Apparemment, ce n’est pas le cas. Au contraire : les performances sont inférieures à celles de l’A8-3500M seul. Pire, le mode Dual Graphics engendre des anomalies visuelles très gênantes ; une fois de plus, il semblerait que le pilote doive être sérieusement optimisé.
Notons cependant que le Dual Graphics est tout à fait facultatif dans ce titre : même utilisé seul, l’A8-3500M permet d’obtenir un framerate moyen de 31 images/s en 1920 x 1080.
Le Core i5-2520M n’étant pas compatible DirectX 11, nous ne pouvons bien entendu l’inclure dans ce test.
Just Cause 2
Même en qualité moyenne, Just Cause 2 reste un titre relativement exigeant. Voyons comment nos processeurs graphiques pour portables s’en tirent.
L’A8-3500M parvient atteindre 30 images/s en moyenne en 1024 x 600, mais ce chiffre tombe sous la barre des 25 images/s dans les résolutions plus élevées. L’Intel HD Graphics 3000 fait cependant nettement moins bien et plafonne à 20 images/s à la résolution la plus faible.
Comme nous nous y attendions, la carte graphique dédiée se comporte bien et le mode Dual Graphics fait légèrement mieux avec près de 30 images/s en 1600 x 900.
H.A.W.X. 2
HAWX 2 est notre troisième titre compatible avec plusieurs modes DirectX. Nous commençons par la version 9.
Les framerates constatés sont agréablement surprenant dans l’ensemble, seul l’Intel HD Graphics 3000 n’atteignant pas les 35 images/s en 1600 x 900 et 1920 x 1080. Le mode Dual Graphics n’apporte rien en DX9, comme prévu.
Examinons maintenant les performances en mode DirectX 10/11.
Les framerates sont dans l’ensemble très proches de ceux enregistrés dans la version DirectX 9, sauf pour le mode Dual Graphics, qui parvient ici à dépasser la Radeon HD 6630M.
Antialiasing dans les jeux
Le classement est sans grosse surprise : l’Intel HD Graphics 3000 et le GPU de l’AMD A8-3500M sont tous deux en manque de bande passante par rapport à la Radeon HD 6630M et à sa mémoire dédiée.
Quoi qu’il en soit, il s’agissait là de notre dernier benchmark orienté jeux et il apparaît très clairement que l’A8-3500M dispose d’un avantage colossal sur le Core i5-2520M dans ce domaine.
Benchmarks processeur synthétiques
Après les tests axés sur les graphismes, place aux benchmark orientés processeur, les choses risquent fort d’être très différentes. Nous commençons comme à notre habitude par les tests synthétiques, le premier de la liste étant PCMark Vantage.
La partie graphique de PCMark est à peu près la seule de ce benchmark à contenir une charge de travail 3D ; il est donc intrigant de voir que l’A8-3500M affiche des performances si proches de celles du Phenom II X4 à 1,5 GHz. Le GPU étant pratiquement toujours au repos, nous espérions sincèrement qu’il resterait suffisamment de marge thermique à la puce pour que le Turbo Core s’active et accélère les cores du CPU jusqu’à 2,4 GHz, ou au moins aussi près de cette fréquence que possible.
Malheureusement, il apparaît clairement que le Phenom II X4 tourne nettement plus rapidement que l’A8-3500M ; même lorsque ce dernier est couplé à une carte graphique dédiée (la Radeon HD 6630M) afin d’éliminer totalement la charge pesant sur sa portion graphique, le Turbo Core ne semble pas changer grand-chose.
Pour être tout à fait honnête, il convient de rappeler que l’A8-3500M possède le TDP le plus faible de tous les Llano pour portables ; ceci dit, nous restons fortement déçus de constater que le Turbo Core s’apparente plus à une annonce marketing qu’à une fonctionnalité ayant un quelconque mordant. À titre de comparaison, lorsque le Turbo Boost d’Intel s’enclenche, cela se voit nettement (et c’est vérifiable grâce à l’utilitaire que la firme distribue).
L’Intel Core i5-2520M se fait ici pardonner toutes ses dernières places dans les benchmarks orientés jeux et prend une avance assez claire sur l’AMD A8-3500M. Nous remettons toutefois sérieusement en question la pertinence du score « gaming » de PCMark au vu des résultats affligeants du Sandy Bridge dans les vrais jeux.
Dans le benchmark arithmétique de Sandra, l’A8-3500M se comporte à peu de choses près comme un Phenom II X4 1,5 GHz. Le Core i5-2520M, lui, est plus proche du Phenom II à 2,4 GHz, mais lorsque les extensions iSSE4.2 activées, le processeur d’Intel prend une énorme avance.
Même situation dans le benchmark multimédia, si ce n’est que le Core i5 laisse tout le monde derrière lorsque le logiciel fait appel aux extensions iAVX.
Les résultats de test de cryptographie sont similaires, mais cette fois, le Core i5-2520M sort carrément du graphique grâce à sa fonction AES-NI, qui lui permet d’être dix fois plus rapide que la concurrence dans le benchmark AES256-ECB !
Performances GPGPU/GPCPU
Passons maintenant en revue les capacités de traitement que possèdent le CPU et le GPU du Llano lorsqu’on les utilise simultanément sous OpenCL et Direct3D.
Intel n’a publié son SDK pour OpenCL qu’il y a peu, et il est limité au processeur ; il ne fonctionne pas sur les unités d’exécution HD Graphics. Ces dernières peuvent toutefois faire tourner les shaders DirectCompute ; nous pouvons donc tester cet élément.
L’A8-3500M possède un avantage colossal sur l’Intel Core i5-2520M dans OpenCL et l’Intel HD Graphics 3000 dans DirectCompute. Mais les choses sont quelque peu différentes dans le test de cryptographie GPGPU/GPCPU :
Sous OpenCL, la partie CPU du Core i5-2520M fait jeu égal avec l’APU A8-3500M dans cette discipline, et ce, alors même que sa partie GPU reste inactive ! Les deux résultats du bas du graphique sont les scores obtenus par une Radeon HD 5570 et par l’Intel HD Graphics 3000 sous DirectCompute.
Pour terminer, voyons ce qu’il en est de la bande passante mémoire. Comme vous pouvez le constater, l’A8-3500M souffre de sa faible fréquence ; le Phenom II X4 à 2,4 GHz fait nettement mieux en comparaison et s’approche un peu plus du Core i5-2520M.
Benchmarks processeur : bureautique
Passons maintenant aux tests de bureautique.
Le benchmark ABBYY FineReader mesures les performances des processeurs en matière de reconnaissance optique des caractères (OCR). Le logiciel examine des images d’un livre numérisé et les transforme en un document Word.
L’A8-3500M est légèrement en retrait par rapport au Phenom II X4 1,5 GHz, ce qui laisse à penser que la suppression du cache L3 a une incidence négative sur les performances. Quoi qu’il en soit, le processeur Intel arrive clairement en tête.
Dans les trois logiciels de compression, l’Intel Core i5-2520M l’emporte sur l’AMD A8-3500M, qui semble plafonner à 1,5 GHz malgré le Turbo Core.
Benchmarks processeur : création de contenu
Poursuivons avec les benchmarks de création de contenu, à commencer par la modélisation et le rendu en 3D.
3ds Max et Blender ne mesurent que le temps nécessaire pour effectuer le rendu d’une scène 3D, mais Cinebench mesure le temps de rendu (en vert) et la réactivité de la fenêtre (en bleu). Intel domine le test de rendu dans les trois logiciels, mais dans Cinebench, qui est le seul benchmark à faire état de la capacité du GPU à afficher un framerate fluide, le Core i5 se fait battre à plate couture.
Le passage de la 3D à la 2D met la pression sur la portion CPU des puces. Notre benchmark emploie un certain nombre de filtres en multithreading, ce qui l’optimise donc pour les processeurs à plusieurs cores ; l’Intel Core i5 prend ici une avance indisputable.
Intel conserve son avance dans ces deux titres Adobe alors que l’AMD A8-3500M affiche des performances inexplicablement faible dans After Effects. Bref, il vaut probablement éviter de monter un station de traitement vidéo mobile autour d’un Llano.
Benchmarks processeur : encodage média
Intel continue à terminer en tête de tous les benchmarks processeur, comme le montrent nos tests d’encodage audio et vidéo.
Il n’y a pas grand-chose à dire, si ce n’est que l’architecture Intel possède un avantage évident en matière d’encodage… et ce, alors que nous n’avons même pas activé la fonction Quick Sync !
Encodage vidéo sur APU : APP Compute vs Quick Sync
AMD a fièrement claironné les capacités des 400 cores Radeon du Llano en matière de traitement GPGPU. Voyons s’ils parviennent à se mesurer à la fonctionnalité Quick Sync d’Intel dans un test de transcodage vidéo.
L’A8-3500M est très certainement aidé par les capacités GPGPU de ses shaders et parvient même à battre le Phenom II X4 assorti d’une Radeon HD 5570, ce qui nous faire que la « tuyauterie » de l’APU est mieux optimisée pour ce genre de tâches.
Malheureusement pour AMD, l’Intel Quick Sync est bien plus rapide encore : même avec l’accélération matérielle, l’A8-3500M ne parvient qu’à se hisser au niveau du Core i5-2520M en mode « pur CPU ». Les résultats ne sont en réalité pas vraiment surprenants : la logique à fonction fixe est conçue pour effectuer une seule tâche mais pour la faire bien, et c’est exactement le cas de Quick Sync. Le GPGPU est très polyvalent, mais il ne faut pas s’attendre à voir moteur graphique intégré se montrer aussi rapide ou économe que Quick Sync dans une application optimisée pour l’Intel Media SDK.
Qualité vidéo HD : HQV 2.0
En matière de lecture vidéo HD, les cartes Radeon sont généralement à préférer, tout du moins selon nos tests. Pour cet article, nous allons nous concentrer sur les différences qui existent entre le HD Graphics 3000 des Sandy Bridge et la Radeon HD 6620G des Llano. Pour les découvrir, nous faisons appel au benchmark HQV 2.0.
Résultats du test HQV 2.0 (sur 210) | |||||||||||
---|---|---|---|---|---|---|---|---|---|---|---|
AMD A8-3500M | Radeon HD 5670 | Intel HD Graphics 3000 | |||||||||
Catégorie 1 : Conversion vidéo | 90 | 90 | 78 | ||||||||
Catégorie 2 : Réduction du bruit et des artéfacts | 44 | 44 | 44 | ||||||||
Catégorie 3 : Mise à l’échelle et amélioration de l’image | 30 | 30 | 25 | ||||||||
Catégorie 4 : Traitement adaptatif | 27 | 27 | 12 | ||||||||
Total | 191 | 191 | 159 |
Ce benchmark n’est pas parfait, dans la mesure où il est assez subjectif, mais deux testeurs expérimentés utilisant le même matériel et le même pilote ne devraient normalement pas fournir des résultats différant de plus de 10 à 15 points.
Dans ces conditions, comment le Llano s’en tire-t-il ? Avec 191 points sur 210, il se comporte comme une Radeon HD 5570, ce qui est franchement très bien.
À titre de comparaison, l’Intel HD Graphics 3000 obtient un score de 159 sur 210, ce qui est nettement moins. Sa capacité à gérer le bruit et les artéfacts dus à la compression ainsi qu’à optimiser les tons chair est impressionnante, mais nous avons été déçus par sa prise en charge du « 2:2 Film Resolution », par ses performances insuffisantes en matière d’amélioration du contraste et surtout par son rendu catastrophique en rééchantillonnage et en mise à l’échelle.
L’Intel HD Graphics continue en outre à souffrir de son incapacité à gérer correctement la lecture vidéo à 23,976 images/s (le moteur double une image toutes les 40 secondes). Au final, AMD l’emporte dans ce test.
Consommation et autonomie
Au vu des affirmations d’AMD en matière de consommation énergétique, nous sommes tout naturellement très intéressés par les performances du Llano dans ce domaine. Après tout, AMD ne possède qu’une présence modeste sur le marché des portables ; à l’heure où les formats ont tendance à devenir de plus en plus compacts et l’autonomie de plus en plus importante, si la firme désire progresser dans ce segment, il va falloir que ses produits se montrent à la fois performants et économes.
Tom’s Hardware Real Life Usage
Notre premier test consiste en un passage par le Tom’s Hardware Real Life Usage, un benchmark concocté par notre collègue Andrew Ku et qui simule un usage réel composé de navigation sur internet, de tâches sous Microsoft Office et de lecture d’un film au format DivX.
Étant donné que nos deux laptops possèdent des batteries et des écrans différents, nous avons décidé d’éliminer ces deux variables en mesurant l’évolution de la consommation dans le temps et d’utiliser un moniteur externe.
D’après le graphique ci-dessus, on s’attendrait à première vue à ce que l’A8-3500M consomme moins que l’Intel Core i5-2520M dans un scénario d’utilisation « bureautique ».
Cependant, le processeur Intel passe plus souvent en mode basse consommation, ce qui lui permet de se montrer au final très économe : le Core i5-2520M a consommé en moyenne 12,8 watts durant la navigation sur internet, 17 watts durant les tâches MS Office et 19,4 watts lors de la lecture du film. À titre de comparaison, l’A8-3500M a consommé respectivement 15,2 watts, 16,3 watts et 19,5 watts. Certes, le Core i5 a montré dans nos benchmarks qu’il possédait une portion CPU plus rapide, mais cela ne se ressent pas lorsqu’il s’agit simplement de surfer, de taper un texte ou de regarder un film : le ressenti est identique.
Voyons ensuite comme nos deux plateformes se comportent lorsqu’on lance une tâche graphique.
Le diagramme de consommation ci-dessus étant le résultat d’un test en milieu contrôlé sur un moniteur externe, nous avons refait l’expérience avec l’écran de l’ordinateur portable. Le laptop équipé de l’A8-3500M a tenu 2h12. Si le portable Intel était équipé de la même batterie, il aurait tenu 1h22.
Ce résultat est très impressionnant : non seulement l’A8-3500M nous confère une autonomie pratiquement deux fois plus grande, mais ses performances graphiques sont considérablement plus élevées. En pratique, cela signifie qu’un possesseur d’ordinateur portable Llano pourrait jouer à un jeu 3D (pas trop exigeant) pendant deux heures avec un framerate tout à fait correct alors qu’un ordinateur à base d’Intel Core i5 ne tiendrait que la moitié de ce temps avec un framerate à peine jouable. Il semble donc qu’AMD ait eu raison de s’enthousiasmer vis-à-vis de la consommation de son dernier bébé ; celle-ci représente un avantage bien réel pour un appareil portable.
Pour terminer, nous avons voulu vérifier les affirmations de la firme concernant l’AMD AllDay Power. Pour être parfaitement clair, il faut savoir qu’AMD définit une « journée » comme « 8 heures ou plus sous Windows au repos ». Ce qui est absolument ridicule. Personne n’allume son ordinateur pour le regarder sans rien faire pendant une journée. Et c’est d’autant plus ridicule que dans la réalité, le Llano s’en tire largement assez bien pour qu’il ne soit pas nécessaire de tenter de créer le buzz avec un concept marketing totalement creux.
Sur notre machine de test à base d’A8-3500M, nous avons tenté de déterminer combien de temps tiendrait la batterie en réglant la luminosité de l’écran au minimum et en effectuant une tâche simplissime : lire un document. Nous avons lancé le logiciel de benchmark Battery Eater Pro afin de simuler un utilisateur parcourant un document. Notre ordinateur a tenu 7h40, ce qui n’est pas rien pour un portable classique doté d’un processeur AMD, surtout au vu du passif de la firme sur ce marché. Il semble donc que la plateforme Sabine soit en mesure de marcher sur les platebandes d’Intel.
Conclusion
Llano : un énorme potentiel
Il apparaît clairement que le GPU est le composant le plus crucial du projet Fusion d’AMD et que le succès du Llano dépendra de ses capacités graphiques. Heureusement pour la firme, les performances des AMD-A en la matière sont dignes d’une carte graphique dédiée.
Nous aurions sans doute préféré tester un processeur pour ordinateur de bureau, mais il n’est pas surprenant qu’AMD ait commencé par un modèle pour portable : les économies d’énergie qu’engendre le Llano en font en effet un produit parfaitement adapté à ce marché. Nous avions déjà vu ce que les AMD-C et E, deux gammes de puces basse consommation, pouvaient faire dans un netbook. Le Llano fait la même chose, mais dans un portable. Le timing est bien choisi : on ne trouve après tout que bien peu de portables à 500-700 € équipés d’un moteur graphique correct. Les Sandy Bridge d’Intel ne s’en sortent certes pas mal avec leur HD Graphics 3000, mais les Llano font considérablement mieux en 3D tout en consommant moins. Si les estimations de prix formulées par AMD sont correctes (ce qui reste à confirmer), nous pourrions nous retrouver avec des portables à 500 € capables de faire fonctionner les jeux 3D de manière plus que correcte, une perspective attrayante qui pourrait avoir une incidence énorme sur le marché. Bien entendu, nous ne pouvons rien recommander tant que les portables ne seront pas disponibles dans le commerce : ce que les fabricants feront du Llano sera tout aussi important que les capacités de la puce.
Sur marche des ordinateurs de bureau, par contre, l’avenir semble nettement moins rose pour l’APU d’AMD. Au vu de ses performances, nous dirions qu’il convient parfaitement lorsqu’il s’agit de remplacer un PC d’entrée de gamme équipé d’un chipset graphique intégré. Cela représenterait d’ailleurs une belle bouffée d’air frais dans ce segment où les performances graphiques ont toujours été mises au second plan. Si le Llano parvient à s’y imposer, il pourrait très certainement avoir un impact sur les attentes des consommateurs ; les développeurs pourraient compter sur un parc matériel plus puissant et programmer leurs jeux en fonction de celui-ci, ce qui constituerait une excellente nouvelle pour le jeu sur PC.
Hors de l’entrée de gamme, malheureusement, les AMD-A sont largement à la traîne : il n’est pas compliqué de mettre quelque chose comme une Radeon HD 6670 (80 €) dans un boîtier et d’obtenir une machine qui fasse mieux que le Llano, tant dans les tests graphiques que processeur.
Si le Llano a un talon d’Achille, il s’agit clairement de son architecture processeur, la Stars, qui se fait humilier par les Sandy Bridge d’Intel. Notre A8-3500M est le seul modèle quad-core de la gamme à afficher un TDP de 35 watts, et nous espérons sincèrement que c’est cette enveloppe thermique restreinte qui est responsable de ses résultats décevants dans les tests orientés CPU. Les performances de la partie processeur de la puce ne se sont jamais, à aucun moment, approchées de celles d’un Phenom II X4 cadencé à 2,4 GHz, alors que c’est ce que nous attendions au moins dans les tests mono-threadés comme iTunes ou LAME, où le Turbo Core aurait dû s’enclencher. AMD devrait peut-être songer sérieusement à retirer cette fonction des arguments marketing concernant les APU qui n’en profiteront jamais…
L’avenir
AMD nous a montré plusieurs applications en cours de développement qui devraient tirer parti du projet APP, mais il va falloir bien plus que du potentiel pour que le traitement GPGPU décolle réellement. Il suffit de voir ce qui se passe chez Nvidia : le CUDA existe depuis plus longtemps, Nvidia offre beaucoup plus de ressources aux développeurs et pourtant, le résultat le plus probant de cette stratégie est probablement Adobe CS5… Nous ne sommes pas trop sûrs de ce qu’il faudra pour que le GPGPU se popularise, mais il est certain qu’un parc informatique contenant plus d’APU ne fera pas de tort.
Reste également la question de l’avenir. Certes, l’architecture Stars ne va pas tarder à se faire remplacer par la Bulldozer et le successeur du Llano, c’est-à-dire le Trinity, va en profiter pour sa portion CPU. Mais l’architecture Bulldozer reste un grand point d’interrogation : nous n’avons encore aucune idée de ce que seront ses performances. Pendant ce temps, Intel ne se repose pas sur ses lauriers : les Ivy Bridge, gravés en 22 nm, devraient passer en production d’ici la fin de l’année. Par comparaison, le Llano est la première puce gravée en 32 nm d’AMD et les représentants de Globalfoundries indiquent qu’il faudra encore deux ans avant que le firme ne puisse passer au 20 nm (et deux ans de plus pour le 14 nm). À supposer que les prévisions d’AMD soient correctes, ce qui, disons-le franchement, pourrait très bien ne pas être le cas : la société n’est pas étrangère aux reports quand il s’agit de concrétiser ses annonces en matière d’avancées technologiques.
D’un autre côté, l’aspect graphique a toujours été la faiblesse d’Intel. La firme a beau essayer, encore et encore, elle finit toujours par minimiser l’importance des GPU, qui restent toujours dans l’ombre de ses processeurs. Et c’est une faiblesse qu’AMD semble exploiter aujourd’hui. Alors oui, indéniablement, le processeur d’Intel est plus puissant, mais les véritables questions sont la suivantes : seriez-vous plus enclin à remarquer la lenteur du CPU d’AMD ou celle du GPU d’Intel ? Votre attention serait plus attirée par la meilleure autonomie de l’AMD lors des tâches graphiques ou par les performances plus élevées de l’Intel dans les applications ?
Comme c’est bien souvent le cas, il s’agit de questions sans réponses toutes faites car tout dépend de votre utilisation. En réalité, la plupart des consommateurs ne vont pas remarquer la moindre différence entre un Intel Core Sandy Bridge et un AMD-A Llano quand ils surferont sur Internet ou rédigeront un document. Par contre, dans les jeux, l’APU d’AMD bat le processeur d’Intel à plate couture. Et si vous jouez sur portable, l’avantage est double : non seulement les performances sont plus élevées, mais l’autonomie également.
Les puces Intel gèrent mieux les tâches orientées CPU et la fonction Quick Sync accélère considérablement mieux le transcodage vidéo. Il est indéniable que l’architecture Nehalem est supérieure à la Stars. Mais sur le marché des portables, les performances graphiques et l’autonomie seront probablement les éléments déterminants pour la plupart des acheteurs ; le fait que 3ds Max fonctionne moins bien sur le Llano est secondaire.
Quel est donc notre verdict final ? Avec ses capacités graphiques, le Llano est susceptible d’apporter un véritable renouveau au sein du marché d’entrée/milieu de gamme. Son avantage en termes d’autonomie est également très appréciable sur portable et nous espérons qu’AMD prévoira des puces possédant une enveloppe thermique plus généreuse afin de donner à leur partie CPU une meilleure chance de faire ses preuves. Mais sur le marché des desktops, le Llano se trouvera toujours dans l’ombre des processeurs Intel, auxquels il suffit d’adjoindre une carte graphique milieu de gamme pour obtenir des performances plus élevées. En entrée de gamme, cela n’a guère d’importance, mais nous devrons attendre l’arrivée des Trinity pour voir si AMD est capable de concevoir un APU qui fera réellement concurrence à Intel côté CPU tout en lui faisant mordre la poussière côté GPU : un processeur sans compromis aurait nettement plus de chances de succès que la puce en demi-teintes qu’est aujourd’hui le Llano.