Introduction
Toute l’attention d’Intel est actuellement tournée vers Clarkdale, sa gamme phare gravée en 32 nm et basée sur l’architecture du Nehalem. Clarkdale est la base sur laquelle les Core i5 et Core i3 sont conçus. C’est un enjeu de taille pour Intel. Si important, en effet, qu’il m’a été dit sur le ton de la plaisanterie, deux semaines avant le lancement du Lynnfield, que toute la société avait mis l’accent sur Clarkdale, et pas sur le Core i5 et Core i7 que nous voyons aujourd’hui.
Mais Clarkdale est prévu pour dans six mois au moins. Aujourd’hui, il n’y en a que pour le Lynnfield présent dans les nouveaux Core i5 et Core i7 sur socket LGA 1156.
La fin du vénérable Core 2… enfin presque
Avec le lancement de ses Core i7, Core i5 et Core i3, Intel a tranquillement sonné le glas de la famille des Core 2, qui nous a accompagnés pendant plus de trois ans, et qui nous a fait doucement oublier le temps où l’entreprise s’entêtait en vain à faire grimper la fréquence de ses CPU.
La transition ne se fera pas immédiatement, ni même rapidement. Au quatrième trimestre 2010, l’architecture Core 2 sera encore une option intéressante en entrée de gamme.
La gamme des Core 2 Quad va de 120 € à 299 € selon la liste tarifaire du 9 août d’Intel. Les Core 2 Duo s’échelonnent de 100 € à 240 €. Est-ce que le trio de processeurs lancé aujourd’hui met à mal ces tarifs ? La réponse est oui. Est-ce que les trois processeurs Lynnfield en test dans ce dossier, dont les tarifs s’étendent de 199 $ à 555 $ (soit l’équivalent de 190 à 500 € compte tenu des taux de conversion constatés aujourd’hui) vont étouffer les Core 2 Quad et Core 2 Duo, si bien que tout le monde sera prêt à dépenser au moins 200 € sur leur prochain processeur ? Certainement pas.
Au fait, c’est quoi le milieu de gamme ?
Pour faire court, en haut de la pyramide se situe Bloomfield, le Core i7 sur socket LGA 1366. Lynnfield occupe désormais un segment situé entre le haut de gamme et le milieu de gamme. Yorkfield (Core 2 Quad) devient cette famille de transition qui permet à Intel d’attendre la sortie du Clarkdale au 1er trimestre 2010. Wolfdale (Core 2 Duo) continuera avec la famille des Pentium dual-core jusque dans le courant 2010.
Si vous vous êtes penché sur Core 2 Quad ou sur le Phenom X4 II précédemment, le Core i5 risque de vous intéresser. Si vous envisagiez déjà un Core i7 pour le LGA 1366, les Core i7-860 et -870 méritent votre attention avec des tarifs identiques à ceux des i7-920 et -950. Comment est-on censé choisir entre des processeurs dont l’architecture, les fonctionnalités et les prix sont tellement proches ?
Bonne question, c’est d’ailleurs l’un des domaines sur lequel nous allons être particulièrement critiques aujourd’hui. La désignation des produits est confuse si vous n’êtes pas déjà familier avec l’architecture. Heureusement, il y a beaucoup d’innovations plus excitantes à couvrir plutôt que les noms de produits hasardeux.
Un nom c’est quoi ?
Avec les Core 2 Quad et Core 2 Duo, vous aviez une idée générale de ce à quoi vous aviez affaire. L’ajout d’une référence Q8000 ou E7000 n’a pas été particulièrement descriptif, mais au moins il y avait un identifiant clair afin d’aider le profane à se repérer.
Quand Intel a lancé le Core i7 l’année dernière, il n’y avait qu’une seule famille de processeurs basés sur l’architecture Nehalem. Il était donc facile de dire « Core i7… Ouais, des trucs haut de gamme », même si l’on parlait à la fois des 250 € du i7-920 et des 1000 € du i7-965.
Maintenant qu’il existe le Core i5 et un nouvel opus du Core i7, la nomenclature est incompréhensible pour tout le monde sauf pour les utilisateurs avancés qui vivent et respirent Intel. Exposons les choses en les décomposant dans un joli petit tableau.
Core i7 (LGA 1366) | Core i7 (LGA 1156) | Core i5 | Core 2 Quad | |
---|---|---|---|---|
Socket Processeur | LGA 1366 | LGA 1156 | LGA 1156 | LGA 775 |
Nombre de Coeurs | 4 | 4 | 4 | 4 |
Turbo Boost | Oui | Oui | Oui | Non |
Hyper-Threading | Oui | Oui | Non | Non |
L1 Cache | 32 ko/32 ko par coeur | 32 ko/32 ko par coeur | 32 ko/32 ko par coeur | 32 ko/32 ko par coeur |
L2 Cache | 256 ko par coeur | 256 ko par coeur | 256 ko par coeur | Max. 12 Mo partagés |
L3 Cache | 8 Mo partagés | 8 Mo partagés | 8 Mo partagés | Néant |
Canaux Mémoire | 3 | 2 | 2 | 2 |
Fréquence Mémoire max. | DDR3-1066 | DDR3-1333 | DDR3-1333 | DDR3-1600 |
Chipset | X58 | P55 | P55 | X48 |
Prix | 230 € – 900 € | 285 $ à 555 $ (≈ 250 à 500 €) | 199 $ (≈ 190 €) | 120 € – 299 € |
Comme vous pouvez le voir, le Core i7 LGA 1366 reste une offre orientée haut de gamme, avec un maximum de ports PCI Express 2.0 via un chipset Intel X58 Express, jusqu’à trois canaux de mémoire DDR3, la première génération de Turbo Boost d’Intel et l’Hyper-Threading.
Le Core i7 LGA 1156 intègre le contrôleur PCI Express (16 lignes au lieu de 36), abandonne un canal mémoire, voit son Turbo Boost amélioré, et conserve l’Hyper-Threading.
Le Core i5 intègre aussi le contrôleur PCI Express et le contrôleur de mémoire dual-channel. Le Turbo Boost est là, mais un peu moins efficace que celui de l’i7 LGA 1156. Ce qui manque, cependant, c’est la technologie Hyper-Threading (apparemment suffisamment remarquable pour transformer un i7 en i5). Bien entendu, plus on descend dans la gamme plus la vitesse des processeurs est basse.
Anatomie des Core i5/i7
Architecturalement, la majeure partie d’un Core i5 ou i7 Lynnfield est empruntée aux Core i7 Bloomfield LGA 1366 (et donc aux Xeon série 3500). Lynnfield est cependant plus gros que Bloomfield : son die compte 774 millions de transistors contenus dans 296 millimètres carrés (contre 731 millions dans 263 millimètres carrés pour les premiers Core i7). Plus de 400 millions de ces transistors forment le cache du processeur.
Comme pour les Bloomfield, Lynnfield possède une conception monolithique, faite d’une part de quatre cores (pipelines d’exécution, cache L1 données/instructions,cache TLB) et d’autre part de l’uncore (cache L3, PCI Express intégré, contrôleur mémoire, bus QPI, et la PLL). L’alimentation de ces deux « moitiés » demeure séparée et réglable indépendamment dans le BIOS de votre carte mère.
Chacun des quatre cœurs conserve ses 32 ko de cache de données de niveau 1 (8-way set-associative), 32 ko de cache L1 d’instructions (4-way set-associative), et 256 ko de cache L2 (vous l’aurez deviné, encore 8-way set associative ). La présence de 8 Mo de cache L3 (16-way set-associative) devrait également vous paraitre familière.
Avec rien de vraiment nouveau à signaler dans les noyaux eux-mêmes, nous passons au uncore, où Intel a ajouté la connectivité PCI Express 2.0, supprimé un canal de mémoire, portant leur nombre total à deux, et modifié le bus QPI.
Socket LGA1156 : contrôleurs mémoire et PCI Express intégrés
La société ne dira rien de précis sur les modifications apportées à son QuickPath Interconnect, l’interface point à point utilisée pour relier le Core i7 au X58. Mais il existe un connecteur QPI intérieur du Lynnfield, servant de liaison entre le contrôleur PCI Express intégré et le uncore. La communication se faisant au sein du die, les performances et les latences sont toutes les deux meilleures que sur Bloomfield.
Cette interconnexion est importante aujourd’hui, naturellement, mais le deviendra encore plus lorsque Clarkdale sortira l’année prochaine. Avec un processeur graphique en plus du contrôleur mémoire sur le même bout de silicium, la bande passante mémoire, l’un des plus gros talons d’Achille des systèmes graphiques intégrés, est fournie de manière beaucoup plus efficace. Par conséquent, on peut s’attendre à voir Intel ajuster la vitesse de ses bus QPI internes dans un sens ou dans l’autre pour différencier les modèles de Clarkdale.
Bien sûr, rien de tout cela n’est vraiment un problème avec Lynnfield, qui ne possède pas de GPU intégré et communique avec les cartes graphiques dédiées via 16 lignes PCI Express 2.0. Nous avons déjà passé beaucoup de temps à comparer les performances des configurations mono et bi-carte sur P55 contre X58, P45, et 790GX utilisant des processeurs 2,8 GHz (comparaison qui vous sera présentée très bientôt dans un nouvel article). Nous avons conclu qu’il y a très peu de gains ou de pertes causés par l’intégration du contrôleur PCI-Express sur le CPU Lynnfield. En d’autres termes, les utilisateurs ne verront aucune différence.
L’octroi de licences SLI et CrossFire à beaucoup plus d’impact, et permet à la plupart des cartes mères P55 de supporter aussi bien les deux technologies, tout comme le X58. La différence est que les plateformes P55 seront beaucoup moins chères. Mais nous y reviendrons.
Enfin, il ne faut pas oublier le contrôleur mémoire DDR3, à en trois canaux 64 bits sur Bloomfield et seulement deux canaux sur Lynnfield. Officiellement, Bloomfield est conçu pour de la DDR3-1066 au maximum, ce qui donne une bande passante théorique de 25,6 Go/s. Nous avons tous vu le Core i7 LGA 1366 monter jusqu’à DDR3-2133, donc les spécifications officielles ne sont pas à prendre au pied de la lettre. En revanche, Lynnfield est conçu pour de la DDR3-1333, offrant jusqu’à 21,3 Go/s de débit. Sur le papier, la perte du troisième canal est donc en grande partie compensée par une augmentation de la fréquence. Nous allons mettre cette théorie à l’épreuve dans quelques pages.
LGA 1156: Socket et Segmentation
Le tableau ci-dessous résume les changements de sockets qu’ont imposés à leurs clients AMD et Intel au cours des neuf dernières années. Conclue par le LGA 1156, la colonne d’Intel paraît bien encombrée, non ?
Lancement de socket processeur | ||
---|---|---|
Année | AMD | Intel |
2001 | Socket 478 | |
2002 | ||
2003 | Socket 754 | |
2004 | Socket 939 | LGA 775 |
2005 | ||
2006 | Socket AM2 | (Intel lance son Core 2 Duo, la majorité des cartes mères doivent être remplacées) |
2007 | ||
2008 | LGA 1366 | |
2009 | (Le Socket AM3 des nouveaux processeurs fonctionne sur d’anciennes cartes mères, mais pas le contraire) | LGA 1156 |
Je suis sûr que nombre de passionnés ont dépensé beaucoup d’argent sur le LGA 1366, le X58 et le Core i7. En voyant les performances de Lynnfield, le coût de cette plateforme, et les possibilités d’évolution vers les Clarkdale, ils se demanderont pourquoi nous ne les avons pas avertis plus clairement de ce qui était à venir. À ces gens-là, laissez-moi donner une information, je l’espère réconfortante : le prochain Core i9 Gulftown (32nm, hexa-core, Hyper-Threading activé) se posera comme un charme sur les cartes mères X58 existantes. Au contraire, ceux qui attendent Clarkdale attendent un CPU dual-core, certainement pas aussi sexy… sauf si vous mourrez d’envie d’avoir une puce graphique Intel GMA intégré à votre CPU.
Pour quelle raison, alors, Intel lance-t-il un socket LGA 1156 juste un an après le LGA 1366 ? Pourquoi Intel n’a-t-il pas intégré le contrôleur PCI Express dans les CPU sur plate-forme LGA 1366 ?
Dès le départ, le socket 1366 a été conçu pour les machines double processeur, comme le chipset X58 Tylersburg. Le fait qu’il soit d’abord apparu sur les PC de bureau rappelle la façon dont le socket professionnel LGA 771 a fait une incursion dans le domaine grand public via Skull Trail. La différence est que les cartes mères X58 sont descendues sous la barre des 180 € et que les processeurs compatibles se trouvent à moins de 200 €. Ça n’est pas donné bien sûr, mais c’est suffisamment abordable pour inciter les gens à savoir à quelle vitesse un i7 overclocké peut tourner.
Le LGA 1366 ne s’est pas vu gratifié de port PCI Express, car cela aurait rendu le brochage du socket trop complexe. De plus, les serveurs et stations de travail qui utilisent maintenant ce socket ne se seraient pas satisfaits de 16 lignes PCI Express à partager entre les contrôleurs de stockage, les cartes graphiques professionnelles, et les interfaces réseaux à haut débit.
Ainsi, le LGA 1156 est le vrai successeur du LGA 775, malgré une segmentation alambiquée. C’est plus simple que le LGA 1366, son mécanisme de verrouillage applique une pression plus uniforme sur le dissipateur thermique du processeur, et permet une protection contre les interférences électromagnétiques ; un point particulièrement critique pour Clarkdale et son sous-système graphique intégré.
Vous pouvez vous attendre à ce que ce socket demeure omniprésent jusqu’à fin 2011, lorsque le LGA 1155 (prévu pour la première moitié de 2011) commencera à accaparer le marché.
Turbo Boost d’Intel : la potion magique du Lynnfield
Plus que l’intégration du PCI Express, le contrôleur mémoire dual-channel, ou le bus QPI amélioré, la nouveauté la plus remarquable de Lynnfield est la dernière version de la technologie Turbo Boost d’Intel.
Vous vous souvenez que le Bloomfield Core i7-900 dispose d’une unité de contrôle de la puissance (PCU =Power Control Unit) munie d’un contrôleur intégré. Ces deux sous ensembles possèdent à peu près le même nombre de transistors qu’un processeur 486 complet. À intervalles réguliers, la PCU contrôle la température, l’intensité du courant, la consommation électrique, et l’état demandé par le système d’exploitation.
À quoi servent ces informations ? Dans le cas de Bloomfield, qui a un TDP de 130W, le processeur peut presque complètement couper les cores qui ne sont pas utilisés (état C6) et ainsi réduire la consommation. De toute évidence, les cores inactifs (ceux en C3 ou C6) se traduisent par un plus grand écart entre la consommation réelle et le TDP. Ainsi, durant les charges de travail multithread, lorsque trois ou quatre cores Bloomfield travaillent (mais toujours selon les limites programmées du PCU), cette fonctionnalité appelée Turbo Boost augmente de 1 le coefficient du processeur. Multiplié par une fréquence de base de 133 MHz, c’est 133 MHz supplémentaires sur chaque coeur. Avec seulement un core actif (en C0 ou C1), Turbo Boost peut pousser la fréquence encore d’un cran en ajoutant 266 MHz à la fréquence d’origine du CPU.
Nous avons constaté qu’il était en réalité très rare de voir Turbo Boost monter de deux crans, puisque le planificateur de tâche de Vista a la mauvaise habitude de passer les threads d’un core à l’autre, les maintenant tous actifs. Nous avons bien été en mesure de faire une capture d’écran du Core i7 975 à 3,6 GHz, mais cela n’a duré qu’une fraction de seconde. Turbo Boost n’est donc pas un réel avantage.
Mais tout change aujourd’hui. Les trois Core i5 et Core i7 Lynnfield affichent un TDP de 95W (et un plafond de 89 A), obligeant la PCU à gérer encore mieux leur consommation. La PCU voit sa tâche compliquée encore par une implémentation plus ambitieuse de Turbo Boost. Avec trois ou quatre cores actifs, le Core i5-750 et i7-860 voient leur fréquence monter d’un cran (et celle du Core i7-870 monte de deux crans). Mais avec seulement deux cores actifs, les trois modèles bénéficient de quatre crans (533 MHz) d’amélioration. Et avec un seul core actif, les deux Core i7 gagnent 667 MHz tant qu’ils restent sous la barre des 95W.
Turbo Boost : Montée en fréquence (Dans les limites de TDP/A/Temp) | |||||
---|---|---|---|---|---|
Réf. Processeur | Fréquence | 4 Cores Actifs | 3 Cores Actifs | 2 Cores Actifs | 1 Core Actifs |
Core i7-870 | 2.93 GHz | 2 | 2 | 4 | 5 |
Core i7-860 | 2.8 GHz | 1 | 1 | 4 | 5 |
Core i5-750 | 2.66 GHz | 1 | 1 | 4 | 4 |
Core i7-975 | 3.33 GHz | 1 | 1 | 1 | 2 |
Core i7-950 | 3.06 GHz | 1 | 1 | 1 | 2 |
Core i7-920 | 2.66 GHz | 1 | 1 | 2 | 2 |
Plus qu’autre chose c’est cela la nouveauté de Lynnfield. Avec des applications parallélisées, on constate les avantages d’un processeur quad-core. Mais des benchmarks comme WinZip, Lame ou iTunes nous avons vu à maintes reprises les processeurs dual core à haute fréquence prendre le dessus. Lynnfield offre le meilleur des deux mondes et monte en fréquence pour assurer une meilleure vitesse sur des tâches monothread.
Afin de garder un contrôle encore plus étroit sur la consommation, le taux d’échantillonnage du PCU de Lynnfield est augmenté par rapport à celui de Bloomfield. Par conséquent, les nouveaux Core i5 et i7 sont capables d’augmenter la tension ou de la réduire de manière plus efficace que les Bloomfield, et donc de réagir plus rapidement face à une charge de travail single ou multi-threaded. Il ne s’agit que de petits réglages, mais quand il est question de changement entre les statuts “inactif” et “actif”, chaque bit compte.
Test du Turbo
Il est très facile de voir Turbo Boost en action grâce à la version bêta de TMonitor que vous trouverez sur cpuid.com. Il suffit d’assigner une application à un core unique par l’intermédiaire du Gestionnaire des tâches de Windows. L’application sera liée à ce core, permettant ainsi de constater l’accélération fournie par Turbo Boost. Remarquons toutefois que ce n’est pas le meilleur moyen de tirer parti d’une machine équipée d’un Core i5 ou Core i7, puisque nous avons constaté de meilleures performances en gestion automatique (même si iTunes semble sauter d’un core à l’autre).
Comme vous pouvez l’attendre d’une technologie capable d’overclocker un Core i5-750 de 2,66 GHz à 3,2 GHz dans des charges de travail mono-thread, le gain de performance est considérable. Dans les pages suivantes, nos benchmarks compareront les nouveaux i5 et i7 aux Bloomfield, Yorkfield, et Deneb d’AMD, mais vous pouvez d’ores et déjà constater la différence dans iTunes avec TurboBoost activé puis désactivé ci-dessous.
Le résultat est assez convaincant, surtout si on le compare à ceux des autres processeurs.
Opposez le i5-750 (190 €) contre le i7-920 (270 €) dans les applications mono thread et vous obtiendrez des résultats encore plus intéressants. Turbo Boost est la “killer feature” qui va permettre, dans certains cas, aux processeurs Lynnfield de battre des configurations Bloomfield plus onéreuses.
Le Core i7 : décevant avec un seul coeur ?
En essayant de tirer le meilleur parti de Turbo Boost, nous avons observé un comportement intéressant lors de scénarios n’impliquant qu’un seul coeur.
Le Core i5-750 n’avait aucune difficulté à réaliser ses quatre Boost, passant de 2,66 GHz à 3,2 GHz dans la plupart des cas. Toutefois, le Core i7-870 et le Core i7-920 n’ont pas atteint respectivement leur pics de 3,6 GHz et 2,93 GHz, à moins que nous ne forcions manuellement le programme en cours d’exécution à ne fonctionner que sur un coeur.
Certes, selon Intel, la plupart des applications mesurant la fréquence des processeurs s’appuient sur la norme ACPI, et sont donc incapables de détecter correctement les fréquences modifiées par Turbo Boost. Mais on nous a assuré que TMonitor reflète correctement la fréquence réelle de chaque coeur. Par conséquent, d’après nos mesures, il est plus juste de considérer que Core i7-800 monte de quatre crans avec un coeur actif et que le Core i7-900 obtient un gain d’un cran, plutôt que de compter respectivement sur cinq et deux.
Hyper-Threading : le plus du Core i7
Nous avons donc maintenant des Core i7-800 sur LGA 1156 et des Core i7-900 sur LGA 1366. Déroutant, n’est-ce pas. Mais insistons sur le fait qu’un i7 est un i7 car il est équipé de la technologie Hyper-Threading. Évidemment, Intel utilise également la fréquence d’horloge comme un facteur de différenciation, et au moins en théorie, vous devriez obtenir un Turbo Boost plus efficace sur un processeur i7-800 que sur un i5.
Comme vous le savez probablement déjà, l’Hyper-Threading est le nom Intel pour une technologie d’exécution simultanée de plusieurs threads (Simultaneous MultiThreading). Elle permet de faire en sorte que chaque coeur physique soit reconnu comme deux cœurs logiques par le système d’exploitation. Ainsi, lorsque vous ouvrez le gestionnaire des tâches sur une machine équipée d’un processeur Nehalem avec la technologie Hyper-Threading activé, vous pouvez voir huit threads. Cela ne signifie cependant pas que vous avez tout à coup l’équivalent d’un processeur à huit coeurs. Intel copie certaines ressources sur chaque coeur physique afin de rendre la technologie disponible. Il est préférable de considérer l’Hyper-Threading comme permettant aux multicoeurs des processeurs comme les i7 d’être mieux employés dans les charges de travail parallélisées.
Nous savons que MainConcept Reference, par exemple, est bien parallélisé. En activant simplement l’Hyper-Threading, le temps nécessaire au transcodage de notre vidéo de test chute de 1 min 48 s à 1 min 26 s.
De même, la dernière version de l’antivirus d’AVG réalise un gain énorme grâce à la technologie Hyper-Threading (24 % plus rapide). Les environnements moins optimisés ou simplement multitâches donneront des résultats moins prononcés, mais vous auriez raison d’au moins envisager de vous procurer un Core i7 si vous êtes en mesure de bénéficier de l’Hyper-Threading.
Contrôleur mémoire : un canal en moins, ça fait mal ?
Vous « perdez » deux choses en passant d’un Core i7 LGA 1366 à un Core i7 LGA 1156 (et trois choses, si vous optez pour un Core i5) : l’architecture mémoire triple-canal, suffisamment de lignes PCI Express 2.0 pour donner à chaque carte graphique d’une configuration SLI ou CrossFire son port 16x, et, dans le cas du i5, la technologie Hyper-Threading.
Nous savons déjà que la technologie Hyper-Threading peut être un avantage important si vous utilisez les bonnes applications. Nous avons dit que l’intégration du PCI Express n’est pas primordiale. Mais qu’en est-il du sous-système de mémoire ? Techniquement, les deux canaux mémoire DDR3-1333 de Lynnfield ne font perdre qu’environ 4 Go/s par rapport aux trois canaux DDR3-1066 de Bloomfield. Mais ces spécifications n’ont que très peu d’importance pour les overclockers prêts à aller chercher la DDR3 1600, 1866 ou 2000 MHz.
Parce que nous n’avons trouvé que peu d’intérêt aux mémoires plus rapides que la DDR3-1333 (au moins en termes de performances), nous avons équipé notre plate-forme X58 et notre plateforme P55 avec des barrettes de DDR3-1333 réglées sur des timings de 7-7-7-20-1T.
On observe incontestablement un gain de débit considérable avec trois canaux de mémoire DDR3. Mais, comme nous l’avons vu à plusieurs reprises, il ne se traduit pas nécessairement dans les faits. Si vous étiez inquiet d’un éventuel impact négatif du contrôleur mémoire de Lynnfield, soyez rassurés.
P55 : le chipset perd ses prérogatives
Dites adieu à la conception traditionnelle des plateformes Intel à trois composants. Le P55 (et très probablement tous les chipsets de bureau après lui) fait partie d’une plateforme à deux puces, comprenant le processeur et une partie du coeur logique de la carte mère. Il y a certainement une équipe d’ingénieurs de NVIDIA qui doit se sentir honorée par cet hommage.
Avec les contrôleurs mémoire et PCI Express faisant maintenant partie de Lynnfield (bientôt suivi du circuit graphique dans le Clarkdale au premier trimestre 2010), le chipset n’a plus grand-chose à faire, à part gérer les fonctionnalités qui étaient auparavant du ressort du southbridge (les ICH chez Intel). Ainsi, le P55 vous offre six ports SATA à 3 Go/s, un contrôleur Ethernet Gigabit, 14 ports USB 2.0, l’Audio HD, et huit lignes PCI Express 2.0 pour la connexion des périphériques. Le P55 est un southbridge tout ce qu’il y a de plus banal.
Le P55 réalise néanmoins de remarquables économies d’énergie par comparaison avec le X58. Pour commencer, Lynnfield possède un TDP de 95W. Bloomfield quant à lui affiche 130W auxquels il faut ajouter les 22 W du X58 Express. Le P55 consomme jusqu’à 4,7 W soit très légèrement plus que les 4,5 W du southbridge ICH10R. Additionnez le tout et c’est une économie de plus de 56W au total !
Faire le lien
Sur une plateforme X58 le processeur communique avec le chispet via un bus QPI à 25,6 Go/s. Il y a ensuite une connexion DMI à 2 Go/s entre le chipset X58 et le southbridge ICH10.
Avec une plateforme P55 et son design à deux puces, le northbridge est absorbé dans le Core i5/i7, et il ne reste plus qu’à relier le processeur à l’équivalent d’un southbridge, même si Intel appelle cela un centre de contrôle de plateforme (PCH, Platform Controller Hub). Comme les ICHs avant lui, le P55 se connecte à son hôte (Lynnfield) via une connexion DMI.
Selon Intel, le lien DMI entre le Lynnfield et la P55 tourne à 2 Go/s, tout comme les générations de ICH précédentes. Auparavant, cette connexion gérait six liens PCI Express 1.1, SATA, l’USB 2.0, l’Ethernet Gigabit, et l’Audio HD. Avec le passage à la P55, la plupart de ces sous-systèmes demeurent inchangés. Cependant, le chipset supporte désormais huit liens PCI Express 2.0.
Intel n’en est pas moins convaincu que son lien DMI ne sera pas saturé. Les chiffres ne mentent pas, cependant. Avec la bonne combinaison de SSD, il ne serait pas difficile de créer des embouteillages sur la carte mère.
Windows 7 : Microsoft écoute Intel, enfin
Depuis sa sortie, Windows Vista a subi de nombreux outrages – dont une partie était méritée. Un point particulier que nous avons vu affecter à la fois Intel et AMD est la gestion de l’énergie.
Dans le cas d’AMD, activer la technologie Cool’n’Quiet sur les premiers Phenom causait une dégradation sensible des performances sous Vista. Le scheduler, l’ordonnanceur des processus, de Vista passait son temps à déplacer les threads des coeurs actifs vers les coeurs au repos et tournant à la moitié de la fréquence nominale. Pourquoi faisait-il ça ? De sorte à maintenir la symétrie d’un système à pleine charge, il faut éviter que les requêtes d’entrées/sorties soient concentrées sur un seul coeur. Si l’on fait sauter les threads d’un coeur à l’autre, on gagne en rapidité. Mais ce beau concept vole en éclats lorsque les coeurs inactifs sont mis en semi veille.
Cette technologie fut mise au point au cours de la conception du noyau Windows NT, et d’après nos expériences avec les composants d’Intel ou AMD, elle n’était pas considérée comme un atout pour les deux fondeurs. Bien sûr, Intel n’était pas touché de la même manière qu’AMD. Le problème d’Intel avec Vista était la consommation électrique. À chaque migration d’un thread d’un coeur à l’autre, il faut par exemple réécrire le cache L3 d’un processeur Nehalem, ce qui consomme de l’énergie.
Cette situation change avec Windows 7, et une fonction appelée “coeur idéal” (ideal core). Si un tâche de calcul est exécutée par un coeur, le système d’exploitation la laissera là. Cela a deux conséquences pour Intel : d’abord, on ne perd pas d’énergie à migrer le processus, d’autre part, les coeurs inactifs peuvent descendre dans leur état de vielle le plus profond, le C6. A priori, ces économies d’énergie devrait permettre de gagner 10 à 15 minutes d’autonomie sur les PC portables équipés de processeurs Nehalem (qui resteront une chimère jusqu’au lancement des CPU Arrandale plus tard cette année). Le corollaire est que les processeurs incapables de descendre en état C6 (et donc les processeurs AMD) ne montreront pas les mêmes gains.
Le Core parking est une deuxième optimisation, basée sur le constat que dans les précédents systèmes d’exploitation, il était possible de voir quatre coeurs occupés par des tâches de fond à moins de 10 % chacun. L’idée est donc de rassembler toutes ces tâches sur un seul coeur, ce qui permet de laisser les autres au repos.
Il est facile de voir comment ces deux optimisations peuvent travailler de concert pour diminuer la consommation. Ideal Core évite les migrations frénétiques des threads, et Core parking optimise la charge de chaque coeur. Ensemble, les deux maximisent le nombre de coeurs laissés au repos, et devraient donc générer des gains de consommation.
S vous souhaitez en savoir plus à propos des changements intégrés dans Windows 7, écoutez cette interview (en anglais) de Mark Russinovich, expert technique chez Microsoft.
Nous sautons le pas
Compte tenu des retours de nos lecteurs sur Vista, de la disponibilité de la version finale de Windows 7 et de la compatibilité de notre suite de tests, nous avons fait le choix de Windows 7 pour tester les plateformes de ce comparatif.
Mais avant de le faire, nous avons voulu quantifier les économies d’énergie supposées par Intel. Nous avons donc exécuter PC Mark Vantage sur la même machine (équipée du Core i7 870), d’une part sur une installation fraîche de Vista SP2 x64, d’autre part sur une installation fraîche de 7 RTM (toutes deux x64).
Les résultats sont contraires à ce que nous attendions. Sous Windows 7, la consommation moyenne est 6 W supérieure, mais le test est terminé 3 minutes plus tôt que vous Vista. On remarque néanmoins que, lorsque la machine sous 7 reste au repos, sa consommation est réellement plus faible que sous Vista.
Nous avons présenté ces résultats à Intel, qui les a interprétés ainsi : la politique de passage du CPU en état P est plus agressive sous Windows 7 que sous Vista, ce qui signifie que le 7 enclenche plus rapidement et plus souvent le mode Turbo du Core i7 870. On obtient donc de meilleures performances, mais aussi une consommation plus importante. Au contraire, au repos, les optimisations ideal core et core parking entre en jeu et diminuent la consommation.
La leçon de ce test est néanmoins que Windows 7 génère une consommation moyenne plus importante que Vista. Nous sommes presque certains d’avoir une explication à ce fait, mais nous attendrons d’avoir les données chiffrées suffisantes pour soutenir notre hypothèse. Retenez pour l’instant que si vous utilisez votre PC en permanence, Windows 7 ne diminuera pas votre facture d’électricité. Pour démontrer une diminution de la consommation sous 7, nous devrions soit inclure une période beaucoup plus longue de repos (ce qui reflèterait mieux l’usage moyen de la majorité des PC), soit remplacer un certain composant, soit désactiver certains paramètres dans l’OS.
Configuration de test et benchmarks
Configuration matérielle | |
---|---|
Processeurs | Intel Core i7-920 Extreme (Bloomfield) 2.66 GHz, LGA 1366, 4.8 GT/s QPI, 8 MB L3, Power-savings enabled |
Intel Core i7-870 (Lynnfield) 2.93 GHz, LGA 1156, 8 MB L3, Power-savings enabled | |
Intel Core i5-750 (Lynnfield) 2.66 GHz, LGA 1156, 8 MB L3, Power-savings enabled | |
Intel Core 2 Extreme QX9770 (Yorkfield) 3.2 GHz, LGA 775, 1,600 MHz FSB, 12 MB L2, Power-savings enabled | |
Intel Core 2 Quad Q9550S (Yorkfield) 2.83 GHz, LGA 775, 1,333 MHz FSB, 12 MB L2, Power-savings enabled | |
AMD Phenom II X4 965 BE (Deneb) 3.4 GHz, Socket AM3, 4 GT/s HyperTransport, 6 MB L3, Power-savings enabled | |
Cartes mères | Asus P6T (LGA 1366) X58/ICH10R, BIOS 0707 |
Gigabyte P55-UD6 (LGA 1156) P55, BIOS F3 | |
Intel DX48BT2 (LGA 775) X48/ICH10R, BIOS 1902 | |
Asus M4A79T Deluxe (AM3) 790FX/SB750, BIOS 1103 | |
Mémoire | Corsair 4 GB (2 x 2 GB) DDR3-1600 7-7-7-20 @ DDR3-1333 |
Corsair 6 GB (3 x 2 GB) DDR3-1600 7-7-7-20 @ DDR3-1333 | |
Disques durs | Intel SSDSA2M160G2GC 160 GB SATA 3 Gb/s |
Intel SSDSA2MH080G1GN 80 GB SATA 3 Gb/s | |
Carte graphique | Sapphire Radeon HD 4870 X2 2GB |
Alimentation | Cooler Master UCP 1100W |
Ventirad | Vigor Gaming Monsoon III LT |
Configuration logicielle | |
Système d’exploitation | Windows 7 x64 RTM |
DirectX | DirectX 11 |
Pilote carte mère | Intel INF Chipset Update Utility 9.1.1.1015 |
Pilote carte graphique | Catalyst 9.8 |
Bien que nous ayons testé les Core i7 et i5 Lynnfield sur une carte mère Gigabyte P55-UD6, nos précédents tests du Turbo Boost, de l’Hyper-Threading, des performances mémoire, et de Windows 7 contre Vista furent tous faits sur la carte Intel DP55KG.
Paramètres des Benchmarks | |
---|---|
Encodage audio | |
iTunes | Version: 8.2.1.6 (64-bit), Audio CD (“Terminator II” SE), 53 min., Default format AAC |
Lame MP3 | Version: 3.98.2 (32-bit), Audio CD “”Terminator II” SE, 53 min, wave to MP3, 160 Kb/s |
Encodage vidéo | |
TMPEG 4.7 | Version: 4.7, Import File: “Terminator II” SE DVD (5 Minutes), Resolution: 720×576 (PAL) 16:9 |
DivX 6.8.5 | Encoding mode: Insane Quality, Enhanced Multi-Threading, Enabled using SSE4, Quarter-pixel search |
XviD 1.2.2 | Display encoding status=off |
Mainconcept Reference 1.6.1 | MPEG2 to MPEG2 (H.264), MainConcept H.264/AVC Codec, 28 sec HDTV 1920×1080 (MPEG2), Audio: MPEG2 (44.1 KHz, 2 Channel, 16-Bit, 224 Kb/s), Mode: PAL (25 FPS), Profile: Tom’s Hardware Settings for Qct-Core |
Applications | |
Autodesk 3ds Max 2009 (64-bit) | Version: 2009 Service Pack 1, Rendering Dragon Image at 1920×1080 (HDTV) |
WinRAR 3.90 | Version 3.90 (64-bit), Benchmark: THG-Workload (334 MB) |
WinZip 12.1 | Version 12.1, Compression=Best, Benchmark: THG-Workload (334 MB) |
Adobe Photoshop CS4 | Radial Blur, Shape Blur, Median, Polar Coordinates filters |
AVG Anti-Virus 8.5 | Virus scan of 334MB of compressed files |
Benchmarks synthétiques | |
3DMark Vantage | Version: 1.02, GPU and CPU scores |
PCMark Vantage | Version: 1.00, System, Memories, TV and Movies, and Productivity benchmarks, Windows Media Player 10.00.00.3646 |
SiSoftware Sandra 2009 SP4 | CPU Test=CPU Arithmetic/MultiMedia, Memory Test=Bandwidth Benchmark |
Benchmarks synthétiques
Commençons nos tests avec PCMark Vantage. On peut déjà constater la puissance du Core i7 870. Rappelez-vous néanmoins que, même s’il fait du milieu de gamme Intel, il n’est pour autant pas très bon marché, à plus de 500 €. Nous pensons honnêtement que le 870 est trop cher, comme le Crore i7 950 avant lui.
Au contraire, le Core i5 750 – à moins de 200 € – se montre plus rapide que le Core 2 Extreme – à 1000 €. Il est donc largement plus avantageux. Ne parlons pas du Core 2 Q9550, encore 10 € plus onéreux que le i5.
Les benchmarks synthétiques sont très favorables à la technologie HyperThreading d’Intel, les développeurs parallélisant les tests pour les préparer au futur. 3D Mark Vantage en est un très bon exemple, qui donne une large avance aux Core i7 870 et 920.
Le score GPU seul montre un autre visage, tous les CPU offrant à peu près les mêmes performances. Au classement global, le Core i5 750 bat le Core 2 Quad Q9550 et fait jeu égal avec le Core 2 Extreme QX9770.
Alors que le contrôleur mémoire du chipset X48 des Core 2 fait pâle figure face au contrôleur mémoire intégré des Phenom II, le contrôleur mémoire double canal des Lynnfield, armé des mêmes modules DDR3-1333 réglés aux mêmes timings, délivre une bande passante largement supérieure. Le Core i7 920 grâce à son troisième canal DDR3 64 bits reste intouchable.
Aplications multimedias
MainConcept bénéficie clairement de l’HyperThreading. Toutefois, même sans HT, le Core i5 750 dépasse le Core 2 Extreme. Mais il ne parvient pas à rattraper le Phenom II X4 965 à 3,4 GHz.
iTunes au contraire repose sur un seul thread. C’est donc l’heure de gloire du mode Turbo Boost, les Core i7 870 et Core i5 750 décrochant le Core i7 920. L’architecture Core 2 montre qu’elle en a encore dans les transistors, mais le rapport performance/prix du Core i5 est incroyable.
Le transcodage par DviX déploie huit threads, mais il est largement influencé par la fréquence pure. Les i7 870 et i5 750 profitent de leur mode Turbo pour battre le i7 920. Le Phenom II Peut être fier de lui puisqu’il parvient enfin à battre le plus puissant des Core 2. Mais il a un nouveau maître, qui s’appelle Core i5.
Xivd est légèrement multithread ; les première et deuxième place des Core i7 870 et i5 750 sont encore la conséquence de leur mode Turbo. Le Core i7 920 finit troisième, suivi du Core 2 Extreme.
Dans nos articles précédents, nous n’avons constaté aucun avantage à utiliser la version 64 bits de Lame. Nous nous sommes donc rabattus sur la version 32 bits pour ce dossier. Le verdict est déjà vu : l’absence de multithread donne l’avantage aux processeurs dotés du mode Turbo Boost le plus rapide.
Applications bureautiques
Nous nous attendions à voir le Core i5 dominer plu largement le Core i7 920 dans ce test, grâce à son mode Turbo Boost. La première place du Core 2 Extreme est encore plus surprenante : il devance même le Core i7 870, pourtant capable d’atteindre 3,6 GHz lorsqu’un seul thread est calculé.
La dernière version de WinRAR, la 3.90, est optimisée pour les systèmes 64 bits et le calcul multithread. C’est ce qui explique l’avance confortable des deux Core i7 bénéficiant de l’HyperThreading. Le Core i5 finit troisième, suivi du Core 2 Extreme et du Phenom II X4.
Lui aussi optimisé pour l’HyperThreading, 3ds Max 2009 préfère les Core i7. Le Core i5 termine le rendu peu de temps après, cependant.
Sous l’antivirus AVG, on constate encore une fois le bénéfice énorme qu’apporte l’HyperThreading. Le Core i5 à 200 € et le Core 2 Extreme à 1000 € sont à égalité, mais sont tous les deux quelques secondes en retard sur le Phenom II.
Notre test Photoshop CS4 exécute un ensemble de filtres optimisés multithread, mais c’est clairement la fréquence supérieure du Core i7 870 qui lui permet de prendre la première place loin devant tous les autres CPU. Le Core i5 750 est équivalent au Core i7 920, tous deux étant légèrement devancé par le Core 2 Extreme QX9770. Le Phenom II X4 à 3,2 GHz finit loin derrière.
Consommation
La très faible consommation des Core i5 et i7 saute aux yeux. Au repos, les deux Lynnfield descendent environ 20 W en dessous du niveau du Core 2 Quad Q9550S. Rappelons que ce CPU offre des performances identiques au Core 2 Q9550, mais pour un TDP de 65 W seulement (contre 95 W pour le Q9550 non S). Le fait que les Lynnfield demandent encore mois d’énergie au repos que cette puce déjà optimisée pour une faible consommation est donc particulièrement remarquable. La même remarque vaut pour le Phenom II X4 965, qui consomme lui aussi moins que le Core 2 Quad, au repos.
Lançons le test Smal FFT de Prime 95 en même que le Burn-In test de FurMark, et les consommations sautent au plafond. Le Q9550S prend alors la première place, et montre tout son intérêt. Mais les deux Lynnfield décrochent les deuxième et troisième places, et confirment leur excellence. Le Phenom II X4 965 termine quatrième, suivi du Core 2 Extreme puis du Core i7 920 avec son TDP de 130 W et son chipset X58 gourmand.
Il y a toujours un écart entre les valeurs de TDP et les consommations réelles. Cependant, ici, les TDP et nos mesures se recoupent. Le Core 2 Quad a un TDP 30 W inférieur aux Lynnfield. Si l’on soustrait les watts absorbés par le northbridge, on retrouve l’écart mesuré ici. De même, si l’on se rappelle des 22 W demandés par le chipset X58, et du TDP de 130 W du Core i7 Bloomfield, il n’est pas surprenant que cette combinaison ferme la marche.
Conclusion
Je vais être honnête – quand j’ai mis la main sur un Core i5 de présérie il y a trois mois, ce processeur m’a pris par surprise, même avec un bridage artificiel de son mode Turbo Boost à 2,8 GHz. C’était avant que les caractéristiques définitives et les prix furent fixés. Maintenant que nous avons passé quelques semaines avec des composants finalisés, les gammes de processeurs Core i5 et Core i7 “Lynnfield” sont encore plus impressionnantes.
D’une part, il devient nettement plus difficile de recommander l’achat d’un processeur Core i7 Bloomfield en socket LGA 1366. Certes, ces Core i7 900 sont censés être plus haut de gamme, et on ne peut ignorer que l’année prochaine le monstreux Core i9 Gulftown à six coeurs pourra prendre place dans n’importe quelle carte mère à chipset X58 existante. Mais tout de même : des cartes mères vendues moins de 100 € ? Des Core i5 à moins de 200 $ ? C’est 10 $ de moins que le Core 2 Quad Q9550, et 45 $ de moins que le Phenom II X4 965.
Bien, donc le Core i5 750 offre un prix particulièrement intéressant. Mais ce n’est pas son seul atout. Une consommation maîtrisée (particulièrement au repos), une fréquence d’origine comparable au Core i7 920 plus un mode Turbo Boost plus ambitieux poussant le CPU à 3,2 GHz lors de tâches monothread, la compatibilité CrossFire et SLI… la liste est longue, vraiment.
Que penser des Core i7 en socket LGA 1156 ? Nous avons testé le Core i7 870 et sommes convaincus que, de la même manière que le Core i7 950, il est mal positionné. Vendu presque deux fois plus cher que le Core i7 860, tout en présentant des caractéristiques très proches, il s’apparente à un Lynnfield Extreme Edition, sans le coefficient multiplicateur débloqué. Le Core i7 860, lui, pourra intéresser ceux pour qui ont besoin de l’HyperThreading. Son prix le met à la hauteur du Core i7 920, son mode Turbo Boost le rend plus rapide, et les cartes mères compatibles couteront entre 75 € et 50 € de moins.
Mais notre préférence va au Core i5 750. Le fait qu’il parvienne à dominer le plus puissant des Core 2 Quad (le QX9770) dans quasiment tous nos tests est tout simplement bluffant.
Pour les fans d’AMD, le lancement de ces nouvelles gammes Intel n’est pas qu’une mauvaise nouvelle. Nous le disions lors de la sortie du Phenom II X4 965, début août : mieux vaut attendre avant de craquer. Aujourd’hui, vous comprenez pourquoi. Avec le Core i5 750 positionné à 199 $, AMD n’a pas d’autre choix que de rabaisser ses tarifs, surtout ceux des Phenom II de haut de gamme.
De par ses performances, le Core i5 750 mérite donc totalement un “Tom’s Hardware Recommended Buy”.
C’est tout pour aujourd’hui. Mais nous publierons très bientôt d’autres articles examinant plus en détail les performances des Lynnfield dans les jeux (la présence d’un contrôleur PCI Express intégré et son influence dans les jeux méritait d’être traité via un article dédié), ainsi que l’overclocking de ces puces. L’un de nos exemplaires est monté à 4,1 GHz avec un simple refroidissement par air…