Huit GPU NVIDIA H100 piloté par un processeur Intel Xeon Scalable de 4e génération, avec 2 To de DDR5-4800. Google promet “26 exaFlops de performances IA” et une dix fois la bande passante réseau des A2.
Dans le cadre sa conférence Google I/O, le géant de Mountain View a dévoilé de nombreux produits : la Pixel Tablet, le Geminos, ou encore le Pixel Fold, premier smartphone pliable de la marque. Ce qui a retenu notre attention se situe plutôt du côté des centres de données, avec le lancement de “A3 GPU supercomputer”.
A lire aussi, les dernières actualités concernant l’entreprise Google et ses produits (gamme Pixel, Chromebooks, Chromecast…) :
- L’IA de Google recrée Doom en temps réel, un résultat bluffant mais à 20 FPS
- Non Android 15 ne sera pas en retard, ce sont les Pixel 9 qui sont en avance
- Pixel 9 : l’IA comme béquille pour compenser les faiblesses techniques
- One UI 7.0 repoussé indéfiniment, les smartphones Samsung privés d’Android 15 ?
Dans son communiqué, Google explique que les nouveaux supercalculateurs A3 sont “conçus pour former et servir les modèles d’IA les plus exigeants qui alimentent aujourd’hui l’IA générative et l’innovation en matière de grands modèles de langage”. Concrètement, les machines virtuelles A3 associent 8 GPU H100 de NVIDIA à un processeur Intel Xeon Scalable de 4e génération (Sapphire Rapids) non spécifié, et 2 To de mémoire DDR5-4800. Grâce aux NVIDIA NVSwitch et NVLink 4.0, la bande passante bisectionnelle pour les 8 GPU de l’A3 s’élève à 3,6 To/s. Ces machines virtuelles pour supercalculateurs Google Compute Engine A3 délivrent « 26 exaFlops de performances IA ».
Interface IPU
Selon Google, l’A3 représente le premier déploiement de son interface de données GPU-to-GPU, baptisée IPU pour Infrastructure Processing Unit. Celle-ci permet de partager des données à 200 Gbit/s en contournant le CPU hôte. L’IPU permet de multiplier par 10 la bande passante réseau disponible pour les machines virtuelles A3 par rapport aux machines virtuelles A2, rapporte l’entreprise.
« Les VM A3 de Google Cloud, équipées de GPU NVIDIA H100 de nouvelle génération, vont accélérer la formation et le service des applications d’IA générative », a déclaré Ian Buck, vice président de l’hyperscale et de l’informatique à haute performance chez NVIDIA. « Après le lancement récent des instances G2 de Google Cloud, nous sommes fiers de continuer à travailler avec Google Cloud pour aider les entreprises du monde entier à se transformer grâce à une infrastructure spécialement conçue pour l’IA. »
À lire > Google progresse dans le développement de ses propres processeurs pour serveurs
Ces machines virtuelles A3 ne sont pas encore largement déployées. Pour accéder au programme d’accès anticipé, les entreprises doivent s’inscrire sur une liste d’attente, sans garantie d’être sélectionnées.
Source : Google