Google lance l’A3, son supercalculateur IA alimenté par des GPU NVIDIA H100

Huit GPU NVIDIA H100 piloté par un processeur Intel Xeon Scalable de 4e génération, avec 2 To de DDR5-4800. Google promet “26 exaFlops de performances IA” et une dix fois la bande passante réseau des A2.

Dans le cadre sa conférence Google I/O, le géant de Mountain View a dévoilé de nombreux produits : la Pixel Tablet, le Geminos, ou encore le Pixel Fold, premier smartphone pliable de la marque. Ce qui a retenu notre attention se situe plutôt du côté des centres de données, avec le lancement de “A3 GPU supercomputer”.

Image 1 : Google lance l'A3, son supercalculateur IA alimenté par des GPU NVIDIA H100
© Google
Image 2 : Google lance l'A3, son supercalculateur IA alimenté par des GPU NVIDIA H100
© Google

Dans son communiqué, Google explique que les nouveaux supercalculateurs A3 sont “conçus pour former et servir les modèles d’IA les plus exigeants qui alimentent aujourd’hui l’IA générative et l’innovation en matière de grands modèles de langage”. Concrètement, les machines virtuelles A3 associent 8 GPU H100 de NVIDIA à un processeur Intel Xeon Scalable de 4e génération (Sapphire Rapids) non spécifié, et 2 To de mémoire DDR5-4800. Grâce aux NVIDIA NVSwitch et NVLink 4.0, la bande passante bisectionnelle pour les 8 GPU de l’A3 s’élève à 3,6 To/s. Ces machines virtuelles pour supercalculateurs Google Compute Engine A3 délivrent « 26 exaFlops de performances IA ».

Interface IPU

Selon Google, l’A3 représente le premier déploiement de son interface de données GPU-to-GPU, baptisée IPU pour Infrastructure Processing Unit. Celle-ci permet de partager des données à 200 Gbit/s en contournant le CPU hôte. L’IPU permet de multiplier par 10 la bande passante réseau disponible pour les machines virtuelles A3 par rapport aux machines virtuelles A2, rapporte l’entreprise.

« Les VM A3 de Google Cloud, équipées de GPU NVIDIA H100 de nouvelle génération, vont accélérer la formation et le service des applications d’IA générative », a déclaré Ian Buck, vice président de l’hyperscale et de l’informatique à haute performance chez NVIDIA. « Après le lancement récent des instances G2 de Google Cloud, nous sommes fiers de continuer à travailler avec Google Cloud pour aider les entreprises du monde entier à se transformer grâce à une infrastructure spécialement conçue pour l’IA. »

À lire > Google progresse dans le développement de ses propres processeurs pour serveurs

Ces machines virtuelles A3 ne sont pas encore largement déployées. Pour accéder au programme d’accès anticipé, les entreprises doivent s’inscrire sur une liste d’attente, sans garantie d’être sélectionnées.

Source : Google