GTC 2021 : les principales annonces de NVIDIA

Au menu : des GPU “Ampere Next” prévus en 2022 ; un CPU Grave basé sur ARM ; de nouvelles cartes RTX professionnelles, une puce DRIVE Atlan ou encore des DPU BlueField.

À l’occasion de la GTC 2021, Jensen Huang, PDG de NVIDIA, a annoncé plusieurs produits et fixé le cap des prochaines années en matière de GPU, CPU et DPU. Vous pouvez voir l’intégralité de la conférence ci-dessous.

Commençons par le sujet qui intéresse sans doute le plus les joueurs : les GPU. L’entreprise a lancé son architecture Ampere l’année dernière. La prochaine génération, dissimulée sous l’appellation “Ampere Next”, arrivera l’année prochaine, en 2022. Elle sera remplacée deux ans plus tard, en 2024, par “Ampere Next Next”. Il est probable qu’Ampere Next désigne l’architecture des GPU répondant au nom de code Hopper.

Nous savons donc désormais une chose : contrairement à certaines rumeurs, Ampere n’aura pas de successeur dès cette année. Pour la suite, NVIDIA n’a pas fourni d’informations concernant les améliorations ou le nœud de gravure utilisé. Au niveau de la finesse de gravure, les GPU Ampere pour centres données sont fabriqués en 7 nm par TSMC (GA100) ; les RTX 3000 le sont par Samsung en 8 nm.

Pour Hopper, il semble plausible que les GPU pour centres de données passent au N5 de TSMC. En revanche, pour les GPU grand public, les RTX 4000, le choix du fondeur et du nœud de gravure restent incertains ; avec la situation mondiale actuelle, la capacité de production de TSMC ou de Samsung à cette période pourrait devenir un facteur encore plus déterminant que par le passé. Quant à “Ampere Next Next”, mystère, y compris au sujet du nom de code de la future architecture.

Image 1 : GTC 2021 : les principales annonces de NVIDIA

CPU Grace

La ligne CPU sur l’image ci-dessus vous aura certainement interpelé : NVIDIA prépare un processeur ARM intitulé Grace. La société présente Grace comme son premier CPU pour les centres de données et promet des performances 10 fois supérieures à celles des serveurs les plus rapides d’aujourd’hui dans les charges de travail d’IA et de HPC.

Image 2 : GTC 2021 : les principales annonces de NVIDIA

Grace hérite de cœurs de CPU ARM Neoverse de “nouvelle génération” non spécifiés. Il s’agit peut-être des cœurs V1 Zeus. Selon ARM, ces derniers offrent une hausse des IPC de 50 % par rapport aux cœurs Neoverse N1 actuels. La plateforme Arm V1 prend en charge l’interface PCIe 5.0 et les mémoires DDR5, HBM2e et HBM3. En matière d’interconnexion GPU, NVIDIA semble privilégier le NVLink au CCIX 1.1.

Image 3 : GTC 2021 : les principales annonces de NVIDIA
Image 4 : GTC 2021 : les principales annonces de NVIDIA
Image 5 : GTC 2021 : les principales annonces de NVIDIA

Les CPU Grace équiperont notamment deux supercalculateurs commandés par le CSCS et le Los Alamos National Laboratory. Ces derniers seront construits en partenariat avec Hewlett Packard Enterprise. Ils doivent être mis en service à partir de 2023.

Enfin, en 2025, NVIDIA prévoit une version plus puissante de ce CPU, “Grace Next”.

DGX A100 320G et DGX Superpod

En novembre dernier, NVIDIA avait présenté sa DGX Station A100 320G armée de quatre GPU A100, chacun doté de 80 Go de mémoire HMB2e, et d’un processeur AMD EPYC 7742 à 64 cœurs. Celle-ci est désormais officiellement lancée.

Cette machine atteint une puissance de calcul FP32 de 2,5 PFLOPS. Comme son nom et le nombre de GPU le préfigurent, elle contient 320 Go de mémoire HBM2e en tout. À cela s’ajoutent 512 Mo de DDR4-3200 et un SSD NVMe de 7,68 To. Malgré une consommation avoisinant les 1500W, le volume sonore en fonctionnement n’excède pas 37 dBA.

Image 13 : GTC 2021 : les principales annonces de NVIDIA

Pour acquérir cette DGX Station A100, les clients ont deux options : l’acheter 149 000 dollars ou la louer 9000 dollars par mois.

Par ailleurs, NVIDIA a aussi mis à jour son DGX SuperPOD. Il reçoit désormais des GPU A100 de 80 Go, des DPU Bluefield-2 (Data Processing Units) et peut être utilisé avec le logiciel Base Command.

Le DGX Superpod embarque de 20 à 140 systèmes DGX A100. Chaque système contient deux processeurs EPYC 7742 et 8 GPU A100. Prix du DGX Superpod le moins onéreux : 7 millions de dollars. La facture peut s’envoler à 60 millions de dollars pour les versions les mieux dotées.

Image 14 : GTC 2021 : les principales annonces de NVIDIA

A30 et A10

L’A100 ne sera plus la seule solution Ampere destinée aux centres de données. En effet, elle est rejointe par deux petites sœurs, les A30 et A10. La première est munie de 24 Go de mémoire HMB2 et la seconde de la même quantité mais de type GDDR6. Toutes les spécifications sont rassemblées dans le tableau ci-dessous.

Image 15 : GTC 2021 : les principales annonces de NVIDIA
Image 16 : GTC 2021 : les principales annonces de NVIDIA
Image 17 : GTC 2021 : les principales annonces de NVIDIA
SolutionA100 PCIeA30A10
GPUGA100GA100GA102-890
FP649,7 TFLOPS5,2 TFLOPS
FP64 cœurs Tensor19,5 TFLOPS10,3 TFLOPS
FP3219,5 TFLOPS10,3 TFLOPS31,2 TFLOPS
TF32156 TF82 TF62,5 TFLOPS
Bfloat16312 TF165 TF125 TF
FP16 Cœurs Tensor312 TF165 TF125 TF
INT8624 TOPS330 TOPS250 TOPS
INT41248 TOPS661 TOPS500 TOPS
Cœurs RT72
Mémoire40 Go HBM224 Go HBM224 Go GDDR6
Bande passante mémoire1,555 Go/s933 Go/s600 Go/s
Interconnexion12 NVLinks, 600 Go/s? NVLinks, 200 Go/s
Multi-Instance GPU (MIG)7 MIGs @ 5 Go4 GPU @ 6 Go chacun
2 GPU @ 12 Go chacun
1 GPU @ 24 Go
Optical Flow Acceleration1
NVJPEG1 decoder?
NVENC?1 encoder
NVDEC4 decoders1 decoder (+AV1)
Facteur de formeFHFLFHFLFHFL
TDP250W165W150W

NVIDIA : le GPU Ampere GA100 bientôt intégré à la gamme CMP HX ?

RTX A4000 et A5000 pour ordinateurs fixes

NVIDIA étoffe également sa gamme de cartes pour les professionnels, anciennement connue sous le nom Quadro. La RTX A6000 cohabitera d’ici la fin du mois avec les RTX A5000 et RTX A4000, deux références croisées il y a peu.

Carte graphiqueNVIDIA RTX A4000NVIDIA RTX A5000NVIDIA RTX A6000
GPUAmpere GA106 GPUAmpere GA102 GPUAmpere GA102 GPU
Nœud de fabricationSamsung 8 nmSamsung 8 nmSamsung 8 nm
Surface du die276 mm²628 mm²628 mm²
Cœurs GPU6144819210 752
Cœurs Tensor192256336
Fréquence de base??1860 MHz
FP32??40 TFLOPs
VRAM16 Go GDDR624 Go GDDR648 Go GDDR6
Bus mémoire256-bit384-bit284-bit
Bande passante mémoire448 Go/s768 Go/s768 Go/s
TDP140W230W300W
Prix de lancementTBCTBC4650 dollars

RTX A5000, A4000, A3000 et A2000 pour ordinateurs portables

Sur le marché des ordinateurs portables, NVIDIA dégaine quatre modèles, les RTX A5000, A4000, A3000 et A2000. L’entreprise indique que les premières machines équipées de telles cartes arriveront au cours du trimestre.

Image 18 : GTC 2021 : les principales annonces de NVIDIA
Carte graphiqueRTX A2000RTX A3000RTX A4000RTX A5000
GPUGA107GA104GA104GA102
Nombre de transistors12 milliards17,4 milliards17,4 milliards28 milliards
Nœud de fabricationSamsung 8 nmSamsung 8 nmSamsung 8 nmSamsung 8 nm
Surface du die276 mm²392,5 mm²392,5 mm²628,4 mm²
SMs20324048
FP32 ALUs2560409651206144
INT32 ALUs1280204825603072
Cœurs Tensor80128160192
Cœurs RT20324048
FP32 performance9,3 TFLOPS12,8 TFLOPS17,8 TFLOPS21,7 TFLOPS
RT performance18,2 TFLOPS25,0 TFLOPS34,8 TFLOPS75,6 TFLOPS
Tensor performance74,7 TFLOPS102,2 TFLOPS142,5 TFLOPS174,0 TFLOPS
VRAM4 Go GDDR66 Go GDDR68 Go GDDR616 Go GDDR6
Interface mémoire128-bit192-bit256-bit256-bit
Bande passante mémoire192 Go / s264 Go / s384 Go / s448 Go / s
TDP35 – 95 W60 – 130 W80 – 140 W80 – 165 W

DPU BlueField-3 et BlueField-4

NVIDIA a présenté deux DPU : le BlueField-3 attendu en 2022 et le BlueField-4 prévu pour 2024. Proposé en formats HHHL et FHHL, le DPU BlueField-3, fruit du travail des équipes de Mellanox, se compose de 22 milliards de transistors. Il embarque 16 cœurs Arm Cortex-A78, plusieurs accélérateurs et 16 Go de mémoire DDR5. Son niveau de performances est de 42 SPECrate2017_int et 1,5 TOPS. Cela le place à peu près au niveau d’un processeur Xeon Scalable Cascade Lake à 12 cœurs. Son successeur, le BlueField-4 et ses 64 milliards de transistors atteindrait 160 SPECrate2017_int et 1000 TOPS.

Image 19 : GTC 2021 : les principales annonces de NVIDIA
Image 20 : GTC 2021 : les principales annonces de NVIDIA

NVIDIA DRIVE Atlan

Enfin, terminons ce tour d’horizon avec un produit destiné au secteur automobile, le NVIDIA Drive Atlan. Cette puce vise les 1000 TOPS et devrait être intégrée dans des véhicules autonomes à partir de 2025.

Image 21 : GTC 2021 : les principales annonces de NVIDIA

Selon l’entreprise, “DRIVE Atlan comprendra l’architecture GPU de nouvelle génération de NVIDIA, des nouveaux cœurs de CPU Arm, ainsi que des accélérateurs d’apprentissage profond et de vision par ordinateur”. Cela lui accorde des “performances comparables à celles d’un centre de données” et offre “aux constructeurs automobiles de vastes capacités de calcul pour construire des véhicules richement programmables et perpétuellement évolutifs grâce à des mises à jour over-the-air sécurisées”.

Sources : NVIDIA, Tom’s Hardware US, WCCFTech