NVIDIA lance un GPU A2 Tensor Core

Une solution d’entrée de gamme et polyvalente pour les serveurs.

NVIDIA étoffe son offre de GPU pour serveurs avec l’A2 Tensor Core, présentée par l’entreprise comme une solution d’entrée de gamme polyvalente. Elle embarque un GPU Ampere GA107 gravé en 8 nm ; possède 1280 cœurs CUDA et 40 cœurs Tensor ; 16 Go de GDDR6 sur un bus de 128 bits, pour une bande passante mémoire de 200 Go/s. Cet A2 Tensor Core utilise une interface PCIe Gen4 x8 et a un TDP configurable entre 40 W et 60 W.

Image 1 : NVIDIA lance un GPU A2 Tensor Core

Voici comment NVIDIA présente ce GPU A2 Tensor Core : “Le GPU d’entrée de gamme NVIDIA A2 Tensor Core facilite la mise en œuvre des workflows d’inférence grâce à une conception compacte à hautes performances et à faible consommation pour les applications d’IA à l’Edge. Le GPU A2, qui se distingue par une configuration PCIe Gen4 compacte et une enveloppe thermique (TDP) configurable de 40 à 60 Watts, permet d’accélérer les workflows d’inférence de manière versatile sur n’importe quel serveur pour un déploiement à l’échelle.”

Image 2 : NVIDIA lance un GPU A2 Tensor Core
Image 3 : NVIDIA lance un GPU A2 Tensor Core

La carte NVIDIA Ampere A100 pulvérise le record Octanebench

Spécifications techniques et performances

Le tableau ci-dessous, élaboré par NVIDIA, rassemble les spécifications techniques et les performances. Un autre tableau, proposé par VideoCardz, compare ce GPU A2 Tensor Core aux autres références pour centres de données de NVIDIA ; il se positionne effectivement tout en queue d’un peloton dominé par l’A100.

Peak FP324,5 TF
TF32 Tensor Core9 TF | 18 TF¹
BFLOAT16 Tensor Core18 TF | 36 TF¹
Peak FP16 Tensor Core18 TF | 36 TF¹
Peak INT8 Tensor Core36 TOPS | 72 TOPS¹
Peak INT4 Tensor Core72 TOPS | 144 TOPS¹
RT Cores10
Media engines1 video encoder / 2 video decoders (includes AV1 decode)
Mémoire GPU16 Go GDDR6
Bande passante mémoire200 Go/s
InterfacePCIe Gen4 x8
Facteur de forme1-slot, low-profile PCIe
Max thermal design power (TDP)40–60W (configurable)
Virtual GPU (vGPU) software support²NVIDIA Virtual PC (vPC), NVIDIA Virtual Applications (vApps), NVIDIA RTX Virtual Workstation (vWS), NVIDIA AI Enterprise, NVIDIA Virtual Compute Server (vCS)
1 Avec dispersion
RéférenceGPUCœurs CUDA / TensorMémoireFP32 ComputeTDP
NVIDIA A100GA100-884/8836912 / 43240/80 Go HBM2e 5120b 1.94 TB/s19,5 TFLOPS400W/250W
NVIDIA A40GA102-89510752 / 67248 Go G6 384b 696  Go/s37,4 TFLOPS300W
NVIDIA A30GA100-8903584 / 22424 Go HBM2e 3072b 933  Go/s10,3 TFLOPS165W
NVIDIA A164x GA107-???5120 / 1604x 16 Go G6 128b 200  Go/s18 TFLOPS250W
NVIDIA A2GA107-???1280 / 4016 Go G6 128b 200 Go/s4,5 TFLOPS40-60W