Une solution d’entrée de gamme et polyvalente pour les serveurs.
NVIDIA étoffe son offre de GPU pour serveurs avec l’A2 Tensor Core, présentée par l’entreprise comme une solution d’entrée de gamme polyvalente. Elle embarque un GPU Ampere GA107 gravé en 8 nm ; possède 1280 cœurs CUDA et 40 cœurs Tensor ; 16 Go de GDDR6 sur un bus de 128 bits, pour une bande passante mémoire de 200 Go/s. Cet A2 Tensor Core utilise une interface PCIe Gen4 x8 et a un TDP configurable entre 40 W et 60 W.
Voici comment NVIDIA présente ce GPU A2 Tensor Core : “Le GPU d’entrée de gamme NVIDIA A2 Tensor Core facilite la mise en œuvre des workflows d’inférence grâce à une conception compacte à hautes performances et à faible consommation pour les applications d’IA à l’Edge. Le GPU A2, qui se distingue par une configuration PCIe Gen4 compacte et une enveloppe thermique (TDP) configurable de 40 à 60 Watts, permet d’accélérer les workflows d’inférence de manière versatile sur n’importe quel serveur pour un déploiement à l’échelle.”
La carte NVIDIA Ampere A100 pulvérise le record Octanebench
Spécifications techniques et performances
Le tableau ci-dessous, élaboré par NVIDIA, rassemble les spécifications techniques et les performances. Un autre tableau, proposé par VideoCardz, compare ce GPU A2 Tensor Core aux autres références pour centres de données de NVIDIA ; il se positionne effectivement tout en queue d’un peloton dominé par l’A100.
Peak FP32 | 4,5 TF |
TF32 Tensor Core | 9 TF | 18 TF¹ |
BFLOAT16 Tensor Core | 18 TF | 36 TF¹ |
Peak FP16 Tensor Core | 18 TF | 36 TF¹ |
Peak INT8 Tensor Core | 36 TOPS | 72 TOPS¹ |
Peak INT4 Tensor Core | 72 TOPS | 144 TOPS¹ |
RT Cores | 10 |
Media engines | 1 video encoder / 2 video decoders (includes AV1 decode) |
Mémoire GPU | 16 Go GDDR6 |
Bande passante mémoire | 200 Go/s |
Interface | PCIe Gen4 x8 |
Facteur de forme | 1-slot, low-profile PCIe |
Max thermal design power (TDP) | 40–60W (configurable) |
Virtual GPU (vGPU) software support² | NVIDIA Virtual PC (vPC), NVIDIA Virtual Applications (vApps), NVIDIA RTX Virtual Workstation (vWS), NVIDIA AI Enterprise, NVIDIA Virtual Compute Server (vCS) |
Référence | GPU | Cœurs CUDA / Tensor | Mémoire | FP32 Compute | TDP |
NVIDIA A100 | GA100-884/883 | 6912 / 432 | 40/80 Go HBM2e 5120b 1.94 TB/s | 19,5 TFLOPS | 400W/250W |
NVIDIA A40 | GA102-895 | 10752 / 672 | 48 Go G6 384b 696 Go/s | 37,4 TFLOPS | 300W |
NVIDIA A30 | GA100-890 | 3584 / 224 | 24 Go HBM2e 3072b 933 Go/s | 10,3 TFLOPS | 165W |
NVIDIA A16 | 4x GA107-??? | 5120 / 160 | 4x 16 Go G6 128b 200 Go/s | 18 TFLOPS | 250W |
NVIDIA A2 | GA107-??? | 1280 / 40 | 16 Go G6 128b 200 Go/s | 4,5 TFLOPS | 40-60W |
une idee du prix? on peut rajouter le dlss a une config AMD avec ? :p