AMD lance les premiers GPU en 7 nm, très puissants, mais pour serveur

Du changement en perspective !

Image 1 : AMD lance les premiers GPU en 7 nm, très puissants, mais pour serveur
AMD annonce ses nouveaux GPU pour serveurs, les premiers du monde gravés en 7nm (TSMC FinFET). Ils prennent place sur deux cartes Radeon Instinct MI60 et MI50. Loin du gaming, ces cartes ciblent l’intelligence artificielle (Deep Learning et inférence), le calcul intensif (y compris en Cloud), et les serveurs de bureaux virtuels. On y trouve 13,23 milliards de transistors sur une surface de 331 mm². Ces GPU sont sur architecture Vega20, AMD annonce des performances inégalées, mais le dernier Tesla V100 semble avoir plus de potentiel dans notre tableau de comparaison. La puissance annoncée des MI60 monte à 7,4 TFLOPS en calcul double précision (FP64), un énorme gain par rapport à Vega10. Et Vega20 permet presque de doubler les performances à chaque niveau de précision inférieur. Selon AMD, ces GPU en 7 nm permettraient d’augmenter les performances par Watt de 30 %.

Instinct MI60 Instinct MI50 Instinct MI25 NVIDIA Tesla V100
SXM2 32 Go
Gravure 7 nm FinFET 7 nm FinFET 14 nm FinFET 12 nm
Surface du die 331 mm² 331 mm² 510 mm² 815 mm²
Compute Unit (unité de cacul) 64 60 64 80 (SM)
Processeurs de flux 4096 3840 4096 5120 (+ 640 Tensor)
Fréquence GPU max (Boost) 1800 MHz 1746 MHz 1500 MHz 1530 MHz
Demi-précision (FP16) 29,5 TFLOPS 26,8 TFLOPS 24,6 TFLOPS 31,4 TFLOPS
(125 TFLOPS Tensor)
Simple précision (FP32) 14,7 TFLOPs 13,4 TFLOPS 12,29 TFLOPS 15,7 FLOPS
Double précision (FP64) 7,4 TFLOPS 6,7 TFLOPS 0,768 TFLOPS (1:16) 7,8 TFLOPS
Performance INT8 58,9 TOPS 53,6 TOPS 26,8 TOPS 62,8 TOPS
Quantité de mémoire 32 Go 16 Go 16 Go 32 Go
Type de mémoire HBM2 4096 bits HBM2 4096 bits HBM2 2048 bits HBM2 4096 bits
Bande passante mémoire 1024 Go/s 1024 Go/s 484 Go/s 897 Go/s
Bande passante interconnexion 200 Go/s 200 Go/s 300 Go/s
TDP 300 W 300 W 300 W 300 W

1 To/s de bande passante

Autre record : Image 2 : AMD lance les premiers GPU en 7 nm, très puissants, mais pour serveurle GPU de la MI60 intègre 32 Go de VRAM HBM2 sur son package, de quoi atteindre 1 To/s de bande passante sur un bus mémoire 4096 bits. La MI50 se contente de 16 Go de VRAM, mais avec la même bande passante. On pourra connecter jusqu’à 4 GPU par plateforme avec une bande passante de 200 Go/s, grâce à l’utilisation de deux interconnexions Infinity Fabric en parallèle. Par ailleurs, les cartes se branchent sur interface PCIe 4.0. Le Radeon Instinct MI60 sera disponible d’ici la fin de l’année, le MI50 arrivera dans le courant du premier trimestre 2019.