Du changement en perspective !
AMD annonce ses nouveaux GPU pour serveurs, les premiers du monde gravés en 7nm (TSMC FinFET). Ils prennent place sur deux cartes Radeon Instinct MI60 et MI50. Loin du gaming, ces cartes ciblent l’intelligence artificielle (Deep Learning et inférence), le calcul intensif (y compris en Cloud), et les serveurs de bureaux virtuels. On y trouve 13,23 milliards de transistors sur une surface de 331 mm². Ces GPU sont sur architecture Vega20, AMD annonce des performances inégalées, mais le dernier Tesla V100 semble avoir plus de potentiel dans notre tableau de comparaison. La puissance annoncée des MI60 monte à 7,4 TFLOPS en calcul double précision (FP64), un énorme gain par rapport à Vega10. Et Vega20 permet presque de doubler les performances à chaque niveau de précision inférieur. Selon AMD, ces GPU en 7 nm permettraient d’augmenter les performances par Watt de 30 %.
Instinct MI60 | Instinct MI50 | Instinct MI25 | NVIDIA Tesla V100 SXM2 32 Go |
|
---|---|---|---|---|
Gravure | 7 nm FinFET | 7 nm FinFET | 14 nm FinFET | 12 nm |
Surface du die | 331 mm² | 331 mm² | 510 mm² | 815 mm² |
Compute Unit (unité de cacul) | 64 | 60 | 64 | 80 (SM) |
Processeurs de flux | 4096 | 3840 | 4096 | 5120 (+ 640 Tensor) |
Fréquence GPU max (Boost) | 1800 MHz | 1746 MHz | 1500 MHz | 1530 MHz |
Demi-précision (FP16) | 29,5 TFLOPS | 26,8 TFLOPS | 24,6 TFLOPS | 31,4 TFLOPS (125 TFLOPS Tensor) |
Simple précision (FP32) | 14,7 TFLOPs | 13,4 TFLOPS | 12,29 TFLOPS | 15,7 FLOPS |
Double précision (FP64) | 7,4 TFLOPS | 6,7 TFLOPS | 0,768 TFLOPS (1:16) | 7,8 TFLOPS |
Performance INT8 | 58,9 TOPS | 53,6 TOPS | 26,8 TOPS | 62,8 TOPS |
Quantité de mémoire | 32 Go | 16 Go | 16 Go | 32 Go |
Type de mémoire | HBM2 4096 bits | HBM2 4096 bits | HBM2 2048 bits | HBM2 4096 bits |
Bande passante mémoire | 1024 Go/s | 1024 Go/s | 484 Go/s | 897 Go/s |
Bande passante interconnexion | 200 Go/s | 200 Go/s | – | 300 Go/s |
TDP | 300 W | 300 W | 300 W | 300 W |
1 To/s de bande passante
Autre record : le GPU de la MI60 intègre 32 Go de VRAM HBM2 sur son package, de quoi atteindre 1 To/s de bande passante sur un bus mémoire 4096 bits. La MI50 se contente de 16 Go de VRAM, mais avec la même bande passante. On pourra connecter jusqu’à 4 GPU par plateforme avec une bande passante de 200 Go/s, grâce à l’utilisation de deux interconnexions Infinity Fabric en parallèle. Par ailleurs, les cartes se branchent sur interface PCIe 4.0. Le Radeon Instinct MI60 sera disponible d’ici la fin de l’année, le MI50 arrivera dans le courant du premier trimestre 2019.