La prochaine série d’accélérateurs d’AMD pourraient inclure des APU.
Fin avril, Tom de la chaîne YouTube Moore’s Law is Dead donnait quelques informations au sujet des accélérateurs AMD Instinct MI300 Series. Les MI200 sont disponibles depuis seulement mars, donc leurs successeurs n’arriveront pas tout de suite. Cependant, la donnée du jour est intéressante : selon AdoredTV, au moins une référence Instinct MI300 pourrait devenir le premier APU d’AMD pour le secteur du HPC.
La dernière fois, Tom évoquait jusqu’à 8 dies de calcul pour les Instinct MI300, et une conception basée sur l’empilement 3D. Pour au moins l’un des accélérateurs, AMD associerait des cœurs GPU à des cœurs CPU, à la manière des APU Ryzen que nous connaissons bien. Ces puces “tout-en-un” sont largement répandues pour les dispositifs grand public, mais n’ont pas encore pénétré le secteur du HPC, certainement en raison de la complexité de conception qu’elles impliquent. Néanmoins, ces configurations vont certainement se développer à l’avenir : l’entreprise Tachyum par exemple a récemment annoncé ce qu’elle qualifie de “premiers processeurs universels au monde” ; ces processeurs baptisés Prodigy comprennent un CPU, un GPU et un TPU.
De précédentes fuites accréditent l’hypothèse
Pour en revenir à AMD, l’hypothèse d’un “APU Instinct” avait déjà été formulée par le passé. En décembre 2019, le leaker Komachi_Enkasa mentionnait un “AMD MI200 BIG APU”. À l’époque, il pensait que cela concernait la série Instinct MI200. Plus récemment, ExecutableFix écrivait à propos d’un socket serveur SH5 pour solution MI300.
Ainsi, certains MI300 pourraient tirer parti de l’architecture CPU Zen 4 combinée à l’architecture GPU CDNA 3. Il est probable que d’autres accélérateurs de la série restent de “purs” cGPU.
Séries Instinct
Série | AMD Radeon Instinct MI60 | AMD Instinct MI100 | AMD Instinct MI250X | AMD Instinct MI300 |
Gravure / architecture | 7nm GCN5 (GFX906) | 7nm CDNA1 (GFX908) | 6nm CDNA2 (GFX90A) | 5nm CDNA3 (GFX940) + 6nm (base) |
CPU | – | – | – | Zen4 (APU Mode) |
GPU | Vega 20 | Arcturus | Aldebaran (MCM) | À déterminer |
Base Chiplets | – | – | – | Jusqu’à 2 |
Dies de calcul | 1 | 1 | 2 | Jusqu’à 8 |
Unités de calcul | 64 | 120 | 220 | À déterminer |
Fréquence GPU | 1800 MHz | ~1500 MHz | ~1700 MHz | À déterminer |
FP16 Compute | 29,5 TFLOPS | 185 TFLOPS | 383 TFLOPS | À déterminer |
FP32 Compute | 14,7 TFLOPS | 23,1 TFLOPS | 47,9 TFLOPS | À déterminer |
FP64 Compute | 7,4 TFLOPS | 11,5 TFLOPS | 47,9 TFLOPS | À déterminer |
VRAM | 32 Go HBM2 | 32 Go HBM2 | 128 Go 8x HBM2e | Jusqu’à 8 puces HBM3 |
Vitesse mémoire | 2,0 Gbit/s | 2,4 Gbit/s | 3,2 Gbit/s | À déterminer |
Bus mémoire | 4096-bit | 4096-bit | 8192-bit | Jusqu’à 8192-bit |
Bande passante mémoire | 1 To/s | 1.23 To/s | 3.2 To/s | À déterminer |
Facteur de forme | Dual Slot, Pleine longueur | Dual Slot, Pleine longueur | OAM | OAM |
TDP | 300W | 300W | 560W | Jusqu’à 600W |