NVIDIA : un GPU Lovelace AD102 avec 18 432 cœurs CUDA ?

Des données mentionnent un GPU armé de 12 GPC, contre 7 pour le GA102 Ampere.

En début de semaine dernière, le dénommé kopite7kimiNVIDIA suggérait un changement de programme chez NVIDIA, avec le report de l’architecture GPU Hooper au profit d’Ada Lovelace. Le voici qui récidive, cette fois pour donner des informations à propos d’un potentiel GPU AD102.

Image 1 : NVIDIA : un GPU Lovelace AD102 avec 18 432 cœurs CUDA ?

Celui-ci succéderait à l’actuel GPU GA102 qu’on retrouve dans les RTX 3090 et RTX 3080. L’architecture GPU Lovelace entrainerait une hausse du nombre de GPC (Graphics Processing Clusters) : ceux-ci passeraient de 7 à 12. Si l’on reste sur une base de 12 SM (Streaming Multiprocessors), 6 TPC (Texture Processing Clusters) et 256 cœurs CUDA par GPC, le GPU AD102 hébergerait jusqu’à 144 SM, 72 TPC et 18 432 cœurs CUDA ; des valeurs qui sont respectivement de 84, 42, et 10 752 pour le GPU GA102. Avec une fréquence GPU de 1,8 GHz, cela se traduirait par une puissance de calcul FP32 de 66,4 TFLOPS, contre 38,7 TFLOPS pour le GPU GA102 (la RTX 3090, à qui il manque 2 SM pour exploiter son GPU à 100 %, culmine à 35,58 TFLOPS).

Le GPU GA102 des RTX 3090 et RTX 3080 étudié via une photographie infrarouge

Du 5 nm, mais pas de MCM

Le tableau comparatif élaboré par VideoCardz met en avant l’évolution entre Turing et Ampere. Bien sûr, les valeurs pour Lovelace ne sont, à ce stade, que spéculatives.

GPULovelace AD102Ampere GA102Turing TU102
Nœud de fabrication5 nm Samsung ?8 nm Samsung12 nm TSMC
Graphics Processing Clusters (GPC)1276
Texture Processing Cluster (TPC)724236
Streaming Multiprocessors (SM)1448472
Cœurs CUDA (FP32)18432107524608
Performance FP32 à 1,8 GHz66,4 TFLOPS38,7 TFLOPS16,6 TFLOPS
Bus mémoire384-bit?384-bit384-bit
Type mémoireGDDR6X ?GDDR6XGDDR6

L’architecture GPU Lovelace serait synonyme d’une gravure non plus en 8 nm, mais en 5 nm. En revanche, contrairement à Hooper, Ada Lovelace s’appuierait toujours sur une architecture dite monolithique plutôt que MCM (Multi-Chip Module).

Recevez ces prédictions avec la prudence de rigueur. Toutefois, si deux ans se sont écoulés entre Turing et Ampere, certains observateurs pensent que le délai entre Ampere et Lovelace serait plus court. La raison : la puissance “inattendue” des GPU RDNA 2 d’AMD, et la nécessité pour NVIDIA de passer rapidement à une nouvelle génération encore plus compétitive pour maintenir son leadership. De fait, il est probable que la société ait déjà eu à recomposer sa gamme RTX 3000 en tenant compte de l’arrivée des GPU Big Navi. De là à carrément envisager une architecture GPU imprévue…