Soit un porte-étendard qui serait 2,5 plus puissant que la GeForce RTX 3090 Ti.
Comme avant chaque lancement d’une nouvelle génération de GPU, les spéculations au sujet des performances vont bon train. Celles du jour concernent les architectures RDNA 3 d’AMD et Ada Lovelace de NVIDIA, dont les meilleurs représentants devraient être les GPU Navi 31 et AD102 respectivement. Sur Twitter, les dénommés kopite7kimi et Greymon55 se sont livrés à quelques pronostics : ils prophétisent plus de 100 TFLOPS FP32 pour la GeForce 4090, environ 90 TFLOPS pour la RX 7900 XT.
Un GPU AD102 à 18 432 cœurs avec une fréquence de 2,7 GHz pourrait franchir cette barre symbolique. Néanmoins, comme la GeForce RTX 3090, il est probable que la GeForce RTX 4090 n’exploite pas 100 % de son GPU. Dans le cas de Navi 31, la fréquence GPU devrait dépasser les 3 GHz, là encore en tablant sur une puce entièrement utilisée.
40 TFLOPS pour la GeForce RTX 3090 Ti
Précisons que la GeForce RTX 3090 affiche des performances théoriques FP32 de 35,58 TFLOPS. La récente GeForce RTX 3090 Ti pousse cette valeur à un peu plus de 40 TFLOPS. Quant à la Radeon RX 6900 XT, elle plafonne à 23,04 TFLOPS.
Pour la génération NVIDIA précédente, Turing, la GeForce RTX 2080 délivre 10,07 TFLOPS. La GeForce Titan RTX culmine pour sa part à 16,31 TFLOPS. La GeForce RTX 3090 Ti multiplie donc les performances FP32 par 2,45 par rapport à la Titan. De fait, elle possède 2,3 fois plus de cœurs CUDA (10 752 contre 4608).
Comme indiqué ci-dessus, le GPU AD102 doit permettre jusqu’à 18 432 cœurs CUDA, soit une augmentation de 1,7 par rapport au GPU GA102; par rapport à la RTX 3090 Ti, une RTX 4090 à 100 TFLOPS serait 2,5 fois supérieure.
Quoi qu’il en soit, gardons à l’esprit que la puissance FP32 d’une carte graphique n’est pas strictement corrélée à ses performances dans les jeux.
Des RX 7000 et RTX 4000 lancées d’ici quelques mois
AMD et NVIDIA lanceront très probablement leurs Radeon RX 7000 et GeForce RTX 4000 avant la fin d’année.
Carte graphique / GPU | GeForce RTX 3090 Ti | AD102 | NAVI 31 |
Noeud de fabrication | SAMSUNG 8N | TSMC N5 | TSMC N5/N6 |
Architecture | NVIDIA Ampere | NVIDIA Ada | AMD RDNA3 |
Design GPU | Monolithique | Monolithique | Multi-Chip-Module (MCM) |
Estimated GPU Size | 628mm² | ~600mm² | ~800mm² |
Die | 1 | 1 | 2 GCD + 4 MCD + 1 IOD |
GPU Mega Clusters | 7 Graphics Processing Clusters (GPC) | 12 Graphics Processing Clusters (GPC) | 2×3 Shader Engines |
GPU Super Clusters | 42 Texture Processing Clusters (TPC) | 72 Texture Processing Clusters (TPC) | 2×30 RDNA Workgroups (WGP) |
GPU Clusters | 84 Streaming Multiprocessors (SM) | 144 Streaming Multiprocessors (SM) | 120 unités de calcul |
Cœurs FP32 | 10 752 cœurs CUDA | 18 432 cœurs CUDA | 15 360 processeurs de flux |
Fréquence GPU | 2,6 GHz | ~ 2,7 GHz | ~ 3,0 GHz |
VRAM | 24 Go GDDR6X | 24 Go GDDR6X | À déterminer (GDDR6) |
Vitesse et bus mémoire | 21 Gbit/s – 384-bit | 21 Gbit/s – 384-bit | À déterminer – 256-bit |
Cache | 6 Mo (L2 Cache) | 96 Mo (L2 Cache) | 256 ou 512 Mo d’Infinity Cache |
Consommation | 450 W | 600 W | À déterminer |
FP32 Performance | 40 TFLOPS | ~ 100 TFLOPs | ~ 92 TFLOPs |
Date de lancement | 1er trimestre 2022 | 2e semestre 2022 | 2e semestre 2022 |
Source : WCCFTech