Plus de 100 TFLOPS pour la GeForce RTX 4090 ?

Soit un porte-étendard qui serait 2,5 plus puissant que la GeForce RTX 3090 Ti.

Comme avant chaque lancement d’une nouvelle génération de GPU, les spéculations au sujet des performances vont bon train. Celles du jour concernent les architectures RDNA 3 d’AMD et Ada Lovelace de NVIDIA, dont les meilleurs représentants devraient être les GPU Navi 31 et AD102 respectivement. Sur Twitter, les dénommés kopite7kimi et Greymon55 se sont livrés à quelques pronostics : ils prophétisent plus de 100 TFLOPS FP32 pour la GeForce 4090, environ 90 TFLOPS pour la RX 7900 XT.

Image 1 : Plus de 100 TFLOPS pour la GeForce RTX 4090 ?

Un GPU AD102 à 18 432 cœurs avec une fréquence de 2,7 GHz pourrait franchir cette barre symbolique. Néanmoins, comme la GeForce RTX 3090, il est probable que la GeForce RTX 4090 n’exploite pas 100 % de son GPU. Dans le cas de Navi 31, la fréquence GPU devrait dépasser les 3 GHz, là encore en tablant sur une puce entièrement utilisée.

40 TFLOPS pour la GeForce RTX 3090 Ti

Précisons que la GeForce RTX 3090 affiche des performances théoriques FP32 de 35,58 TFLOPS. La récente GeForce RTX 3090 Ti pousse cette valeur à un peu plus de 40 TFLOPS. Quant à la Radeon RX 6900 XT, elle plafonne à 23,04 TFLOPS.

Pour la génération NVIDIA précédente, Turing, la GeForce RTX 2080 délivre 10,07 TFLOPS. La GeForce Titan RTX culmine pour sa part à 16,31 TFLOPS. La GeForce RTX 3090 Ti multiplie donc les performances FP32 par 2,45 par rapport à la Titan. De fait, elle possède 2,3 fois plus de cœurs CUDA (10 752 contre 4608).

Comme indiqué ci-dessus, le GPU AD102 doit permettre jusqu’à 18 432 cœurs CUDA, soit une augmentation de 1,7 par rapport au GPU GA102; par rapport à la RTX 3090 Ti, une RTX 4090 à 100 TFLOPS serait 2,5 fois supérieure.

Quoi qu’il en soit, gardons à l’esprit que la puissance FP32 d’une carte graphique n’est pas strictement corrélée à ses performances dans les jeux.

Des RX 7000 et RTX 4000 lancées d’ici quelques mois

AMD et NVIDIA lanceront très probablement leurs Radeon RX 7000 et GeForce RTX 4000 avant la fin d’année.

Carte graphique / GPUGeForce RTX 3090 TiAD102NAVI 31
Noeud de fabricationSAMSUNG 8NTSMC N5TSMC N5/N6
ArchitectureNVIDIA AmpereNVIDIA AdaAMD RDNA3
Design GPUMonolithiqueMonolithiqueMulti-Chip-Module (MCM)
Estimated GPU Size628mm²~600mm²~800mm²
Die112 GCD + 4 MCD + 1 IOD
GPU Mega Clusters7 Graphics Processing Clusters (GPC)12 Graphics Processing Clusters (GPC)2×3 Shader Engines
GPU Super Clusters42 Texture Processing Clusters (TPC)72 Texture Processing Clusters (TPC)2×30 RDNA Workgroups (WGP)
GPU Clusters84 Streaming Multiprocessors (SM)144 Streaming Multiprocessors (SM)120 unités de calcul
Cœurs FP3210 752 cœurs CUDA18 432 cœurs CUDA15 360 processeurs de flux
Fréquence GPU2,6 GHz~ 2,7 GHz~ 3,0 GHz
VRAM24 Go GDDR6X24 Go GDDR6XÀ déterminer (GDDR6)
Vitesse et bus mémoire21 Gbit/s – 384-bit21 Gbit/s – 384-bitÀ déterminer – 256-bit
Cache6 Mo (L2 Cache)96 Mo (L2 Cache)256 ou 512 Mo d’Infinity Cache
Consommation450 W600 WÀ déterminer
FP32 Performance40 TFLOPS~ 100 TFLOPs~ 92 TFLOPs
Date de lancement1er trimestre 20222e semestre 20222e semestre 2022
https://twitter.com/greymon55/status/1520473548782927872

Source : WCCFTech