Le GPU AD102 offrirait 144 SM soit 18 432 cœurs CUDA sur la base actuelle ; le GPU GA102 autorise 84 SM / 10 752 cœurs CUDA.
Le grand déballage des données dérobées à NVIDIA se poursuit, cette fois avec les spécifications des GPU Ada. Cette architecture doit succéder à Ampere et servira donc aux cartes graphiques NVIDIA GeForce RTX 40. La fuite d’hier mentionnait simplement leur nom, à savoir AD102, AD103, AD104, AD106, AD107 et AD10B. Désormais, nous connaissons le nombre de multiprocesseurs de flux (SM) pour chaque GPU, hormis le AD10B qui a l’air un peu à part. Les valeurs que vous découvrirez ci-dessous ont été paratagées par plusieurs sources, mais bien entendu, elles n’ont rien d’officielles pour l’instant.
Le GPU AD102 autoriserait 144 SM contre 84 pour le GA102. Cela représente une hausse de 71 % environ. Si l’architecture conserve le même nombre de cœurs CUDA par SM, cette puce offrirait jusqu’à 18 432 cœurs CUDA. Le GPU AD103 permettrait 84 SM (10 752 cœurs CUDA), l’AD104 60 SM (7680 cœurs), les AD106 et AD107 respectivement 36 SM (4608 cœurs) et 24 SM (3072 cœurs). Vous pouvez comparer ces valeurs avec celles des GPU Ampere et Turing dans le tableau ci-dessous.
La GeForce RTX 3070 Ti mobile testée : parfois supérieure à la RTX 3070 mobile, parfois inférieure…
Turing, Ampere et Ada
Segment | Turing | SM | Cœurs CUDA | Ampere | SM | Cœurs CUDA | Ada | SM | Cœurs CUDA |
Très haut de gamme | TU102 | 72 | 4608 | GA102 | 84 | 10 752 | AD102 | 144 | 18 432 |
Haut de gamme | – | – | – | GA103 | 60 | 7680 | AD103 | 84 | 10 752 |
Haut de gamme | TU104 | 48 | 3072 | GA104 | 48 | 6144 | AD104 | 60 | 7680 |
Milieu de gamme | TU106 | 36 | 2304 | GA106 | 30 | 3840 | AD106 | 36 | 4608 |
Milieu de gamme | TU116 | 24 | 1536 | – | – | – | – | – | – |
Entrée de gamme | TU117 | 16 | 1024 | GA107 | 20 | 2560 | AD107 | 24 | 3072 |
Les GeForce RTX 4000 doivent être gravées en 5 nm par TSMC. NVIDIA pourrait dégainer les premiers modèles dès septembre prochain, soit deux ans après la GeForce RTX 3080, pionnière de l’architecture Ampere.
Des GPU avec nettement plus de cache L2
En plus d’un nombre de SM en forte hausse, les GPU Ada profiteraient d’un cache L2 nettement plus conséquent selon un autre article de VideoCardz. Pour ne citer que lui, le GPU AD102 hériterait de 96 Mo de cache L2, soit 16 fois plus que les 6 Mo du GA102.
GPU | SM | Cœurs CUDA | Bus mémoire | Cache L2 |
AD102 | 144 | 18 432 | 384-bit | 96 Mo |
AD103 | 84 | 10 752 | 256-bit | 64 Mo |
AD104 | 60 | 7680 | 192-bit | 48 Mo |
AD106 | 36 | 4608 | 128-bit | 32 Mo |
AD107 | 24 | 3072 | 128-bit | 32 Mo |
GPU | SM | Cœurs CUDA | Bus mémoire | Cache L2 |
GA102 | 84 | 10 752 | 384-bit | 6 Mo |
GA103 | 60 | 7680 | 256-bit | 4 Mo |
GA104 | 48 | 6144 | 256-bit | 4 Mo |
GA106 | 30 | 3840 | 192-bit | 3 Mo |
GA107 | 20 | 2560 | 128-bit | 2 Mo |
Sources : Tom’s Hardware US, VideoCardz
Les données dérobées à NVIDIA révèlent les prochaines architectures GPU : Ada, Hopper et Blackwell
Vous vous êtes trompés dans les valeurs (texte et tableau):
La RTX 3090 (GA102), autorise 88 SM et 10496 cuda.c.
Non c’est correct, nous parlons bien des GPU ici ; la RTX 3090 n’exploite pas 100 % du GA102 (82 SM “seulement” sur les 84 disponibles).
finalement la seule question qui restera intéressante c’est … pour quelle consommation… on va continuer dans la surenchère ou pas ?
Autant pour moi. Mais je crois malgré tout que le nombre de Cuda Cores n’est pas bon. Auquel cas, le GA102 et le AD103 auraient exactement le même nombre.
Il me semble en effet que le GA102 (RTX 3090) n’a que 10.496 Cuda Cores et que le AD103 (potentielle RTX 4080) aurait 10.752 Cuda Cores et un cache L2 plus important.
C’est le nombre de Cuda Core de la RTX 3090 qui n’est pas bon dans votre article,… enfin, il me semble.
Mis à part la RTX 4090, en termes de CUDA CORES c’est pas fou fou
RTX 4080 = 10 752 cœurs CUDA CUDA CORES/ RTX 3080 = 8960 CUDA CORES
RTX 3080 = 8960 CUDA CORES / RTX 2080 = 2944 CUDA CORES
Le gap ne semble pas extraordinaire par rapport aux génération précédentes.