L’architecture GPU Pascal en détail : priorité aux applications GPGPU

David Civera , le 6 avril 2016

Si l’on se penche sur l’architecture Pascal présentée aujourd’hui pour le Tesla P100, on remarque qu’elle donne la priorité aux applications GPGPU au détriment des jeux et du grand public.

L’architecture Pascal (GP100)

Après sa conférence de presse présentant la première puce Pascal, la Tesla P100, NVIDIA a donné plus de détail sur son architecture. Parmi les nouveautés, on notera que la nouvelle finesse de gravure permet d’accroître le nombre de Stream Multiprocessors (SM) disponibles. Chaque SM regroupe 64 coeurs CUDA et quatre unités de textures. L’architecture peut monter jusqu’à 3 840 coeurs CUDA et 240 unités de texture, soit un total de 60 SM.

– Comparatif : les cartes graphiques du moment au banc d’essai

Priorité aux applications GPGPU

Chaque SM a moins de coeurs CUDA et d’unités de texture que sur les Kepler, mais le ratio FP64/FP32 est nettement supérieur. Concrètement, cela signifie que la puce privilégie les applications GPGPU. L’autre grande nouveauté est la priorité donnée à la mémoire. La puce Pascal a deux fois moins de coeurs CUDA que la puce Maxwell GM200, mais on retrouve la même taille de bancs de registre par SM. Comme Pascal a nettement plus de SM, on se retrouve avec une puce ayant des bancs de registre plus grands et une plus grande mémoire partagée, ce qui sera intéressant lorsque l’on traite une très grande quantité de données à la fois. Bref, le GP100 est clairement tourné vers l’apprentissage automatique, l’intelligence artificielle et les opérations GPGPU. NVIDIA estime que l’augmentation du nombre de SM sera suffisante pour apporter un gain de performance acceptable dans les jeux. La réponse devrait arriver avec les GeForce GTX 1080, qui pourrait aussi embarquer une puce légèrement modifiée pour les jeux.

Caractéristiques	Tesla K40	Tesla M40	Tesla P100
GPU	GK110 (Kepler)	GM200 (Kepler)	GP100 (Pascal)
Finesse	28 nm	28 nm	16 nm
Transistors	7,1 milliards	8 milliards	15,3 milliards
Taille du die	551 mm²	601 mm²	610 mm²
Stream Multiprocessors (SM)	15	24	56
Coeur CUDA / SM	192	128	64
Unités de texture / SM	16	8	4
FP32 Cores CUDA / GPU	2 880	3 072	3 584
Ratio FP64/FP32	1/3	1/32	1/2
Fréquences de base	745 MHz	948 MHz	1 328 MHz
Fréquence boost	875 MHz	1 114 MHz	1 480 MHz
Puissance en double précision (FP64) en TFLOPS	1,680	0,192	5,304
Bus mémoire	384 bits GDDR5	384 bits GDRR5	4 096 bits HBM2
Mémoire	Jusqu’à 12 Go	Jusqu’à 24 Go	16 Go
Cache L2	1,5 Mo	3 Mo	4 Mo
Taille des bancs de registre	4 Mo	6 Mo	14 Mo
TDP	235 W	250 W	300 W

NVIDIA

David Civera

Twitter

Né aux États-Unis, élevé en France et à Singapour, adopté par les Philippines, et maintenant…

Les commentaires sont fermés.

Les derniers articles

Des processeurs AMD crament au contact de certaines cartes mères
2 avril 2025 08:43
Le Galaxy S26 Ultra pourrait vous décevoir par son appareil photo
2 avril 2025 07:38
RuneScape Dragonwilds : Voici la configuration nécessaire pour le jeu
1 avril 2025 08:41
iOS 18.4 et visionOS 2.4 sont là, voici toutes les nouveautés
1 avril 2025 07:37
AMD enchaîne les pannes en série pour ce modèle de Ryzen 7
31 mars 2025 08:20
GTA 6 : Pas de nouveaux trailers avant la sortie du jeu ?
31 mars 2025 07:16
Windows 12 : le point sur ce que l’on sait déjà du futur système d’exploitation de Microsoft
28 mars 2025 12:36
Les jeux Electronic Arts seront prochainement disponibles sur Amazon Luna
28 mars 2025 10:54
Assassin’s Creed Shadows dépasse les 3 millions de joueurs
28 mars 2025 08:48
L’ancien PDG d’Intel s’offre une très belle indemnité de départ
28 mars 2025 07:42

L’architecture GPU Pascal en détail : priorité aux applications GPGPU

Priorité aux applications GPGPU

La rédaction vous conseille aussi...