La latence mémoire des GPU Ampere et RDNA 2 comparée

Malgré un plus grand nombre de caches, le GPU RDNA 2 est plus véloce.

Le site Chips and Cheese livre un rapport intéressant sur la latence mémoire des GPU Ampere de NVIDIA et RDNA 2 d’AMD ; plus précisément, la GeForce RTX 3090 et la Radeon RX 6800 XT. Les tests effectués sous OpenCL montrent que le GPU RDNA 2 d’AMD jouit de latences nettement inférieures à celles du GPU Ampere de NVIDIA.

Image 1 : La latence mémoire des GPU Ampere et RDNA 2 comparée

Pour comprendre ces courbes, quelques précisions ne sont pas superflues. Pour ses cartes Ampere, NVIDIA utilise un traditionnel système de cache à deux niveaux : L1 et L2. Les Radeon RX 6000 s’appuient sur une plus excentrique conception à quatre niveaux : L0, L1, L2 et Infinity Cache (L3). Comme relevé ci-dessus, la latence entre le cache L1 et L2 pour la carte de NVIDIA est supérieur à 100 ns. Pour celle d’AMD, malgré le cache L1 entre le L0 et le L2, la latence est de seulement 66 ns entre le L0 et le L2. En outre, l’Infinity Cache n’induit que 20 ns de latence. Ainsi, en dépit d’un nombre de caches plus conséquent, le GPU RDNA 2 a une latence VRAM similaire à celle de son rival.

Une photographie d’une cargaison de GeForce RTX 3080 Ti

Un GPU GA102 plus massif

Chips and Cheese pense que le massif GPU GA102 de la RTX 3090 avec sa surface de 628 mm² (contre 520 mm2 pour Navi 21) a un impact sur les latences, et que les puces Ampere de NVIDIA sont surtout à l’aise avec beaucoup de parallélisme. Par ailleurs, les faibles latences L2 et L3 des cartes RDNA 2 leur garantissent logiquement de meilleures performances dans des charges de travail peu gourmandes où ce critère prévaut.

Si ce sujet vous intéresse, n’hésitez pas à consulter le dossier de Chips and Cheese. Vous y trouverez des analyses de la latence mémoire pour d’anciens GPU NVIDIA et AMD ainsi qu’une comparaison CPU / GPU.