Grosse semaine pour AMD. Avant la conférence de demain soir, le constructeur lève les premières bribes d’information sur son futur GPU Vega 10.
AMD lance trois nouvelles cartes dédiées aux intelligences artificielles, rassemblées au sein d’une nouvelle famille d’accélérateurs Radeon Instinct. Il y a la petite MI6, la moyenne MI8 et la grande MI25, qui est basée sur un GPU encore inédit mais très attendu, un GPU Vega 10.
Plus puissante qu’une Titan X Pascal
En analysant les caractéristiques techniques que nous a communiqué AMD, nous pouvons conclure que la MI6 est une Radeon RX 480 adaptée (avec 16 Go de GDDR5), la MI8 est une Radeon Nano (à GPU Fiji). La plus intéressante du lot est donc la MI25.
Pourquoi 25 ? Car elle délivrerait 25 TFlops de puissance brute de calcul en demi-précision (FP16). L’architecture Vega étant capable d’effectuer deux calculs FP16 en simultané sur une unité FP32, la puissance théorique FP32 est divisée par deux, soit 12,5 TFlops (Vega diffère en cela de Fiji et Polaris qui calculent en FP16 comme en FP32).
Pas de carte avant plusieurs mois
Comment cette puissance brute se traduira-t-elle en pratique ? Impossible à dire à ce stade évidemment. AMD ne nous a montré qu’un seul benchmark, très spécifique, un sous-score de DeepBench, test qui simule la phase d’apprentissage d’un réseau neuronal. La MI25 s’y montre 50 % plus rapide que la Titan X Pascal de Nvidia ! AMD omet cependant de comparer avec le Tesla P100, la véritable concurrente de la MI25, qui délivre une puissance brute très légèrement supérieure (10,6 TFlops contre 10,1 TFlops).
Une bonne partie de cette avance serait due à des optimisations logicielles, les Radeon Instinct étant exploitées au travers d’une nouvelle bibliothèque, MIOpen. Pour des résultats en jeux, il nous faudra patienter encore plusieurs mois, mais nous serions très surpris de retrouver une avance comparable.
Caractéristiques des Radeon Instinct :
Modèle | MI6 | MI8 | MI25 |
GPU | Polaris 10 (Ellesmere) | Fiji | Vega 10 |
Équivalent Radeon | RX 480 | Nano | – |
Puissance brute (FP16/FP32) | 5,7 TFlops/5,7 TFlops | 8,2 TFlops/8,2 TFlops | 25 TFlops/12,5 TFlops |
Quantité de mémoire | 16 Go GDDR5 | 4 Go HBM | – |
Bande passante mémoire | 224 Go/s | 512 Go/s | – |
TDP | 150 W | 175 W | 300 W |