La gamme professionnelle de NVIDIA : Tesla, Quadro, VGX

Double précision vs. simple précision

La différence entre double précision et simple précision est facile à comprendre : dans le premier cas, c’est plus précis (oui, c’est une lapalissade). Pour autant, dans quels domaines la précision est-elle si importante ? Dans la majorité des calculs scientifiques, qui ne peuvent s’accommoder de l’approximation des calculs en simple précision. Les jeux en 3D, par contre, s’en tirent très bien en simple précision. Nous avons demandé à NVIDIA si certains domaines pouvaient utiliser la simple précision, et la réponse a été que les calculs pour l’analyse en temps réel (par exemple déterminer si une zone contient du pétrole) se contentaient généralement de la simple précision.

La semaine dernière, NVIDIA nous présentait sa gamme de cartes graphiques (un mot un peu inapproprié) professionnelle, qui comprend essentiellement 3 gammes : Tesla, Quadro et VGX.

Un domaine peu connu

NVIDIA l’avoue, la gamme professionnelle est financée en partie (au niveau de la R&D) par les cartes graphiques grand public : proposer des cartes professionnelles serait intenable actuellement au niveau des coûts et les rares sociétés qui ne proposaient que des cartes graphiques professionnelles ont d’ailleurs disparu assez rapidement après l’avènement du GPU, fin des années ’90. Le terme carte graphique est d’ailleurs de plus en plus inapproprié : si les Quadro, les Tesla et les VGX partagent la même architecture au niveau des puces (essentiellement Fermi et Kepler), elles ne font pas toutes des tâches graphiques à proprement parler. Et des cartes comme les Tesla et les VGX ne proposent même plus de sorties vidéo.

Les cartes Tesla

Commençons par la gamme Tesla. Actuellement, NVIDIA propose essentiellement des cartes basées sur l’architecture Fermi, qui sont soit utilisables seules (elles ont une sortie vidéo) ou en conjonction avec des cartes Quadro de la même gamme, ce que NVIDIA appelle Maximus (nous allons y revenir). La gamme Kepler, plus récente, comprend la Telsa K10 (qui utilise un GK104) et la future Tesla K20, basée sur l’attendu GK110. Le GK110 est la version haut de gamme de Kepler et va notamment proposer une puissance de calcul élevée en double précision, contrairement aux autres puces. Avec le GK110, la puissance en double précision est le tiers de la puissance en simple précision, alors que les GK104 sont vingt-quatre fois moins puissances en double précision. Les cartes Tesla ont un TDP contenu (225 W) et sont destinées à travailler en parallèle, la limite étant souvent le nombre de connecteurs PCI-Express et le nombre de lignes gérées par le système. 

Les cartes Quadro

La gamme Quadro, elle, comprend des « vraies » cartes graphiques. Les Quadro sont des cartes destinées aux professionnels de la vidéo, de la 3D, de l’image. Nous avons pu voir la récente K5000, une carte qui propose notamment quatre sorties vidéo. Carri Systems, partenaire de NVIDIA et intégrateur officiel pour les Quadro et les Tesla, présentait d’ailleurs une machine équipée de cette Quadro et de quatre écrans. Techniquement, la carte supporte même les (rares) écrans 4K/Ultra HD via ses sorties DisplayPort 1.2. En plus des fonctions classiques des Quadro, NVIDIA a indiqué que les programmes peuvent utiliser une des nouveautés de l’architecture Kepler, l’encodeur H.264. Ce dernier propose plus de réglages que sur les cartes GeForce et il est possible d’encoder matériellement en H.264 et en 1080p à 240 images/s.

La technologie Maximus

Nouveauté, NVIDIA propose un pseudo SLI pour sa gamme professionnelle : Maximus. La technologie, qui passe en version 2.0 avec le support de Kepler, permet en fait de placer une carte Quadro pour l’affichage et une (ou plusieurs) carte Tesla pour les calculs. L’intérêt est évident : remplacer une station de rendu et une station de travail par un seul appareil. De plus en plus d’applications proposent la prise en charge de cette configuration hétérogène, avec des gains parfois très importants.

Image 1 : La gamme professionnelle de NVIDIA : Tesla, Quadro, VGXMaximusCarri Systems et PNY (fournisseur officiel des cartes Quadro et Tesla en Europe) ont présenté des stations Maximus et nous avons pu voir la technologie en action. Globalement, c’est évidemment performant, l’intérêt étant surtout de déporter les calculs sur une carte en particulier et donc de laisser la Quadro (par exemple) gérer l’affichage. Sur un rendu 3D, au lieu de faire les modifications en temps réel sur la Quadro et ensuite de gérer le rendu sur la même Quadro, en bloquant la machine, on peut déplacer le rendu sur une carte Tesla et continuer à travailler sur l’affichage et à utiliser la machine avec la Quadro. Le gain est intéressant dans certains cas.

VGX, les cartes cloud

Enfin, il y a les cartes destinées au monde du cloud, les cartes VGX. L’idée est de gérer l’affichage en virtualisant les cartes graphiques sur un serveur, en utilisant des cartes dédiées. La gamme comprend deux modèles : la première est la K1, une carte dotée de quatre GPU GK107 et capable de gérer 100 utilisateurs « virtualisés ». Utiliser des GPU virtualisés pour prendre en charge les sessions à distance à du sens : la majorité des solutions de ce type sont souvent limitées par le CPU et les capacités graphiques sont problématiques quand c’est le CPU qui doit gérer l’affichage des clients, même avec un processeur de serveur. La VHX K2 est dotée de deux GK104 (plus rapide) et prend en charge 64 utilisateurs. La première est surtout destinée à gérer plusieurs clients légers (des hotlines par exemple) alors que la seconde est plutôt prévue pour les usages « lourds » et permet de virtualiser des stations de travail.

Pour le jeu dans le cloud, le fonctionnement est différent. Les cartes VGX n’ont pas de sorties vidéo, mais elles proposent un encodeur H.264 matériel intégré, comme toutes les cartes Kepler. L’idée est donc d’exécuter les jeux sur un seul GPU — comme les services en cloud travaillent souvent en 720p, la puissance du GK107 n’est pas un souci — et d’encoder directement le flux en H.264 avant de l’envoyer aux joueurs. L’intérêt est simple : au lieu de mettre une carte graphique par jeu dans un serveur, on met une carte pour quatre joueurs.

Au final, NVIDIA propose une gamme complète et — de ce que nous avons pu voir — performante. Bien évidemment, la concurrence existe, notamment chez AMD avec des FirePro et — de façon plus marginale — chez Matrox avec les cartes destinées à gérer plusieurs écrans. Mais NVIDIA reste pour le moment le choix le plus pertinent dans le monde professionnel, en partie grâce à CUDA.