Faute de pouvoir importer les accélérateurs les plus performants, des clients chinois sont prêts à acquérir des GeForce RTX 4090 pour alimenter leurs centres de données. Les cartes sont préalablement transformées en version blower pour répondre à cet usage.
Les mesures en vigueur depuis le 16 novembre interdisent la commercialisation de certains GPU / cGPU en Chine, dont la carte graphique GeForce RTX 4090 de NVIDIA, jugée coupable d’être trop performante ; des Radeon seraient également concernées. Des acquéreurs ont à l’évidence anticipé cet embargo et constitué pas mal de stocks ; pour maximiser leurs profits, ils reconvertissent les GeForce en accélérateurs pour les centres de données.
C’est ce que montrent des clichés pris par un informateur de Baidu. Nous y voyons une transformation de GeForce RTX 4090 en variantes blower – en l’occurrence de modèles Palit OmniBlack et Gainward Phantom – destinés finir dans des centres de données.
Une miniaturisation de GeForce RTX 4090
L’ironie de cette situation est que NVIDIA fait la chasse aux versions blower des GeForce depuis l’ère d’Ampere (RTX 3000), estimant sans doute que celles-ci risqueraient d’avoir une incidence néfaste sur les RTX non GeForce (les cartes professionnelles, anciennement appelées Quadro).
Naturellement, au sein des serveurs, les GPU doivent se satisfaire d’un espace confiné et restreint, bien plus étroit que dans la plupart des tours des PC gamer ; ils passent de l’élevage en « plein air » à de l’élevage intensif si vous nous permettez l’analogie.
Pas de considérations sanitaires ou relatives au bien-être animal pour des GPU ; leurs seules exigences : être correctement alimentés et refroidis.
Les GeForce RTX 4090 sont ainsi démontées puis transformées en cartes blower ; s’en suit apparemment un protocole de test assez rigoureux à base de Furmark et autre 3DMark permettant de s’assurer que le GPU AD102 et la mémoire GDDR6X survivent à ce traitement.
De fait, la GeForce RTX 4090 implique bien certains restrictions, notamment l’absence de prise en charge du P2P mais s’en sort aussi bien qu’une RTX 6000, bien plus onéreuse, dans de nombreuses charges de travail.
Par ailleurs, si les GeForce ne sont logiquement pas aussi fonctionnelles que des A100 ou des H100 dans certains domaines, l’écosystème logiciel NVIDIA devrait pouvoir fonctionner sans trop de problèmes avec quelques modifications. En matière d’intelligence artificielle par exemple, la librairie TensorRT-LLM open source lancée le mois dernier facilitera sûrement le travail d’optimisation.