NVIDIA : du watercooling pour les GPU PCIe A100 pour centres de données

Au sein des serveurs, cela induit une baisse de la consommation d’environ 30 % selon la société.

Si le critère de l’efficacité énergétique n’est pas – encore – un élément crucial pour les PC domestiques, c’est en revanche un énorme enjeu pour les centres de données. Afin de l’améliorer, NVIDIA et Equinix planchent sur des GPU PCIe NVIDIA A100 refroidis par liquide. NVIDIA les qualifie de “premiers d’une gamme de GPU pour serveurs grand public répondant à la demande des clients pour des centres de données écologiques et performants”.

GPU PCIe NVIDIA A100 watercooling
Crédit : NVIDIA

Equinix est un fournisseur qui gère plus de 240 centres de données et qui ambitionne de devenir le premier de son secteur à être climatiquement neutre. Afin de réduire le PUE (Power Usage Effectiveness) de ses centres de données, Equinix a ouvert en janvier une installation dédiée à la poursuite des progrès en matière d’efficacité énergétique. Une partie porte sur le refroidissement liquide, notamment sur les GPU A100 80GB PCIe Liquid-Cooled. Ces solutions sont en cours d’échantillonnage et doivent être disponibles cet été.

A lire > Gigabyte lance des serveurs associant CPU Altra Max et GPU NVIDIA A100

Un PUE de 1,15 au lieu de 1,6

L’impact sur l’efficacité énergétique du refroidissement liquide est loin d’être négligeable. Dans des tests séparés, Equinix et NVIDIA ont constaté qu’un centre de données utilisant le refroidissement liquide pouvait effectuer les mêmes charges de travail qu’une installation refroidie par air tout en utilisant environ 30 % d’énergie en moins. NVIDIA estime qu’un centre de données refroidi par liquide peut atteindre 1,15 PUE, bien en dessous du 1,6 de son cousin refroidi par air.

En outre, les centres de données refroidis par liquide sont également bien plus compacts. En effet, les GPU A100 watercoolés n’utilisent qu’un seul emplacement PCIe, alors que les GPU A100 refroidis par air en occupent deux.

Image 1 : NVIDIA : du watercooling pour les GPU PCIe A100 pour centres de données
Crédit : NVIDIA

Concrètement, le refroidissement liquide implique le recours à de petites quantités de fluides dans des systèmes fermés concentrés sur les principaux points chauds, plutôt que des systèmes nécessitant des millions de gallons d’eau par an pour refroidir l’air à l’intérieur des centres de données.

La technologie mise au point par NVIDIA ne devrait d’ailleurs pas se limiter aux centres de données. L’entreprise considère que “les voitures et d’autres installations pourraient en bénéficier pour refroidir les systèmes à haute performance intégrés dans des espaces confinés”.

Au moins une douzaine de fabricants de systèmes prévoient d’intégrer ces GPU dans leurs offres plus tard cette année. Parmi eux figurent ASUS, ASRock Rack, Foxconn Industrial Internet, GIGABYTE, H3C, Inspur, Inventec, Nettrix, QCT, Supermicro, Wiwynn et xFusion.

A lire > NVIDIA détaille sa gamme de serveurs basés sur le CPU Grace

Des GPU H100 l’année prochaine

De fait, comme le souligne le communiqué de NVIDIA, cette réduction du PUE est une tendance mondiale dictée par des réglementations de plus en plus contraignantes ; le refroidissement liquide sera l’une des voies offertes aux fournisseurs pour respecter les nouvelles normes. Au passage, vous noterez que la zone EMEA (Europe Middle East & Africa) est actuellement championne de l’informatique écoresponsable, avec un indicateur d’efficacité énergétique moyen bien inférieur à celui de l’Amérique et de l’Asie.

Image 2 : NVIDIA : du watercooling pour les GPU PCIe A100 pour centres de données
Crédit : NVIDIA

NVIDIA prévoit de donner suite à la carte PCIe A100 avec une version utilisant le GPU Tensor Core H100 l’année prochaine. L’entreprise souhaite aussi “soutenir le refroidissement liquide dans ses GPU pour centres de données à hautes performances et ses plates-formes NVIDIA HGX dans un avenir proche”.

Source : NVIDIA