Refroidissement liquide en datacenters GPU : les chiffres réels d'efficacité
Nous publions nos données de PUE et de consommation énergétique après 6 mois d'exploitation avec un HGX B200 refroidi par liquide.
Chaque vendor de datacenter annonce un PUE de 1,2. Si ce chiffre était réel, le secteur aurait déjà résolu son problème énergétique. Il ne l'a pas résolu — le datacenter Tier III moyen de l'industrie opère autour de 1,45-1,55 selon les rapports annualisés de l'Uptime Institute (Global Data Center Survey), et cela sans compter les pics quand arrive la canicule. L'écart entre marketing et mesure est le sujet de cet article.
Ce que mesure exactement un PUE
PUE = énergie totale du DC / énergie consommée par l'IT. Si votre PUE est 1,2, pour chaque watt utilisé par le GPU, 0,2 W sont dépensés en refroidissement, onduleurs, éclairage et pertes. Un PUE de 1,5 triple cet overhead.
Le problème, c'est que le PUE se mesure dans des conditions très différentes selon qui le rapporte. Certains le donnent « de conception » (théorique, à charge idéale), d'autres « annualisé » (moyenne réelle incluant été et hiver), d'autres « best-case » (meilleur trimestre). Les seuls comparables sont les annualisés avec instrumentation physique indépendante.
Air pulsé vs refroidissement liquide direct
HGX B200 dissipe 10,2 kW par nœud. Avec 8 GPU à 1 kW chacun, plus CPU, mémoire et réseau, un rack de 4 nœuds dépasse 45 kW de charge thermique. L'air pulsé cesse de fonctionner à cette densité : la température de retour dépasse les plages ASHRAE A2/A3 recommandées, les GPU entrent en throttling thermique, et le temps moyen entre pannes chute d'un ordre de grandeur.
Le refroidissement liquide direct (eau tempérée, 40-45 °C en entrée) élimine le problème par la physique. Le liquide a 3 400 fois plus de capacité calorifique volumétrique que l'air ; un tuyau d'eau fait le travail de quarante extracteurs. Le GPU fonctionne 8 à 12 °C plus frais à la même charge, ce qui réduit la consommation par courant de fuite au niveau du silicium et améliore le MTBF.
Nos chiffres, septembre 2025 – mars 2026
Six mois d'exploitation continue à Madrid avec le cluster HGX B200 sous refroidissement liquide direct-to-chip. Mesures avec compteurs certifiés classe 0.5s, relevés horaires, publication mensuelle.
PUE annualisé
1,18 (σ = 0,03)
PUE pic (août Madrid 41 °C)
1,24
PUE minimum (janvier)
1,13
Consommation refroidissement / consommation IT
11,6 %
Eau consommée par MWh IT
0,09 m³ (circuit fermé)
Température moyenne d'entrée GPU
36,2 °C
Événements de throttling thermique GPU
0
“La différence entre un PUE de 1,5 et un PUE de 1,2 sur la durée de vie d'un HGX B200 représente 21 tonnes de CO₂ évitées par nœud — l'équivalent de la consommation électrique annuelle d'environ 40 foyers espagnols. Multipliez par racks. Puis multipliez par flotte.”
Ce que le marketing durable ne vous dit pas
- L'eau du circuit fermé ne s'évapore pas — elle se régénère. Elle n'entre pas en concurrence avec l'agriculture locale.
- La chaleur résiduelle est techniquement réutilisable pour le chauffage urbain ou l'eau chaude sanitaire industrielle — une frontière d'efficacité ouverte à mesure que les réseaux de chaleur européens arrivent à maturité.
- Le datacenter est raccordé au réseau espagnol ; l'Espagne a clos 2024 avec environ 56 % de production renouvelable annualisée (REE, rapport sur le système électrique 2024). L'empreinte carbone par MWh est environ la moitié de la moyenne européenne.
- La fabrication du matériel reste la partie la plus sale du cycle de vie — aucun greenwashing n'y change rien. La seule réponse est d'allonger la durée de service et de réduire la consommation opérationnelle.
Nous publions ces chiffres parce que tant que le secteur ne mesure pas de la même manière, la conversation sur la durabilité de l'IA reste dans des PowerPoint. La chaire avec l'Université de Grenade travaille sur un protocole public de benchmarking énergétique reproductible. Quand il sera prêt, nous le publierons aussi.