Centre de Ressources
L'échange et le partage favorisent la croissance et
travaillent ensemble pour un développement commun!

Quelle est la différence entre refroidissement liquide et refroidissement par air pour les centres de données ? La réponse définitive apportée par le GB200
2025.12.02 laney.zhao@walmate.com

Au cours des décennies de développement des centres de données, le refroidissement par air est toujours resté le choix dominant. Cependant, le lancement de la série GB200 de NVIDIA est en train de bouleverser cet équilibre. Alors que la densité de calcul atteint de nouveaux sommets, les méthodes de refroidissement traditionnelles ne peuvent plus répondre aux besoins. Le refroidissement liquide passe officiellement de l'ombre à la lumière, devenant une infrastructure clé pour soutenir la puissance de calcul de l'IA.

 

1- Changement fondamental du côté de la demande


a. La densité de puissance franchit un point de basculement

La densité de puissance du rack GB200 NVL72 devrait dépasser les 30 kW, un chiffre qui dépasse largement la limite de dissipation thermique de 15 à 20 kW des technologies de refroidissement par air traditionnelles. Cela implique :

· Un choix technologique inévitable : Le refroidissement liquide passe de « à considérer » à « seule option possible ».

· Un changement qualitatif de l'espace marché : Chaque déploiement de GB200 représente une demande certaine en refroidissement liquide.

· Une augmentation significative de la valeur : La valeur du système de refroidissement liquide pour un seul rack atteint plusieurs centaines de milliers de yuans.

b. Évolution des exigences en matière de fiabilité

Avec l'augmentation de la densité de calcul par rack, la valeur commerciale qu'il supporte augmente de façon exponentielle. La fiabilité du système de refroidissement liquide est directement liée à :

· La continuité d'activité : Une seule panne de refroidissement peut entraîner une perte de calcul valant plusieurs millions.

· La durée de vie du système : Pour chaque augmentation de 10°C, la durée de vie des composants électroniques est réduite de moitié.

· La stabilité des performances : L'efficacité du refroidissement influence directement la capacité de la puce à maintenir durablement ses performances de pointe.

 

2- Amélioration complète des exigences techniques

a. Exigences de saut d'efficacité thermique

Le GB200 impose des exigences sans précédent au système de refroidissement :

· Multiplication des performances de conduction thermique

· La conductivité thermique des plaques froides doit atteindre 3 à 5 fois celle des solutions traditionnelles.

· La résistance thermique de contact doit être réduite d'un ordre de grandeur.

IMG20251110164518(1).webp

Figure 1- Plaque de refroidissement liquide à microcanaux

 

b. Contrôle de précision du débit

· Nécessite une précision de contrôle du débit inférieure à ±1%.

· Prend en charge le réglage dynamique du débit pour s'adapter à différentes conditions de charge.

c. Uniformité de la température

· La différence de température sur la surface de la puce doit être contrôlée à moins de 5°C.

· Évite les points chauds locaux qui affectent la stabilité du système.

 

3- Saut de complexité de l'intégration système

Le système de refroidissement liquide a évolué d'une simple fourniture de composants vers un projet de système complexe :


a. Mode traditionnel :

· Fourniture de plaques froides standardisées.

· Connexions de tuyauterie simples.

· Fonctions de surveillance de base.

b. Ère du GB200 :

· Conception d'architecture de refroidissement liquide au niveau rack.

· Système intelligent de distribution de débit.

· Surveillance de l'état de santé en temps réel.

· Capacités de maintenance prédictive.

屏幕截图 2025-11-20 090317.webp 

Figure 2- Rack NVIDIA GB200

 

4- Élévation globale des barrières à la concurrence

Dans le nouvel environnement du marché, les entreprises doivent franchir des seuils plus élevés :


a. Barrières technologiques

Les entreprises du refroidissement liquide doivent dépasser les limites d'une discipline unique et développer un système technologique intégré et pluridisciplinaire. La fusion approfondie de technologies multidisciplinaires comme la conception de microcanaux, la science des matériaux et la mécanique des fluides constitue le seuil de base, tandis que la capacité de simulation thermique et d'optimisation au niveau des puces met à l'épreuve l'accumulation technique profonde des entreprises. Il ne s'agit plus d'une simple amélioration des procédés, mais d'un projet systémique nécessitant des investissements en R&D à long terme.

b. Barrières de certification

Le système de certification industriel devient de plus en plus rigoureux. Les entreprises doivent non seulement réussir les tests de fiabilité stricts définis par les constructeurs de serveurs, mais aussi obtenir la certification technique du fabricant de puces d'origine. Cette exigence de double certification valide non seulement les performances techniques du produit, mais teste également le système qualité de l'entreprise et sa capacité d'approvisionnement stable et continue, devenant un laissez-passer indispensable pour entrer dans la chaîne d'approvisionnement centrale.

c. Barrières de service

Alors que le système de refroidissement liquide évolue pour devenir un sous-système central, la capacité de service est devenue un élément clé de la concurrence. Les entreprises doivent établir un réseau de réponse rapide couvrant l'ensemble du pays et construire un système opérationnel professionnel 7×24 heures. Cette capacité de service exige non seulement la réactivité du support technique, mais aussi une solution de service complète incluant la maintenance préventive et la gestion des urgences, devenant ainsi un partenaire de confiance pour les clients.

 

Nous mettrons régulièrement à jour les informations et technologies relatives à la conception thermique et à l’allègement. Merci de votre intérêt pour Walmate.