Pour les actualités en français, voir la page News in French.

Calcul et fusion

Le centre de calcul et de données scientifiques d’ITER entre en activité

Près de six ans après le début des travaux de conception et de construction, le centre de calcul et de données scientifiques d’ITER a été achevé au mois de décembre 2024 et sera pleinement opérationnel en 2025.

Peter Kroul, de la section Systèmes et opérations informatiques, nous fait visiter le Centre de calcul et de données scientifiques, où les données d'ITER seront stockées, sécurisées, traitées et distribuées tout au long de la durée de vie de la machine. Le stockage et la gestion des données débuteront en 2025, lorsque le centre commencera à recevoir les données des différents systèmes de l'installation ITER.

Le centre de calcul et de données scientifiques est conçu pour recevoir jusqu’à 1 MW d’équipements dans 46 racks—les composants du calculateur haute performance d’ITER et des systèmes de stockage et de communication utilisés pour gérer l’ensemble des données du programme et les transférer vers un centre de sauvegarde situé à l’extérieur du site.

Au cours de l’année 2025, les équipements seront transférés de leur emplacement temporaire vers leur emplacement définitif dans le centre de calcul et de données scientifiques. En parallèle, le nombre de processeurs du calculateur haute performance sera porté à 17 000. Les emplacements temporaire et définitif sont tous deux situés dans le sous-sol du siège d’ITER. Dans un premier temps, le nouveau centre de données fonctionnera à 50% de sa capacité, puis il montera en puissance en fonction des besoins. Le premier système, baptisé judicieusement « IBM Fusion », a déjà été installé.

La conception de l’infrastructure de calcul a débuté en 2019, avec pour objectif de satisfaire aux normes des centres de données de niveau 3, qui spécifient, entre autres, que les infrastructures centrales telles que les systèmes d’alimentation électrique et de refroidissement ne doivent pas rester à l’arrêt plus de 1,6 heure par an. Il s’agit d’une valeur de référence et la conception d’ITER devrait, si tout va bien, permettre de surpasser ces exigences et de maintenir les interruptions à un minimum absolu.

Pour permettre la maintenance de l’ensemble des infrastructures centrales sans les mettre à l’arrêt, le centre de données est équipé de plusieurs circuits de distribution électrique indépendants et de composants redondants pour les systèmes d’alimentation et de refroidissement. « Si l’un des circuits d’alimentation du bâtiment est hors service, nous pouvons procéder aux réparations tout en continuant de fonctionner sur l’autre circuit, explique Peter Kroul, l’un des responsables du centre de calcul. Et c’est aussi valable pour les générateurs, la connectivité et tous les autres éléments critiques ».

Une puissance de calcul et une capacité de stockage de données considérables

Le calculateur haute performance d’ITER est constitué de plusieurs clusters conçus pour traiter des tâches nécessitant une grande puissance de calcul telles que les simulations Monte Carlo. La neutronique, qui permet d’analyser les flux de neutrons dans une installation, est l’une des principales applications des méthodes Monte Carlo. Pour garantir la sûreté nucléaire, la neutronique doit être recalculée pour la nouvelle structure à chaque fois que la conception d’un élément du Bâtiment tokamak est modifiée. 

« Les méthodes Monte Carlo procèdent particule par particule et suivent les probabilités associées à chaque neutron individuellement, indique David Fernandez, le responsable de la section Systèmes et opérations informatiques. Ceci implique de répéter les mêmes opérations un très grand nombre de fois, et c’est précisément le type de tâches intensives pour lesquelles sont conçus les calculateurs haute performance. »

Chacun des racks situés derrière cette porte contient des centaines de câbles pour les connexions du calculateur haute performance d’ITER.

Outre les algorithmes Monte Carlo, le calculateur d’ITER sera utilisé pour réaliser des simulations de physique des plasmas, des opérations de dynamique des fluides et plusieurs autres tâches scientifiques et techniques nécessitant une grande puissance de calcul. Mais dans la plupart des cas, il faudra commencer par adapter le logiciel. « Pour les simulations, comme pour la plupart des autres tâches effectuées par le calculateur haute performance, il est nécessaire de modifier le code source pour exploiter la pleine capacité de cette grosse machine », souligne David Fernandez.

Le centre de calcul et de données scientifiques répondra également à l’une des exigences prioritaires d’ITER : stocker, sécuriser, traiter et distribuer les vastes volumes de données produits tout au long de la durée de vie du programme. Dans un premier temps, le nouveau centre de données disposera d’une capacité de stockage de l’ordre de quelques dizaines de pétaoctets et utilisera le système de stockage IBM Spectrum Scale. Mais il est conçu pour stocker un volume de données estimé à 5 exaoctets, que devrait produire le programme au fil du temps.¹

« Pour parvenir à stocker la totalité des données générées sur la durée du programme, nous avons besoin que les systèmes de stockage évoluent en permanence, en termes de capacité et de densité, dit Peter Kroul. Fort heureusement, nous avons eu accès aux feuilles de route technologiques de plusieurs grands fournisseurs mondiaux d’équipements de stockage, ce qui nous a apporté un certain degré de confort pour nos projections. Par exemple, lorsque nous avons commencé en 2019, nous étions capables de stocker 5 à 6 pétaoctets dans un rack. Six ans plus tard, ce chiffre approche des 20 pétaoctets et il devrait tripler ces trois prochaines années. »

La salle de contrôle principale, depuis laquelle les expériences scientifiques seront surveillées et analysées, disposera de 10 jours de données très rapidement accessibles et analysables. Toutes les données seront transmises en continu au centre de données, qui sera la chambre forte d’ITER et maintiendra ces données en ligne pendant toute la durée de vie du programme afin de permettre aux scientifiques de réaliser des analyses lors des différentes phases expérimentales. Selon Peter Kroul, ceci distingue ITER des autres infrastructures scientifiques à grande échelle, dans lesquelles les données ne restent en ligne que pendant certaines phases puis sont stockées « à froid », il n’est alors plus possible d’y accéder rapidement. « Dans notre cas, les scientifiques ont besoin de réaliser des analyses pendant toutes les phases du programme, c’est pourquoi le stockage des données est conçu différemment, dit-il. Plutôt qu’un archivage « à froid », nous maintiendrons toutes les données à l’état « chaud », sur disque ou équivalent, pendant toute la durée du programme. »

Le centre de données sera raccordé à un centre de sauvegarde et de distribution de données situé à Marseille, à plus de 50 km du site, grâce à des liaisons optiques à grande vitesse dédiées, qui sont elles aussi redondantes. Les opérations de stockage et de gestion des données débuteront en 2025, lorsque le centre commencera à recevoir les données des différents systèmes de l’installation ITER.

Dans un souci de durabilité, les concepteurs du centre de calcul et de données scientifiques ont prévu un système de refroidissement par rangée, dans lequel les serveurs et les unités de stockage sont rafraîchis par des tours de conditionnement d’air refroidies à l’eau placées entre les racks. La consommation d’électricité et le degré de refroidissement peuvent être optimisés individuellement pour chaque rack de l’installation.

L’efficacité d’un centre de données est mesurée par un indicateur d’efficacité énergétique appelé PUE (power usage effectiveness), qui correspond au rapport entre la quantité totale d’énergie utilisée par le centre de données et l’énergie consommée par ses équipements de calcul. « Je pense que le PUE du centre de données d’ITER sera inférieur à 1,3, ce qui est une valeur satisfaisante en termes de consommation d’énergie et de refroidissement », dit Peter Kroul.
 

¹Un pétaoctet représente un million de gigaoctets. Un exaoctet correspond à mille pétaoctets, ou un milliard de gigaoctets.