mardi 8 janvier 2008

Le CNRS met 207 teraflops à la disposition de la communauté scientifique

Cherchant à rattraper le retard d'investissement de la France dans ses capacités de calcul intensif, le CNRS vient d'acheter à IBM un calculateur hybride. Associant machine SMP et architecture BlueGene/P, la plateforme offrira à la communauté scientifique 207 teraflops en juillet 2008

207 teraflops. C'est la puissance du calculateur que le CNRS vient d'acquérir auprès d'IBM afin de le mettre à la disposition de l'ensemble de la communauté scientifique française. 140 Teraflops seront accessibles dès la fin du mois de janvier, la puissance totale étant prévue pour juillet prochain. Un teraflop correspond à mille milliards d'opérations en virgule flottante par seconde. « Et nous pensons déjà à quelques petaflops », anticipe Catherine Bréchignac, présidente du CNRS.

Cette capacité de calcul intensif va d'abord satisfaire des besoins urgents en recherche climatologique. Elle sera aussi mise à profit dans les sciences de la terre et de l'univers (océanographie, astrophysique...) et servira potentiellement pour tous les traitements nécessitant des puissances de calcul très importantes : physique fondamentale, chimie, ingénierie, biologie, mathématiques appliquées, informatique.

« Un rattrapage », selon Valérie Pécresse

Il était temps. Valérie Pécresse, ministre de l'enseignement supérieur et de la recherche, le reconnaît : « C'est un rattrapage ». Ces dernières années, la France avait « accumulé un retard dans ses investissements scientifiques ». L'acquisition conséquente que vient de réaliser le CNRS n'est donc qu'une première étape pour le combler. L'avenir, évoque la ministre, c'est aussi la réflexion que va conduire le comité stratégique du calcul intensif (CSCI) mis en place cet automne, et le projet GENCI (grand équipement national de calcul intensif ) mené par l'Etat, le CEA, le CNRS et les universités.

Jusque-là, le CNRS ne disposait que de 7 teraflops. Entre son propre centre de calcul (l'Idris), le CCRT du CEA et le Cines (centre informatique pour l'enseignement supérieur), on ne rassemblait pas plus de 25 teraflops. « Il était nécessaire de faire un gros effort sur le calcul », admet la présidente Catherine Bréchignac. Les 25 millions d'euros que l'organisme vient d'investir dans la plateforme conçue par IBM (une somme qui inclut la maintenance sur quatre ans) ont été réglés sur ses fonds propres, avec une participation de 10% de l'Institut de France.

Au 3ème rang mondial pour la puissance du calculateur

Moyennant un coût d'accès qui n'a pas encore été déterminé, les entreprises pourront aussi exploiter cette formidable puissance de calcul qui place pour l'instant la plateforme du CNRS au troisième rang mondial des supercalculateurs. Pour l'instant seulement car les performances progressent constamment et le classement mondial des plateformes HPC (high performance computing) se modifie régulièrement.

Aujourd'hui, devant les 207 teraflops (en puissance de crète) du CNRS, on trouve le demi petaflop de l'infrastructure installée en Californie par le département américain de l'énergie et IBM, au Livermore Laboratory, et le quart de petaflop du centre de recherche allemand de Jülich (plateforme également livrée par IBM).

Une machine SMP et une MPP couplées par un stockage commun

A l'initiative du CNRS, le supercalculateur fourni par IBM présente la particularité d'être une plateforme hybride, « composée de deux machines couplées par un stockage commun », explique Arnold Migus, directeur général du CNRS. « La première machine, d'une puissance de 68 teraflops, exploite une architecture SMP qui va permettre d'optimiser les applications actuelles. La seconde machine prépare l'avenir. » D'une capacité de 139 teraflops, elle repose sur un système BlueGene/P qui exploite une architecture MPP (massivement parallèle).

La première machine, sous IBM AIX, comprend huit cabinets IBM Power6, 3 584 processeurs de calcul et 18 To de mémoire. La seconde, sous Linux, intègre dix cabinets BlueGene/P, 40 480 processeurs de calcul et 20 To de mémoire. Entre les deux, la gestion unifiée des données se fait par un système de fichiers global et un système commun de gestion des travaux.

« Ce qui est très important, c'est que l'on peut passer facilement d'une machine à l'autre », insiste Arnold Migus qui se plaît à souligner par ailleurs la rapidité avec laquelle cette acquisition a été menée : « Moins de six mois entre le cahier des charges et la livraison. Ce qui prouve que nous pouvons faire aussi bien que le privé lorsque la loi nous y autorise ».

Le directeur du CNRS fait ici référence au dispositif d'achat d'équipement scientifique défini par la loi de programmation pour la recherche de 2006. C'est au terme d'une procédure de marché négocié qu'IBM a été retenu. L'offre d'autres fournisseurs a bien été examinée mais, selon Arnold Migus, IBM était le seul à pouvoir répondre au cahier des charges et en particulier à la mise en commun de la partie stockage. Le constructeur national Bull, notamment, n'apportait « qu'une partie de la réponse ».

Source : http://www.lemondeinformatique.fr/actualites/lire-le-cnrs-met-207-teraflops-a-la-disposition-de-la-communaute-scientifique-24997.html

Aucun commentaire: