El supercomputador MareNostrum 5 y chips ‘made in Europe’

Esta mañana se ha realizado el acto oficial en el que la Comisión Europea ha anunciado oficialmente los detalles de que el Barcelona Supercomputer Center–Centro Nacional de Supercomputación (BSC) ha sido elegido sede para instalar un supercomputador a nivel Europeo. Todos los medios de comunicación están hablando de ello en estos momentos. ¿Pero a qué nos referimos cuando hablamos del supercomputador Marenostrum 5?

Superordenadores mil millones de veces más rápidos en solo 30 años

Para una toma rápida de perspectiva de los estudiantes en mi curso de supercomputación en el master de la UPC de la fulgurante carrera espacial que representa la supercomputación,  cuento  que el computador al que yo tenía acceso en el año 1982, donde ejecuté mi primer programa, era un Fujitsu que permitía calcular algo más de un millón de operaciones por segundo en su procesador (o CPU). 30 años después, cuando en el 2012 el BSC puso en funcionamiento el supercomputador MareNostrum 3, este era “solo” 1 000 000 000  veces más rápido que el ordenador en el que yo empecé.

En concreto, el supercomputador MareNostrum 3 presentaba un rendimiento máximo teórico de 1,1 Petaflops (1 100 000 000 000 000 operaciones de coma flotante por segundo). Lo conseguía poniendo a trabajar en paralelo a más de 3 000 servidores albergados en 36 racks con procesadores que disponian de varios núcleos (o cores en inglés, con un total de casi 50 000 cores). Por aquel entonces el supercomputador Marenostrum estaba considerado como uno de los más rápidos del mundo,  concretamente en la posición trigésimosexta, en  la lista TOP500, que se actualiza cada medio año y ordena los 500 supercomputadores más potentes del mundo.  

A continuación pueden ver una fotografía donde se observan los racks de computación del Marenostrum 3 que se albergaban en la capilla de Torres Girona del campus nord de la UPC en Barcelona (en el 2012).

Nuevos componentes en el motor de un supercomputador

Hasta el 2012, el incremento de capacidad de computación que cada año conseguíamos de los ordenadores era gracias a la mejora continuada del rendimiento de las CPU y a las técnicas de programación paralela. Sin embargo, desde entonces el incremento de capacidad de computación no ha sido solo gracias estos factores, sino también a los nuevos sistemas hardware masivamente paralelos basados en aceleradores hardware GPU (graphical processing units), que resultan decenas de veces más eficientes que las CPU tradicionales.

Las GPU se desarrollaron originalmente para acelerar el juego 3D que requiere el uso repetido de procesos matemáticos que incluyen distintos cálculos sobre matrices. Inicialmente, compañías como NVIDIA y AMD desarrollaron estos chips rápidos y masivamente paralelos para tarjetas gráficas dedicadas a videojuegos: pronto se vio que las GPU útiles para juegos 3D eran muy adecuadas también para acelerar cálculos sobre matrices numéricas; por ello, este hardware en realidad benefició a la comunidad científica, y en el 2007 NVIDIA lanzó el lenguaje de programación CUDA para poder programar sus GPU. Gracias a ello, centros de investigación en supercomputación como el BSC empezaron a usar GPU para acelerar aplicaciones numéricas.

Una muestra de su potencia es una parte del actual supercomputador Marenostrum 4 (MareNostrum es el nombre genérico que utiliza el BSC para referirse a las diferentes actualizaciones de su supercomputador más emblemático y el más potente de España, y hasta hoy se han instalado cuatro versiones desde 2004). La capacidad de cálculo del MareNostrum 4 actual está repartida en dos partes totalmente diferenciadas: un bloque de propósito general y un bloque de GPU que se puso en funcionamiento en el año 2018.

A nivel de hardware este bloque con GPU consta de 54 nodos equipado con 2 procesadores IBM POWER9 que disponen de 20 cores físicos cada uno y con 512GB de memoria. Cada uno de estos procesadores POWER9 están conectados a dos GPU NVIDIA V100 (Volta) con 16GB de memoria, en total 4 GPU por nodo. Todo ello en solo 3 racks del Marenostrum actual (los  que se ven en la fotografía siguiente) que ofrecen 1,5 Petaflops de rendimiento máximo teórico, mucho más  que los 1,1 Petaflops que tenía en el 2012 todo el Marenostrum 3 en 36 racks (foto anterior). És decir, más potencia en menos de un 10% del espacio.

Pero un detalle que aún no he mencionado, pero muy muy importante: es que toda esta tecnología de computo no es Europea. Volvemos luego a este detalle.

¿Y ahora, Marenostrum 5?

El pasado viernes la Comisión Europea anunciaba su apuesta por el Barcelona Supercomputing Center como sede de uno de los grandes superordenadores europeos, el Marenostrum 5. Este tendrá una potencia pico de 200 Petaflops (200 mil billones de operaciones por segundo) hasta 17 veces superior al actual Marenostrum 4 que es de 13,7 Petaflops. 

Se tratará de un superordenador que mezclará diversos tipos de tecnologías cómo las comentadas (CPU, GPU, …). La utilización de la supercomputación para disciplinas y actividades cada vez más diversas hace que los supercomputadores de hoy en día tengan que dar respuesta a problemas con necesidades computacionales también diferentes. Ofrecer una arquitectura heterogénea, probablemente a base de dos grandes clústeres con características diferentes, es la propuesta que plantea el BSC para optimizar tanto los tiempos de respuesta como el consumo energético de los distintos trabajos que tendrá que computar el futuro superordenador. Los detalles de esta arquitectura heterogénea se irán perfilando a medida que avancen los trabajos de definición y licitación de la infraestructura.

La parte principal del MareNostrum 5 se instalará en un edificio que se ha construido al lado de la capilla de la Torre Girona, de la Universitat Politècnica de Catalunya, donde reside el actual MareNostrum 4. Algunos componentes del nuevo supercomputador ocuparán parte de este antiguo espacio, aunque el grueso principal llenará los 700 metros cuadrados del nuevo edificio. Se prevé que el Marenostrum 5 entre en funcionamiento el 31 de diciembre de 2020.

MareNostrum 5 tendrá un coste de 223 millones de euros, que es el presupuesto previsto para su adquisición, su instalación y para mantenerlo operativo durante 5 años. El 50% de este presupuesto estará financiado por la Unión Europea y el otro 50% por los estados que formarán el consorcio de apoyo a la propuesta desde el primer momento (Portugal, Turquía y Croacia). Irlanda, que dio su apoyo político a la propuesta, está estudiando incorporarse al consorcio, liderado por el BSC, al que, hasta la fecha de su constitución, prevista para finales de julio, podrían incorporarse también otros estados. Los patronos del BSC (el Ministerio de Ciencia, Innovación y Universidades, el Departament d’Empresa i Coneixement de la Generalitat de Catalunya y la Universitat Politècnica de Catalunya) también han apoyado desde el primer momento la propuesta.

Sin duda un triunfo de un potente y numeroso equipo humano del BSC que ha trabajado intensamente en la propuesta, entre ellos Mateo Valero (director del BSC), Josep Maria Martorell (Director Asociado del BSC) y Sergi Girona (Director de Operaciones del BSC y CIO) que esta mañana han presentado la propuesta (ver foto adjunta).

 

El chip de los futuros supercomputadores europeos

Pero lo más importante del proyecto de este nuevo superordenador Europeo Marenostrum 5 no será su potencia de cálculo, sino que además incorporará una plataforma experimental dedicada a desarrollar nuevas tecnologías para la futura generación de supercomputadores. De esta manera, el BSC, además de ofrecer servicios de supercomputación de primer nivel para investigadores de toda Europa, contribuirá con su investigación a que las futuras generaciones de supercomputadores puedan incorporar tecnologías íntegramente desarrolladas en Europa.

El director del BSC, Mateo Valero, ha explicado esta mañana durante el acto oficial la importancia de esta plataforma experimental en MareNostrum 5 desde el convencimiento de que  “Europa, por seguridad y por soberanía, no puede seguir con el alto grado de dependencia que tiene respecto a las tecnologías de computación fabricadas en otros continentes” como parte de la iniciativa de la Comisión Europea de incluir el desarrollo de nuevas tecnologías en la hoja de ruta europea de la supercomputación, que se está llevando a cabo a través de la iniciativa EuroHPC-JU.

En resumen, la Comisión Europea está financiando el desarrollo de un “chip made in Europe” cómo tecnología estratégica para garantizar la soberanía informática del continente y dejar de depender de otros países en una tecnología tan estratégica. La idea seria que, según Mateo Valero, el MareNostrum 6 que debería construirse en 2025 “ya podría estar íntegramente fabricado con componentes europeos”.

¿Y esto que tiene que ver con la inteligencia artificial?

Mateo Valero, director del BSC, ha dicho que “será un supercomputador híbrido adaptado a los nuevos requerimientos de los usuarios de superordenadores, con especial énfasis en la inteligencia artificial“. La investigación en este campo de la inteligencia artificial ha estado guiada en gran parte por los hallazgos experimentales más que por la teoría, en el sentido de que estos avances espectaculares en el área a partir del 2012 solo han sido posibles gracias a que la computación que se requería para poderlos llevar a cabo estaba disponible; de esta manera, los investigadores de este campo han podido poner a prueba y ampliar viejas ideas, a la vez que han avanzado con nuevas que requerían muchos recursos de computación.

OpenAI publicó en su blog un estudio donde presentaban un análisis en el que se confirma que, desde 2012 (cuando Alex Krizhevsky, Ilya Sutskever y Geoffrey E. Hilton emplearon por primera vez aceleradores hardware GPU en inteligencia artificial), la cantidad de computación disponible para generar modelos de inteligencia artificial ha aumentado exponencialmente a la vez que afirman que las mejoras en la capacidad de cálculo han sido un componente clave del progreso de la inteligencia artificial. En  este mismo artículo presentan una gráfica muy visual para sintetizar los resultados de su análisis:

La gráfica muestra la cantidad total de cálculos, en Petaflop por día, que se han  utilizado para entrenar redes neuronales  que son referentes en la comunidad de investigación. Recordemos que un “petaflop / s-day”, el eje vertical del gráfico que está en escala logarítmica,  equivale a realizar 1 000 000 000 000 000 operaciones de redes neuronales por segundo durante un día (s-day), o un total de aproximadamente 100 000 000 000 000 000 000 operaciones, independientemente de la precisión numérica. Viendo esta gráfica, a nadie se le escapa la importancia de avanzar en la supercomputación para poder garantizar los avances en la inteligencia artificial.

En resumen, una gran apuesta de Europa hacia el BSC,  para que impulse el avance científico de la supercomputación en Europa y contribuya de esta manera a posicionar Europa en el puesto que le corresponde en el mundo, también en estas áreas tecnológicas tan estratégicas cómo son  la supercomputación e inteligencia artificial.