Conociendo a Fugaku: La supercomputadora más rápida del planeta

Fugaku es una supercomputadora a exaescala (mientras que solo está a petasescala para el punto de referencia principal) instalada en el Centro RIKEN de Ciencias Computacionales de Kobe, Japón.

El nombre de Fugaku, fue elegido así, por ser un nombre alternativo utilizado para denominar al grande Monte Fuji.

La idea del nombre es representar la similitud entre el Monte Fuji y la nueva supercomputadora Fugaku.

Representado, la altura del Monte Fuji al alto rendimiento de la supercomputadora y la expansión existente en la base del Monte Fuji, a la expansión de usuarios que podrían ser capaces de utilizar la supercomputadora.

La supercomputadora Fugaku comenzó a desarrollarse en 2014 como el gran sucesor de la supercomputadora K y comenzó a operar oficialmente a pleno rendimiento, este mismo año 2021.

A pesar de eso, Fugaku debutó en 2020 y se convirtió en la supercomputadora más rápida del mundo en Junio de 2020, además de convertirse en la primera computadora basada en arquitectura ARM en lograr ser la más rápida del mundo.

En junio de 2020, Fugaku logró 1,42 exaFLOPS (fp16 con precisión de fp64) en el punto de referencia HPL-AI, lo que la convierte en la primera supercomputadora que logra 1 exaFLOPS.

A fecha de Abril de 2021, Fugaku sigue siendo la supercomputadora más rápida del planeta.

Hardware de Fugaku

La supercomputadora está construida con el microprocesador Fujitsu A64FX. Esta CPU se basa en la arquitectura del procesador ARM versión 8.2A y adopta las extensiones vectoriales escalables para supercomputadoras.

Fugaku pretendía y ha logrado ser hasta 100 veces más potente que la computadora K (es decir, un objetivo de rendimiento mayor de 1 exaFLOPS).

La configuración inicial (en Junio de 2020) de Fugaku utilizaba 158,976 CPU de A64FX unidas mediante la interconexión de fusión patentada por Fujitsu y en una actualización de Noviembre de 2020 se le aumentó el número de procesadores.

Software de Fugaku

Fugaku utiliza un “sistema operativo ligero de varios núcleos” llamado IHK/McKernel.

El sistema operativo utiliza tanto Linux, como el ligero núcleo McKernel funcionando simultáneamente, de lado a lado de toda la supercomputadora.

La infraestructura en la que se ejecutan ambos núcleos se denomina Interfaz para Núcleos Heterogéneos: IHK.

Las simulaciones de alto rendimiento se ejecutan en McKernel, con Linux disponible para todos los demás servicios compatibles con POSIX.

Además del software del sistema, la supercomputadora ha ejecutado muchos tipos de aplicaciones, incluidos varios puntos de referencia.

Al ejecutar el estándar de referencia HPL, utilizado por TOP500, Fugaku está en petascale y casi a la mitad de exascale.

Además, Fugaku ha establecido récords mundiales en al menos otros tres puntos de referencia, incluidos HPL-AI a 2,0 exaflops y el sistema ha superado el umbral de exaescala en el índice de referencia.

La descripción de ese índice de referencia es la siguiente:

  • El método de resolución de elección es una combinación de factorización LU y refinamiento iterativo que se realiza posteriormente para devolver la solución a la precisión de 64 bits. La innovación de HPL-AI radica en eliminar el requisito de computación de 64 bits en todo el proceso de la solución y en su lugar optar por una precisión de baja precisión (probablemente 16 bits) para LU, y una iteración sofisticada para recuperar la precisión perdida en la factorización.

Rendimiento de Fugaku

El rendimiento inicial informado de Fugaku fue un Rmax de 416 petaFLOPS en el punto de referencia LINPACK de alto rendimiento FP64 utilizado por el TOP500. Después de la actualización de noviembre de 2020 en el número de procesadores, el rendimiento de Fugaku aumentó a una Rmax de 442 petaFLOPS.

Fugaku también logró alcanzar los primeros lugares en otras clasificaciones que prueban a grandes supercomputadoras en diferentes cargas de trabajo, incluidos Graph 500, HPL-AI y HPCG. Ninguna supercomputadora anterior ha liderado las cuatro clasificaciones a la vez.

Después de la actualización de hardware, en Noviembre de 2020, Fugaku aumentó su rendimiento en la nueva prueba de referencia HPC-AI de precisión mixta a 2.0 exaflops. Ese dato superaba su propia marca de 1.4 exaflops registrada seis meses antes.

Estas mediciones representan las primeras referencias de una computadora por encima de un exaflop, para cualquier precisión y en cualquier tipo de hardware.

Curiosamente, el recuento de núcleos de Arm A64FX se incrementó en un 4.5% hasta aumentar su capacidad Arm A64FX de 7,299,072 núcleos a 7,630,848 núcleos y el rendimiento creció mucho más en proporción a su aumento de núcleos.

Esa actualización, permitió alcanzar a la supercomputadora Fugaku, un nuevo récord mundial de 442 petaflops en el índice HPL.

El rendimiento de Fugaku supero así, al rendimiento combinado de las siguientes 4 supercomputadoras del planeta incluidas en la lista Top500 (y casi de las 5 siguientes) superando por un margen del 45% a todas las demás computadoras dentro de las 10 más potentes del mundo en el benchmark HPCG.

Historia de Fugaku

El 23 de Mayo de 2019, RIKEN anunció que la supercomputadora se llamaría Fugaku. En Noviembre de 2019, el prototipo de Fugaku ganó el primer lugar en la lista Green500.

El envío de los racks y equipos a las instalaciones de RIKEN comenzó el 2 de Diciembre de 2019 y se completó el 13 de mayo de 2020.

En junio de 2020, Fugaku se convirtió en la supercomputadora más rápida del mundo en la lista TOP500, desplazando a la IBM Summit.

Las operaciones a gran escala, apenas han comenzado a realizarse en Marzo de este 2021.

Costo de Fugaku

En 2018, Nikkei informó que el programa costaría alrededor de 130 mil millones de yenes chinos, al cambio 1 billón de dólares estadounidenses o algo así, como 828.795.000.000 millones de euros.

Configuración del sistema de Fugaku

Arquitectura

  • Armv8.2-A SVE

Núcleos

  • 48 núcleos (para cálculo) + 4 núcleos (para SO)

Memoria:

  • HBM2 32 GiB / nodo, 1024 GB / s

Interconectar

  • Interconexión D de tofu

De entrada y salida

  • PCIe Gen3

Proceso

  • FinFET de 7 nm (TSMC)

Almacenamiento

  • 1er nivel: SSD NVMe de 1,6 TB / 16 nodos.
  • 2º Nivel: Sistema de archivos compartidos de 150 PB.
  • 3er Nivel: Servicio de almacenamiento en la nube.

Lenguajes de programación y bibliotecas en Fugaku

Compilador

  • Fortran (subconjunto Fortran 2008, Fortran 2018)
  • C11 ( extensiones GNU y Clang )
  • Subconjuntos de C ++ 14 y C ++ 17 (extensiones GNU y Clang)
  • Subconjunto OpenMP 4.5 y OpenMP 5.0
  • Java

Programación paralela

  • XcalableMP
  • FPDPS

Lenguaje de escritura

  • Python ( NumPy y SciPy )
  • Ruby

Bibliotecas de matemáticas

  • BLAS , LAPACK , ScaLAPACK ( versión en inglés ) , SSL II
  • Fujitsu SSL II
  • EigenEXA, BLAS por lotes

Sistemas Operativos

  • Red Hat Enterprise Linux 8
  • McKernel

Mini Fugaku

En agosto de 2020, la Computational Science Promotion Foundation en Port Island inició un servicio para alquilar por horas una máquina llamada “Mini Fugaku” equipada con la misma CPU que Fugaku.

Mientras que Fugaku tiene a 432 computadoras trabajando al mismo tiempo, el mini Fugaku tiene una capacidad de computación abrumadoramente baja con 8 computadoras.

Esta mini supercomputadora tiene la función de comprobar el correcto funcionamiento de los programas que se encuentran a la espera de comenzar a usarse en la supercomputadora Fugaku.

Fuentes: Wikipedia Japonesa, TOP 500 Supercomputers.

Relacionado

Alan Turing: Historia completa, estudios y pensamientos filosóficos

Alan Turing (1912–1954) nunca se describió a sí mismo como un filósofo, pero su artículo de 1950 “Computing Machinery and Intelligence” es uno de los más citados en la literatura filosófica moderna. Dio un nuevo enfoque al problema tradicional mente-cuerpo, relacionándolo con el concepto matemático de computabilidad que él mismo había introducido en su artículo de 1936-7 “Sobre los números computables, con una aplicación al Entscheidungsproblem”. ¡SEGUIR LEYENDO!

El Avance de los Qubits de Argonne: Un salto adelante en la Computación Cuántica

La computación cuántica es un campo en rápido desarrollo con el potencial de revolucionar muchas industrias, desde la medicina hasta la ciencia de los materiales. Sin embargo, uno de los principales retos a los que se enfrentan los investigadores de computación cuántica es el desarrollo de qubits que sean estables y escalables. Investigadores logran Aumentar el Tiempo de Coherencia Ahora, los investigadores del Laboratorio Nacional Argonne ¡SEGUIR LEYENDO!

Computación Cuántica: Una sencilla introducción

¿Cómo puede obtener más y más de menos y menos? A medida que las computadoras más pequeñas se vuelven, más poderosas parecen volverse: hay más capacidad de descifrar números en un teléfono celular del siglo XXI de lo que habría encontrado en una computadora militar del tamaño de una habitación hace 50 años. Sin embargo, a pesar de estos avances sorprendentes, todavía hay muchos problemas complejos ¡SEGUIR LEYENDO!

El Departamento de Energía de EE. UU lanza la supercomputadora Perlmutter AI

El jueves, el Departamento de Energía de EE. UU. lanzó oficialmente la creación de Perlmutter, una supercomputadora de próxima generación que ofrecerá casi 4 exaflops de rendimiento de inteligencia artificial. El sistema, plantado en el Centro Nacional de Computación Científica de Investigación Energética (NERSC) en el Laboratorio Nacional Lawrence Berkeley, es el más rápido del mundo en las matemáticas de precisión mixta de 16 y 32 ¡SEGUIR LEYENDO!

GPU NVIDIA logra ser más rápida que una computadora cuántica

Un equipo de investigadores de Microsoft y el Scalable Parallel Computing Lab de Zúrich publicaron un artículo en el que hablaban del potencial de la computación cuántica para el futuro y lo comparaban con una única tarjeta gráfica NVIDIA. Los investigadores descubrieron que la GPU funciona mejor que una computadora cuántica hipotética en algunas aplicaciones. En un artículo publicado en la revista Association for Computing Machinery, ¡SEGUIR LEYENDO!

No: La Inteligencia Artificial aún no es capaz de simular la conciencia humana, ni de debatir con humanos

No, IBM no ha creado una máquina capaz de debatir como si tuviese la misma conciencia que un ser humano. Hoy bien temprano, leí este artículo en el País, en el que se subtitula que "IBM desarrolla una inteligencia artificial capaz de competir con humanos en el arte de la oratoria" pues bien, el vídeo sobre la idea expresada en ese artículo. De hecho, varios medios ¡SEGUIR LEYENDO!

Un nuevo procesador de IBM impulsa la computación cuantica a más de 400 qubits

IBM anunció hoy la última generación de su familia de procesadores cuánticos, el Osprey. Con más de tres veces el número de qubits que el procesador de la generación anterior -Eagle- Osprey es el primero en ofrecer más de 400 qubits, eso significa que IBM sigue en camino de lanzar el primer procesador de 1000 qubits durante el próximo año. A pesar del alto número de ¡SEGUIR LEYENDO!

Salir de la versión móvil