Conociendo a Fugaku: La supercomputadora más rápida del planeta

Fugaku es una supercomputadora a exaescala (mientras que solo está a petasescala para el punto de referencia principal) instalada en el Centro RIKEN de Ciencias Computacionales de Kobe, Japón.

El nombre de Fugaku, fue elegido así, por ser un nombre alternativo utilizado para denominar al grande Monte Fuji.

La idea del nombre es representar la similitud entre el Monte Fuji y la nueva supercomputadora Fugaku.

Representado, la altura del Monte Fuji al alto rendimiento de la supercomputadora y la expansión existente en la base del Monte Fuji, a la expansión de usuarios que podrían ser capaces de utilizar la supercomputadora.

La supercomputadora Fugaku comenzó a desarrollarse en 2014 como el gran sucesor de la supercomputadora K y comenzó a operar oficialmente a pleno rendimiento, este mismo año 2021.

A pesar de eso, Fugaku debutó en 2020 y se convirtió en la supercomputadora más rápida del mundo en Junio de 2020, además de convertirse en la primera computadora basada en arquitectura ARM en lograr ser la más rápida del mundo.

En junio de 2020, Fugaku logró 1,42 exaFLOPS (fp16 con precisión de fp64) en el punto de referencia HPL-AI, lo que la convierte en la primera supercomputadora que logra 1 exaFLOPS.

A fecha de Abril de 2021, Fugaku sigue siendo la supercomputadora más rápida del planeta.

Hardware de Fugaku

La supercomputadora está construida con el microprocesador Fujitsu A64FX. Esta CPU se basa en la arquitectura del procesador ARM versión 8.2A y adopta las extensiones vectoriales escalables para supercomputadoras.

Fugaku pretendía y ha logrado ser hasta 100 veces más potente que la computadora K (es decir, un objetivo de rendimiento mayor de 1 exaFLOPS).

La configuración inicial (en Junio de 2020) de Fugaku utilizaba 158,976 CPU de A64FX unidas mediante la interconexión de fusión patentada por Fujitsu y en una actualización de Noviembre de 2020 se le aumentó el número de procesadores.

Software de Fugaku

Fugaku utiliza un “sistema operativo ligero de varios núcleos” llamado IHK/McKernel.

El sistema operativo utiliza tanto Linux, como el ligero núcleo McKernel funcionando simultáneamente, de lado a lado de toda la supercomputadora.

La infraestructura en la que se ejecutan ambos núcleos se denomina Interfaz para Núcleos Heterogéneos: IHK.

Las simulaciones de alto rendimiento se ejecutan en McKernel, con Linux disponible para todos los demás servicios compatibles con POSIX.

Además del software del sistema, la supercomputadora ha ejecutado muchos tipos de aplicaciones, incluidos varios puntos de referencia.

Al ejecutar el estándar de referencia HPL, utilizado por TOP500, Fugaku está en petascale y casi a la mitad de exascale.

Además, Fugaku ha establecido récords mundiales en al menos otros tres puntos de referencia, incluidos HPL-AI a 2,0 exaflops y el sistema ha superado el umbral de exaescala en el índice de referencia.

La descripción de ese índice de referencia es la siguiente:

  • El método de resolución de elección es una combinación de factorización LU y refinamiento iterativo que se realiza posteriormente para devolver la solución a la precisión de 64 bits. La innovación de HPL-AI radica en eliminar el requisito de computación de 64 bits en todo el proceso de la solución y en su lugar optar por una precisión de baja precisión (probablemente 16 bits) para LU, y una iteración sofisticada para recuperar la precisión perdida en la factorización.

Rendimiento de Fugaku

El rendimiento inicial informado de Fugaku fue un Rmax de 416 petaFLOPS en el punto de referencia LINPACK de alto rendimiento FP64 utilizado por el TOP500. Después de la actualización de noviembre de 2020 en el número de procesadores, el rendimiento de Fugaku aumentó a una Rmax de 442 petaFLOPS.

Fugaku también logró alcanzar los primeros lugares en otras clasificaciones que prueban a grandes supercomputadoras en diferentes cargas de trabajo, incluidos Graph 500, HPL-AI y HPCG. Ninguna supercomputadora anterior ha liderado las cuatro clasificaciones a la vez.

Después de la actualización de hardware, en Noviembre de 2020, Fugaku aumentó su rendimiento en la nueva prueba de referencia HPC-AI de precisión mixta a 2.0 exaflops. Ese dato superaba su propia marca de 1.4 exaflops registrada seis meses antes.

Estas mediciones representan las primeras referencias de una computadora por encima de un exaflop, para cualquier precisión y en cualquier tipo de hardware.

Curiosamente, el recuento de núcleos de Arm A64FX se incrementó en un 4.5% hasta aumentar su capacidad Arm A64FX de 7,299,072 núcleos a 7,630,848 núcleos y el rendimiento creció mucho más en proporción a su aumento de núcleos.

Esa actualización, permitió alcanzar a la supercomputadora Fugaku, un nuevo récord mundial de 442 petaflops en el índice HPL.

El rendimiento de Fugaku supero así, al rendimiento combinado de las siguientes 4 supercomputadoras del planeta incluidas en la lista Top500 (y casi de las 5 siguientes) superando por un margen del 45% a todas las demás computadoras dentro de las 10 más potentes del mundo en el benchmark HPCG.

Historia de Fugaku

El 23 de Mayo de 2019, RIKEN anunció que la supercomputadora se llamaría Fugaku. En Noviembre de 2019, el prototipo de Fugaku ganó el primer lugar en la lista Green500.

El envío de los racks y equipos a las instalaciones de RIKEN comenzó el 2 de Diciembre de 2019 y se completó el 13 de mayo de 2020.

En junio de 2020, Fugaku se convirtió en la supercomputadora más rápida del mundo en la lista TOP500, desplazando a la IBM Summit.

Las operaciones a gran escala, apenas han comenzado a realizarse en Marzo de este 2021.

Costo de Fugaku

En 2018, Nikkei informó que el programa costaría alrededor de 130 mil millones de yenes chinos, al cambio 1 billón de dólares estadounidenses o algo así, como 828.795.000.000 millones de euros.

Configuración del sistema de Fugaku

Arquitectura

  • Armv8.2-A SVE

Núcleos

  • 48 núcleos (para cálculo) + 4 núcleos (para SO)

Memoria:

  • HBM2 32 GiB / nodo, 1024 GB / s

Interconectar

  • Interconexión D de tofu

De entrada y salida

  • PCIe Gen3

Proceso

  • FinFET de 7 nm (TSMC)

Almacenamiento

  • 1er nivel: SSD NVMe de 1,6 TB / 16 nodos.
  • 2º Nivel: Sistema de archivos compartidos de 150 PB.
  • 3er Nivel: Servicio de almacenamiento en la nube.

Lenguajes de programación y bibliotecas en Fugaku

Compilador

  • Fortran (subconjunto Fortran 2008, Fortran 2018)
  • C11 ( extensiones GNU y Clang )
  • Subconjuntos de C ++ 14 y C ++ 17 (extensiones GNU y Clang)
  • Subconjunto OpenMP 4.5 y OpenMP 5.0
  • Java

Programación paralela

  • XcalableMP
  • FPDPS

Lenguaje de escritura

  • Python ( NumPy y SciPy )
  • Ruby

Bibliotecas de matemáticas

  • BLAS , LAPACK , ScaLAPACK ( versión en inglés ) , SSL II
  • Fujitsu SSL II
  • EigenEXA, BLAS por lotes

Sistemas Operativos

  • Red Hat Enterprise Linux 8
  • McKernel

Mini Fugaku

En agosto de 2020, la Computational Science Promotion Foundation en Port Island inició un servicio para alquilar por horas una máquina llamada “Mini Fugaku” equipada con la misma CPU que Fugaku.

Mientras que Fugaku tiene a 432 computadoras trabajando al mismo tiempo, el mini Fugaku tiene una capacidad de computación abrumadoramente baja con 8 computadoras.

Esta mini supercomputadora tiene la función de comprobar el correcto funcionamiento de los programas que se encuentran a la espera de comenzar a usarse en la supercomputadora Fugaku.

Fuentes: Wikipedia Japonesa, TOP 500 Supercomputers.

Relacionado