Encuadre
31 de marzo de 2025
K) Supercómputo. La astronomía y las grandes bases de datos
La astronomía ha sido una disciplina históricamente limitada por las observaciones. Nuestros antepasados hicieron registros detallados de un cielo en el que podían identificarse unos cuantos miles de estrellas (este número está disminuyendo como consecuencia de la contaminación lumínica [ver UNAM Internacional 3, p. 108). Más adelante, con la invención del telescopio en el siglo XVI fuimos capaces de alcanzar objetos muy tenues y distantes. Ahora era posible observar no sólo estrellas brillantes, sino muchas otras más débiles, además de nebulosas e incluso galaxias incomprensiblemente lejanas.
Sin embargo, aun con el desarrollo de telescopios más potentes y con la construcción de grandes observatorios alrededor del mundo en el siglo pasado (incluyendo varios en nuestro país), el número de observaciones astronómicas permaneció relativamente bajo; la astronomía seguía siendo una ciencia de pocos datos. Esto cambió en las últimas décadas con el desarrollo de detectores de alta sensibilidad y resolución, así como de telescopios robóticos capaces de realizar registros de forma automática, permitiendo grandes campañas de observación.
La astronomía moderna se enfrenta a un desafío sin precedentes: el manejo, curaduría, almacenamiento y análisis de enormes cantidades de datos generados por telescopios terrestres y espaciales, así como por simulaciones numéricas. Para abordar este reto, el supercómputo ha emergido como una herramienta indispensable que permite analizar y procesar estos datos de forma eficiente, aprovechando líneas de análisis paralelas que se ejecutan simultáneamente en supercomputadoras. Estas supercomputadoras, que ocupan espacios del tamaño de una bodega, reciben datos de telescopios y simulaciones y los analizan, identificando, caracterizando y catalogando objetos celestes de forma automática. Esta es una tarea monumental que sería imposible realizar manualmente.
Por ejemplo, el censo astronómico Sloan Digital Sky Survey (SDSS), que involucra a un centenar de instituciones (entre ellas la UNAM, que actualmente desempeña un papel muy activo tanto en el desarrollo de tecnología como en el análisis científico), mapeó con un telescopio robótico un tercio del cielo, produciendo un catálogo con quinientos treinta millones de objetos celestes, incluyendo más de un millón de galaxias con distancias medidas.
El proyecto Dark Energy Survey (DESI), en el que la UNAM colabora desarrollando técnicas de análisis de datos junto con decenas de instituciones de todo el mundo, consiste en un mapa muy profundo que abarca la mitad del cielo. La imagen del cielo tomada por DESI contiene diez trillones de pixeles (equivalentes a un millón de fotos tomadas con un teléfono celular), generando en total un petabyte (mil billones de bytes) de datos. Este mapa requirió para su análisis inicial cien millones de horas CPU (una hora CPU equivale a una hora de cómputo en una computadora personal). Cuando se complete, DESI habrá generado un catálogo con treinta y cinco millones de galaxias.
En el frente computacional las simulaciones cosmológicas modernas pueden recrear universos sintéticos que luego son “observados” con instrumentos virtuales. Estas simulaciones se ejecutan en supercomputadoras con decenas o cientos de miles de unidades de procesamiento, cada una equivalente a una computadora personal. Las simulaciones cosmológicas emulan la evolución del universo desde poco después del Big Bang hasta el tiempo presente, proporcionando una historia detallada de la formación y evolución de cientos de miles de galaxias y generando en el proceso varios petabytes de datos.
Recientemente personas investigadoras de la UNAM simularon con gran detalle una galaxia sintética parecida a la Vía Láctea como parte del proyecto internacional Assembling Galaxies of Resolved Anatomy (AGORA), en el que participan sesenta instituciones internacionales. Esta simulación fue ejecutada en la supercomputadora Miztli de la UNAM y requirió un millón y medio de horas CPU.
La cantidad y complejidad de los datos astronómicos requieren formas de almacenamiento inteligentes. Los sistemas actuales de almacenamiento son distribuidos: los grandes volúmenes de datos se fragmentan y se guardan en varios servidores. Esto permite un acceso eficiente y rápido, ya que varios servidores pueden leer (y analizar) diferentes partes de los datos simultáneamente. Una combinación prometedora de supercómputo y almacenamiento distribuido son las llamadas
grids (grillas o rejillas), en las que diferentes sistemas de cómputo y almacenamiento, que pueden estar separados físicamente por grandes distancias, se interconectan formando una red. La UNAM inició recientemente una
grid que conecta a tres entidades académicas: la Dirección General de Cómputo y de Tecnologías de Información y Comunicación (DGTIC), el Laboratorio de Modelos y Datos (LAMOD) de los institutos de Astronomía y de Ciencias Nucleares, y el Instituto de Ciencias de la Atmósfera y Cambio Climático (ICAyCC), por medio de una red de muy alta velocidad. En el futuro esta grid podría conectarse con instituciones fuera del país, aumentando la capacidad compartida de cómputo.
Como estos ejemplos demuestran, la astronomía actual está dominada por datos. La creciente cantidad de información disponible traerá nuevos retos y exigirá el desarrollo de técnicas innovadoras para su análisis y manejo. En este sentido, los avances recientes en inteligencia artificial auguran una nueva era de supercómputo y bases de datos, en la que agentes de inteligencia artificial autónomos escanearán continuamente bases de datos para curar información, interactuar con investigadores, realizar análisis complejos y, potencialmente, descubrir nuevos patrones que conduzcan a hallazgos científicos.
El Dr. Miguel Aragón obtuvo su doctorado en astrofísica por la Universidad de Groningen, Países Bajos y posteriormente realizó estancias de investigación en la Universidad Johns Hopkins y en la Universidad de California, Riverside, EEUU. Actualmente es investigador titular B de tiempo completo en el Instituto de Astronomía de la UNAM. Sus áreas de interés son la formación y evolución de galaxias, la red cósmica, inteligencia artificial y nuevas tecnologías de interacción humano-máquina.