“Adaptamos el cluster a nuestras necesidades, lo que nos permite afinar más los cálculos”

Charla con Martín Gumbau, responsable de Sistemas de Grupos de Investigación Química Teórica y Computacional en el Instituto de Investigación Química (ICIQ) de Cataluña, quien nos cuenta cómo utilizan la tecnología de Dell Technologies e Intel para proyectos de IA, Big Data y Machine Learning.

Publicado el 19 Abr 2022

Martín Gumbau, responsable de Sistemas de Grupos de Investigación Química Teórica y Computacional en el Instituto de Investigación Química (ICIQ) de Cataluña

¿Qué tipo de proyectos están llevando a cabo en el Instituto Catalán de Investigación Química?

Somos un centro de investigación química y nos ubicamos en el campus de la Universidad URV en Tarragona. Formamos parte del BIST (Barcelona Institute of Science and Technology). En el centro tenemos tres líneas generales de investigación, la de catálisis de procesos químicos, la química supra-molecular y la de energías renovables. En todas ellas se utiliza la química computacional. Para ello usamos nuestro cluster de HPC principalmente. La química computacional ha ido creciendo y aumentando en cuanto a prestigio en los últimos años, y se ha convertido en una rama muy especializada, de tal manera que en ICIQ tenemos tres grupos de químicos computacionales, aunque los experimentales usan la computación como herramienta de apoyo.

Por este motivo, la tecnología es esencial para nosotros, y las máquinas que necesitamos son cada vez más potentes. Necesitamos resultados con celeridad y lo más precisos posibles. Para ello usamos flujos de trabajos programados en los que interviene el aprendizaje de las decisiones. Actualmente empezamos a orientarnos hacia tecnologías cercanas a la Inteligencia Artificial, como son el Machine Learning, Data Mining o Redes Neuronales. Por tanto, las máquinas que necesitamos tienen que abarcar estas necesidades.

Por poner algún ejemplo, en ICIQ estamos trabajando en la investigación de energías renovables como fuéles respetuosos con el medio ambiente o energías fotovoltaicas, también procesos de obtención de hidrógeno.

¿Cuáles fueron los orígenes de la química computacional y cómo ha ido evolucionando en los últimos años?

En nuestro caso, en el año 2004, ICIQ comenzó su andadura ya con tres grupos computacionales, de los 15 o 20 grupos de investigación que había. Para ello, se creó un pequeño cluster en una Computer Room para poder instalar los racks y servidores de cómputo, a partir de ahí hemos ido evolucionando y aprendiendo conforme la tecnología. Mejorando las instalaciones con doble línea eléctrica y doble sistema de refrigeración. En este tiempo hemos ajustado la infraestructura a las nuevas necesidades tecnológicas que acompañan nuestro trabajo.

Otra cuestión importante para nosotros es tener siempre presente que las máquinas son cada vez más potentes y muchas veces consumen más energía y desprenden más calor. Tenemos claro que el ahorro energético es fundamental, y es un elemento a tener en cuenta a la hora de adquirir equipamiento. Cada vez los servidores trabajan a un régimen de temperatura más alto, lo que nos deja margen para mantener la sala con menor refrigeración. También hemos dotado a la sala de computación de un sistema de freecooling de apoyo para el aprovechamiento de la temperatura exterior en invierno, al mismo tiempo que nos sirve de evacuación del propio calor.

¿Qué recursos informáticos necesita?

En un primer momento, comenzamos con un cluster de ordenadores típicos, con servidores de marca blanca y chips de Intel. Pero pronto se quedó obsoleto. Y por ello decidimos migrar a servidores de Dell Technologies, estamos en el año 2008. Nuestra relación con Dell ha ido aumentando con el paso del tiempo, y ellos en todo momento nos han ido orientando sobre nuevas tendencias que se adaptan a nuestras necesidades. Con el presupuesto que disponemos intentamos invertir en los mejores equipos. Los profesionales de Dell Technologies nos proporcionan el knowledge imprescindible para tomar una decisión acertada.

Con el tiempo, nuestra relación con Dell Technologies e Intel ha ido aumentando. Actualmente disponemos de un cluster con 447 nodos en activo que incluye 6.020 procesadores Intel, 21TB de memoria RAM y 57 TB de espacio en disco. La comunicación se realiza mediante redes infiniband para cálculo y ethernet para la transferencia de datos. Intentamos adquirir siempre la tecnología que más se adapta a nuestras necesidades.

Además, disponemos de GPUs de Nvidia como aceleradores. Nos sirven de base para utilizar tecnologías relacionadas con la Inteligencia Artificial como son el Machine Learning y Redes Neuronales.

El HPC no es solo la computación, también debe tener un disco que soporte toda la investigación. Nosotros trabajamos con aplicaciones que nos generan varios GB de información en cada cálculo lo que requiere de un alto almacenamiento y el correspondiente backup. Y es que en el campo de la investigación debemos sacar adelante una serie de publicaciones y la base de estas investigaciones debe estar disponible. Para ello hemos implementado un sistema propio de acceso a la información www.iochem-bd.org. He de decir que tiene el valor añadido que es un proyecto Open Source en gitlab. Así que está disponible para descarga e instalación.

Actualmente empezamos a orientarnos hacia tecnologías cercanas a la Inteligencia Artificial, como son el Machine Learning, Data Mining o Redes Neuronales

¿Qué particularidades tiene su data center con tecnología Dell Technologies e Intel?

Uno de los valores de disponer de un cluster de cálculo propio frente a utilizar un data center es que nos permite hacer las cosas más a medida. Es decir, adaptamos el cluster a las necesidades de los distintos grupos de investigación, lo que nos da la posibilidad de afinar más los cálculos y dedicar recursos de manera intensiva a un proyecto si fuere el caso. En un cluster más grande los recursos y las máquinas son compartidos, así que la prioridad es menor y es más compleja la preparación de los cálculos. Aquí lo adaptamos a las necesidades.

En cuanto a velocidades de procesamiento, hay proyectos que requieren el uso de las máquinas de manera intensiva y otros que no. Algunos requieren mucha capacidad de procesamiento y otros pequeños cálculos que se van introduciendo en baterías de cientos de ellos. Para nosotros no es operativo requerir de semanas para obtener el resultado de un cálculo. Piensa que la investigación es una carrera en cada uno de los proyectos que realizamos, es decir, los proyectos tienen un deadline a cumplir.

Además, como he comentado anteriormente, es importante para nosotros incorporar nuevas tecnologías, como la Inteligencia Artificial, que nos proporcionen la automatización de procesos, por ejemplo. Para asegurarnos que la tecnología nos ayuda en nuestra investigación, trasladamos nuestras necesidades a los expertos de Dell Technologies, ellos nos asesoran en la decisión de la solución que mejor se adapta a nuestros requerimientos.

Ocasionalmente nos permiten utilizar algunas máquinas en sus centros y laboratorios de pruebas para saber si el rendimiento que nos ofrecen es el esperado, o si tenemos que reajustar parámetros para adaptarlo a nuestras necesidades.

¿Puede destacar algún proyecto reciente de investigación en el que haya participado el ICIQ?

Por ejemplo, dedicamos parte del cluster a la secuenciación genómica del SARS-Cov-2 (Covid19), a través del proyecto internacional Folding@Home, un proyecto internacional colaborativo. Cedimos parte del cluster a la Universidad de Washington de St. Louis para hacer este tipo de computación. Abrimos una celda del cluster para que los investigadores de Washington pudieran usarla de manera intensiva. A parte de proyectos nacionales como PHOTORED, CARBYNOID, ELECTRA-H2 y otros 17, estamos implicados en proyectos europeos tales como LICROX , SOLAR2CHEM, … una lista completa puede consultarse en nuestra página web ICIQ-RESEARCH-PROJECTS.

Nuestra relación con Dell ha ido aumentando con el paso del tiempo, y ellos en todo momento nos han ido orientando sobre nuevas tendencias que se adaptan a nuestras necesidades

¿Tiene previstas futuras inversiones para mejorar la infraestructura de estas instalaciones?

Ahora mismo estamos estables, pero todos los años acometemos ampliaciones. No somos un gran CPD como el Barcelona Supercomputing Center. Tenemos servidores de diferentes generaciones, y cada año vamos renovando parte de los equipos. En ese sentido, vamos adquiriendo y sustituyendo el equipamiento según presupuesto.

¿TE GUSTARÍA SABER MÁS? Toda esta información se contará con detalle en el evento que tendrá lugar el próximo 26 de abril. ¡No te lo pierdas! Reserva tu plaza aquí: Inscripción al seminario web – Zoom

HPC, un activo público, un activo para las empresas

El descubrimiento y la innovación siempre han comenzado con grandes mentes que sueñan en grande. A medida que la analítica, la computación de alto rendimiento (HPC) y la inteligencia artificial (IA) continúan convergiendo y evolucionando, están impulsando la próxima revolución industrial y el próximo salto cuántico en el progreso humano. Y con la ayuda de una tecnología cada vez más poderosa, podemos soñar aún más.

Dell Technologies e Intel colaboran, también en España, a expandir los límites de esta nueva y emocionante frontera con soluciones de HPC diseñadas para ayudarle a resolver problemas complejos más rápido que nunca. De hecho, Dell Technologies es una de las únicas empresas del mundo capaces de proporcionar un portfolio completo de plataformas para Data Analytics, IA y HPC, incluyendo estaciones de trabajo, servidores, redes, almacenamiento y servicios.

¡Esperamos contar con tu participación! Regístrate aquí

¿Qué te ha parecido este artículo?

Tu opinión es importante para nosotros.

Lucía Bonilla
Lucía Bonilla

Artículos relacionados

Artículo 1 de 2