Mendieta, la supercomputadora de entrenamiento para IA de la UNC
Hace 10 años que Mendieta vive en la Universidad Nacional de Córdoba (UNC) con un desempeño altísimo. No es el perro fiel y parlante que acompaña a Inodoro Pereyra en la historieta de Roberto Fontanarrosa, sino una supercomputadora que a sus funciones habituales ha sumado desde hace un tiempo el entrenamiento para inteligencia artificial. Es la machine learning de la Universidad pública cordobesa.
Mendieta es única en su tipo en las casas de altos estudios argentinas y la de mayor poder de cálculo abierta a la comunidad científico-tecnológica y a las empresas.
Forma parte, junto a otras, del Centro de Computación de Alto Desempeño (CCAD) de la UNC, con usuarias y usuarios de todo el país. Este centro, el más federal de Argentina, cuenta con cuatro clusters o supercomputadoras (Mulatona, Eulogia, Serafín y MendietaF2) funcionando a pleno con un total de aproximadamente 250 Telops y unos 500 Terabytes de almacenamiento.
Para entenderlo mejor, las supercomputadoras son una red de computadoras, que pueden utilizar tarjetas gráficas (GPU), como las que tienen las consolas de videojuegos, que se encargan de generar imágenes casi reales. Tiene incluso más potencia que los procesadores CPU.
Mendieta es una de ellas. Según consta en su hoja de vida hace unos años llegó a ser la más rápida de Argentina por su potencia de cálculo, conforme a estándares internacionales, y se posicionó como la más “verde” de América latina por su bajo consumo de energía por cálculo.
Mendieta fue adquirida en 2013 con fondos de la Facultad de Matemática, Astronomía y Física (Famaf) de la UNC, el Instituto de Física Enrique Gaviola (Ifeg) y el Instituto de Astronomía Teórico y Experimental (Iate), dependientes del Conicet. Tenía ocho nodos y contaba con unidades gráficas para cálculo.
En una segunda etapa, con financiamiento del Sistema Nacional de Computación de Alto Desempeño (SNCAD) sumó 14 nodos y llegó a tener 22. “Esa fue la máquina que en un test de velocidad dio muy bien; era una de las computadoras más rápidas de la Argentina en ese momento. Esa computadora siempre funcionó”, explica Nicolás Wolovick, director del CCAD.
Tiempo después, nació Eulogia (nombre de la mujer de Inodoro Pereyra), y en 2020 se compró a Serafín (otro personaje de Fontanarrosa), una supercomputadora, que permite 156 billones de operaciones con números decimales por segundo. Para tener una idea de la magnitud, una computadora muy potente da un billón de operaciones por segundo.
A través de todas ellas se puede calcular, por ejemplo, la respuesta aerodinámica de un auto de competición, analizar cómo se forma la opinión en la sociedad, evaluar la dinámica cuántica de un sistema molecular o estudiar la formación de la estructura del universo mediante una infinidad de cálculos imposibles en el mundo real; las supercomputadoras realizan simulaciones recreando virtualmente el objeto de estudio.
La máquina que aprende
El camino de Mendieta a convertirse en machine learning comenzó en 2018 y 2019 (sin abandonar sus otras funciones) cuando dos de sus nodos fueron reconvertidos a nodos de cómputo para IA y renombrados como Nabucodonosor (Nabu) I y II (el chancho vegetariano de la tira de Inodoro Pereyra), que además tenía placas aceleradoras de GPU donadas por el Córdoba Technology Cluster. La transformación de las máquinas se realizó en el laboratorio de electrónica de Famaf.
De ese modding (modificación de partes de un ordenador) nace el nodo de IA de Córdoba, denominado NodoAI, que los científicos y las empresas empiezan a utilizar para realizar pruebas pilotos o tests.
Nabu 1 y Nabu 2 se crearon aprovechando los servidores ya existentes pero con placas que las convertían en computadoras de alto rendimiento para aprendizaje automático: machine learning y dinámica molecular.
Después de mucho andar, y con el apoyo del Córdoba Technology Cluster y el Ministerio de Ciencia y Tecnología, el Consejo Federal de Ciencia y Tecnología (Cofecyt) entregó un subsidio de 60 mil dólares para la compra de placas y así se conformó Mendieta fase 2, una computadora añosa pero con placas de última generación. Desde que está funcionando, no descansa y tiene cola virtual de trabajos para su ejecución.
“Es muy usada, no se cae, nunca falló”, dice Wolovick.
La potencia de Mendieta es de 120 billones de operaciones por segundo, casi a la par con Serafín. ¿Cuánto representa? El director del CCAD explica que no es correcto decir que equivale a 200 computadoras interconectadas. “Una super computadora no es un fórmula 1; habría que pensar en 200 camiones todos en paralelo que no van tan rápido, pero llevan una brutal carga por unidad de tiempo”, grafica.
Redes neuronales
“Machine learning es una colección de algoritmos, donde una red neuronal, usualmente profunda, de muchas capas, aprende de ejemplos y a partir de eso puede interpolar y extrapolar, puede dar respuesta a cosas para las que no se la entrenó anteriormente”, explica Wolovick. Y da un ejemplo: se le puede mostrar a la máquina 500 gatos y se le dice “estos son gatos”, se le muestra 500 perros y se le dice “estos no son gatos” y si se le muestra un oso, la máquina dice “no es un gato”, con el 95 por ciento de probabilidad.
“Esos algoritmos son simples por un lado pero tremendamente pesados computacionalmente porque requieren muchísimo cálculo. Si no tenés estas aceleradoras diseñadas para ese tipo de cargas de trabajo anda muy lento. La CPU no está diseñada para eso, las GPUS son las que posibilitaron que el aprendizaje automático con redes neuronales profundas, que usualmente se conoce como inteligencia artificial, despegue”, apunta el director de CCAD.
Y agrega: “Cuando hacés investigación en machine learning no entrenás una red neuronal sino tratás de investigar cuál es la red neuronal óptima para tu proceso de aprendizaje. Tenés que hacer muchísimos entrenamientos para ver cuál es el mejor, la cantidad de cómputos que requiere es monumental”.
Reciclaje y “cibercirujeo”
Mendieta es una máquina reciclada que llega a los máximos estándares. La empresa fabricante de placas -cuenta Wolovick- no podía creer que se utilizaran con los antiguos servidores.
Para actualizar los primeros ocho nodos se compraron procesadores a 15 dólares en Texas, Estados Unidos, que allí son material de descarte. “Es el cluster más interesante que tenemos porque es el ejercicio máximo de la eficiencia y la imaginación. Son conocimientos técnicos muy precisos que nosotros usamos a nuestro favor para obtener máximos beneficios a menor costo”, dice Wolovick.
Pero, además, pronto también llegarán donaciones de piezas y partes de la máquina Cosma 6 de la Universidad de Durham, en el Reino Unido, que allí ya no se utilizan. Placas de red, cables, RAM. “Tiene que ver con el espíritu del ‘cybercirujeo’ pero con calidad que permita operar 24/7″, apunta.
Por otra parte, Conicet financia la mano de obra: hoy hay tres técnicos CPA (carrera de personal de apoyo): Carlos Bederián, Marcos Mazzini y Alejandro Silva. “Nadie puede creer que con tres personas tengamos cuatro clusters funcionando en todo momento, con buena calidad de servicio. Eso tiene que ver con la capacidad técnica, que hace que no tengas que hacer mucho esfuerzo”, dice el director de CCAD. Y agrega: “Esta compu es un ejemplo interesante. Técnicamente lo que estamos haciendo es actualizar máquinas PCIe 2.0 a 3.0 y usando placas PCIe 4.0 en estas computadoras, estamos saltando dos generaciones a costo casi cero y con excelentes resultados.”
En definitiva, Mendieta es un centro de servicios. Cualquier persona que quiera utilizarla puede solicitar la apertura de una cuenta, un login o permiso de uso para investigación. Nabu es el primer escalón.
Hay científicos de varias áreas de conocimiento que las utilizan, como el equipo del Conicet que logró crear líquidos con alta compresibilidad. Para ello utilizó nanopartículas “porosas” para reducir el volumen del agua hasta 20 veces.
“Somos muy abiertos porque sabemos que no es una tecnología fácil de usar. Tiene un costo, pero lo paga la Universidad. No le cobramos a la gente, pero si necesitás por algún motivo prioridad absoluta, te vendemos horas-core y estás adelante de los otros”, subraya Wolovick.
Para el sistema de ciencia y tecnología de Argentina es libre. La mayoría son usuarias y usuarios científicos. Alrededor de 150 activos en el último año.
“Tenemos que darle acceso a todo el mundo porque no sabés quiénes de todos los chicos y las chicas que están investigando van a ser las personas que publiquen en Nature. Se trata de igualdad de derechos al cómputo. Tratamos de acercar el cómputo a la gente, no alejarlo”, concluye Wolovick.
https://www.lavoz.com.ar/ciudadanos/mendieta-la-supercomputadora-de-entrenamiento-para-ia-de-la-unc/
Compartilo en Twitter
Compartilo en WhatsApp
Leer en https://www.lavoz.com.ar/ciudadanos/mendieta-la-supercomputadora-de-entrenamiento-para-ia-de-la-unc/