El Xpress

Colossus: la gigafactoría de GPUs que acelera la carrera de la IA

La Gigafactory Colossus

Así es La Gigafactory Colossus: el superordenador de Elon Musk que marca un antes y un después en la carrera por la inteligencia artificial.

La Gigafactory Colossus no es solo un superordenador: es una declaración de poder tecnológico. Construida en apenas 122 días, esta infraestructura de xAI liderada por Elon Musk ha roto todos los récords de la industria. Su capacidad actual, con 200.000 GPUs trabajando en conjunto, la convierte en la mayor máquina de entrenamiento de inteligencia artificial jamás vista.

Pero la ambición va más allá. Musk proyecta que La Gigafactory Colossus crecerá hasta alcanzar un millón de GPUs, una escala que ningún otro actor de la industria ha logrado siquiera planear. En este contexto, Colossus no es únicamente un logro técnico, sino el inicio de una nueva etapa en la carrera global por la inteligencia artificial.

La Gigafactory Colossus - Vista aerea

La Gigafactory Colossus: un superordenador sin precedentes

La idea de una gigafactoría, tradicionalmente asociada a las baterías de Tesla, ahora se aplica al mundo del cómputo. Con Colossus, xAI busca acelerar el entrenamiento de modelos de IA a un ritmo nunca antes alcanzado. La infraestructura actual incluye 200.000 GPUs, más de 1 exabyte de almacenamiento194 petabytes/s de ancho de banda de memoria y 3,6 terabits/s de red por servidor.

Para dimensionar el logro, basta con comparar los tiempos: mientras que la industria estimaba que un proyecto de esta magnitud tomaría 24 meses, Musk y su equipo lo completaron en cuatro. Un récord que redefine lo posible en la construcción de superordenadores.

Construcción récord en Memphis

El corazón de La Gigafactory Colossus late en Memphis, Tennessee, en un parque industrial a orillas del Mississippi. Allí, xAI encontró una instalación preexistente que permitió acelerar el montaje y adaptar el espacio a un nuevo propósito: albergar la mayor infraestructura de IA del planeta.

En su interior se distribuyen cuatro “data halls”, cada uno con 25.000 GPUs, interconectados por una red de fibra óptica de altísima velocidad. El diseño en “raised floor” divide el espacio en tres niveles: energía, refrigeración y cómputo, optimizando cada metro cuadrado para un rendimiento máximo.

La elección de Memphis no fue casualidad: más que un símbolo, fue una decisión estratégica para ganar tiempo y superar las expectativas iniciales del proyecto.

Innovaciones en refrigeración y energía

La Gigafactory Colossus no solo destaca por su escala, sino también por sus innovaciones técnicas. Su sistema de refrigeración líquida mueve vastas cantidades de agua en tuberías diseñadas para mantener estables los GPUs, con módulos independientes que permiten dar mantenimiento sin detener el clúster completo.

Cada rack, equipado con GPUs Nvidia H100, puede ser intervenido de manera modular, reduciendo al mínimo los tiempos muertos. Además, el sistema de ventilación incorpora luces indicadoras que permiten identificar fallas en segundos, una ventaja operativa clave frente a los data centers convencionales.

En cuanto a energía, Colossus se apoya en baterías Tesla Megapack para estabilizar la red eléctrica. Esta capa adicional elimina microvariaciones de milisegundos que, en un clúster de 200.000 GPUs, podrían comprometer la eficiencia del entrenamiento. Con ello, xAI garantiza una entrega de energía constante y optimizada.

El músculo detrás de Grok y la carrera por la IA

El superordenador Colossus tiene una misión clara: potenciar Grok, el modelo de xAI integrado en la red social X. Gracias a su enorme capacidad, Grok ha evolucionado rápidamente, incorporando funciones de visión para analizar imágenes además de texto.

Musk plantea que este es solo un paso hacia la inteligencia artificial general (AGI), un sistema capaz de replicar la versatilidad de la mente humana. En este terreno, Colossus no es solo un motor de cómputo, sino el campo de pruebas que podría acelerar la llegada de la AGI.

No es casualidad que rivales como OpenAI y Microsoft ya hayan manifestado preocupación: con el acceso a semejante poder de cómputo, xAI se posiciona en la delantera de la competencia.

Lo que viene: hacia un millón de GPUs

El plan de Musk es claro: duplicar y escalar Colossus hasta alcanzar un millón de GPUs. Esto no solo implicará más potencia, sino la posibilidad de resolver problemas considerados imposibles hasta hoy, desde avances científicos inéditos hasta la exploración de nuevas fronteras tecnológicas.

Sin embargo, el poder de La Gigafactory Colossus también despierta debates sobre concentración de recursos, riesgos de dependencia y escenarios de uso indebido. El equilibrio entre innovación y responsabilidad será determinante en el futuro inmediato.

Un antes y un después en la carrera tecnológica

Con La Gigafactory Colossus, Elon Musk y xAI han marcado un punto de quiebre en la historia del cómputo. La escala alcanzada, sumada a la velocidad de ejecución, coloca este proyecto en una liga propia.

El impacto puede ser doble: un acelerador de descubrimientos que cambie para siempre la ciencia y la tecnología, o un riesgo de concentración de poder con consecuencias impredecibles. En cualquier caso, el mundo observa, porque Colossus ya no es solo un superordenador: es la apuesta que podría definir el rumbo de la inteligencia artificial y, con ella, el futuro de la humanidad.

Robinson G.

Escritor entusiasta. Me gusta explorar temas curiosos y dudas existenciales. Todo empezó con aquellos “Datos curiosos de Google”.