Ciudad de México,
Martín Olivera
Crédito foto: Sergio F Cara (NotiPress/Composición)
La empresa tecnológica Microsoft dio a conocer una nueva infraestructura en su plataforma Azure, creada para entrenar modelos de inteligencia artificial en un tiempo mucho menor al habitual. Según la compañía, esta tecnología permite realizar procesos que antes tomaban meses en solo unas semanas, lo que representa un avance significativo en el desarrollo y despliegue de modelos de IA a gran escala.
El anuncio tuvo lugar en octubre de 2025, cuando Microsoft activó su primer clúster de producción con más de 4.600 unidades NVIDIA GB300 NVL72. Estas unidades utilizan GPU Blackwell Ultra, conectadas mediante la red de datos InfiniBand desarrollada por NVIDIA. La infraestructura fue diseñada para soportar modelos de inteligencia artificial con cientos de billones de parámetros, como los que actualmente trabajan empresas como OpenAI.
Dicho avance fue posible gracias a la colaboración entre múltiples áreas de ingeniería de Microsoft y NVIDIA. De acuerdo con el comunicado, "el lanzamiento del superclúster NVIDIA GB300 NVL72 por parte de Microsoft Azure es un paso emocionante en el avance de la IA de vanguardia". La empresa aseguró que se trata del primer sistema de su tipo disponible a nivel global.
Cada sistema está compuesto por máquinas virtuales que suman un total de 72 GPU por unidad, integradas con memoria rápida, canales de comunicación de alta velocidad y soporte para tareas complejas como el razonamiento y la comprensión multimodal. Esto significa que los modelos pueden procesar texto, imágenes y otros formatos de información en paralelo, sin perder velocidad ni precisión.
El nuevo diseño también considera aspectos como el consumo de energía y la estabilidad del sistema. Para ello, Microsoft implementó sistemas de refrigeración avanzados que funcionan con unidades independientes y mecanismos de control térmico en sus centros de datos. Además, se utilizaron nuevas estrategias de distribución eléctrica para manejar la alta densidad de potencia que requieren estas operaciones.
Sobre el manejo de datos, las herramientas de software fueron ajustadas para aprovechar al máximo la nueva infraestructura. La empresa destacó que su plataforma puede escalar de forma eficiente, lo cual permite ejecutar modelos mucho más grandes sin interrupciones ni pérdida de rendimiento. "La red garantiza que los clientes puedan escalar el entrenamiento de modelos ultragrandes de manera eficiente", explicó la compañía.
La compañía indicó que continuará expandiendo esta tecnología en sus centros de datos a nivel global. Esto permitirá a las organizaciones de distintos sectores acceder a capacidades de inteligencia artificial que antes estaban fuera de su alcance por razones técnicas o de costos.
Finalmente, Microsoft adelantó que se darán a conocer nuevos resultados y mediciones de desempeño conforme avance la implementación del clúster GB300. Mientras tanto, las nuevas capacidades de Azure ya están disponibles para empresas que desarrollan modelos de IA de próxima generación.