Un modelo experimental de OpenAI logró resolver cinco de seis problemas en la OIM 2025, alcanzando el nivel de los mejores competidores humanos
Un modelo experimental de inteligencia artificial desarrollado por OpenAI logró posicionarse entre el 10% de los participantes que obtuvieron medalla de oro en la Olimpiada Internacional de Matemáticas 2025 (OIM). Según informó uno de los investigadores del proyecto, el sistema resolvió con éxito cinco de los seis complejos problemas planteados en la competencia. Tal hazaña que hasta ahora solo había sido alcanzada por 67 estudiantes humanos de un total de 630.
El certamen se llevó a cabo entre el 10 y el 20 de julio en Sunshine Coast, Queensland, Australia. La OIM es considerada la máxima competencia mundial en matemáticas para estudiantes de nivel secundaria y, desde su fundación en 1959, ha reunido a jóvenes de más de 100 países.
Tal información fue difundida por Alexander Wei, investigador de OpenAI, a través de una publicación en X donde aseguró: "De este modo, hemos obtenido un modelo capaz de elaborar argumentos complejos e irrefutables al nivel de los matemáticos humanos".
De acuerdo con el mismo post, el modelo obtuvo una puntuación de 35 sobre 42, cifra equivalente al umbral mínimo para obtener medalla de oro. Este puntaje se alcanzó resolviendo cinco de los seis problemas planteados, todos ellos centrados en álgebra de alta complejidad. Las pruebas de la OIM son reconocidas por su exigencia y por requerir habilidades avanzadas de razonamiento matemático, creatividad y precisión lógica, algo que históricamente ha representado un desafío considerable para los sistemas de IA.
Este logro tiene un valor técnico significativo: mientras muchos modelos de lenguaje destacan en tareas que requieren procesamiento de texto y patrones repetitivos, el desempeño en matemáticas puras ha sido una barrera aún no superada completamente. Según Wei, este avance refleja la capacidad del modelo para "elaborar argumentos complejos e irrefutables".
Hasta el momento, no se ha revelado el nombre ni la disponibilidad futura del modelo. Según lo publicado por el investigador, se trata de una herramienta en etapa experimental, sin ventana definida para su lanzamiento al público general. No obstante, se anticipa que sus aplicaciones podrían extenderse más allá del ámbito matemático, aprovechando sus capacidades de razonamiento para otras tareas complejas de interacción con usuarios.