Ciudad de México,
Juan Manuel Flores
Crédito foto: Sergio F Cara (NotiPress/Composición)
La compañía propiedad de Elon Musk, xAI anunció que próximamente estará disponible una nueva versión de su modelo de inteligencia artificial generativa, Grok-1.5. Junto con lo cual, compartieron una tabla comparativa para mostrar los avances de la compañía respecto a las capacidades del modelo, en relación con su predecesor Grok-1. Cabe resaltar, la tabla también equipara el rendimiento de la nueva versión de Grok con el de otros modelos conocidos como Ministral Grande, Calude 2, Calude 3 Soneto, Gemini Pro 1.5, GTP-4 y Cluade 3 Opus
"Una de las mejoras más notables de Grok-1.5 es su rendimiento en tareas relacionadas con la codificación y las matemáticas", afirma xAI. Refiriendo, en las pruebas de rendimiento, el nuevo Grok consiguió una puntuación de 50.6% en el punto de referencia MATH y del 90% en el GSMK8. Dichos puntos de referencia se relacionan con la resolución de problemas matemáticos equiparables a la competencia de alumnos de primaria y secundaria. Por otra parte, en el punto de referencia HumanEvai, que evalúa la generación de código y las capacidades de resolución de problemas, Grok obtuvo un puntaje de 74.1%.
Con estas puntuaciones, xAI evidencia, las capacidades y rendimiento de Grok mejoraron significativamente en comparación con su predecesor. Con lo cual se coloca por encima de modelos como Mistral Grande, Claude 2, y a la par de Claude 3 Soneto y Gemini Pro 1.5. Sin embargo, no equipara las capacidades de razonamiento y resolución de problemas de GTP-4 y Claude 3 Opus.
Por otra parte, xAI, destaca, el nuevo Grok cuenta con una nueva característica. Esta es, la capacidad de procesar contextos largos de hasta 128 mil tokens dentro de su ventada de contexto. Con lo cual, su memoria tiene una longitud hasta 16 veces más potente y, por tanto, el potencial para procesar información de documentos más pesados. De acuerdo con el comunicado, Grok-1.5 estará disponible para los usuarios con plan premium de X en los próximos días. Tras lo cual será implementado gradualmente a los otros tipos de suscripciones.