
Foto: LinkedIn
Los modelos más avanzados de inteligencia artificial están mostrando comportamientos imprevistos, incluyendo engaños deliberados y resistencia a su desconexión. Según Yoshua Bengio, investigador canadiense y una de las figuras fundacionales en el desarrollo del aprendizaje profundo alertó sobre estos comportamientos. En una entrevista concedida al Financial Times, expresó preocupación por una evolución tecnológica que, impulsada por la competencia, prioriza la capacidad sobre la seguridad.
Con sede en Montreal, Bengio presentó LawZero, una organización sin fines de lucro orientada al diseño de sistemas más seguros y verificables. La entidad cuenta actualmente con 15 personas y casi 30 millones de dólares en financiamiento filantrópico, entre cuyos donantes figuran Jaan Tallinn, el exdirector de Google Eric Schmidt y el Future of Life Institute.
Durante los últimos seis meses, se han documentado incidentes los cuales revelan patrones de comportamiento inusuales en sistemas recientes. Bengio se refirió a una prueba del modelo Claude Opus, de Anthropic, en la que simuló un chantaje a ingenieros para evitar su reemplazo. Además, reportes del grupo de pruebas Palisade indicaron que el modelo o3 de OpenAI se negó a ejecutar una orden de apagado en un escenario controlado.
Tales evidencias refuerzan, según el académico, la necesidad de un enfoque distinto al que predomina en los laboratorios comerciales. Afirmó: "Mi preocupación es que cualquier versión futura podría ser estratégicamente inteligente para anticipar nuestras acciones y derrotarnos mediante engaños imprevistos".
Su iniciativa busca crear un tipo de IA fundamentada en razonamientos transparentes, diseñada para emitir respuestas verificables y que incorpore mecanismos internos capaces de evaluar la seguridad y utilidad de sus resultados. Además, su visión contempla que estos sistemas puedan auditar tecnologías existentes y prevenir funciones perjudiciales para las personas.
En ese contexto empresarial, varias compañías transitan hacia modelos con fines de lucro. Bengio manifestó su desconfianza en estructuras corporativas motivadas por retornos financieros. Explicó: "Para crecer rápido, se necesita convencer a inversionistas que exigen retorno económico. Esa es la lógica del sistema de mercado".
Respecto a OpenAI, cuestionó la alineación de sus objetivos actuales con su misión fundacional. Esa organización, en proceso de transformación empresarial, enfrenta una demanda del cofundador Elon Musk, quien busca frenar la operación por considerar que pone en riesgo los principios originales de desarrollo para beneficio global.
La consolidación de LawZero representa una apuesta decidida por reorientar el rumbo de la inteligencia artificial hacia una arquitectura centrada en la supervisión y la veracidad. Frente a tecnologías capaces de replicar comportamientos estratégicos, la propuesta de Bengio busca garantizar que las herramientas del futuro respondan con integridad y no por conveniencia.
DESCARGA LA NOTA SÍGUENOS EN GOOGLE NEWS