Foto: Sergio F Cara (NotiPress)
OpenAI presentó Operator, una herramienta innovadora dentro de su plataforma ChatGPT que promete revolucionar la interacción con la web mediante inteligencia artificial generativa. Operator se posiciona como un navegador inteligente, capaz de realizar tareas autónomas en sitios web al comprender e interactuar con sus elementos visuales, como botones, enlaces, cajas de texto y menús desplegables, sin depender de integraciones API personalizadas.
Según OpenAI, Operator es "un agente experimental diseñado para realizar tareas en la web por ti. Usando su propio navegador, puede observar, escribir, hacer clic y desplazarse por una página web". Este avance se basa en el modelo Computer-Using Agent (CUA), que combina la visión computacional de GPT-4o con razonamiento avanzado basado en aprendizaje por refuerzo, permitiendo a la IA interactuar directamente con interfaces gráficas de usuario (GUI).
Entre las capacidades destacadas de Operator se encuentran la posibilidad de completar formularios, realizar compras en línea, ordenar alimentos o incluso crear memes. Estas tareas se llevan a cabo al "ver" la página web mediante capturas de pantalla y "actuar" utilizando acciones de mouse y teclado. Además, si encuentra obstáculos o comete errores, Operator puede autocorregirse o devolver el control al usuario, ofreciendo una experiencia colaborativa.
Operator frente a una competencia creciente
Aunque OpenAI reconoce que Operator está en una etapa inicial, esta tecnología establece nuevos estándares en pruebas clave como WebArena y WebVoyager, destacándose por su capacidad de interactuar con herramientas y sitios web que los humanos usan a diario. Esto no solo permite ahorrar tiempo en tareas repetitivas, sino que también amplía las oportunidades para empresas que buscan optimizar sus servicios con IA. De hecho, OpenAI ya colabora con compañías como DoorDash, Instacart, Uber y OpenTable para garantizar la compatibilidad con sus plataformas.
Sin embargo, Operator no es el único actor en este ámbito. Soluciones como Claude 3.5 Sonnet, de Anthropic, y el proyecto Gemini de Google, buscan ofrecer capacidades similares. Incluso dispositivos como Rabbit R1 intentaron implementar esta idea en el pasado, aunque sin éxito. No obstante, Operator tiene la ventaja de estar respaldado por ChatGPT, la plataforma de IA generativa más popular hasta la fecha.
Por el momento, la herramienta estará disponible exclusivamente para los usuarios Pro de Estados Unidos, quienes pagan 200 dólares al mes por este nivel de suscripción. OpenAI planea expandir su alcance gradualmente, llevándola posteriormente a los planes Plus, Team y Enterprise.
DESCARGA LA NOTA SÍGUENOS EN GOOGLE NEWS