Usuarios ya pueden pedir Uber y comida sin abrir apps gracias a Gemini

Con Gemini, los celulares Android ahora pueden ejecutar pedidos por voz en apps como Uber Eats o Grubhub, sin intervención directa

Gemini también puede interpretar chats, entender listas y automatizar compras desde la pantalla sin depender de una integración fija con la app

Pedir comida o transporte sin abrir una sola app ya no es promesa: el 11 de marzo, Gemini comenzará a hacerlo realidad en celulares Android. La herramienta debutará con el lanzamiento del Samsung Galaxy S26 en Estados Unidos y Corea del Sur, en fase de vista previa, y posteriormente llegará como actualización a la serie Google Pixel 10, con más integraciones previstas hacia finales de año junto con Android 17.

Durante el evento Galaxy Unpacked, ambas compañías realizaron una demostración en vivo del sistema. Gemini puede abrir aplicaciones en una ventana virtual, ejecutar acciones en segundo plano y mostrar el progreso mediante notificaciones en tiempo real. El usuario conserva control total en la etapa final, ya que debe seleccionar opciones y confirmar pagos o reservas.

En la prueba presentada, al indicar "Pide un Uber al aeropuerto", el asistente abrió la aplicación y avanzó hasta la pantalla de confirmación. Si existe ambigüedad, solicita información adicional antes de continuar. En el caso de destinos múltiples en el área triestatal de Nueva York, el sistema pidió precisión sobre el aeropuerto elegido. La elección de categoría del viaje, validación de tarifa y confirmación final permanecen bajo decisión del usuario.

Sameer Samat, presidente del ecosistema Android de Google, explicó la perspectiva operativa del sistema. "Me refiero a algunas de las tareas que quizás quieras automatizar como una especie de lavandería digital", declaró a WIRED.

En otra demostración, Gemini analizó el contexto de un chat grupal donde se organizaba una noche de juegos y consolidó un pedido de pizza. Tras revisar los artículos en el carrito, Samat indicó que el asistente "pidiera esto en Grubhub para entrega a domicilio", lo cual activó el proceso automatizado dentro de la aplicación. El sistema solo permite ejecutar una automatización a la vez.

Dicho modelo puede enfrentar limitaciones operativas. En escenarios de alta demanda o restricciones del restaurante, regresa con alternativas y solicita confirmación. También puede necesitar aclaraciones sobre tamaño o tipo de producto antes de completar la orden.

Samat señaló que el asistente no depende de una estructura fija de la aplicación. "Puede ser resistente a cosas así", afirmó, en referencia a cambios visuales en las interfaces. Además, detalló el alcance del lanzamiento: "Es la primera vez que hacemos esto en Android con aplicaciones. En cierto modo, lo vemos como el principio de una nueva era de inteligencia móvil".

La automatización funciona mediante tres mecanismos técnicos: integración backend a través del protocolo de contexto de modelo (MCP), funciones estructuradas creadas por desarrolladores denominadas App Functions, o navegación directa de la interfaz cuando no existen integraciones previas. En este último caso, Gemini interpreta botones, cuadros de texto y menús en pantalla para completar la tarea.

Respecto a la privacidad, indicó que el primer conjunto de aplicaciones excluye servicios sensibles. La información procesada no será utilizada para publicidad y los usuarios podrán eliminar los datos visualizados por el asistente.