Ciudad de México,
Judith Moreno
Crédito foto: Axel Olivares (Composición/NotiPress)
La función Storybook de Gemini promete crear cuentos ilustrados con inteligencia arificial. Si bien, la propuesta suena estupenda, esta tecnología parece no alcanzar aún las expectativas de los usuarios. Varios de ellos reportaron inconsistencias entre las ideas ingresadas y los resultados obtenidos durante pruebas realizadas en distintas plataformas. Esta brecha ha sido documentada en pruebas realizadas por medios, donde se evidencian diferencias entre lo solicitado y lo representado por el sistema.
Según un reporte publicado por The Verge, Google activó recientemente Storybook dentro de su asistente Gemini, con la capacidad de generar relatos en 10 páginas, acompañada por ilustraciones y párrafos breves. Las historias pueden ser leídas en voz alta desde la propia interfaz y están disponibles tanto en dispositivos móviles como en escritorio, en todos los idiomas compatibles con la plataforma.
Así, la herramienta permite a los usuarios describir argumentos, elegir estilos artísticos específicos —como anime, plastilina o cómic— y subir imágenes personales como base para la narrativa. No obstante, en pruebas realizadas por la periodista Emma Roth, la plataforma no logró coincidir con su intención creativa al momento de generar una historia basada en un dibujo propio de un gato caricaturizado.
Durante esa experiencia, también surgieron fallos visuales como una ilustración donde un pez mostraba un brazo humano. En otra historia, una escena de salsa de espagueti adquirió la apariencia de una representación violenta animada, mientras que una imagen familiar colocó la televisión en el lado opuesto al que los personajes estaban mirando.
Igualmente, la misma periodista indicó que, más allá de esas anomalías, otras historias generadas no presentaron errores evidentes. A pesar de ello, se mantuvo la dificultad de alinear las imágenes generadas por IA con una visión estética definida por el usuario, incluso cuando se proporcionaban ejemplos visuales como referencia.
En un video oficial de Google citado por The Verge, se muestra a una mujer construyendo una nave espacial. La escena incluye sonidos escritos como "tap, tap, tap", mientras la figura sostiene una llave inglesa y otro objeto no identificado, lo cual representa otra instancia en la que la ilustración no corresponde con claridad a la narrativa esperada.
Storybook se encuentra ya disponible de forma global y se integra al conjunto de herramientas de Gemini. Hasta el momento, no se han detallado los mecanismos utilizados para verificar la coherencia entre ilustraciones y texto, ni los criterios que rigen la interpretación de contenidos visuales proporcionados por los usuarios.
Este tipo de herramientas amplía el acceso a la creación narrativa mediante inteligencia artificial, aunque los resultados documentados por medios especializados evidencian limitaciones técnicas en el cumplimiento de solicitudes personalizadas.