Si alguna vez ha intentado editar un AI-Imagen generada, conoces la lucha del flujo de trabajo actual. Ves exactamente lo que hay que cambiar, pero explicárselo al chatbot a menudo parece un tedioso juego de teléfono. Por lo general, debes rodear un lugar, salir del editor y luego escribir un mensaje largo en el chat principal solo para corregir un solo detalle. Bueno, filtraciones recientes sugieren que Google se está preparando para arreglar la torpe experiencia de edición de imágenes con IA en Géminis de una vez por todas.
Los últimos hallazgos provienen de Autoridad de Android. Según el informe, una nueva actualización de la versión beta de la aplicación de Google (versión 17.10.54.sa.arm64) revela una interfaz mucho más potente para editar imágenes. Esta actualización está diseñada específicamente para creaciones realizadas con la familia de modelos Nano Banana.
El cambio más significativo es la adición de un cuadro de texto dinámico directamente dentro de la pantalla de marcado. Anteriormente, Gemini sólo ofrecía herramientas básicas como un lápiz o un resaltador. Esto le obligó a salir de la ventana de edición para describir los cambios deseados. En la próxima versión, puedes permanecer exactamente donde estás, rodeando un objeto específico e inmediatamente escribiendo tus instrucciones en un cuadro en la parte inferior de la pantalla. Esto hará que los ajustes de la IA sean mucho más precisos.
Más allá del cuadro de texto, la filtración también destaca dos nuevas herramientas experimentales llamadas Cambiar tamaño y Efectos. La función Cambiar tamaño probablemente le permitirá cambiar entre los formatos Cuadrado, Retrato y Paisaje sin necesidad de generar una imagen completamente nueva desde cero.
Estas mejoras en la interfaz de usuario coinciden con la implementación más amplia de nanoplátano 2 junto al Modelo de imagen Flash Gemini 3.1. Google diseñó el motor para ofrecer velocidad y precisión, ofreciendo una mejor representación del texto y una comprensión más profunda de los objetos del mundo real. Google está utilizando el poder de su IA para cerrar la brecha entre el arte básico de IA y la edición controlada de nivel profesional.
Actualmente, estas funciones están ocultas en el código beta y requieren activación manual. Además, algunos ni siquiera funcionan actualmente. Aún así, su presencia sugiere que hay un lanzamiento público en el horizonte.
Fuente: Android Headlines
