El nuevo modelo de vídeo con IA Veo 3.1 de Google puede combinar imágenes en clips

Google mente profunda ha presentado Veo 3.1, la última actualización de su modelo de generación de vídeo. Como sugiere el nombre, esta es una versión mejorada. de Veo 3. Disponible a través de plataformas como Flow, la aplicación Gemini y la API Gemini, esta nueva versión se centra en proporcionar a los creadores herramientas más sofisticadas para combinar imágenes y mejorar el realismo visual en medios generados por IA. Google También lanzó una versión más pequeña y menos potente llamada Veo 3.1 Fast. Este último ofrece tiempos de generación más rápidos cuando la fidelidad total no es estrictamente necesaria.

La capacidad principal de Veo 3.1 es su capacidad para fusionar múltiples imágenes separadas en un único clip de vídeo unificado. Esta función, denominada «Ingredientes del vídeo» dentro de la herramienta de edición Flow, agiliza las primeras etapas de producción. Un usuario puede ingresar varias imágenes de referencia distintas (especificando un personaje, un objeto o un estilo artístico) y el modelo sintetiza una escena continua que incorpora todos esos elementos visuales. Una mejora clave en esta versión es la generación de audio rico y sincronizado para los clips. Esto añade una capa crucial de profundidad y profesionalismo que antes faltaba.

El modelo también aborda la necesidad de un mejor flujo narrativo en los clips generados. La función «Fotogramas a vídeo» simplifica la creación de transiciones cinematográficas fluidas. Los usuarios proporcionan sólo la imagen inicial y la imagen final de una secuencia, y Veo 3.1 genera automáticamente el metraje de vídeo continuo que conecta perfectamente los dos puntos finales. Esta función es particularmente útil para establecer tomas o transiciones ingeniosas entre escenas. Si bien dos imágenes contrastantes pueden producir resultados surrealistas e impredecibles, proporcionar marcos estéticamente similares conduce a resultados altamente coherentes.

Además, los creadores ahora pueden crear secuencias más largas. La capacidad mejorada «Extender» permite a los usuarios alargar un clip existente haciendo que el modelo base la continuación en el último segundo del metraje anterior. Esto ayuda a mantener la coherencia visual y la continuidad al crear secuencias que pueden durar un minuto o más. En general, debería reducir significativamente las limitaciones históricas sobre la duración del vídeo en herramientas de inteligencia artificial.

Google también se ha expandido el conjunto de herramientas para la manipulación directa de escenas. La función «Insertar» permite a los creadores introducir nuevos elementos en un clip existente. La IA maneja el complejo trabajo de integración, ajustando automáticamente las sombras, la iluminación y las texturas para garantizar que la adición se vea visualmente natural dentro de la escena.

Además, Google lanzará pronto una función que permitirá a los usuarios eliminar objetos o caracteres no deseados de un clip. La IA reconstruirá el fondo para garantizar una edición limpia. Estas capacidades de edición precisas ofrecen un nivel de control granular que los creadores apreciarán.

Veo 3.1 ya está disponible y ofrece un realismo mejorado y una mayor adherencia a las indicaciones del usuario. También promete una comprensión más refinada de los estilos cinematográficos. La introducción del modelo proporciona un conjunto de opciones más preciso y capaz para quienes utilizan IA en sus flujos de trabajo de creación de videos.

Fuente: Android Headlines

Deja un comentario Cancelar respuesta