Google lanza función que convierte fotos en videos con audio a través de Gemini: así funciona

Google estrena una nueva herramienta en Gemini que transforma fotos en videos de 8 segundos con sonido. Te explicamos cómo funciona y quiénes pueden usarla.

Edecio Brito Adrián | 11/07/2025

Google Veo 3

Google anunció el lanzamiento de una nueva y creativa función dentro de su aplicación de inteligencia artificial, Gemini, que permite a los usuarios transformar fotos estáticas en clips de video dinámicos con sonido.

La herramienta, impulsada por el modelo de generación de video de última generación de la compañía, Veo 3, ya comenzó a implementarse para los suscriptores de Google AI Ultra y Pro en Chile y otras regiones seleccionadas.

Esta función nace con el objetivo de acercar la creación de video con IA al público general. Según Google, en las últimas siete semanas ya se han generado más de 40 millones de videos con la tecnología de Veo 3, lo que demuestra el gran interés de los usuarios por estas herramientas creativas. La nueva capacidad de foto a video se está implementando desde hoy en la versión web de Gemini y llegará a lo largo de la semana a los dispositivos móviles.

Paso a paso: cómo darle vida a tus imágenes con Gemini

El proceso para utilizar esta nueva herramienta es sencillo y se basa en el uso de "prompts" o instrucciones escritas. Para convertir una foto en un video, el usuario debe seguir estos pasos:

Ingresar a la aplicación de Gemini (web o móvil).
Hacer clic en la opción "herramientas" en la caja de instrucciones y seleccionar "video".
Subir una fotografía estática desde el dispositivo.
En la misma caja de instrucciones, describir el movimiento que se desea aplicar a la imagen y el audio que se quiere incluir. Se pueden añadir diálogos, efectos de sonido y ruido ambiental.
Gemini procesará la solicitud y creará un clip de video de ocho segundos en resolución 720p, en formato MP4 horizontal (16:9), con el audio sincronizado.

Una vez generado, el video se puede descargar o compartir directamente desde la aplicación. Las posibilidades creativas incluyen animar objetos cotidianos, dar vida a dibujos o pinturas, o añadir movimiento a paisajes naturales.

Seguridad y transparencia en la IA generativa

Google ha destacado que la seguridad es una prioridad en el uso de sus herramientas generativas. La compañía realiza pruebas proactivas para solucionar problemas potenciales antes de que surjan y aplica políticas contra la creación de contenido inseguro. Además, todos los videos generados por esta función incluirán una marca de agua visible para indicar que son creados por IA, así como una marca de agua digital invisible llamada SynthID, que permite rastrear su origen.

Lo más reciente

U2 y "How to Dismantle an Atomic Bomb": a 21 años de su conquista en Reino Unido

El 5 de diciembre de 2004, U2 alcanzó por novena vez el número uno en Reino Unido con un álbum que marcó su regreso definitivo al rock.

"Band on the Run" de Wings: 52 años del álbum que consolidó a Paul McCartney más allá de The Beatles

El 5 de diciembre de 1973, Paul McCartney y Wings publicaron "Band on the Run", el tercer álbum de la banda.

Los Jaivas vuelven al Estadio Nacional: ¿quedan entradas disponibles?

¿Quedan entradas para Los Jaivas en el Estadio Nacional? No te pierdas la oportunidad de vivir un concierto histórico y una experiencia única.

David Byrne sorprende con una playlist "para quienes odian la música de Navidad"

El líder de Talking Heads, David Byrne, lanzó una selección de 32 canciones que desafía los clichés de la temporada.

"Lo estamos resolviendo con esta colaboración público-privada": Alcalde de Renca sobre el "Plan Maestro del Agua"

El alcalde de Renca conversó junto a Nada Es Tan Grave sobre el "Plan Maestro del Agua" con aportes público-privados.

Esto es lo que mostró Marvel: equipos, filtraciones y el misterioso rol de Downey

Marvel genera expectativa con Avengers: Doomsday, anticipando un estreno cargado de sorpresas y la unión de icónicos héroes y exvillanos.