Google anunció el lanzamiento de una nueva y creativa función dentro de su aplicación de inteligencia artificial, Gemini, que permite a los usuarios transformar fotos estáticas en clips de video dinámicos con sonido.
La herramienta, impulsada por el modelo de generación de video de última generación de la compañía, Veo 3, ya comenzó a implementarse para los suscriptores de Google AI Ultra y Pro en Chile y otras regiones seleccionadas.
Esta función nace con el objetivo de acercar la creación de video con IA al público general. Según Google, en las últimas siete semanas ya se han generado más de 40 millones de videos con la tecnología de Veo 3, lo que demuestra el gran interés de los usuarios por estas herramientas creativas. La nueva capacidad de foto a video se está implementando desde hoy en la versión web de Gemini y llegará a lo largo de la semana a los dispositivos móviles.
Paso a paso: cómo darle vida a tus imágenes con Gemini
El proceso para utilizar esta nueva herramienta es sencillo y se basa en el uso de "prompts" o instrucciones escritas. Para convertir una foto en un video, el usuario debe seguir estos pasos:
- Ingresar a la aplicación de Gemini (web o móvil).
- Hacer clic en la opción "herramientas" en la caja de instrucciones y seleccionar "video".
- Subir una fotografía estática desde el dispositivo.
- En la misma caja de instrucciones, describir el movimiento que se desea aplicar a la imagen y el audio que se quiere incluir. Se pueden añadir diálogos, efectos de sonido y ruido ambiental.
- Gemini procesará la solicitud y creará un clip de video de ocho segundos en resolución 720p, en formato MP4 horizontal (16:9), con el audio sincronizado.
Una vez generado, el video se puede descargar o compartir directamente desde la aplicación. Las posibilidades creativas incluyen animar objetos cotidianos, dar vida a dibujos o pinturas, o añadir movimiento a paisajes naturales.
Seguridad y transparencia en la IA generativa
Google ha destacado que la seguridad es una prioridad en el uso de sus herramientas generativas. La compañía realiza pruebas proactivas para solucionar problemas potenciales antes de que surjan y aplica políticas contra la creación de contenido inseguro. Además, todos los videos generados por esta función incluirán una marca de agua visible para indicar que son creados por IA, así como una marca de agua digital invisible llamada SynthID, que permite rastrear su origen.