Si Gemini ya me había dejado sin palabras, solo me faltaba ver cómo genera vídeo. Los resultados son sorprendentes
La generación de vídeo a partir de una orden de texto llegó por fin a Gemini: tras el anuncio por parte de Google, ya fue aterrizando en los móviles de quienes tienen una suscripción Advanced. Lo esperaba con ganas y por fin pude probarlo: está a la altura de las expectativas. Tras sorprenderme con el entendimiento del texto y su generación, después de que crear imágenes se convirtiera en algo cotidiano y cuando ya me había acostumbrado a intercambiar Google por las búsquedas mediante chatbot, la frontera del vídeo quedó finalmente traspasada. Veo 2 es la apuesta de Google en la generación animada, este modelo ya está disponible desde Gemini. Si puedes imaginarlo, puedes crear tu vídeo Google prometió que la generación de vídeo con su modelo Veo 2 se integraría en el selector de Gemini, primero para los usuarios que tienen una suscripción Advanced. Después llegará de forma más limitada a los usuarios de las cuentas gratuitas, una gran ventaja sobre herramientas como Sora, de Open AI. Que se democratice la IA en todas sus vertientes es una buena noticia. En Xataka Móvil He probado la revolución de ChatGPT en la generación de vídeo: así funciona Sora en el móvil ¿Que se hacía algo lioso decantarse por un LLM a la hora de utilizar Gemini, ya fuera en la app como en la web? Pues otro selector más: Veo 2 se une a Gemini 2.0, 2.5 y la búsqueda profunda. Ahora mismo tengo cinco opciones distintas, creo que lo lógico es que Veo 2 se activara al pedirle al chatbot un vídeo, igual que hace Imagen 3 con las imágenes. Supongo que, de momento, es una manera de destacar la novedad. La interfaz de generación no tiene nada del otro mundo: un cuadro de texto y ya, de momento no se le pueden adjuntar archivos (sí grabar una orden de voz). ¿Que busco animar una imagen? La copio con el portapapeles y la pego en el chatbot, luego escribo con texto cómo deseo animar dicha imagen. Los resultados son muy buenos, la clave aquí se encuentra en afinar el prompt. Veo 2 se comporta de forma muy precisa a la orden: cuanto más extenso y afinado sea el prompt, Meno riesgo de alucinaciones Veo 2 tiene un potencial enorme, su calidad se encuentra a un excelente nivel (bajo mis pruebas, me ha gustado más que Sora y Pika, por ejemplo), logra animar de manera realista (a 24 fps), no he visto exageradas alucinaciones (todo depende de lo específica que sea la orden de texto) y parece que Google no le ha puesto demasiados filtros de copyright. Por ejemplo, creó vídeos de Dragón Ball y de los Simpson sin poner objeciones. Veo 2 necesita un par de minutos de tiempo para crear vídeos de 8 segundos "Gato tocando la batería en una calle de San Francisco. El público del gato le arroja monedas, todos los integrantes de ese público son perros" Una vez está activo en la cuenta, aparecerá el selector de Veo 2. Por mis pruebas, solo lo tengo en los móviles, no en la web. Aunque encontré un truco: si inicio una conversación con el modelo de vídeo en el teléfono, y la continúo en el navegador, Gemini me seguirá haciendo vídeos si se lo pido. Aunque en la web no me aparezca Veo 2. ¿Y cuáles son las cualidades de las creaciones? Veamos. Vídeos de entre cinco y ocho segundos. Resolución máxima a 720p. 24 fotogramas por segundo. Formato 16:9 y guardado en archivos MP4. Límite mensual en la generación de vídeos. Gemini avisará conforme se acerque dicho límite. Veo 2 incluye una marca de agua invisible en cada fotograma para identificar los vídeos como creados con IA. Las órdenes de generación pueden escribirse en español. De momento solo disponible para cuentas de Gemini Advanced. No está nada mal, es el complemento perfecto a la creación de imágenes con Imagen 3 y al resto de opciones relacionadas con el texto que ofrecen los modelos de Gemini. La IA interpreta suficientemente bien las órdenes, incluso aunque no sean demasiado detalladas. Y se obtienen resultados que van más allá de la curiosidad. Google no está dispuesta a dejar que la adelanten en IA El límite de la muerte de Veo 2: Gemini permite unas quince generaciones diarias De ser pionera en las herramientas de IA a quedar relegada a los puestos de consolación por un grave error de cálculo: no ver el potencial de los largos modelos de lenguaje como chatbots generativos. Open AI marcó el inicio con ChatGPT y consiguió hacerse con la referencia. Aunque Google pisó el acelerador y anda recortando camino a base de arrojar paladas de billetes a a los motores (como Open AI, que es una máquina de quemar dinero). En Xataka Android Si no sabes hablar con Gemini para acertar en tus peticiones, lo hará por ti. Este es el botón que desbloquea el prompt perfecto

La generación de vídeo a partir de una orden de texto llegó por fin a Gemini: tras el anuncio por parte de Google, ya fue aterrizando en los móviles de quienes tienen una suscripción Advanced. Lo esperaba con ganas y por fin pude probarlo: está a la altura de las expectativas.
Tras sorprenderme con el entendimiento del texto y su generación, después de que crear imágenes se convirtiera en algo cotidiano y cuando ya me había acostumbrado a intercambiar Google por las búsquedas mediante chatbot, la frontera del vídeo quedó finalmente traspasada. Veo 2 es la apuesta de Google en la generación animada, este modelo ya está disponible desde Gemini.
Si puedes imaginarlo, puedes crear tu vídeo

Google prometió que la generación de vídeo con su modelo Veo 2 se integraría en el selector de Gemini, primero para los usuarios que tienen una suscripción Advanced. Después llegará de forma más limitada a los usuarios de las cuentas gratuitas, una gran ventaja sobre herramientas como Sora, de Open AI. Que se democratice la IA en todas sus vertientes es una buena noticia.
¿Que se hacía algo lioso decantarse por un LLM a la hora de utilizar Gemini, ya fuera en la app como en la web? Pues otro selector más: Veo 2 se une a Gemini 2.0, 2.5 y la búsqueda profunda. Ahora mismo tengo cinco opciones distintas, creo que lo lógico es que Veo 2 se activara al pedirle al chatbot un vídeo, igual que hace Imagen 3 con las imágenes. Supongo que, de momento, es una manera de destacar la novedad.

La interfaz de generación no tiene nada del otro mundo: un cuadro de texto y ya, de momento no se le pueden adjuntar archivos (sí grabar una orden de voz). ¿Que busco animar una imagen? La copio con el portapapeles y la pego en el chatbot, luego escribo con texto cómo deseo animar dicha imagen. Los resultados son muy buenos, la clave aquí se encuentra en afinar el prompt.
Veo 2 tiene un potencial enorme, su calidad se encuentra a un excelente nivel (bajo mis pruebas, me ha gustado más que Sora y Pika, por ejemplo), logra animar de manera realista (a 24 fps), no he visto exageradas alucinaciones (todo depende de lo específica que sea la orden de texto) y parece que Google no le ha puesto demasiados filtros de copyright. Por ejemplo, creó vídeos de Dragón Ball y de los Simpson sin poner objeciones.
Veo 2 necesita un par de minutos de tiempo para crear vídeos de 8 segundos

Una vez está activo en la cuenta, aparecerá el selector de Veo 2. Por mis pruebas, solo lo tengo en los móviles, no en la web. Aunque encontré un truco: si inicio una conversación con el modelo de vídeo en el teléfono, y la continúo en el navegador, Gemini me seguirá haciendo vídeos si se lo pido. Aunque en la web no me aparezca Veo 2.
¿Y cuáles son las cualidades de las creaciones? Veamos.
- Vídeos de entre cinco y ocho segundos.
- Resolución máxima a 720p.
- 24 fotogramas por segundo.
- Formato 16:9 y guardado en archivos MP4.
- Límite mensual en la generación de vídeos. Gemini avisará conforme se acerque dicho límite.
- Veo 2 incluye una marca de agua invisible en cada fotograma para identificar los vídeos como creados con IA.
- Las órdenes de generación pueden escribirse en español.
- De momento solo disponible para cuentas de Gemini Advanced.
No está nada mal, es el complemento perfecto a la creación de imágenes con Imagen 3 y al resto de opciones relacionadas con el texto que ofrecen los modelos de Gemini. La IA interpreta suficientemente bien las órdenes, incluso aunque no sean demasiado detalladas. Y se obtienen resultados que van más allá de la curiosidad.
Google no está dispuesta a dejar que la adelanten en IA

De ser pionera en las herramientas de IA a quedar relegada a los puestos de consolación por un grave error de cálculo: no ver el potencial de los largos modelos de lenguaje como chatbots generativos. Open AI marcó el inicio con ChatGPT y consiguió hacerse con la referencia. Aunque Google pisó el acelerador y anda recortando camino a base de arrojar paladas de billetes a a los motores (como Open AI, que es una máquina de quemar dinero).
Veo 2 me ha sorprendido, ya decía que me parece mejor que los contrincantes. Aunque claro, veremos qué ocurre en los próximos meses: la competencia es tan dura, que no pasa una semana sin que dejemos de ver novedades en el campo de la IA. Le tengo muchas ganas al próximo Google I/O de mediados de mayo, estoy convencido de que Gemini será el protagonista absoluto.
Imagen de portada | Iván Linares
En Xataka Android | Mientras ChatGPT quita funciones a los usuarios gratuitos, Google hace todo lo contrario: ahora Gemini 2.5 Pro funciona gratis
-
La noticia
Si Gemini ya me había dejado sin palabras, solo me faltaba ver cómo genera vídeo. Los resultados son sorprendentes
fue publicada originalmente en
Xataka Android
por
Iván Linares
.