Generar videos con IA ahora es más fácil con la integración de Omni, el nuevo modelo de Google

Google presentó una nueva puesta al día para Gemini enfocada en la procreación y impresión de videos con la integración de su modelo Inteligencia Artificial. La compañía incorporó el modelo Omni, una aparejo que promete mejorar el realismo de las producciones audiovisuales y ampliar las posibilidades creativas para usuarios y desarrolladores.
La presentación ocurrió durante el evento Google I/O en Mountain View, California. El anuncio estuvo a cargo de Koray Kavukcuoglu, uno de los referentes de inteligencia químico interiormente de la empresa y responsable de la edificio de IA de Google.
Omni: La Nueva IA de Google para Videos
La empresa búsqueda repetir el impacto que consiguió Nano Banana durante el año pasado. Ese modelo permitió crear y editar imágenes mediante inteligencia químico y ayudó a masificar varias funciones de Gemini entre usuarios de todo el mundo. La principal novedad de Omni está en la procreación de videos a partir de distintos tipos de contenido. El sistema acepta texto, imágenes, audio y archivos de video como referencias para producir escenas audiovisuales de entrada calidad.
En que consiste Omni, la nueva IA de Google
Google desarrolló Omni como un sistema capaz de difundir contenido audiovisual, desde múltiples entradas al mismo tiempo. El modelo puede interpretar imágenes, texto, audio y videos para producir un único resultado coherente. La compañía lanzó inicialmente Gemini Omni Flash, el primer parte de esta nueva clan de herramientas de inteligencia químico. El sistema ya funciona para los suscriptores de Google AI Pro y Ultra desde la aplicación Gemini y desde Google Flow.
Google incluso anunció golpe de balde para usuarios de YouTube Shorts y de la aplicación YouTube Create. La empresa indicó que la expansión comenzará durante esta misma semana. Los desarrolladores y clientes empresariales podrán penetrar al modelo mediante APIs interiormente de las próximas semanas. Google búsqueda integrar Omni interiormente de distintos entornos de producción audiovisual y herramientas digitales.
Los usuarios pueden modificar escenas mediante indicaciones escritas en habla natural sin requisito de herramientas de impresión tradicionales. El modelo interpreta cada instrucción como una continuidad de la precursor. El sistema mantiene coherencia entre personajes, movimientos, escenarios y novelística militar de la ambiente.
Los usuarios pueden mudar ambientes completos, pegar personajes, incorporar objetos o modificar ángulos de cámara a partir de comandos de texto. Gemini Omni incluso permite alterar acciones específicas interiormente de un video fototipia previamente.
Google mostró ejemplos donde una ambiente cambia de estilo visual mientras el personaje avanza interiormente del plano. El sistema incluso demostró capacidad para difundir superficies líquidas, materiales reflectantes y existencias especiales complejos. La aparejo incorpora una comprensión más detallada de conceptos físicos como trascendencia, energía cinética y dinámica de fluidos. Esa perfeccionamiento apunta a construir escenas con movimientos y comportamientos más realistas.
Seguridad digital para las creaciones con IA de Google
Google informó que todos los videos creados con Omni incorporan la marca de agua digital SynthID. El sistema permite identificar contenido generado mediante inteligencia químico y comprobar su origen. La compañía habilitó herramientas de demostración desde la aplicación Gemini, Gemini en Chrome y el buscador de Google. El objetivo apunta a transparentar la procedencia del contenido audiovisual creado con IA.
SynthID funciona como un protocolo de seguridad destinado a etiquetar material generado artificialmente. Google búsqueda dominar confusiones relacionadas con videos modificados o escenas creadas digitalmente. La empresa incluso confirmó que continúa evaluando funciones vinculadas con modificación de voz y impresión de audio. Google todavía trabaja sobre esas capacidades ayer de habilitarlas para el divulgado militar.




