Google presenta Gemini Omni: l’IA che trasforma chiunque in un creatore di video professionali

Al Google I/O 2026 debutta la nuova intelligenza artificiale multimodale

Durante il Google I/O 2026, l’evento annuale dedicato agli sviluppatori, Google ha svelato Gemini Omni, una nuova generazione di modelli di intelligenza artificiale progettata per creare e modificare contenuti multimediali in modo estremamente avanzato.

Secondo l’azienda di Mountain View, Omni è stato pensato per lavorare con qualsiasi tipo di input, dal testo alle immagini, passando per audio e video. Il punto di forza più evidente, almeno nella fase iniziale, riguarda però la produzione di contenuti video realistici e personalizzabili attraverso semplici comandi in linguaggio naturale.

L’obiettivo è superare il concetto tradizionale di chatbot, mettendo a disposizione degli utenti uno strumento capace di combinare filmati, immagini, tracce vocali e testi per generare nuovi video senza richiedere competenze tecniche di montaggio o post-produzione.

Arriva Gemini Omni Flash, presto anche la versione Pro

Il primo modello disponibile è Gemini Omni Flash, già integrato nell’app Gemini, in Google Flow e destinato ad arrivare progressivamente anche su YouTube Shorts.

Google ha inoltre confermato che nei prossimi mesi potrebbe essere rilasciata anche una versione Pro, al momento non ancora accessibile al grande pubblico.

Editing video tramite conversazione con l’IA

Una delle funzioni più innovative di Gemini Omni riguarda il cosiddetto editing conversazionale. Gli utenti possono modificare un video semplicemente dialogando con l’intelligenza artificiale, senza dover ricominciare ogni volta il progetto da zero.

Basta chiedere al sistema di cambiare:

ambientazioni;
oggetti presenti nella scena;
stile grafico;
inquadrature;
dinamica dell’azione.

Google ha spiegato che il modello è in grado di mantenere memoria degli elementi già creati, preservando così la coerenza narrativa e visiva dell’intero contenuto.

Durante la presentazione ufficiale sono stati mostrati esempi in cui un semplice filmato veniva trasformato in pochi istanti: da scena realistica a versione pixel art, fino a reinterpretazioni in stile fumetto, con personaggi aggiunti e sfondi completamente modificati.

Un sistema multimodale che unisce video, audio e immagini

Google definisce Gemini Omni un modello “nativamente multimodale”, perché capace di integrare contemporaneamente diversi formati in un unico processo creativo.

A differenza dei classici strumenti text-to-video, Omni può utilizzare:

video;
immagini;
tracce audio;
testo.

Questo permette di creare contenuti molto più complessi e personalizzati. Ad esempio, caricando un dipinto ispirato allo stile di Edvard Munch e una base musicale jazz, il sistema può generare automaticamente un nuovo video che combina atmosfera visiva e sonorità richieste.

Video più realistici grazie alla comprensione della fisica

Google ha posto grande attenzione anche sul tema del realismo. Secondo l’azienda, Gemini Omni possiede una comprensione più avanzata di fenomeni fisici come:

gravità;
energia cinetica;
dinamica dei fluidi.

Questo consentirebbe di ottenere scene più credibili e naturali rispetto ai precedenti modelli di IA generativa.

Il sistema sarebbe inoltre capace di interpretare riferimenti culturali e storici per produrre contenuti coerenti con il contesto richiesto dall’utente.

Avatar digitali e timori legati ai deepfake

Tra le funzionalità annunciate c’è anche la possibilità di creare avatar digitali personalizzati, in grado di replicare voce, espressioni facciali e aspetto dell’utente.

Google ha però precisato che questa tecnologia verrà introdotta gradualmente, con particolare attenzione agli aspetti legati alla sicurezza e al rischio di manipolazione dell’identità digitale.

Le nuove capacità di Omni hanno infatti alimentato preoccupazioni sul possibile aumento dei deepfake e della disinformazione online.

Per contrastare questi rischi, Google ha confermato che tutti i contenuti generati dal sistema includeranno SynthID, la filigrana digitale sviluppata dall’azienda per identificare immagini e video creati tramite intelligenza artificiale.

Disponibilità e prossimi sviluppi

Attualmente Gemini Omni Flash è disponibile per gli utenti dei piani Google AI Plus, Pro e Ultra. Alcune funzionalità saranno integrate gratuitamente anche in YouTube Shorts e nell’app YouTube Create.

Nei prossimi mesi Google punta ad ampliare ulteriormente il progetto introducendo nuovi formati di output, inclusa la generazione diretta di immagini e audio attraverso il modello AI.