Il nuovo strumento video AI di Google è disordinato, convincente e terrificante

8

L’anno scorso ho simulato il cervo di peluche di mio figlio.
Mettilo in viaggio.
Ho usato la pubblicità dei Gemelli come copertura per l’esperimento e non ho mai mostrato a mio figlio di quattro anni un secondo delle avventure inventate di Buddy il cervo. Doveva essere innocuo. O almeno contenuto.
Si scopre che il confine tra “giocoso” e “pieno slop” è sfocato.
Gli strumenti per realizzare video realistici sono troppo buoni. Troppo facile.

Google si sta impegnando molto in questo senso con Omni.
È una famiglia di modelli che promettono di trasformare testo, foto, video – qualsiasi cosa – in qualsiasi altra cosa. Attualmente realizza solo video.
Omni Flash è ora disponibile all’interno di Flow.
Veo funziona ancora. Ma Omni afferma di conoscere meglio il mondo. I personaggi rimangono coerenti. La logica regge.
Le richieste sono economiche.

L’ho provato.
Amico, il cervo è tornato al lavoro.
Ha fatto le valigie per l’intelligenza artificiale.
I risultati furono un disastro misto a talento genuino.
Alcune clip erano strette. In realtà ho seguito le mie istruzioni meglio di Veo cinque mesi fa.
Ma il salto spaventa? Vero.
Ho visto Buddy cambiare orientamento a mezz’aria mentre faceva paracadutismo. La gravità ha dimenticato per chi stava lavorando.

Successivamente ha chiesto la libertà artistica.
Ho detto a Omni di fare un montaggio: amico che fa le valigie, si imbarca su una crociera, atmosfera carina. Ho chiesto un oggetto da valigia divertente che ripaga più tardi.
L’intelligenza artificiale ha scelto il miele.
Più avanti nella clip Buddy lo afferra come se fosse una crema solare. Schizza una sostanza gialla e appiccicosa sullo zoccolo. “Oh oh.”
Non è un brutto scherzo.
Ma la bottiglia è mutata.
Vaso. Bottiglia con spruzzatore d’acqua. Tubo per spremere il miele.
Avanti e indietro.
Nel fotogramma finale sembrava che la modella avesse vomitato gli ultimi cinque secondi su una tela.
Caos.

Modifiche al testo?
Google si dà credito qui. Funziona meglio di prima.
Meglio è la parola chiave.
Veo 3 ha rifiutato di cambiare le cose. Ho dovuto ricominciare da capo ogni volta. Omni ci prova. Di solito fallisce.
Gli ho detto di sistemare le espressioni facciali di Buddy. Ci sono facce strane e sciolte.
Gli è stato chiesto di rimuovere le corna che non avrebbe dovuto avere. I cuccioli di cervo non hanno le corna.
Obbedì in un colpo solo. Aggiunte corna a ogni altra scena della clip.
Testardo.

C’è un metro che corre.
I crediti bruciano velocemente. Da 15 a 40 per scena. Le modifiche costano un’altra fetta.
Ho il piano Pro. 1.000 crediti al mese.
Li ho bruciati in 20 clip. 145 rimasti.
Se vuoi esattamente quello che immagini? Sanguinerai soldi inseguendo il modello dietro gli angoli.

Ho provato qualcosa di personale.
Saltato amico.
Inserisci un selfie neutro nel macinino.
Detto: Fammi mangiare gli spaghetti. Siediti su un aereo. Mordere una baguette alla Torre Eiffel.
Mi è crollato lo stomaco quando è stato caricato il video.
Sì, ci sono indizi. La forcella fa un tintinnio troppo forte. Una donna sullo sfondo duplica durante il volo.
Misterioso.
Comunque convincente.

Ho mostrato la clip per la pasta a mio marito.
Sa che collaudo la tecnologia. Non gli ho detto che era AI.
Mi ha guardato mangiare. Ha detto che sembrava reale. L’unico indizio era la ciotola sconosciuta.
Vive con me. Mi guarda ogni giorno.
Non l’ho cronometrato.
Altre clip?
Esca sui social media.
Un video della Torre Eiffel sembrava un po’ da cartone animato. Un altro era acuto.
Fino a quando la mia IA non ha girato la testa. Capelli improvvisamente raccolti in una coda di cavallo che non indosso.
So che è falso.
Gli estranei potrebbero non farlo. Questo mi mette a disagio.

Arriva l’esaurimento.
Sono rimasto scioccato dai deepfake per anni. Prima le foto. Video successivo.
Veo 3 mi ha preso l’ultima volta. Anche Omni dovrebbe farlo. Ma lo shock si è trasformato in un ronzio sordo.
Fare cinema è ancora difficile. Google vende un sogno.
Omni è migliore. Miglioramenti riconoscibili.
Ma la barriera è bassa.
Telefono in mano. Carta di credito pronta. Puoi sederti nel tuo salotto e sembrare come se fossi a Maui senza alcuno sforzo.
Siamo alla singolarità?
Forse no.
Ma siamo decisamente nel profondo del misterioso.

Tutte le immagini e i video in questa storia sono stati generati dall’intelligenza artificiale di Google