Google przedstawia nowe narzędzie wideo AI: chaotyczne, fascynujące i przerażające

11

W zeszłym roku nakręciłem film przedstawiający wypchanego renifera mojego syna.
Wysłał go na „wycieczkę”.
Ukrył eksperyment pod pozorem reklamy Bliźniąt i ani przez sekundę nie pokazywał swojemu czteroletniemu dziecku sfabrykowanych przygód Jelenia Buddy’ego. Miało być nieszkodliwie. Albo przynajmniej lokalnie.

Okazuje się, że granica pomiędzy „zabawą” a „totalną tandetą” zaciera się.
Narzędzia do tworzenia realistycznych filmów są zbyt dobre. Zbyt łatwy w użyciu.

Google agresywnie zmierza w tym kierunku, wprowadzając model Omni.
To rodzina modeli, które obiecują przekształcić tekst, zdjęcia i filmy — jakkolwiek to nazwać — w cokolwiek. W tej chwili tworzy tylko filmy.
Omni Flash jest już dostępny w Flow.
Veo nadal działa. Ale Omni twierdzi, że lepiej rozumie świat. Postacie pozostają niezmienione. Logika pozostaje taka sama.
Afirmacje są tanie.

Przetestowałem to.
Koleś jeleń wrócił do pracy.
Spakowałam swoją „walizkę AI”.
Rezultatem była mieszanka katastrofy i prawdziwego talentu.
Niektóre strzały były zacięte. Właściwie postępowali zgodnie z moimi instrukcjami lepiej niż Veo pięć miesięcy temu.
Ale chwile grozy? Prawdziwy.
Widziałem, jak Buddy zmieniał orientację w powietrzu podczas skoków spadochronowych. Grawitacja zapomniała, po której jest stronie.

Następnie poprosiłem o swobodę twórczą.
Poprosiłem Omniego o stworzenie montażu: pakowanie kumpla, wejście na statek wycieczkowy, uroczy nastrój. Poprosił mnie o dodanie do walizki zabawnego przedmiotu, który otworzy się później.
AI wybrała miód.
W dalszej części filmu Buddy traktuje to jak krem ​​​​przeciwsłoneczny. Rozpyla lepką żółtą substancję na kopyto. „Ups”.
Niezły żart.
Ale butelka uległa mutacji.
Słoik. Butelka wody do opryskiwania. Tubka na miód.
Tam i z powrotem.
Ostatnie ujęcie wyglądało, jakby model wyrwał na płótno ostatnie pięć sekund.
Chaos.

Edytowanie tekstu?
Google przypisuje sobie tutaj zasługę. Działa lepiej niż wcześniej.
„Lepiej” to słowo klucz.
Veo 3 nie chciał niczego zmieniać. Za każdym razem musiałem zaczynać od nowa. Omni próbuje. Zwykle kończy się niepowodzeniem.
Poprosiłem o poprawienie wyrazu twarzy Buddy’ego. Mam dziwne, roztopione twarze.
Poprosił o usunięcie rogów, których nie powinien. Jelonki nie mają poroża.
Ukończył go w jednym kadrze. Dodano rogi do wszystkich innych scen w filmie.
Uparty.

Jest licznik.
Pożyczki szybko się wypalają. 15 do 40 na scenę. Redaktorzy są warci innego artykułu.
Mam plan Pro. 1000 kredytów miesięcznie.
Pochłonąłem je w 20 klipach. Zostało 145.
Jeśli chcesz dokładnie tego, co sobie wyobrażasz? Będziesz marnować pieniądze, goniąc za modelem po zakrętach.

Spróbowałem czegoś osobistego.
Tęskniłem za kolegą.
Załadowałem neutralne selfie do samochodu.
Zapytał: “Każ mi zjeść spaghetti. Siedziałem w samolocie. Ugryzłem bagietkę pod Wieżą Eiffla.”
Mój żołądek podskoczył, gdy wideo się załadowało.
Tak, są znaki. Widelec dzwoni zbyt wyraźnie. Kobieta w tle jest powielona w locie.
Złowrogo.
Mimo to przekonujący.

Pokazałam klip ze spaghetti mojemu mężowi.
Wie, że testuję technologię. Nie powiedziała, że ​​to sztuczna inteligencja.
Patrzył, jak jem. Powiedział, że wygląda naprawdę. Jedyną wskazówką jest nieznana miska.
Mieszka ze mną. Patrzy na mnie codziennie.
Nie zauważyłem.
Inne klipy?
Przynęta mediów społecznościowych.
Jeden z filmów przedstawiających Wieżę Eiffla wyglądał trochę kreskówkowo. Drugi był ostry.
Dopóki moja sztuczna inteligencja nie odwróciła głowy. Moje włosy nagle związały się w kucyk, którego nie noszę.
Wiem, że to fałszywe.
Nieznajomi mogą nie wiedzieć. To sprawia, że ​​czuję się niekomfortowo.

Pojawia się zmęczenie.
Od lat jestem zszokowany deepfakesami. Najpierw zdjęcia. Potem wideo.
Veo 3 trafił ostatni raz. Omni też powinien. Ale szok przeszedł w głuchy szum.
Tworzenie filmów jest wciąż trudne. Google sprzedaje marzenie.
Omni jest lepszy. Rozpoznawalne ulepszenia.
Ale bariera jest niska.
Telefon w ręku. Karta kredytowa jest gotowa. Możesz usiąść w swoim salonie i bez żadnego wysiłku wyglądać, jakbyś był na Maui.
Czy dotarliśmy do osobliwości?
Być może nie.
Ale zdecydowanie jesteśmy głęboko w złowrogim świecie.

Wszystkie obrazy i filmy w tym artykule zostały utworzone przez sztuczną inteligencję Google