Гугл представил новый ИИ-инструмент для видео: хаотичный, убедительный и пугающий

14

В прошлом году я сфабриковал видео с плюшевым оленем моего сына.
Отправил его в «поездку».
Скрывал эксперимент под видом рекламы Gemini и ни секунды не показывал своему четырехлетнему ребенку сфабрикованные приключения Buddy the deer. Это должно было быть безобидно. Или, по крайней мере, локально.

Оказалось, что грань между «игривым» и «полным мусором» размыта.
Инструменты для создания реалистичного видео слишком хороши. Слишком просты в использовании.

Google активно продвигается в этом направлении с моделью Omni.
Это семейство моделей, обещающее превращать текст, фото, видео — что угодно — в что угодно. На данный момент она создает только видео.
Omni Flash уже доступна внутри Flow.
Veo все еще работает. Но Omni утверждает, что лучше понимает мир. Персонажи остаются неизменными. Логика сохраняется.
Утверждения дешевы.

Я протестировал её.
Buddy the deer вернулся к работе.
Собрал свой «ИИ-чемодан».
Результаты оказались смесью катастрофы и настоящего таланта.
Некоторые кадры были плотными. На самом деле они лучше следовали моим инструкциям, чем Veo пять месяцев назад.
Но моменты испуга? Реальные.
Я видел, как Buddy менял ориентацию в воздухе во время прыжка с парашютом. Гравитация забыла, на чьей она стороне.

Далее я запросил творческую свободу.
Попросил Omni создать монтаж: Buddy собирает вещи, садится на круизный лайнер, милое настроение. Попросил добавить смешной предмет в чемодан, который раскроется позже.
ИИ выбрал мед.
Позже в клипе Buddy берет его, как солнцезащитный крем. Брызжет липкой желтой субстанцией на свою копыто. «Упс».
Неплохая шутка.
Но бутылка мутировала.
Банка. Бутылочка с водой для опрыскивания. Туба для меда.
Туда и обратно.
Финальный кадр выглядел так, будто модель вырвала последние пять секунд на холст.
Хаос.

Редактирование текста?
Google дает себе заслуги здесь. Оно работает лучше, чем раньше.
«Лучше» — ключевое слово.
Veo 3 отказывалась изменять вещи. Мне приходилось начинать каждый раз заново. Omni пытается. Обычно терпит неудачу.
Я попросил исправить мимику Buddy. Получил странные, расплавившиеся лица.
Попросил удалить рога, которых у него не должно быть. У оленят нет рогов.
Он выполнил в одном кадре. Добавил рога во все остальные сцены в клипе.
Упрямый.

Есть счетчик.
Кредиты сгорают быстро. 15 до 40 за сцену. Редакции стоят еще один кусок.
У меня Pro-план. 1000 кредитов в месяц.
Я сожрал их за 20 клипов. Осталось 145.
Если вы хотите именно то, что представляете? Вы будете проливать деньги, гоняясь за моделью по углам.

Я попробовал что-то личное.
Пропустил Buddy.
Загрузил нейтральное селфи в машину.
Попросил: «Сделай так, чтобы я ела спагетти. Сидела в самолете. Кусала багет на Эйфелевой башне».
Мой желудок упал, когда загрузилось видео.
Да, есть признаки. Вилка звенит слишком чисто. Женщина на фоне дублируется в полете.
Зловеще.
Тем не менее, убедительно.

Я показал клип со спагетти своему мужу.
Он знает, что я тестирую технологии. Не сказала, что это ИИ.
Он смотрел, как я ем. Сказал, что это выглядит реально. Единственная подсказка — незнакомая миска.
Он живет со мной. Смотрит на меня каждый день.
Не заметил.
Другие клипы?
Приманка для социальных сетей.
Одно видео Эйфелевой башни выглядело немного мультяшно. Другое было резким.
Пока мой ИИ-я не повернула голову. Волосы вдруг в хвосте, который я не ношу.
Я знаю, что это фейк.
Незнакомцы могут не знать. Это заставляет меня чувствовать себя некомфортно.

Наступает усталость.
Я была в шоке от дипфейков годами. Сначала фото. Затем видео.
Veo 3 попало в последний раз. Omni должно было тоже. Но шок угас до тусклого гула.
Создание кинематографа все еще сложно. Google продает мечту.
Omni лучше. Распознаваемые улучшения.
Но барьер низкий.
Телефон в руке. Кредитная карта готова. Вы можете сидеть в своей гостиной и выглядеть так, будто вы в Мауи, без каких-либо усилий.
Мы достигли сингулярности?
Возможно, нет.
Но мы определенно глубоко в зловещем.

Все изображения и видео в этой статье были созданы искусственным интеллектом Google