Видео: imagen.research.google

Компания Google давно работает над новой моделью искусственного интеллекта, превращающей текстовые подсказки в видео без звука. Недавно она представила две новые системы, о которых рассказывает The Verge.

Модель для создания высококачественных видео Imagen Video выдает окончательные результаты одновременно невероятные, ужасные и тревожные. Наиболее убедительными образцами являются те ролики, которые повторяют анимацию.

Наименее убедительно выглядят клипы, повторяющие движения реальных людей и животных, например, фигура, которая сгребает снег, или кот, прыгающий на диван. Здесь деформация и ухудшение кадров более очевидны.

Тем временем уже обсуждаются возможные этические проблемы, которые может принести с собой эта технология: от расовых и гендерных стереотипов и предрассудков, до их потенциала для злоупотребления (например, создания порнографии без согласия, создания пропаганды и дезинформации).

Исследователи Google кратко уклоняются от этих вопросов.

Но пока Imagen Video — это исследовательский проект, и Google уменьшает его потенциальный вред для общества, просто не публикуя его для общественности. Презентованный пораньше подобный проект Make-a-Video от Meta также ограничен.

Но как и в случае с системами преобразования текста в изображение, скорее всего подобные модели вскоре будут тиражироваться и имитироваться сторонними исследователями. Когда это произойдет, появятся новые проблемы безопасности.

В дополнение к Imagen Video отдельная группа исследователей Google также опубликовала подробную информацию о другой модели преобразования текста в видео под названием Phenaki. По сравнению с Imagen Video, в центре внимания Phenaki — создание более длинных видео, соответствующих инструкциям подробной подсказки.

Клас
3
Панылы сорам
0
Ха-ха
0
Ого
8
Сумна
1
Абуральна
1