Відэа: imagen.research.google

Кампанія Google даўно працуе над новай мадэллю штучнага інтэлекту, якая ператварае тэкставыя падказкі ў відэа без гуку. Нядаўна яна прэзентавала дзве новыя сістэмы,пра якія распавядае The Verge.

Мадэль для стварэння высакаякасных відэа Imagen Video выдае канчатковыя вынікі адначасова неверагодныя, жудасныя і трывожныя. Найбольш пераканаўчымі ўзорамі з'яўляюцца тыя ролікі, якія паўтараюць анімацыю.

Найменш пераканаўча выглядаюць кліпы, што паўтараюць рухі рэальных людзей і жывёл, напрыклад, фігура, якая зграбае снег, або кот, які скача на канапу. Тут дэфармацыя і пагаршэнне кадраў больш відавочныя.

Тым часам ужо абмяркоўваюцца магчымыя этычныя праблемы, якія можа прынесці з сабой гэтая тэхналогія: ад расавых і гендарных стэрэатыпаў ды забабонаў, да іх патэнцыялу для злоўжывання (напрыклад, стварэння парнаграфіі без згоды, стварэння прапаганды і дэзынфармацыі).

Даследчыкі Google коратка ўхіляюцца ад гэтых пытанняў.

Але ж пакуль Imagen Video — гэта даследчы праект, і Google памяншае яго патэнцыйную шкоду для грамадства, проста не публікуючы яго для грамадскасці. Прэзентаваны крыху раней падобны праект Make-A-Video ад Meta таксама абмежаваны.

Але як і ў выпадку з сістэмамі пераўтварэння тэксту ў відарыс, хутчэй за ўсё падобныя мадэлі неўзабаве будуць тыражавацца і імітавацца староннімі даследчыкамі. Калі гэта адбудзецца, з'явяцца новыя праблемы бяспекі.

У дадатак да Imagen Video асобная група даследчыкаў Google таксама апублікавала падрабязную інфармацыю аб іншай мадэлі пераўтварэння тэксту ў відэа пад назвай Phenaki. У параўнанні з Imagen Video, у цэнтры ўвагі Phenaki — стварэнне больш доўгіх відэа, якія адпавядаюць інструкцыям падрабязнай падказкі.

Клас
3
Панылы сорам
0
Ха-ха
0
Ого
8
Сумна
1
Абуральна
1