Stability AI презентував нову ШІ-модель Stable Video 4D для генерації відео під різними кутами
Британський стартап Stability AI представив свою нову модель штучного інтелекту, яка генерує відео під різними кутами – Stable Video 4D. Команда бачить її застосування у розробці ігор, відеомонтажі та віртуальній реальності, йдеться на сайті стартапу.
Пишуть, що Stable Video 4D може швидко створювати короткі 3D-відео з зображень або інших відео. Модель генерує п’ять кадрів відео з восьми різних ракурсів, які перед цим вкаже користувач, десь за 40 секунд. А вся 4D оптимізація займає приблизно 20-25 хвилин.
«Спираючись на міцний фундамент нашої моделі Stable Video Diffusion, яка перетворює зображення у відео, модель Stable Video 4D приймає відео як вхідний сигнал і генерує кілька відеороликів нового вигляду з різних точок зору. Це досягнення являє собою стрибок у наших можливостях, переходячи від генерації відео на основі зображень до повного динамічного 3D-синтезу відео», – йдеться у блозі.
Stable Video 4D має відкритий код. У Stability AI очікують, що компанії візьмуть цю модель на озброєння «доопрацьовуючи її відповідно до своїх унікальних потреб».
ШІ-модель перебуває на стадії дослідження, але вже доступна на платформі Hugging Face. Кажуть, що її постійно вдосконалюватимуть. Тут можна більше почитати про технічний звіт, в якому детально описуються методології, виклики та прориви.
У Stability AI бачать застосування своєї моделі у розробці ігор – індустрії, яка без захвату сприймає впровадження штучного інтелекту у своїй роботі. Нещодавно журналісти WIRED опублікували дослідження, як штучний інтелект забирає робочі місця у працівників геймдеву.
З іншого боку стоїть питання з авторськими правами, яке тягнеться чи не з часів створення ШІ. У січні минулого року ініціативна група художників подала в суд на компанії, що використовують Stable Diffusion – моделі, що Stability AI випустила у 2022 році.
За словами позивачів, Stable Diffusion містить неавторизовані копії мільйонів — а, можливо, мільярдів — захищених авторським правом зображень. Ці копії були зроблені без відома та згоди художників та збиралися для тренування штучного інтелекту.