Текст теперь можно превратить в видео. ИИ научился этому, используя тысячи часов записей

Команда инженеров по машинному обучению из материнской компании Facebook Meta (признана экстремистской организацией, деятельность запрещена на территории РФ) представила новую систему под названием Make-A-Video. Как следует из названия, эта модель ИИ делает видео. Все работает просто: пользователь вводит приблизительное описание сцены, и систем генерирует короткое видео, соответствующее тексту.

В сообщении анонсирующем Make-a-Video, компания отмечает, что инструменты для создания видео бесценны «для создателей контента и художников». Но, как и в случае с моделями преобразования текста в изображение, есть и тревожные перспективы. Результаты этих инструментов могут быть использованы для дезинформации и пропаганды.

«Плюшевый мишка, рисующий портрет»

В документе, который описывает технические детали модели, авторы разработки рассказывают, как она работает. Make-A-Video обучается на парах изображений и подписей, а также на немаркированных видеоматериалах. Учебный контент получили из двух наборов данных (WebVid-10M и HD-VILA-100M). В них — миллионы видеороликов на сотнях тысяч часов отснятого материала. Там есть и стоковые видеоматериалы, созданные такими сайтами, как Shutterstock и рандомные видео из интернета.

Пока Make-A-Video выводит 16 кадров видео с разрешением 64 на 64 пикселя, которые затем увеличиваются в размере с помощью отдельной модели AI до 768 на 768.

Meta не делала объявлений о том, как или когда Make-A-Video станет общедоступным или кто будет иметь к нему доступ. Компания представила регистрационную форму, которую можно заполнить, если вы заинтересованы в том, чтобы попробовать ее в будущем.

Пожалуйста, оцените статью:
Пока нет голосов
Источник(и):

ХайТек