Meta впервые представила свой генератор искусственного интеллекта для преобразования текста в видео

Компьютерные новости и новости технологий на Game-Zoom

Марк Цукерберг дал пользователям представление о новом искусственном интеллекте Meta под названием Make-A-Video, который позволяет создавать видеоролики из текстовых описаний. Создание изображений с помощью ИИ уже чрезвычайно впечатляет, позволяя создавать красивые портреты, пейзажи и другие произведения искусства с помощью только описательного текста. Meta раздвигает границы с помощью ИИ и предлагает нечто еще более впечатляющее — генерацию текста в видео с помощью ИИ.

Генерация изображений ИИ из текстовых описаний существует уже некоторое время, и с помощью таких инструментов, как DALL-E, Midjourney и других, есть несколько вариантов создания изображений из текста. Создание видео из текстовых описаний было следующим логическим шагом в создании ИИ, и Meta, возможно, представила свой ИИ Make-A-Video.

Так что же представляет собой эта новая система искусственного интеллекта Make-A-Video от Meta и как она соотносится с точки зрения качества и простоты использования? Что ж, судя по видео, опубликованным до сих пор, кажется, что это довольно далеко и очень похоже на то, что DALL-E и другие генераторы искусства AI могли бы предложить, если бы они создавали видео. Это ни в коем случае не идеально, и некоторые видео выглядят лучше, чем другие, но в целом результаты весьма впечатляющие. Make-A-Video может использовать предыдущие неподвижные изображения и группы изображений для создания видео и даже может использовать видео для создания вариаций этих видео. Сообщение Марка Цукерберга в Facebook о Make-A-Video дает нам представление о том, чего ожидать от нового ИИ.

Преобразование текста в видео с искусственным интеллектом сложно

Как объясняет Цукерберг в своем посте: «Создавать видео намного сложнее, чем фотографии, потому что помимо правильного создания каждого пикселя, система также должна предсказывать, как они будут меняться с течением времени». Это имеет смысл, поскольку при создании движения задействовано больше факторов, чем при создании неподвижного изображения. Meta использует слой неконтролируемого обучения, чтобы помочь решить эту проблему, что облегчает системе понимание движения. Однако неконтролируемое обучение может привести к неправильному использованию программного обеспечения, например к порнографии, насилию или расизму. Как только этот инструмент станет общедоступным, Meta, вероятно, запретит определенные фразы и слова, чтобы предотвратить неправильное использование своего ИИ.

Генерация изображений с помощью ИИ уже чрезвычайно мощна и может создавать удивительные произведения искусства или просто забавные мемы, но с созданием видео с помощью ИИ перед пользователями открывается больше творческих возможностей. Возможно, однажды мы сможем создать целый фильм только с текстовыми описаниями и продвинутым искусственным интеллектом. До тех пор. Технология Make-A-Video компании Meta — важный шаг к этому будущему.

Последнее обновление 02.10.2022