Спасибо! Ваша заявка успешно отправлена.
Наш менеджер свяжется с Вами в ближайшее время для уточнения всех деталей заявки.
Наш менеджер свяжется с Вами в ближайшее время для уточнения всех деталей заявки.
Корпорация Google представила собственные технологии машинного обучения, позволяющей на основе текстового описания создавать видео. Первая модель рассчитана на короткое описание и небольшой ролик, а вторая на более развернутый текст и видео к нему. Ранее схожу технологию представители и в компании Meta*.
Ранее нейросети обладали возможностями только совершенствования визуализированных изображений, в первую очередь фото. В дальнейшем они научились создавать новые картинки, например, у NVIDIA нейросети рисовали образы реально не существующих людей.
Создание изображений на основе текста стало новым трендом в отрасли, впервые реализовать его удалось в 2021-м году представителям OpenAl с их нейросетью DALL-E. На основе короткого текста система могла нарисовать пейзаж, животных или полноценную стену. В начале текущего года компания Google предложила собственный аналог подобной нейросети, получивший название Imagen.
Добившись этого успеха, разработчики приступили к попыткам обучения нейросети создавать на базе текстовых запросов видео. Пионером в этом направлении стала китайская компания CogVideo, но качество работы ее сервиса оставляет желать лучшего. Куда качественней результаты корпораций Meta* и Google. Разработчики последней предложили две модели – Imagen Video и Phenaki.
Алгоритм Make-A-Video от Meta* опирается на модель text-to-image, при которой текст трансформируется в векторное представление информации в сжатом формате, переносимое в дальнейшем в изображение в двухмерной плоскости.
Применение данной диффузионной модели позволяет в результате комплекса мероприятий получать на выходе видео продолжительностью не больше нескольких секунд, обладающее разрешением 768х768 пикселей.
В целом данная технология генерация видео продемонстрировала большую эффективность, чем предложенные решения от разработчиков CogVideo. Алгоритм обеспечивает не только создание видео «с нуля», но и возможность «оживления» уже готовых изображений.
Представители Google несколько уступили по срокам презентации конкурентам из Meta*, но представили сразу два алгоритма. Модель Imagen Video построена на базе технологии text-to-image, не имеющей принципиальных отличий от описанной выше Make-A-Video. На основе нескольких трансформаций текста удается получить короткое видео продолжительностью не более 5,3 секунды, но при этом максимальное разрешение выросло до 1280х768 пикселей.
Для обучения Imagen Video в компании Google применяли свой dataset, объединяющий около 14 миллионов связок текстового описания и видео. Число связок текста и изображения, использованных в процессе обучения, превысило 60 миллионов вариантов.
Второй проект под именем Phenaki изначально адаптирован под более длительные ролики, но и требует больше информации в текстовом описании. Разработчики отмечают возможность создания видео на две-три минуты, в то время как с точки зрения теории ограничений по длине записи не существует. В основе разработки лежит нейросеть ViViT. За длину ролика разработчикам пришлось пожертвовать качеством картинки, имеющей скромное разрешение в 128х128 пикселей.
В целом за последние несколько месяцев разработчики нейросетей смогли пройти значительный путь и добиться успехов в процессе создания нового видео, опираясь на текстовое описание. Вместе с этим в открытом доступе разработки пока отсутствуют из-за боязни их применения не по назначению.
Стоит отметить, что нейросети сегодня учат различным функциям. Например, весной была представлена разработка канадских программистов, позволяющая применять машинное обучение для поиска ошибок в компьютерных играх.
Корпорация Meta включена Росфинмониторингом в перечень компаний террористов и экстремистов, запрещена на территории РФ.
Спасибо! Ваша заявка успешно отправлена.
Наш менеджер свяжется с Вами в ближайшее время для уточнения всех деталей заявки.
Наш менеджер свяжется с Вами в ближайшее время для уточнения всех деталей заявки.
Спасибо! Ваша заявка успешно отправлена.
Наш менеджер свяжется с Вами в ближайшее время для уточнения всех деталей заявки.
Наш менеджер свяжется с Вами в ближайшее время для уточнения всех деталей заявки.