На данный момент это лучшее решение в сегменте text-to-video. Нейронка способна создавать сложные сцены с несколькими персонажами, определенными типами движения и точными деталями объекта и фона. Модель понимает не только то, что пользователь запросил в командной строке, но и то, как эти вещи существуют в физическом мире.
- необыкновенное качество, модель просто обходит всех конкурентов в этом сегменте
- отличное понимание анатомии, никаких 6 пальцев и рук из неоткуда
- удалось найти золотую середину между качеством и уникальностью результатов. Например, можно создать видео с экзотическими рыбами в стиле документальных фильмов BBC.
😒 теперь по минусам:
- точная дата выпуска модели остаётся неопределённой, так как предстоит провести ряд тестирований для предотвращения создания дипфейков и прочих проблем.
- в модели предусмотрено два уровня цензурных фильтров.
- все видео выглядят эстетически привлекательными и стильными, но возникает вопрос, не приведёт ли это к ситуации, аналогичной MidJourney, где все работы выделялись характерным узнаваемым стилем.
Только посмотрите на эти видео:
Заценить возможности Sora и подать заявку на доступ можно тут: https://openai.com/sora#research
Подписаться на тг-канал, чтобы быть в курсе новостей и всяких ии-полезностей можно тут: https://t.me/robot_fleksa