Нейросети: Побродить внутри видео
Товарищи из Хуачжунского университета науки и технологии (Huazhong University of Science and Technology) представили концепт нейросети на основе 4D Gaussian Splatting, позволяющую как бы передвигаться внутри видео - вращать и двигать камеру, меня точку обзора.
За основу взят уже известная Nerf и зарекомендовавший себя быстрый 3D Gaussian Splatting (для статичных сцен).
На следующем видео представлен пример выдаваемый нейросетью, с плавающей камерой.
По заверениям разработчиков, нейросеть на RTX 3090 может создавать картинку разрешением 800х800 с скоростью 70 FPS . Этого может показаться очень мало, но у "конкурентов" скорость сильно меньше, а также отстает качество, да и нейросети пожирнее.
Для тренировки нейросети требуется значимое количество видео с разных ракурсов (скажем, 10-20).
Пока это только концепт, и он не представляет ничего более как "смотри как я могу" на примере короткого видео.
Но если данное направление сможет получить достаточно развитие, то возможно, на ютубе мы сможем не просто вертеть камеру в центре статичной сферы (видео с 360 панорамой), но и получить небольшую свободу "передвижения" внутри видео и эффект стерео-зрения. VR шлемы получат еще одно применение. Например, поприсутствовать на концерте летая по залу.
Ссылка на публикацию https://arxiv.org/abs/2310.08528
Ссылка на страницу проекта (ОСТОРОЖНО, куча видео грузится одновременно!) https://guanjunwu.github.io/4dgs/
P.S. Немного про то как выглядит результат 3D Gaussian Splatting (для статичных сцен). "4D версия" будет в чем-то похожа, просто в кадре будет движение. Видео все равно на английском, так что "полистайте". Да-да, если вы вспомнили про фотограмметрию, вы восхитительны.
P.S.S. Порно-индустрия... ну вы поняли.
Искусственный интеллект
2.4K постов9.7K подписчиков
Правила сообщества
Здесь вы можете свободно создавать посты по теме Искусственного интеллекта. Добро пожаловать :)
Разрешено:
- Делиться вопросами, мыслями, гипотезами, юмором на эту тему.
- Делиться статьями, понятными большинству аудитории Пикабу.
- Делиться опытом создания моделей машинного обучения.
- Рассказывать, как работает та или иная фиговина в анализе данных.
- Век жить, век учиться.
Запрещено:
I) Невостребованный контент
I.1) Создавать контент, сложный для понимания. Такие посты уйдут в минуса лишь потому, что большинству неинтересно пробрасывать градиенты в каждом тензоре реккурентной сетки с AdaGrad оптимизатором.
I.2) Создавать контент на "олбанском языке" / нарочно игнорируя правила РЯ даже в шутку. Это ведет к нечитаемости контента.
II) Нетематический контент
II.1) Создавать контент, несвязанный с Data Science, математикой, программированием.
II.2) Создавать контент, входящий в противоречие существующей базе теорем математики. Например, "Земля плоская" или "Любое действительное число представимо в виде дроби двух целых".
II.3) Создавать контент, входящий в противоречие с правилами Пикабу.
III) Непотребный контент
III.1) Эротика, порнография (даже с NSFW).
III.2) Жесть.
За нарушение I - предупреждение
За нарушение II - предупреждение и перемещение поста в общую ленту
За нарушение III - бан