6

Tencent выкатили нейронку, которая из одного фото генерирует целый 3D-мир

🤯 Tencent выкатили нейронку, которая из одного фото генерирует целый 3D-мир

Это HunyuanWorld-Voyager.
В отличие от аналогов, эта штука отдает на выходе не только RGB-картинку, но и полноценную карту глубины (RGB-D). На практике это значит, что сгенерированное видео можно без танцев с бубном превратить в настоящую 3D-сцену, например, через Gaussian Splatting.

Порог входа, конечно, конский — для запуска нужно минимум 60 ГБ видеопамяти. Но сам факт, что инструмент такого уровня теперь в open-source, — это прикольно.

Разобрал, как это работает и как запустить у себя (если у вас есть доступ к A100 😉) :
👉🏻 Tencent HunyuanWorld-Voyager: создаем 3D-миры из одного фото. Разбор технологии и гайд по запуску

А видеопересказ тут 👈🏻

#щупаем_сорцы