Tencent выкатили нейронку, которая из одного фото генерирует целый 3D-мир
🤯 Tencent выкатили нейронку, которая из одного фото генерирует целый 3D-мир
Это HunyuanWorld-Voyager.
В отличие от аналогов, эта штука отдает на выходе не только RGB-картинку, но и полноценную карту глубины (RGB-D). На практике это значит, что сгенерированное видео можно без танцев с бубном превратить в настоящую 3D-сцену, например, через Gaussian Splatting.
Порог входа, конечно, конский — для запуска нужно минимум 60 ГБ видеопамяти. Но сам факт, что инструмент такого уровня теперь в open-source, — это прикольно.
Разобрал, как это работает и как запустить у себя (если у вас есть доступ к A100 😉) :
👉🏻 Tencent HunyuanWorld-Voyager: создаем 3D-миры из одного фото. Разбор технологии и гайд по запуску
А видеопересказ тут 👈🏻
#щупаем_сорцы