Как на основе фотографий нейросети создают видео
Полагаю, за последние пару лет на глаза многим попадались примеры того, как нейронные сети заставляли людей двигаться на фотографиях. Это было довольно забавно, но на таких "видео" было довольно много артефактов, да и толку от них было не особо. Но развитие на месте не стоит и нейросети научились буквально дорисовывать целые кадры на видео. К примеру как в данном случае.
Может возникнуть вопрос, к примеру, чем такая сеть отличается от той же DLSS созданной компанией NVidia и похожих сетей? Которые тоже повышают частоту кадров, делают изображение чётче и так далее. Почему бы не скормить таким нейросетям точно так же набор фотографий? Разница как раз в том, что существующие нейросети именно повышают качество изображения в реальном времени. Берут видео низкого разрешения и достраивают его до высокого. И прирост частоты происходит именно за счёт того, что видео низкого разрешения проще отобразить. Но эти сети не дорисовывают недостающие кадры.
Данная разработка была представлена учёными из Германии и её цель именно в полноценном создании промежуточных кадров. Данная сеть с нуля дорисовывает недостающие кадры, с учётом сдвига камеры и теней, с учётом изменения освещения и прочих нюансов. Она полностью "додумывает" как должны выглядеть эти кадры. На этом видео я более подробно рассказал о том, как подобная сеть работает.
Может возникнуть вопрос - а зачем вообще эта сеть нужна? Самый простой вариант - для повышения качества и плавности старых фильмов, за счёт дорисовывания недостающих кадров. Но если говорить о чуть более интересных вещах - что бы нейросеть смогла дорисовывать эти кадры, она на фотографиях прежде всего должна определить границы объектов. Трёхмерные границы. И высчитывается это всё исключительно на основание фотографий. Так что подобные нейросети на сегодняшний день разрабатывают в том числе для того, что бы строить 3д модели по фотографиям. Сейчас они ещё довольно громоздки и требуют больших вычислительных ресурсов. Но данное направление развивается очень быстро и, вполне возможно, скоро их можно будет спокойно использовать вместо лидаров. И вам будет достаточно иметь на руках простой смартфон, что бы построить 3д модель своей комнаты, к примеру. А там уже недалеко и до полноценных дешёвых систем жестового управления и дополненной реальности.
