Нейросеть Pix2pix реалистично расцвечивает скетчи и фотографии

Нейросеть Pix2pix реалистично расцвечивает скетчи и фотографии Длиннопост, Нейронные сети, Pix2pix, Обработка, Технологии

По образцу систем автоматического перевода текстов, разработчики из лаборатории Berkeley AI Research (BAIR) Калифорнийского университета в Беркли создали приложение для автоматической трансляции изображений из одного представления в другое. Например, из чёрно-белого наброска в полноцветную картинку.

Нейросеть Pix2pix реалистично расцвечивает скетчи и фотографии Длиннопост, Нейронные сети, Pix2pix, Обработка, Технологии

Четыре примера работы программы, код которой опубликован в открытом доступе. Слева показаны исходные изображения, справа — результат автоматической обработки


Авторы научной работы пишут, что большинство проблем, которые возникают при трансляции изображений, связаны с трансляцией или «многие к одному» (компьютерное зрение — трансляция фотографий в семантические карты, сегменты, границы объектов и т.д.), или «один ко многим» (компьютерная графика — трансляция меток или входных данных от пользователя в реалистичных изображения). Традиционно каждая из этих задач выполняется отдельным специализированным приложением. В своей работе авторы попытались создать единый универсальный фреймворк для всех таких проблем. И у них получилось.

Нейросеть Pix2pix реалистично расцвечивает скетчи и фотографии Длиннопост, Нейронные сети, Pix2pix, Обработка, Технологии

Влияние различных функций потери на результат


Разработчики использовали для поставленной задачи условные генеративные состязательные сети (cGAN), то есть GAN с условным параметром. Так же как GAN усваивает генеративную модель данных, cGAN усваивает генеративную модель по определённому условию, что делает её пригодной для трансляции изображений «один в один».

Нейросеть Pix2pix реалистично расцвечивает скетчи и фотографии Длиннопост, Нейронные сети, Pix2pix, Обработка, Технологии

Трансляция карандашных набросков в реалистичные фотографии. Слева карандашный рисунок, в центре оригинал, а справа сгенерированное изображение


Как и в других генеративных сетях, в этой GAN нейросети воюют между собой. Одна из них (генератор) пытается создать фальшивое изображение, чтобы обмануть другую (дискриминатор). Со временем генератор обучается всё лучше обманывать дискриминатор, то есть генерирвоать более реалистичные изображения. В отличие от обычных GAN, в Pix2Pix одновременно и дискриминатор, и генератор имеют доступ к исходному изображению.

Нейросеть Pix2pix реалистично расцвечивает скетчи и фотографии Длиннопост, Нейронные сети, Pix2pix, Обработка, Технологии

Ну и наконец, в демо-режиме это можно попробовать по ссылке в комментах.

2
Автор поста оценил этот комментарий
Иллюстрация к комментарию
2
Автор поста оценил этот комментарий
Иллюстрация к комментарию
Иллюстрация к комментарию
2
Автор поста оценил этот комментарий
Крипово чет
Иллюстрация к комментарию
раскрыть ветку
2
DELETED
Автор поста оценил этот комментарий

работает )

Иллюстрация к комментарию
раскрыть ветку
2
Автор поста оценил этот комментарий

На самом деле, не обязательно ограничиваться котами. Сервис даёт широкий простор фантазии для рисования различных более или менее реалистичных монстриков. Детали у них, конечно, будут кошачьи, но это только добавляет им милоты :) Рейтинг не позволяет добавить картинки в комментарий, потому вставлю ссылку на то, что у меня получилось: https://www.evernote.com/shard/s226/sh/7a40b919-d9cf-4a46-aa8b-2e6bf24ecfd5/23029cbf4f6801b639f90aa16e536df4

раскрыть ветку