Нейросеть Pix2pix реалистично расцвечивает скетчи и фотографии⁠⁠

По образцу систем автоматического перевода текстов, разработчики из лаборатории Berkeley AI Research (BAIR) Калифорнийского университета в Беркли создали приложение для автоматической трансляции изображений из одного представления в другое. Например, из чёрно-белого наброска в полноцветную картинку.

Четыре примера работы программы, код которой опубликован в открытом доступе. Слева показаны исходные изображения, справа — результат автоматической обработки

Авторы научной работы пишут, что большинство проблем, которые возникают при трансляции изображений, связаны с трансляцией или «многие к одному» (компьютерное зрение — трансляция фотографий в семантические карты, сегменты, границы объектов и т.д.), или «один ко многим» (компьютерная графика — трансляция меток или входных данных от пользователя в реалистичных изображения). Традиционно каждая из этих задач выполняется отдельным специализированным приложением. В своей работе авторы попытались создать единый универсальный фреймворк для всех таких проблем. И у них получилось.

Влияние различных функций потери на результат

Разработчики использовали для поставленной задачи условные генеративные состязательные сети (cGAN), то есть GAN с условным параметром. Так же как GAN усваивает генеративную модель данных, cGAN усваивает генеративную модель по определённому условию, что делает её пригодной для трансляции изображений «один в один».

Трансляция карандашных набросков в реалистичные фотографии. Слева карандашный рисунок, в центре оригинал, а справа сгенерированное изображение

Как и в других генеративных сетях, в этой GAN нейросети воюют между собой. Одна из них (генератор) пытается создать фальшивое изображение, чтобы обмануть другую (дискриминатор). Со временем генератор обучается всё лучше обманывать дискриминатор, то есть генерирвоать более реалистичные изображения. В отличие от обычных GAN, в Pix2Pix одновременно и дискриминатор, и генератор имеют доступ к исходному изображению.

Ну и наконец, в демо-режиме это можно попробовать по ссылке в комментах.

kro7777777

Designforfood

iKotina

Крипово чет

раскрыть ветку

DELETED

работает )

go1em

На самом деле, не обязательно ограничиваться котами. Сервис даёт широкий простор фантазии для рисования различных более или менее реалистичных монстриков. Детали у них, конечно, будут кошачьи, но это только добавляет им милоты :) Рейтинг не позволяет добавить картинки в комментарий, потому вставлю ссылку на то, что у меня получилось: https://www.evernote.com/shard/s226/sh/7a40b919-d9cf-4a46-aa8b-2e6bf24ecfd5/23029cbf4f6801b639f90aa16e536df4