Еще в прошлом году я в свое время подавался в лист ожидания для того чтобы опробовать нейросеть GPT3 для генерации текстов, и спустя достаточно длительное ожидание она попала ко мне в руки, и даже в рабочем проекте мы с ней поэкспериментировали.
И когда Open AI открыли возможность получить доступ к их новой нейросети DALL·E 2 я конечно же воспользовался возможностью и вот на прошлой неделе и она попала мне в руки.
Введение — а что это за DALL·E 2 такая?
Те кто в курсе спокойно пропускайте этот раздел, а те кто увидел этот пост и не имеет контекста о что за дали (он же художник такой, да?) добро пожаловать
Немного про саму нейросеть DALL·E 2 — она создана для генерации изображений на основе пользовательского описания.
https://openai.com/dall-e-2/ — на сайте проекта достаточно подробно и с примерами показывается что эта штука уже может, но я добавлю пару примеров в статью, чтобы у вас как у читателя сразу был некоторый контекст.
Астронавт отдыхающий в тропическом отеле в космосе в фотореалистичном стиле
Тарелка супа которая является порталом в другое измерение как «digital art» («цифровое искусство»)
Астронавт верхом на лошади как карандашный рисунок
Также кроме создания изображений с нуля, данная нейросеть способна модифицировать изображения дорисовывая что-то на них, так и создавать варианты исходного изображения.
Пример создания вариантов из исходного изображения
Пример модификации изображения — нейросеть попросили дорисовать диван
Итак, после того как все мы поняли что же эта штука умеет, настало время проверить это на практике.
Тесты нейросети и интересные результаты
Unreal engine 5 space station background inspired with space games and films
(unreal engine 5 фоновая космическая станция вдохновлённая космическими играми и фильмами)
Этот вариант генерации вышел несколько абстрактным, но в целом неплохо
Viewst team (developers, designers, managers and so on) making coding and sales of they wysiwyg software what helps create animated banners in Leonardo da Vinci styles
Как видно получается неплохо, задумка похожа на стоковые фотографии о командах которые делают свои дизайнерско\разработческие и прочие дела, но вот качество лиц конечно подкачало на «фотореалистичных вариантах»
И также как вы думаю заметите и на некоторых других изображениях нейросеть пытается в текст, и насколько помню из тестов других людей он для самой сети может что-то значить
Теперь перейдем к другим стилям
Realistic oil painting of Doggy in medieval armor with viewst chameleon logo on shield fighting with dragon of low sales
(Реалистичная масляная живопись изображающую Догги в средневековой броне с Viewst логотипом хамелеоном на щите сражающейся с драконом низких цен)
А вот это уже весьма круто выглядит и более чем соответствует запросу — не считая отсутствия дракона низких цен :)
Photo of cosplayers with costumes from games, films, anime before they go on stage to show whey work and performance
(Фото косплееров с костюмами по играм, фильмам и аниме перед тем как они выйдут на сцену показать свою работу и выступление)
Опять мы видим проблему с лицами людей (и любовь по всей видимости к аниме у нейросети :) )
А теперь попробуем поменять стиль для такого запроса
Digital art of cosplayers with costumes from games, films, anime before they go on stage to show whey work and performance
И так как я уперся в лимит для одного поста, то остальные кусочки уже опубликую отдельными частями:
- Часть 2
- Часть 3
- Часть 4