ИИскусство

"Фу, это нейросетка нарисовала, это ненастоящее искусство!" Конечно, весомый аргумент, и по большому счету верный, но иногда... Короче, решил я освоить эти ваши нейросети (да, я об этом уже писал, и те три человека, которые на меня подписаны, скорее всего знают об этом), а именно генерацию изображений через Стейбыл Дифьюжын.

Когда нужно сделать картинку, на которой будет что-то более или менее соответствующее запросу, то это не так уж и сложно. Но не всё так просто, когда у тебя есть чёткое видение того, как должен выглядеть конечный результат. А у меня как раз так, и мне нужно, чтобы изображение на экране абсолютно соответствовало изображению в моей голове. Художники таких называют "доёбистый заказчик (не отвечать)". Но нейросеть не возмущается, а смиренно принимает все правки, сколько бы их не было. А их у меня обычно туева хуча, причём с самых первых шагов.

Около 50 попыток уходит только на то, чтобы нейронка выдала мне эскиз, в котором все объекты расположены правильно (так, как мне надо, то есть), и который можно было бы взять за основу, постоянно добавляя и меняя выражения как в основном промте, так и в негативном. Далее следует изменение через инпэинт различных элементов типа предметов на фоне, прически, деталей одежды.

И вот изображение уже почти готово, осталось исправить некоторые мелкие детали типа аксессуаров, формы рта, цвета глаз, а так же количества и формы СРАНЫХ ПАЛЬЦЕВ!!!11 которые являются прямо больным местом сгенерированных изображений. Для этого засовываю картинку в графический редактор, дроблю её на элементы, и начинаю корректировать их уже по отдельности. И каждый из них проходит по несколько шагов инпэинта, клинапа, апскейла, и так по кругу, пока результат меня не удовлетворит.

Обычно хватает 5-10 операций, пока дело не доходит до рук и ПАЛЬЦЕВ, да что с вами не так?! Их должно быть 5 (ну, иногда 4, при определенном положении руки), не шесть, не три, а ПЯТЬ! Да, вот в этом месте должен быть ещё мизинец, понимаешь? Нет, большой палец должен быть с другой стороны, это правая рука, видишь в промте ключ (right hand)? И ногти должны быть одинакового цвета, а кольцо должно быть НА пальце, а не ВМЕСТО.

А иногда сложности возникают, откуда не ждёшь. Например, при попытке сгенерировать платье или майку. Проблема в том, что промты пишутся на английском, а в английском платье - это "dress" (одежда), а майка - это "t-shirt" (футболка). Может быть, есть более правильные слова, но май инглиш из бед и огорчений, я не знаю, как объяснить нейронке, что мне нужна майка, которая футболка, но без рукавов. Моих когнитивных способностей хватает только на то, чтобы прописать в промте "футболка", а в негативном промте "рукава". Вроде работает, но не всегда и не со всем.

Когда все детали отредактированны, я снова собираю их в графическом редакторе подобно паззлам, попутно настраивая сглаживания, прозрачности. Теперь сохраняю эту мозаику как один файл и, ура, у меня получилось именно то, что я хотел.

К чему этот пост? К тому, что генерация изображений иногда бывает чуть более сложным делом, чем просто прописывание нескольких фраз в поле промта. И иногда это бывает не рандомное изображение, а реализация вполне конкретного образа из головы автора. Но это, конечно же, не искусство. Как считаешь, юзернейм?

Искусственный интеллект

2.5K поста9.9K подписчика

Добавить пост

Правила сообщества

Здесь вы можете свободно создавать посты по теме Искусственного интеллекта. Добро пожаловать :)


Разрешено:


- Делиться вопросами, мыслями, гипотезами, юмором на эту тему.

- Делиться статьями, понятными большинству аудитории Пикабу.

- Делиться опытом создания моделей машинного обучения.

- Рассказывать, как работает та или иная фиговина в анализе данных.

- Век жить, век учиться.


Запрещено:


I) Невостребованный контент

  I.1) Создавать контент, сложный для понимания. Такие посты уйдут в минуса лишь потому, что большинству неинтересно пробрасывать градиенты в каждом тензоре реккурентной сетки с AdaGrad оптимизатором.

  I.2) Создавать контент на "олбанском языке" / нарочно игнорируя правила РЯ даже в шутку. Это ведет к нечитаемости контента.


II) Нетематический контент

  II.1) Создавать контент, несвязанный с Data Science, математикой, программированием.

  II.2) Создавать контент, входящий в противоречие существующей базе теорем математики. Например, "Земля плоская" или "Любое действительное число представимо в виде дроби двух целых".

  II.3) Создавать контент, входящий в противоречие с правилами Пикабу.


III) Непотребный контент

  III.1) Эротика, порнография (даже с NSFW).

  III.2) Жесть.


За нарушение I - предупреждение

За нарушение II - предупреждение и перемещение поста в общую ленту

За нарушение III - бан