Ответ на пост «Обложка книги: нейросеть vs человек»
Disclaimer: я сам ничего не знаю и не умею, делаю все неправильно, но делаю это так.
Пробую запрос [snake and bird --ar 2:3]. Здесь пишу в квадратных скобках, чтоб было видно начало и конец запроса. Для нейросети скобки, естественно, не использую. В моем запросе --ar - это aspect ratio, по-русски - соотношение сторон. Поскольку речь идет об обложке книги, осмелюсь предположить, что нужна обложка с портретным расположением рисунка (у меня x:y == 2:3). Отправляю запрос, получаю результат (см. рис.1):
Понимаю, что 1) полноцвет вредит обложке, и что 2) ИИ скрещивает ежа с ужом практически в буквальном смысле слова, поэтому нужно зафиксировать каждую тварь на рисунке. И еще похоже, что 3) для более достоверного рисунка надо указать ИИ больше достоверных подробностей как то вид змеи, дерева и птицы. Трансформирую запрос таким образом:
[On a branch of a withered tree lies a cobra snake next to a bird near the nest painting pencil drawing realism high detailed --ar 2:3].
То есть, я указал ИИ, что в кадре должна быть ветка, на которой висит/стоит/сидит/лежит конкретная змея кобра рядом с которой непонятно что делающая непонятно какая птица возле непонятно где находящегося какого-то типа непонятной формы гнезда и все это изобразить как можно реалистичнее и в виде карандашного рисунка. Результат на рисунке 2:
Да, это не фонтан, но с этим можно начинать работать. На рисунках 3 и 4 изображены апскейл (проработка деталей) первого кадра рис.2 и апскейл одной из вариаций того же кадра.
Это уже начинает напоминать обложку. Дале следует ее лишь доработать.
Один немаловажный момент: все эти рисунки я генерил на старой, третьей версии Midjourney. Она ну очень бестолковая, поэтому еще до генерации я был практически уверен, что нейросеть забудет о гнезде. Сейчас пользователям предоставлен доступ к версии 4c (или 4d?), и там ИИ гораздо лучше предугадывает пожелания пользователя и аккуратнее следит за деталями, поэтому в настоящей Midjourney рисунки наверняка получились бы гораздо лучше, чем то, что показал я.
И еще. Если на обложке Вашей книги изобразить нечто, похожее на рис.1, я уверен, тираж будет мгновенно распродан. Осталось лишь придумать название для нового романа, а с ChatGPT как-нибудь уже договоритесь, там сеть понимает русский язык. :)
Обложка книги: нейросеть vs человек
Новая книга — новая обложка. И в этот раз я решила воспользоваться услугами Midjourney. Возможно, главную роль сыграло отсутствие опыта, но у меня ничего не вышло.
Змея и птица. Ожидание: змея и птица. Реальность: змея с птичьей головой)
Птица, круженная клубками змей = птица в гнезде из шнурков)
К сожалению, не сохранила результаты. Бесплатные попытки кончились, и с досады я все позакрывала. Но было весело. Особенно сам процесс работы нейросети, когда из облака красок начинает вырисовываться картина.
В общем, до этого момента мне казалось, нейросетки могут ВСЁ. Думаю, у художников еще долго хлеб будет с маслом.
Но обложка то все равно нужна. Пришлось рисовать самой. Вот она:
Если у кого получится нейросеткой сделать что-то похожее, то напишите, пожалуйста, об этом. Не в корыстных целях, правда интересно. Ощущение, если ей подавать два объекта, она делает с ними вот это:
Нечто убивает детей
Фан арт на комикс «Нечто убивает детей»
Фан арт на комикс «Нечто убивает детей»
Midjourney не всесильна!
Как говорится – не все коту масленица. Я на собственном опыте убедился, что нейросеть на данном этапе неидеально рисует нестандартные вещи. То, что редко встречается в запросах пользователей. Неважно рисует технику, особенно выдуманную. Города, которые никто и никогда не видел и которые существуют только в воображении автора. В качестве источника для образов и запросов я выбрал как всегда свою книгу.
Для начала мне захотелось, чтобы нейросеть нарисовала мне планету пережившую глобальный катаклизм. У планеты отсутствует северное полушарие. Вместе него хаос из астероидов. Южное осталось целым. Сохраняется (благодаря определенной технологии) атмосфера и жизнь. По линии разлома стена из черных и неприступных гор. Миссия для нейросети невыполнимая. Получив превью, я не стал больше ее мучать. Стоит заметить, что картинки вышли довольно-таки интересные, но сути они не смогли передать.
С самой черной стеной вышло лучше. Первое превью получилось красивым, но мне хотелось, чтобы горы не прерывались. Чтобы не было между ними прохода.
Возможно стоило запросить некоторые изображения из первого превью в более высоком разрешении. Увы, мне не хотелось понапрасну тратить бесплатные попытки, не добившись желаемого результата.
Во втором превью стали проглядываться желаемые очертания.
Я запросил вариации четвертой картинки.
Почти то, что нужно. Не хватает натуралистичности первого превью. Горы кажутся излишне искусственными.
Хотя в тут у меня во-второй раз закралось подозрение, что нейросеть читала мою книгу. В моей истории горная цепь, тянущаяся по всему экватору не естественного, а искусственного происхождения. Будем считать, что результат меня устроил.
Двигаемся далее. В очередном запросе я сделал краткое описания города инженеров, исследователей и изобретателей. Город Микея расположен на острове, парящем в небе, среди облаков. Слово стимпанк так же использовал в качестве ключевого.
Результат меня озадачил. С одной стороны здания меня впечатлили и порадовали. С другой, до полного и окончательного удовлетворения мне не хватало общей панорамы города. Видов улиц. Идущих по ним людей и человекоподобных, паровых роботов. Не хватало солнечного света. Быть может я слишком требователен?
А может стоит работать дальше. Ведь одной картинкой не отобразишь огромный город. Здесь еще не хватает самых разнообразных паровых машин и механизмов. Однако не стоит забывать о том, что на данном этапе нейросеть пока плохо рисует нестандартную технику.
Вот эта картинка наиболее точно отображает мое представление о городе. Я бы добавил только больше просторных окон. Да и верхняя часть здания выглядит половинчатой. Так, словно у него имеется только одна стена.
Ну и напоследок то, что у меня вызвало недоумение и раздражение больше всего. Я хотел, чтобы нейросеть нарисовала пиратские бипланы.
Казалось бы, в результате получилось все красиво и выразительно. Но… Как так? Неужели нейросеть не знает, как нарисовать винт у самолета? Одна лопасть здесь, другая там. Третья вообще фиг знает где.
Обратите внимание на пилота с третьей картинки. Что-то интересное в нем есть. Я определенно запомню и использую этот образ.На некоторых картинках нейросеть явно перемудрила с фюзеляжем, кабиной, колесами.
На следующем превью так же много огрехов. Винты, колесо, висящее в воздухе и в человеке, двойной фюзеляж. При моих навыках в фотошопе, опускаются руки и не хочется что-либо исправлять, тратить тучу времени.
Четвертая картинка кому-то очень зашла. Пользователь запросил увеличенный вариант, чем упростил мне задачу. И да, с глазами у него что-то явно не так. на превью он смотре прямо.
В следующем превью прям целый набор персонажей. Только вот что случилось с человеком на второй картинке? Это у него такие усы-воротник? Или в тайных чертогах нейросети пробежал таракан?
Zheka Kennedy ART (SELENA)
Zheka Kennedy ART (SELENA)
Обложка для детской книги!!
Новая книга!! Как думаете , кто этот пирог состряпал?