Qwen 2,5
2 поста
2 поста
Продолжаю выкладывать фото того, что делаю в свободное от основной работы время. ( часть 1, часть 2 ). Работа пока не закончена, но уже что то начало получаться. Решил поделится процессом.
Если что, это декоративная штука для интерьера, аналог распространенных вязанных салфеток.
Обратил внимание, что за все 11 лет, я ничего не купил по рекламным ссылкам, постам, баннерам тут. Только смотрел, если что то совсем необычное.
Рисовать модельки (концепции) домиков интересно и захватывающе. Когда из хаотичного и поверхностного описания потребностей, полученного от заказчика - в голове а затем и на ПК/бумаге рождается концепт, учитывающий все хотелки и в добавок красивый - это почти оргазм.
9,5 из десяти концепций идут в корзину. 9,5 - потому что от одной оставшейся половина переделывается для экономии или просто потому что. И это очень обидно. Реализацию концепции такой как её придумал архитектор - могут увидеть лишь избранные из избранных.
Для того чтобы работать по этой профессии нужно знать ОЧЕНЬ много. Знания только профессии "архитектура" недостаточно даже чтобы в живую а не в 3д построить туалет типа сортир. Нужны знания по инженерным сетям, конструкциям, физике, психологии и социологии, климатологии, геодезии, юриспруденции и так далее..
Обширные знания в разных областях не гарантируют реализацию "идеального здания" из концепции, лишь делают шансы на реализацию больше 0, но никак не 100%
Архитектора многие пытаются использовать как дизайнера. Мы это можем - обучение архитектора включает в себя дизайн (так как не зная что внутри, функциональных особенностей интерьеров, не соберёшь из комнат дом). Но дизайн это скучно и нервно (заказчики дизайна как правило очень капризны), поэтому многие отказываются.
Работа архитектора - это на 80% или больше - работа с людьми: согласования, выставки и конференции, конкурсы, получения заданий и корректировки, увязывание архитектуры с конструктивом, электрикой, сантехникой, вентиляцией и так далее. Не для интровертов.
На сегодняшний день творческая составляющая профессии архитектора в РФ - практически полностью отсутствует. Со стороны законодательства жёсткие ограничения везде - от генплана до расположения розеток в комнатах. Со стороны ПО - очень многие задачи шаблонны и сильно автоматизированы, просто складываем "кубики", чертим узлы и оформляем ПД, работа в основном механическая и административная.
Для третьей части выбирал тему и решил остановиться на самой банальной, итак:
А-а-а-автомобиль.
Ну, так как я люблю стимпанк, и большинство неросеток на стимпанке показывают все свои изъяны, эта тема очень показательна. Очень часто соединительные трубки приходят не туда (или вобще вникуда), шестерёнки кривые и пересекаются под произвольными углами, свет и пар отрисовываются кое-как, а ровные плоскости сливаются с деталями в одной каше.
В этот раз я не буду рассказывать о генерации промптов, это было в предыдущей, здесь будет побольше картинок.
Итак, первая. Кинематографический стиль (неожиданно обрезаны верх и низ), с трубами всё ок, пар идёт почти откуда надо, только присуствует непонятная конструкция за пассажирским диваном, но неплохо.
Вторая. Явная отсылка к фильму "лига выдающихся джентельменов", только в чёрном цвете..


19й век+стимпанк
3. Эта прям удачно получилась. приятно рассматривать детали. Фары как настоящие. Трубы. Датчики со стрелочками и отличный фон. Жаль только 2 фары смотрят не туда. Специфика длинных промптов - вылезают артефакты как и в прошлом посте.


19й век+стимпанк, очень длинный промпт ,артефакты
4. Это уже что то похожее на ретро Caterham. "Мотоциклетная" фара спереди придаёт особый шарм.
5. Особо удачная версия в плане детализации и фотографической точности по части передачи эффектов искажения объектива и очень правдоподобного фона.




9й век+стимпанк
6. Просто стимпанк, промпт без указания временного отрезка, что значительно сказалось на картинке. Обратите внимание, трубы и шестерёнки вполне нормально установлены на транспортном средстве, нет никаких невыполнимых технических решений )
7. Получилось нечто из вселенной безумного макса. Посмотрите, какой свет, какая композиция, как хорошо получилась покраска. Единственное не понравилось, труба от котельной, которая кажется частью фона, но явно "склеена" с основным объектом. Нейросетя пыталась сделать её частью автомобиля, но не справилась.



детальный промпт авто в стиле стимпанк
8. И на последок такое вот авто-недоразумение. Главное всё вполне логично с технической точки зрения.
Подводя итог - На мой взгляд Qwen-2,5, со стимпанком справилась, процентов на 80 точно.
Продолжаю изучать возможности китайской нейросети Qwen 2,5 max. Тут 1 часть
Провёл тест генерации на робо-лицах. Получилось очень даже неплохо.
Промпт генерировал через deepseek.
Ниже под картинкой простой способ достичь такого результата и сравнение пары вариантов.
Для генерации я использовал 2 варианта, с длинным промптом и коротким
Естественно, оба текста для теста я не стал долго и мучительно выдумывать, а поручил эту задачу DeepSeek, которая сейчас так популярна (и между прочем, заслужено, но это отдельная тема). Я просто попросил сгенерировать промпт на английском языке для генерации картинки с искомым содержимым (режим R1 лучше включить). В итоге получил короткий текст, который скормил уже Qwen-2,5 max. В итоге получил следующие варианты, далее 3 примера:



Генерация с коротким промптом
Детализация на высоте, есть из чего выбрать:


Детали (короткий промпт)
Но, не смотря на неплохой результат, я решил всё таки раскрыть все возможности Qwen и попросил DeepSeek уточнить промпт, добавив в него деталей, увеличить длинну, и сделать акцент на резкости. То что получилось в итоге видно на 1 картинке в посте, а также на следующих:



Генерация с длинным промптом
Изображение стало более живым, не потеряв при этом в уровне детализации:



Детали (длинный промпт)
Однако, появились и артефакты:
Резюмируя, можно сказать, что лучше использовать в Qwen промпт подлиннее, хотя и с коротким тоже неплохо получается. Если проанализировать те тесты, которые остались за пределами этого поста - при генерации с длинным промптом картика становится очень шаблонной, сцена почти не меняются, ракурс практически всегда один и тот-же, меняются в основном детали. То есть при длинном промпте у ИИ отключается фантазия.