ShatalinArt

ShatalinArt

Пикабушник
267 рейтинг 16 подписчиков 11 подписок 11 постов 2 в горячем
5

Гайд: как превратить любой фильм в интерактивную книгу

Отправиться в приключение по сюжету любимого фильма и направить главных героев другим путем. А может отыграть партию за отрицательного героя? Или сделать так, чтобы главный герой бросил свою пассию и сошелся с более подходящей ему по характеру второстепенной героиней, которая и вывезла весь фильм на своей харизме третьего размера?

Или запустить героя из одного фильма в мир из другого фильма?

Покажу как это сделать на примере.

Воплотим в реальность один старый кайфовый мем про Блейда в сериале Сумерки.

Для начала нам необходимо создать описание героя. В нашем случае это Блейд.

Идем на сайт Lmarena, где предоставляется бесплатный доступ к топовым нейромоделям.

В левом меню выбираем Side by Side, чтобы получить ответ сразу от двух нейромоделей и выбрать тот, который понравится больше. Советую модели: Gemini Pro 2.5 и Claude Sonet 4.5

Копируем промпт заготовку для создания описания с помощью нейросети:

Дай описание персонажа, словно это карточка персонажа в игре, все слова пиши на русском языке. Персонаж: Блейд. Пиши текст без таблиц, без сносок, без ссылок и без урл, а само повествование в абзацах, 6-7 полных абзаца: описания, характеристики, характер, чем знаменит персонаж, где участвовал, поведение, как одевается, что любит, что не любит, какие заслуги и т.п. Необходимо получить полный детальный портрет персонажа. Можно добавлять кинематографические описания. В описании всегда употребляй имя Блейд

Жмет кнопку - отправки сообщения.

Жмет кнопку - отправки сообщения.

Нейросети выдадут нам два варианта:

Копируем любое описание или можно взять часть из одного текста, часть из другого. Полученный текст куда-нибудь скопируйте (в текстовый документ, ворд, не важно, просто сохраните текст).

Описание героя у нас готово.

Теперь создадим описание сериала Сумерки.

Можно сразу в том же чате на Lmarena. В чат вбейте это задание-промпт:

Напиши гайд по этому шаблону. Название мира: Мир из сериала Сумерки

Шаблон:

НАЗВАНИЕ_МИРА

Пиши текст словно ты опытный путешественник и гид по миру «<НАЗВАНИЕ_МИРА>». Расскажи от первого лица, словно ведёшь дневник/гайд/блог открытий, погружая читателя в каждую деталь этого мира. Не описывай и не называй себя, ты гид за кадром, который рассказывает больше о мире от третьего лица, о его персонажах, об истории.

1. Введение

Объясни, что делает «НАЗВАНИЕ_МИРА» уникальным и притягательным. Опиши его основную атмосферу и нарратив.

2. География и атмосфера

Расскажи о природных ландшафтах, локациях, районах, климате, сезонных изменениях, звуках и запахах. Пусть читатель почувствует шум ветра, шорох листвы, аромат местной кухни. Погрузи читателя в этот мир.

3. История и устройство общества

Кратко пройди по ключевым вехам истории, опиши социальный уклад, экономику, важнейшие традиции и обычаи жителей.

4. Главные локации

Перечисли и опиши основные места: города, деревни, святые рощи, башни, подземелья, бары, клубы, парки и т. п. Удели внимание мелким деталям (архитектура, вывески, узоры на стенах).

5. Население и культура

Расскажи о характере местных жителей, их повседневных привычках, легендах, праздничных ритуалах и фольклоре.

6. Основной сюжет и лор

Погрузись в мифологию мира: расскажи чем живут персонажи, вокруг чего все происходит и живет, тайные общества и запретные знания. Опиши, как это вплетено в реальную жизнь мира.

7. Ключевые персонажи

Представь главных героев и антагонистов, их личности, мотивации, связи между ними и эволюцию арок.

8. Конфликты и сюжетные арки

Разбери основные конфликты (политические, личные, мистические), центральный лор и ключевые сюжетные повороты.

9. Практические рекомендации

Опиши, куда бы ты лично отправился первым делом: какие заведения и мастерские посетить, с кем поговорить, что попробовать на вкус, где отдохнуть.

10. Возможные приключения

Предложи несколько сюжетных сценариев для посещающих этот мир: расследование, тайные обряды, экспедиции, союзы с героями и группами, погружение в главне проблемы мира.

11. Опасности и табу

Укажи зоны риска, чего лучше избегать, о чём не стоит расспрашивать, какие ритуалы и места могут оказаться смертельно опасными.

12. Загадки и тайны для самостоятельного исследования

Перечисли интригующие улики, символы, забытые рукописи, недосказанные легенды, происшествия — всё, что может заинтересовать пытливого следопыта и путешественника по этому миру.

13. Заключение

Дай эмоциональные советы по подготовке к путешествию: что взять с собой, какой настрой сохранить, какие ожидания оставить позади.

Требования к стилю:

- Пиши только повествовательными абзацами, без таблиц, списков, сносок и пунктов/подпунктов.

- Максимум конкретики и сенсорных деталей; избегай общих формулировок и пустых оценок.

- Встраивай «факты» в действие и наблюдение; не давай сухих справок.

- Допускаются короткие диалоги и цитаты для оживления.

- Сохраняй единый голос и выбранный тон на всём протяжении текста.

Вывод:

Сгенерируй цельный текст-обзор локации «<НАЗВАНИЕ_ЛОКАЦИИ>», следуя структуре выше и всем требованиям к стилю. Не дублируй план в явном виде — только живое повествование.

Получаем ответ от нейросетей и сохраняем текст описания мира в свой блокнот:

Теперь у нас есть описание героя и описание мира. Добудем для героя еще аватарку:

Суповой набор для нового блокбастера почти готов.

Далее переходим на сайт https://literai.ru/ где мы и будем запускать наш сценарий.

На главной странице жмите на кнопку "Создай свой мир"

Откроется настройка литературного конструктора.

Нам нужны ключи для доступа к нейромодели, которая будет создавать для нас истории.

На данный момент в Опенроутере доступна к бесплатному использованию модель Polaris Alpha. Это тестовое название для новой модели, скорее всего это новая модель GPT. Регистрируйтесь на сайте Опенроутер https://openrouter.ai/ , проще всего через гугл акк. Делайте свой апи ключ.

Бесплатно на один ключ в Опенроутере дают 50 запросов к нейромодели в день, этого достаточно для одной полноценной истории.

Далее на сайте LiterAI в строке провайдера ставите эту ссылку:

https://openrouter.ai/api/v1/chat/completions

В строке модель впишите:

openrouter/polaris-alpha

И в строке ключа, ключ который сделали в опенроуетере.

Вот так:

Проматываем чуть ниже до каталога героев. Жмем на кнопку "Создать персонажа"

Откроется окошко для создания персонажа. Вписываем имя. Загружаем аватарку. В описание добавляем текст с описанием, которое нам сгенерировала нейросеть. Жмем - Готово.

Персонаж добавляется в каталог и автоматически выбирается как активный. Внизу активируется кнопка "Далее". Жмем. В этом окне надо выбрать ему роль. Можно добавить ему любую роль или выбрать - играет за себя.

Жмем - далее. Открывается каталог сценариев. Добавим свой. Нажмите кнопку - создать сцену. Откроется окно добавления сценария. Я назову сценарий "Сумерки" и добавим текст сценария который создала нам нейронка. Готово. Сценарий добавился в каталог. Жмем кнопку "Начать историю".

Откроется окно чата в котором нейронка начнет создавать нашу историю. Наслаждаемся!

В конце текста каждой страницы нейросеть будет предлагать два варианта развития событий. Можно кликать по любому варианту и нейросеть продолжит писать историю в этом ключе. Можно написать свой вариант продолжения и нажать кнопку отправить, тогда нейронка продолжит писать историю по вашему указанию.

Гайд готов.

Теперь вы знаете как поместить любого героя в любой фильм и переиграть историю на свой лад.

Показать полностью 14
4

Литературный нетфликс. Выбираем любого персонажа, помещаем его в любой мир и читаем историю

Литературный Netflix — это новая форма чтения, где любой герой может оказаться в любом мире, а каждая история превращается в уникальный литературный сериал, который пишется в реальном времени.

Забавные идеи «а что если бы Гарри Поттер сражался с Дартом Вейдером?» можно превратить в полноценные истории в три клика. Раньше такие идеи писались в формате фанфиков, теперь существует сервис, который создает истории за секунды.

На платформе literai.ru вы не просто читаете историю. Вы выбираете персонажа из любой вселенной, перетаскиваете его в совершенно чужой мир и получаете уникальное повествование, сюжет которого можно направлять в любую сторону в процессе написания. Доктор Хаус в Средиземье? Джинкс из Arcane в «Пятом элементе»? Не проблема.

Под капотом – движок конструктор, который собирает из каталогов – описание персонажа, дает ему роль, соединяет это со сценарием из каталога сценариев и отправляет полное задание нейросетевому чат боту. Нейромодель обрабатывает запрос и начинает писать историю. В процессе написания можно давать указания куда направить сюжет или выбирать из двух вариантов развития сюжета, которые подбирает сама нейросеть.

Как работает LiterAi.ru

Модель простая и гениальная:

- Библиотека персонажей — от Штирлица до Рика Санчеза, от Ильи Муромца до героев из игры Киберпанк 2077. Каждый герой уже «обучен» своему характеру, манере речи, мотивации. Если вашего любимого героя нет в каталоге, то вы можете добавить его в каталог самостоятельно.

- Выбор вселенной — любой сеттинг: от классического Хогвартса до постапокалиптического мира Матрицы или средневекового Вестероса. Также можно добавить любой ваш сценарий в каталог самостоятельно.

- Генерация сюжета — AI адаптирует персонажа к новым правилам мира, сохраняя его суть. Геральт всё так же будет саркастичен, но теперь в Хогвартсе с волшебной палочкой вместо стали будет гонять магов.

Несколько форматов для создания истории.

Можно играть за одного героя, можно поместить до четырех героев в один мир и следить за их приключениями, можно запустить скрипт, который будет писать всю историю самостоятельно, страницу за страницей.

На сайте нет регистрации и профилей, это значит никакая информация не записывается и не хранится, зашли на сайт, выбрали персонажа, поиграли, закрыли сайт. История, которую вы прочтете не сохраняется на сайте, следовательно никто не узнает что вы там читали. Готовую историю можно скачать в процессе игры, в виде текстового файла. Это специальный экспортный текстовый файлик, который можно снова загрузить на сайт и продолжить историю, или дать почитать вашу историю друзьям, но это уже на ваше усмотрение.

На сайте есть каталог с готовыми историями, которые можно почитать. Своеобразный формат прохождения книги в роли героя.

Каталог готовых историй -> https://literai.ru/category/books/

literai.ru работает с нейросетями по API, это означает, что вы можете подключить любую из топовых нейромоделей для создания истории. Если прошлые тесты старых и дешевых нейромоделей могли показывать плохое качество текста, то самые современные модели, такие как Gemini 2.5 Pro, Claude Sonnet 4.5, Claude Opus 4.1, Qwen 3 max, Grok 4 – справляются с написанием литературных текстов на отлично. Энтузиасты, которые пробовали писать книги с помощью чата гпт в самом чате, не смогли создать ничего толкового, так как формат чата не позволяет развернуть скрипт конструктора. Когда вы подключаетесь к модели чата по Api, то вы можете написать свой чат со своим функционалом, где ответы от нейромоделей будут использоваться комплексно вместе со скриптами на сайте, если кто знаком с таким понятием как Агенты ИИ, то это примерно про такой формат взаимодействия. На сайте LiterAI скрипты конструктора выстраивают ответы от чат бота в определенном формате, это позволяет работать с текстом в более сложных комбинациях и задавать определенные параметры для генерации текста, чтобы получить качественное литературное повествование.

Закономерный вопрос. Где взять доступ к топовым нейромоделям и как подключить их на сайте?

Есть сервисы, которые предоставляют доступ по апи всем пользователям. Это разные исследовательские проекты, научные центры или провайдеры, где тестируются новые модели. Можно зарегистрироваться там как бетатестер/студент/исследователь и получить ключ доступа к моделям. Один из провайдеров, такой как Опенроутер – постоянно отдает на тесты новые модели.

На данный момент в Опенроутере доступна к бесплатному использованию модель Polaris Alpha. Это тестовое название для новой модели, скорее всего это новая модель Grok 5. Регистрируйтесь на сайте Опенроутер https://openrouter.ai/ , проще всего через гугл акк. Делайте свой апи ключ.

Бесплатно на один ключ в Опенроутере дают 50 запросов к нейромодели в день, этого достаточно для одной полноценной истории.

Далее на сайте LiterAI в строке провайдера ставите эту ссылку:

https://openrouter.ai/api/v1/chat/completions

В строке модель впишите:

openrouter/polaris-alpha

И в строке ключа, ключ который сделали в опенроуетере.

На LiterAI каждый может стать сценаристом, режиссёром и зрителем одновременно. Здесь нет границ: персонажи путешествуют между жанрами, миры переплетаются, а истории оживают в формате, который раньше был невозможен.

Сайт был создан как хобби проект парочкой энтузиастов, поэтому все бесплатно. Пользуемся в свое удовольствие!

Почему такой проект не был создан какой-нибудь крупной компанией? Есть несколько причин. Первая и самая важная – нет полноценного варианта для монетизации такого проекта. Конструктор работает по Api с нейромоделями, деньги с пользователя брать не за что. Вторая причина – копирайт на персонажей и творческие миры. Если включить монетизацию проекта, то это будет означать что сайт использует чужих персонажей, чтобы извлекать прибыль, и тогда сразу прилетят иски за нарушение копирайта. В нашем случае сайт просто выступает как каталог с описанием персонажей и разных сеттингов, что-то вроде литературной википедии. Вся информация предоставляется бесплатно для ознакомления, монетизации нет, исков нет. Третья причина, хранение данных пользователей и модерация пользовательского контента. Если компания захочет собирать данные пользователей и продавать их, то они попадут в ловушку разных органов надзора, которые требуют все данные, логи, требуют хранить все на серверах и модерировать контент. Для этого требуется цела команда, расходы на сервера и другие трудности. На сайте LiterAI нет регистраций и баз пользователей, следовательно, и нет проблем с этим. Единственный вариант монетизации – собирать небольшие донаты на проект, но с донатов, думаю хватит только на оплату сервера. Ссылок на тг канал не будет, сорян.

Показать полностью 4
3

Haveall SDXL – натренировал новую топ модель формата XL. Погнали тестировать!

Основные преимущества модели Haveall SDXL:

- Очень высокое качество генерируемых изображений. Такие изображения будут легко приниматься на стоковых биржах, можно создавать платные обложки для писателей, музыкантов, артистов. Можно обрабатывать фото, восстанавливать фото. Создавать мокапы, фотосеты, фото продукции.

- Улучшена цветовая палитра. Улучшено отображение кожи, материалов, поверхностей и архитектурных структур.

- Для тренировки было использовано 5200 очень тщательно отобранных изображений. Для достижения такого качества на одном датасете было натренировано 4 разных модели (каждая со своими параметрами) и объединены в одну. Только с таким комплексным подходом удалось побороть многие недостатки модели SDXL.

- Подписи для изображений датасета были разделены на несколько категорий. Часть была написана вручную, для подписи трети изображений использовался чат GPT, для части датасета были использованы промпты из MJ v.6, добавлены разные стили.

- Датасет включает в себя как фото, так и анимационные арты, изометрику, графические арты, немного аниме. Разные форматы и камеры.

Специально под свои модели я создал сайт, где собираю коллекцию промптов, уже под 1000 разных качественных примеров. Все картинки на сайте содержат встроенную инфу по генерации, просто перетаскиваем изображение с сайта во вкладку «PNG INFO» в Автоматике или Фордже и считываем промпт, не надо все копировать вручную, очень удобно. На сайте работает поиск, можно искать как на русском языке, так и на английском.

Сайт с галереей: https://haveall.net/

Страничка модели, там указаны ссылки на скачивание и рекомендации по базовым настройкам генерации: https://haveall.net/haveall-sdxl-model-dlya-stable-diffusion/

Страничка на цивитай: https://civitai.com/models/440030

Приглашаю всех на тестирование. Закидывайте интересные варианты генераций в галерею на цивитаи. И в целом, пишите свои впечатления. Нужна обратная связь.

p.s. можно сказать, это демо модель для того, чтобы показать возможности моего нового метода тренировки (тюнинга) SDXL модели. Эту модель я тренировал на арендованной 4090 более 20 дней. Т.е. на датасет из 5200+ изображений ушло более 20 дней на чистую тренировку на одной видеокарте и месяцы на поиски идеальных настроек. Если я смогу где-то достать четыре видеокарты 4090, то попробую создать уже очень серьезную модель на датасете в 50-90к изображений. Если посмотреть примеры генераций, посмотреть на что способна модель с датасетом всего в 5к изображений, то можно представить насколько круче будут способности модели с датасетом от 50к изображений.

Показать полностью 13
23

Запилил модель для SD 1.5 с высокой детализацией. Хвастаюсь

Натренировал 10 Лор на 1300 изображениях в 1024х1024, каждую под свою тематику (авто, мото, женщины, мужчины, пейзажи и т.д.), потом смиксовал каждую Лору отдельно с моделью на которой тренировал сами Лоры. Работает только в таком варианте, надо миксовать Лору с той моделью, на которой она тренировалась, тогда ложится хорошо. Тренировал на своей модели HolygeneX.

Получилось 10 моделей с токенами и параметрами, унаследованными от Лор, далее я смиксовал обратно эти модели в тренировочную. А потом намерджил ее в базовую модель от SD, чтобы сохранить разнообразие весов. В итоге получилась модель HolygeneX LR, которая может генерировать картинки в разрешении 768х768, 1024х768, 768х1024 и 1024х1024 в SD 1.5.

И обязательно для крутой детализации генерировать с Hires. Fix, я обычно ставлю увеличение на 2 и Denoising strength 0,3-0,45. Тогда на выходе получаетcя большой формат и с офигенной детализацией.

Загрузил модель на civitai https://civitai.com/models/53207/holygenex-lr

Полные промпты там же в картинках.

Пробуем, тестируем, кайфуем.

Показать полностью 12
49

Что такое VAE для Stable Diffusion? Обязательно добавляем!

Что такое VAE для Stable Diffusion? Обязательно добавляем!

Stable Diffusion принадлежит к классу диффузионных моделей. Идея состояла в том, чтобы смешать картинку и гауссовский шум, а далее обучить нейросеть из зашумленных изображений восстанавливать оригиналы. Если подать такой нейросети на вход чистый шум, то постепенно она превратит его в симпатичную картинку. В Stable Diffusion этим занимается UNet.
Нюанс в том, что картинка с разрешением 512х512 состоит из 262 144 пикселей. Если применять диффузионный процесс к ней напрямую, то на вычисления будет уходить много времени и памяти, что усложняет процесс тренировки и инференса. Мы же хотим генерировать картинки быстро и на относительно недорогих видеокартах. Поэтому изображения отображаются в пространство меньшей размерности (latent space), там производятся вычисления, а результат обратно разжимается с помощью Variational Autoencoder (VAE).

Если вы используете стандартную модель от SD, то при процессе раскодировки SD использует дефолтный VAE, который входит в сборку автоматика или другие сборки, которые вы используете. Если же вы скачали какую-то другую модель, то тут начинаются нюансы. Стандартная VAE от SD хорошо работает в целом, но у нее проблемы с глазами, носом, губами и пальцами. Стандартную VAE можно использовать, но больше подойдет для пейзажей, архитектуры и паинтов. Авторы новых моделей, которые можно найти на сайтах каталогах, иногда, добавляют VAE заточенные под их модели. Они тренируют модель VAE под себя, под свою модель, тем самым улучшают те детали, на которые была заточена модель, это может быть космический сет, аниме, аналоговое фото и т.д. Например, есть VAE заточенные под аниме, они натренированы под стиль аниме. С таким VAE отлично получается генерация анимешных артов, но с помощью аниме VAE вы уже не разожмете, например, реалистичное фото человека или животного.
Вместо стандартного SD VAE энтузиасты тренируют новые модели, одна из таких sd-vae-ft-ema-original натренированная на базе LAION-Aesthetics и LAION-Humans для SWF контента. Она дает более улучшенный результат при генерации человеческих тел и считается более универсальной. Есть еще варианты для NSWF, но их ищите отдельно.

Поэтому советуют скачать универсальную VAE, которая будет разжимать генерацию в приемлемом виде на всех моделях. В основном рекомендуют VAE sd-vae-ft-ema-original — скачиваем по ссылке https://huggingface.co/stabilityai/sd-vae-ft-ema-original/blob/main/vae-ft-ema-560000-ema-pruned.safetensors и закидываем файл в папку ВашSD/models/VAE
Далее перезапускаемся, во вкладке Setting выбираем настройки - Stable Diffusion и выбираем vae-ft-ema-560000-ema-pruned.safetensors — жмем Apply settings. Готово.

Теперь ваши сгенерированные картинки будут разжиматься в нормальные без артефактов, дефектов и пятен на лицах. На самом деле это пока что своеобразный костыль, заплатка, не идеально, но работает. Если появятся другие более идеальные варианты, то будем тестировать.

Если вы создаете аниме арт, мультяшные картинки, какие-то специфические арты - то советую под них поискать свои VAE.

Показать полностью
45

Красотень в бутылке. Разбор шаблона1

Обычно логика срабатывает так, что начинаешь придумывать промпт со словами – «нечто» в бутылке. На это словосочетание картинка генерируется не очень удачная, плоская. Наткнулся на удачный вариант – «trapped in a bottle», в переводе – запертый в бутылке, или пойманный в ловушку (бутылку).

Добавляем объект, который разместим в бутылке – «An intricate landscape».

Получаем: «An intricate landscape trapped in a bottle».

Если оставить голое описание, то картинка получится невзрачной, надо докрутить стиль.

Добавляем к промпту «atmospheric lighting, 4k UHD, dark vibes, hyper detailed, vibrant colours, epic composition, octane render». Получаем стиль, но и этого еще не достаточно.

Для более красивой сценки лучше размыть фон за бутылкой. Глаз так видит объекты, мы привыкли так видеть, поэтому и на картинке лучше добавить – «sharp focus».

Почти готово, и как вишенка на торте, добавим к стилю изометричности, тогда сгенерированная картинка получится более объемной, детальной, с перспективой.

Вишенка – «high resolution isometric».

Итоговый промпт:

An intricate landscape trapped in a bottle, atmospheric lighting, 4k UHD, dark vibes, hyper detailed, vibrant colours, epic composition, octane render, sharp focus, high resolution isometric

Показать полностью 3
9

Про миксование моделей. Размышления

Удобно - когда одна универсальная модель, прокачанная. По сути, у нас из таких только Deliberate, вроде бы все ок, но заметил такую фишку, что на пейзажах или на тачках с бекграудом забористым у модели словно не хватает данных и она мухлюет, размазывая фон или засвечивая задник и детализация волнами плывет.

Потестил такую фишку через мердже в аутоматике. Взял дефолтную на 512, смиксовал на нее Delibrate, так что от дефолтной на 7гб осталось 0.1 и залил на нее Delibrate. При тестах картинки пейзажные стали более художественные, мазня-размазня кисточковая добавилась, но при этом и деталей стало больше. Я тогда продолжил миксовать, добавил сверху с коэффициентом 0.1 еще три модели по очереди, эрос, винтефотоген и фотоген космос. В итоге, при первом взгляде деталей на генерированных картинках добавилось. Крепости на пейзажах стали более ровные, детали на тачках целые, лица чутка четче. На civitai пока еще не заливал.

Миджорней скорее всего постоянно допиливает именно модель, она у них по весу, наверное уже гигов 100, поэтому в разных артах, миджорней по детализации бывает обгоняет. Вот бы такую миксовую супер-мега модель для SD запилить, было бы топ, но надо как-то по уму сделать.

Для сравнения.

Deliberate

Миксованная

Тачка стала более ровной, детали лучше прорисованы, задний план меньше размыт.

Deliberate

Миксованная

Когда у модели мало описаний внутри, она начинает дублировать запрос, разбрасывая дубли по периметру, на миксованной видно, что больше отработала по запросу, меньше артефактных дублей, крыши более ровные.

Я пробовал много разных seeds и запросов, просто для примера две картинки, чтобы мысль пояснить без гигабайтных полотен.

Вот думаю, если еще сверху моделей 20 так намиксовать по 0.1 будет ли толк, или может все превратится в кашу? Пока не изучал инструкции, почитать бы чего по этой теме… Может быть есть инструменты какие-то точные, на которых можно все проверить, чтобы зря не миксовать?

Показать полностью 4
Отличная работа, все прочитано!