Synthwave Neuro Arts
8 постов
8 постов
2 поста
Друзья, всем привет, сегодня хочу рассказать, как создавать симпатичные аниме арты прямо в браузере, используя онлайн сервис работающий на нейросети Stable Diffusion.
Теперь вам не нужно иметь мощную видеокарту, достаточно написать запрос, можно даже на русском, и в течении минуты получите изображение. Но как создавать изображения именно в Аниме стиле? Обо всем по порядку.
Сначала регистрируемся на ArtGeneration.me - ссылка реферальная, зарегистрировавшись по ней вы получите 7 дней PRO, вместо 3 и 200 дополнительных генераций, вместо 100 на баланс, так что решайте сами 😁. На сайте вам ежедневно будет начисляться 50 генераций, а если оформите подписку PRO, то 300, жду шутку про тракториста в комментарии.
С регистрацией никаких проблем не возникнет, можно авторизоваться с помощью Яндекса или Гугла, и сразу попадаем в галерею изображений.
Картинки на главной выбираются автоматически из самых популярных, там может быть и ваша
В галерее можно увидеть что сейчас создают пользователи и сразу сделать свою версию. По клику на любую картинку вы сможете увидеть по какому запросу она была создана.
То что получится на изображении описывается с помощью запроса и негативного запроса, так нейросеть понимает, что рисовать, а что не рисовать. Запросы можно писать на русском, они будут автоматически переводится. Но мы будем писать на английском, потому что примеры, которые мы будем находить на сайте где размещают модели тоже будут на английском.
Тут я поменял в запросе только цвет волос с красных на голубые
Самый просто способ сделать красиво, это найти что-то, что вам нравится нажать на кнопку Создать свою версию, так вы откроете изображение с теми же настройками с которыми оно было создано. Останется поменять несколько слов в запросе и получить то что хочется именно вам. Изучим основные настройки.
По клику на иконку рядом с названием модели откроется страница со всеми созданными на этой модели картинками
Настройки генерации скрыты в правом баре, если у вас маленький экран, то он может быть скрыт по умолчанию, нажмите на стрелочку, чтобы развернуть.
Самое важное это модель, от модели зависит буквально все, ниже я расскажу какие модели лучше всего подходят для Аниме стилистики.
Разрешение, на моделях 1.5 (те, где в названии нет XL), важно не выходить за разрешение 512х768 или 768х512, но есть и хитрость, можно пропорционально увеличить разрешение до 960х640 или обратно, так качество изображений будет выше. На XL моделях можно смело делать разрешение больше.
Чтобы открыть описание стиля нажмите на иконку i
Стили это маленькие предустановленные кусочки запросов, они добавляются к запросу который пишите вы, стили очень удобно использовать с простым запросом в 1 - 2 предложения, если копируем откуда-то промпт, то стиль использовать не стоит.
В Избегать пишется негативный запрос, то, чего не должно быть на изображении, лучше всего его взять из готовых примеров, или на сайте где размещают модели. Остальные настройки можно в принципе не менять, по умолчанию они работают хорошо.
Промпт даже не менял, просто загрузил изображение Уэнсдей
Свое изображение позволяет загрузить любое фото или картинку из интернета и получить генерацию которая будет очень похожа на то, что вы загрузите, степень изменения загруженной фотки можно регулировать ползунком.
Над картинкой расположены кнопочки, первая отправляет генерацию в Свое изображение
Сюда же можно отправить вашу генерацию, например, чтобы сделать что-то похожее, но с другим запросом. А если не нравится только одна часть, её можно закрасить маской и тогда закрашенная часть будет пере генерирована. Так например можно улучшить лицо.
На самом деле большинство настроек можно не трогать они по умолчанию работают хорошо
Если не хотите чтобы ваши изображения попадали в общую галерею, можно включить приватный режим.
Проработка отвечает за то, сколько раз нейросеть попробует очистить картинку от шума, оптимально 30-40.
Соответствие запросу оставляете в районе 5-7, эта настройка отвечает за следование запросу, но если превысить, то получите просто некрасивое изображение.
Все генерации создаются путем очистки изображения от шума, он похож на помехи в телике, номер конкретного шума позволяет создать еще раз такую же или очень похожую картинку по тому же запросу. Обычно используется случайный шум - зеленый кубик.
Сэмплер это математический алгоритм для визуализации, мои любимые DPM++ 2M Karras, Euler и UniPC, они самые универсальные.
Слева расположен бар с созданными вами изображениями, можно быстро перейти к настройкам любого созданного ранее изображения просто кликнув на него. Там же удаление и быстрый предпросмотр изображений, чтобы было удобно быстро находить нужную картинку.
Далеко не все модели хорошо подходят для аниме стилистики. Я сделал небольшой топ, лучших на мой взгляд моделей из доступных на ArtGeneration.me.
У каждой модели я написал название, оставил ссылку на все изображения созданные на этой модели и ссылку на Civitai, где можно скопировать хорошие запросы и негативные запросы именно для этой модели, про это еще расскажу ниже.
Очень симпатичная аниме модель, запросы лучше писать ключевыми словами.
И сразу расскажу зачем нам ссылка на Civitai, заходим по ней и видим изображения созданные автором модели, у каждого изображения в правом нижнем углу есть иконка i, жмите на неё и увидите запрос который лучше всего подходит именно для этой модели.
А ниже еще изображения созданные сообществом, там тоже можно найти много всего интересного, и примеры промптов и новые идеи для артов, обязательно посмотрите.
Проще всего сделать красивое изображение если скопировать удачный запрос, а потом понемногу изменять его.
Очень популярная 2.5d модель со своим необычным ярким стилем. В качестве запросов нормально работают и обычные базовые запросы.
Модель больше ориентирована на 3д в стиле пиксара или диснея, но и аниме стиль удается хорошо, особенно если подобрать интересный запрос как в случае с этим примером.
Не совсем про аниме, скорее стиль комиксов, но тоже очень классная 2д модель.
Яркая модель со своим особенным стилем, скорее тоже в мультипликацию, но крутая.
Классический анимешный микс моделей, похожий на все и сразу.
Модель создает безумно милые изображения с классическими большими головами и глазами у персонажей.
Очень классная SDXL модель, которая заточена под арт и в т.ч. аниме, отлично следует промпту, идеальна для работы со стилями и промптов на русском.
На этот раз без 2.5, но тоже очень классный, в стиле классического аниме.
Уже достаточно старая, но все еще очень популярная аниме модель.
Модель от создателя знаменитой Deliberate, не самая интересная аниме модель, на мой взгляд, но у неё хватает поклонников.
SDXL Niji Special Edition
Еще одна отличная SDXL модель заточенная под арт и иллюстрации, но отлично справляется и с аниме и хорошо понимает запросы как и все XL модели.
Рассказать о найденных багах, поделиться созданными изображениями или пообщаться с разработчиками можно в сообществе сервиса в телеграм.
Теперь вы знаете как создать арт с помощью нейросети ArtGeneration.me используя только браузер. Знаете как пользоваться сервисом и сможете найти отличные запросы на сайте размещающем модели. Ну и подобрать модель по душе из этой подборки тоже сможет каждый. Попробуйте повторить любое изображение из подборки самостоятельно.
Друзья, поддержите пост плюсиком, в нашей стране сейчас совсем не много таких проектов создается.
А на этом у меня все, делитесь вашими изображениями в комментариях и удачных генераций.
Привет, друзья, 22 октября Stability AI представила долгожданное обновление своей флагманской модели — Stable Diffusion 3.5. После не самого удачного релиза SD3 Medium в июне этого года, команда взяла паузу для серьёзной переработки архитектуры. Вместо быстрых фиксов разработчики потратили четыре месяца на фундаментальные улучшения. Меня зовут Илья, я основатель онлайн-нейросети для создания изображений ArtGeneration.me, техноблогер и нейро-евангелист и сейчас мы с вами вместе разберемся, что изменилось и действительно ли стоило так долго ждать.
Ключевым изменением стал переход на архитектуру MMDiT (Multimodal Diffusion Transformer). В отличие от предыдущих версий, новая модель использует сразу три предобученных текстовых энкодера. Это серьезное техническое решение, которое потребовало значительной переработки всей архитектуры.
Технические особенности:
Принципиально новая архитектура MMDiT с тремя специализированными текстовыми энкодерами:
OpenCLIP-ViT/G для понимания общего контекста и стилей
CLIP-ViT/L для детального анализа визуальных элементов
T5-XXL для обработки сложных текстовых описаний и пространственных отношений
Внедрение QK-нормализации для стабилизации работы трансформеров, что позволяет лучше контролировать процесс генерации и упрощает дальнейшую настройку модели
Увеличенная до 256 токенов длина контекста на этапе тренировки, что улучшает понимание детальных промптов
Оптимизированный VAE-декодер с 16 каналами и без постквантизации для лучшей цветопередачи и детализации
Впервые Stability AI предлагает сразу три варианта модели. Флагман линейки — Stable Diffusion 3.5 Large с 8 миллиардами параметров, способный работать с разрешением до 1 мегапикселя. Для задач, где критична скорость, создана версия Large Turbo, выдающая результаты всего за 4 шага. Модель генерирует на RTX 4090 за 20 секунд.
А 29 октября ожидается релиз Stable Diffusion 3.5 Medium — облегченной версии с 2.5 миллиардами параметров. Эта модель оптимизирована для работы на обычных компьютерах и поддерживает генерацию изображений от 0.25 до 2 мегапикселей.
Разработчики открыто говорят об особенностях новой версии. Расширение базы знаний и стилей привело к тому, что модель стала менее предсказуемой при работе с неконкретными промптами. Это сознательное решение — сохранить максимально широкую базу знаний в базовых моделях, давая пользователям больше возможностей для тонкой настройки под свои задачи.
Мы провели тестирование SD 3.5 в сравнении c SDXL 1.0 и Black Forest FLUX.1 dev. В такой же последовательности ниже представлены результаты - SD 3.5 затем SDXL 1.0 и потом Black Forest FLUX.1 dev. Пишите в комментарии где по вашему лучший результат. Сид и настройки генерации идентичные. Модели SD 3.5 понятно стандартная, запущенная в комфи на этом воркфлоу, SDXL модель это Juggernaut XL V9 на ArtGeneration.me и Flux 1 dev nf4 v2 запущенная в Forge.
ultra-detailed professional photography: close-up portrait of a weathered elderly craftsman in his workshop, natural window lighting casting dramatic shadows, every wrinkle and skin texture visible, Canon EOS R5, 85mm f/1.2 lens, 4K resolution, hyperrealistic details of wood shavings and tools in background, condensation droplets on nearby water glass, dust particles in sunbeams, {realistic skin pores, subsurface scattering, chromatic aberration}, professional color grading, photojournalistic style, award-winning National Geographic quality, RAW format
epic digital art: futuristic cyberpunk marketplace at golden hour, holographic merchant stalls floating between neon-lit skyscrapers, hundreds of detailed alien species trading exotic goods, volumetric fog effects, ray-traced lighting, cinematic color grading, intricate mechanical details, 8K resolution, created in Unreal Engine 5, {ambient occlusion, global illumination, metal roughness mapping}, concept art quality, trending on ArtStation, otherworldly atmosphere, dynamic composition
high-end anime artwork: magical academy graduation ceremony, cherry blossoms swirling in wind, diverse student characters with unique magical artifacts and detailed uniform designs, golden magic circles appearing in sky, Studio Ghibli quality backgrounds, perfect cel shading, emotional lighting, multi-layered particle effects, {clean line art, detailed eyes, dynamic fabric flow}, masterful composition, vibrant color palette, cinematic aspect ratio, high production value
experimental typography design: 'EVOLUTION' text morphing from ancient hieroglyphs into futuristic digital script, each letter contains detailed micro-scenes of human progress, metallic 3D elements with scratch textures, dynamic perspective, precise kerning, neon accents, floating geometric shapes, 32K resolution, {perfect antialiasing, vector precision, multiple light sources}, professional typographic hierarchy, cutting-edge design trends, seamless transitions
classical concert hall setting, professional orchestra performance scene, female conductor with flowing crimson tailcoat centered in golden ratio, cellist in navy suit and violinist in ivory dress in foreground, pianist in black tuxedo and harpist in silver gown performing, flutist in forest green and clarinetist in burgundy at middle distance, trumpet player in charcoal gray and french horn in purple creating depth, timpanist in white and black, violist in sapphire blue, bass player in russet brown and oboist in slate gray completing background, mahogany-paneled walls, golden baroque details, red velvet curtains, polished hardwood stage, dramatic stage lighting, 8K resolution, hyperrealistic details, concert photography, professional staging
steam locomotive train station evening scene, tall station master in burgundy gold-trimmed uniform checking ornate pocket watch at center platform, wealthy family of four (father in navy tailcoat and top hat, mother in emerald bustle dress with parasol, son in brown suit with newsboy cap, daughter in powder blue dress) waiting near left platform, three vendors (copper-vested coffee seller, gray-capped newspaper boy, girl in white apron selling flowers) working near entrance, engineering team in brass uniforms and oil-stained overalls inspecting locomotive, three traveling academics (professor in tweed, assistant in olive dress, student in burgundy uniform) consulting large map, steampunk mechanical details, brass and copper fixtures, billowing steam effects, gas lamps casting warm light, photorealistic quality, 8K resolution, cinematic framing
Модель распространяется под Stability AI Community License, которая предполагает свободное использование для исследований и некоммерческих целей. Коммерческое использование разрешено компаниям с годовым доходом до $1 млн, для более крупных организаций предусмотрена Enterprise License.
Тут ситуация точная такая же, как и с Flux, из дата сета был убран весь NSFW контент, в результате модель просто не знает что должно быть у людей под одеждой и рисует - что-нибудь типа одежды в лучшем случае, что-нибудь типа человеческой многоножки - в худшем. Как мы видим с Flux - файтюнингом ситуация не решается.
29 октября ожидается релиз Stable Diffusion 3.5 Medium, а следом за ним — выход ControlNet с расширенными инструментами контроля над генерацией. Судя по дорожной карте, команда Stability AI сфокусирована на развитии профессиональных инструментов и улучшении пользовательского опыта.
Новый релиз Stable Diffusion демонстрирует, что команда Stability AI серьезно подошла к работе над ошибками после не самого удачного запуска SD3. Вместо быстрых фиксов они провели фундаментальную работу над архитектурой и представили продукт, учитывающий различные сценарии использования. Но стало ли лучше? Об это судить вам.
Предлагаю протестировать новую версию на своих задачах и поделиться результатами в комментариях. Интересно узнать, как SD 3.5 показывает себя в реальных проектах и стилях.
Я рассказываю больше о нейросетях у себя на YouTube, в телеграм и на Бусти. Буду рад вашей подписке и поддержке. Всех обнял и удачных генераций.
Вот такая фантазия родилась на прошлом стриме в Fooocus на SDXL модели, конечно без лоры на Вайб Советский Панелек и лоры Симулирующей VHS Кассеты ничего бы не вышло.
Информация о генерации и промпт:
{
"prompt": "Russian Apartments, buildings\nMonster Godzilla with an accordion in his hands\nUSSR Vibes, Russian Apartments, buildings, road, rainy, snow, melanchonic",
"negative_prompt": "",
"prompt_expansion": "Russian Apartments, buildings, intricate, elegant, luxurious, dramatic colorful atmosphere, constructed, sunny, beautiful, sharp focus, highly detailed, built, royal,, original, polished, extremely fine detail, color, perfect composition, calm cinematic colors, open background, inspired, amazing, full artistic, creative, positive, unique, attractive, cute, confident, passionate, cheerful",
"styles": "['Fooocus V2', 'Fooocus Enhance', 'Fooocus Sharp']",
"performance": "Speed",
"steps": 30,
"resolution": "(896, 1088)",
"guidance_scale": 4,
"sharpness": 8,
"adm_guidance": "(1.5, 0.8, 0.3)",
"base_model": "leosamsHelloworldXL_helloworldXL70.safetensors",
"refiner_model": "None",
"refiner_switch": 0.5,
"clip_skip": 2,
"sampler": "dpmpp_2m_sde_gpu",
"scheduler": "karras",
"vae": "Default (model)",
"seed": "5169491136384129924",
"lora_combined_1": "SDXLFaeTastic2400.safetensors : 0.35",
"lora_combined_2": "add-detail-xl.safetensors : 0.75",
"lora_combined_3": "Doomer_USSR_VibesRussian_Apartments_-_Style.safetensors : 0.68",
"metadata_scheme": false,
"version": "Fooocus v2.5.5"
}
Скидывайте что у вас получится в комментарии.
Друзья, нашел потрясающую статью для всех, кто работает с моделью Flux! Это огромный список персонажей, которых Flux умеет генерировать "из коробки", без дополнительных лор и обучений ✨
Я перевел список и привожу его в удобном виде для вас.
Синяя птица (Blue Angry Bird)
Черная птица (Black Angry Bird)
Зеленая свинья (Green Pig)
Красная птица (Red Angry Bird)
Желтая птица (Yellow Angry Bird)
Белая птица (White Angry Bird)
Алукард (Alucard) (50/50 - иногда путает с Алукардом из Hellsing)
Саймон Бельмонт (Simon Belmont)
Крэш Бандикут (Crash Bandicoot)
Дидди Конг (Diddy Kong)
Донки Конг (Donkey Kong)
Король К. Рул (King K Rool) (50/50)
Мастер Чиф (Master Chief)
Линк (Link)
Ганондорф с острым носом (Ganondorf with a pointy nose) (50/50)
Горон (Goron) (50/50)
Зельда (Zelda) (50/50)
Самус Аран (Samus Aran)
Стив из Майнкрафта (Minecraft Steve)
Скорпион (Scorpion)
Саб-Зиро (Sub-Zero)
Пакман (Pac-Man)
Бульбазавр (Bulbasaur)
Чаризард (Charizard) (50/50)
Чармандер (Charmander)
Иви (Eevee)
Пикачу (Pikachu)
Сквиртл (Squirtle)
Вапореон (Vaporeon) (50/50)
Эми (Amy)
Наклз (Knuckles)
Соник (Sonic)
Тейлз (Tails)
Марио (Mario)
Луиджи (Luigi)
Боузер (Bowser)
Принцесса Пич (Princess Peach)
Тоад (Toad)
Йоши (Yoshi)
Спайро (Spyro the Dragon)
Телепузик (Teletubby)
Рипли (Ripley) (50/50)
Ксеноморф (Xenomorph) (может потребоваться добавить 'black' для цвета)
Барни (Barney) (добавление 'the dinosaur' сделает его более диким)
Бетти Буп (Betty Boop)
Уолтер Уайт (Walter White)
Кальвин (Calvin) (50/50 - делает его персонажем из Peanuts)
Хоббс тигр (Hobbes the Tiger)
Аквамен (Aquaman)
Бэтгёрл (Batgirl)
Бэтмен (Batman)
Бэтвумен (Batwoman)
Женщина-кошка (Catwoman)
Флэш (The Flash)
Зеленая Стрела (Green Arrow)
Зеленый Фонарь (The Green Lantern)
Харли Квинн (Harley Quinn)
Джокер (The Joker)
Найтвинг (Nightwing)
Шазам (Shazam)
Супергёрл (Supergirl)
Супермен (Superman)
Ариэль (Ariel) (Русалочка)
Белль (Belle) (Красавица и Чудовище)
Базз Лайтер (Buzz Lightyear) (История игрушек)
Золушка (Cinderella)
Дейзи Дак (Daisy Duck)
Дональд Дак (Donald Duck)
Иа (Eeyore) (Винни-Пух)
Эльза (Elsa) (Холодное сердце)
Джинн (Genie) (используйте на свой страх и риск - пытается сделать версию Уилла Смита)
Гуфи (Goofy)
Джек Скеллингтон (Jack Skellington) (Кошмар перед Рождеством)
Джесси (Jessie) (История игрушек)
Молния Маккуин (Lightning McQueen) (Тачки)
Малефисента (Maleficent) (Спящая красавица)
Микки Маус (Mickey Mouse)
Майк Вазовски (Mike Wazowski) (Корпорация монстров)
Минни Маус (Minnie Mouse)
Моана (Moana)
Мистер Исключительный (Mr. Incredible) (Суперсемейка)
Мулан (Mulan)
Немо (Nemo) (В поисках Немо)
Олаф (Olaf) (Холодное сердце)
Питер Пэн (Peter Pan)
Покахонтас (Pocahontas)
Рекс (Rex) (История игрушек)
Симба (Simba) (Король Лев)
Стич (Stitch)
Салли (Sully) (Корпорация монстров)
Тигра (Tigger) (Винни-Пух)
Динь-Динь (Tinker Bell) (Питер Пэн)
ВАЛЛ-И (Wall-E)
Винни-Пух (Winnie the Pooh)
Вуди (Woody) (История игрушек)
Брайан Гриффин (Brian Griffin)
Лоис Гриффин (Lois Griffin)
Мег Гриффин (Meg Griffin) (50/50)
Питер Гриффин (Peter Griffin)
Стьюи Гриффин (Stewie Griffin)
Барни Раббл (Barney Rubble) (50/50 - может сделать его Барни-динозавром)
Фред Флинтстоун (Fred Flintstone)
Вилма Флинтстоун (Wilma Fintstone)
Бендер (Bender)
Гарфилд (Garfield)
Лизун (Slimer)
Майкл Майерс (Michael Meyers)
Хи-Мен (He-Man)
Скелетор (Skeletor)
Пинхед (Pinhead)
Гринч (The Grinch)
Ночная Фурия (Night Fury)
Багз Банни (Bugs Bunny)
Даффи Дак (Daffy Duck)
Элмер Фадд (Elmer Fudd)
Марвин Марсианин (Marvin the Martian)
Дорожный бегун (Road Runner) (50/50)
Сильвестр (Sylvester)
Твити (Tweety)
Хитрый Койот (Wile E Coyote) (50/50)
Капитан Америка (Captain America)
Карнаж (Carnage)
Невероятный Халк (Incredible Hulk)
Железный человек (Iron Man)
Человек-паук (Spiderman)
Веном (Venom)
Мистер Бин (Mr. Bean)
Эпплджек (Applejack)
Флаттершай (Fluttershy)
Пинки Пай (Pinkie Pie)
Принцесса Луна (Princess Luna)
Радуга Дэш (Rainbow Dash)
Сумеречная Искорка (Twilight Sparkle)
Фредди Крюгер (Freddy Kreuger)
Донателло (Donatello)
Леонардо (Leonardo)
Микеланджело (Michelangelo)
Рафаэль (Raphael)
Чарли Браун (Charlie Brown)
Снупи (Snoopy)
Розовая Пантера (Pink Panther)
Блуто (Bluto)
Попай (Popeye)
Хищник (Predator)
Морти (Morty)
Рик (Rick)
Робокоп (Robocop)
Скуби-Ду (Scooby Doo)
Шэгги Роджерс (Shaggy Rogers) (50/50)
Велма Динкли (Velma Dinkley)
Призрачное лицо (Ghostface)
Элмо (Elmo)
Шрек (Shrek)
Осел (Donkey) (из Шрека)
Барт Симпсон (Bart Simpson)
Гомер Симпсон (Homer Simpson)
Клоун Красти (Krusty the Clown)
Лиза Симпсон (Lisa Simpson)
Мардж Симпсон (Marge Simpson)
Картман (Cartman)
Патрик Стар (Patrick Star)
Сквидвард (Squidward)
Губка Боб Квадратные Штаны (Spongebob Squarepants)
Боба Фетт (Boba Fett)
C-3PO (C3PO)
Чубакка (Chewbacca)
Дарт Мол (Darth Maul)
Дарт Вейдер (Darth Vader)
Джабба Хатт (Jabba the Hutt)
Люк Скайуокер (Luke Skywalker)
Мандалорец (The Mandalorian)
R2-D2 (R2D2)
Йода (Yoda) (может потребоваться уточнение baby/old)
Спок (Spock)
Джерри (Jerry)
Том (Tom)
Оптимус Прайм (Optimus Prime)
Цири (Cirilla of Cintra)
Геральт из Ривии (Geralt of Rivia)
Трисс Меригольд (Triss Merigold)
Йеннифэр из Венгерберга (Yennefer of Vengerberg)
Зорро (Zorro) (не всегда с маской)
Гоку (Goku)
Дораэмон (Doraemon)
Хелло Китти (Hello Kitty)
Сейлор Мун (Sailor Moon)
Альберт Эйнштейн (Albert Einstein)
Анджела Лэнсбери (молодая) (Angela Lansbury (Young))
Анджелина Джоли (Angelina Jolie)
Арнольд Шварценеггер (Arnold Schwarzenegger)
Барак Обама (Barack Obama)
Билл Клинтон (Bill Clinton)
Брюс Ли (Bruce Lee)
Брузер Броди (Bruiser Brody)
Колин Бейкер (Colin Baker)
Дэниел Крейг (Daniel Craig)
DJ Marshmello (DJ Marshmello)
Дональд Трамп (Donald Trump)
Дуэйн Джонсон (Dwayne Johnson)
Эмма Стоун (Emma Stone)
Файруза Балк (Fairuza Balk)
Джордж Буш-младший (George W Bush)
Халк Хоган (Hulk Hogan)
Джеки Чан (Jackie Chan) (50/50)
Джо Байден (Joe Biden)
Джон Пертви (John Pertwee)
Джонни Депп (Johnny Depp)
Леди Гага (Lady Gaga)
Марк Цукерберг (Mark Zuckerberg)
Мерил Стрип (Meryl Streep)
Майкл Джексон (Michael Jackson)
Королева Елизавета (Queen Elizabeth)
Стэн Хэнсен (Stan Hansen) (50/50)
Стэн Ли (Stan Lee)
Уилл Смит (Will Smith)
Вольфганг Амадей Моцарт (Wolfgang Amadeus Mozart)
Гримас (Grimace)
Джек из коробки (Jack in the Box) (50/50)
Кулэйд Мэн (Koolaid Man)
Ла Парка (La Parka) (мексиканский рестлер)
M&M's (M&M's)
Человек Мишлен (Michelin Man)
Мистер Картофельная Голова (Mr. Potato Head)
Рональд Макдональд (Ronald McDonald)
Тони Тигр (Tony the Tiger)
Если вы давно хотели сделать серию изображений с каким-то известным персонажем - проверьте этот список! Возможно, он уже "встроен" в Flux.
А если вы знаете о персонаже, которого Flux хорошо генерирует, но его нет в списке - напишите об этом в комментариях. Автор оригинальной статьи обещает дополнять список.
Ссылка на оригинальную статью: https://civitai.com/articles/6986/resource-list-characters-i...
Очень полезная подборка - однозначно в избранное! 🌟
Вот такая фантазия родилась у нас с подписчиками во время пятничного стрима.
Получилось весьма мило, добиться такого стиля помогли лоры https://civitai.com/models/788990 и https://civitai.com/models/672535, а промпт и настройки генерации ниже.
anime in the style of drawings by alan edgar poe. A cute little girl in a pink bunny costume with a big kitchen knife in her hand and an evil smile, with glowing eyes. She takes a basket of pies from a big scared gray wolf. The wolf's face shows surprise and fear, its mouth is open with many teeth. <lora:creepcute-000001:1.0> <lora:Hyper-FLUX.1-dev-8steps-lora:.125> <lora:Junji_Ito_Style_F1D:0.7> jitostyle, monochrome Steps: 8, Sampler: [Forge] Flux Realistic, Schedule type: Simple, CFG scale: 1, Distilled CFG Scale: 3.5, Seed: 3019887914, Size: 768x1280, Model hash: 52cfce60d7, Model: flux1-dev-Q8_0, Lora hashes: "creepcute-000001: be4deb3540bb, Hyper-FLUX.1-dev-8steps-lora: 795f8f372bfb, Junji_Ito_Style_F1D: a474d4b4c761", Version: f2.0.1v1.10.1-previous-561-g82eb7566, Diffusion in Low Bits: Automatic (fp16 LoRA), Module 1: t5xxl_fp8_e4m3fn, Module 2: clip_l, Module 3: ae, Source Identifier: Stable Diffusion web UI
Привет, друзья! В этом видео мы детально разберем FLUX - революционную модель для генерации изображений. Узнаем, чем отличаются версии PRO, DEV и SCHNELL, как установить и настроить FLUX на вашем компьютере, и какую версию выбрать под вашу видеокарту. Погрузимся в мир квантованных моделей и узнаем, как получить максимальное качество при минимальных системных требованиях!
Альтернативный плеер YouTube:
⌚ Содержание:
00:00 Вступление
00:50 Обзор возможностей FLUX
06:26 Типы моделей FLUX: PRO, DEV, SCHNELL
09:07 Квантованные модели NF4
12:56 Модели GGUF и их особенности
18:55 Практическая часть: установка Forge
21:15 Настройка и использование FLUX в Forge
24:18 Портативная версия FLUX
25:18 Заключение
Схема из видео:
Ссылки из видео:
🛠️ Forge
🚀 FLUX.1 [schnell]
🧠 FLUX.1 [dev]
Дополнительные компоненты:
🎨 VAE
🔤 T5XXL
📊 T5XXL GGUF
🖼️ CLIP-L
GGUF модели:
🌟 FLUX.1-dev-gguf
⚡ FLUX.1-schnell-gguf
Прочее:
🔧 LoRa Hyper
💾 Модели NF4 dev, schnell+Hyper
🎭 Модель fp8 STOIQO NewReality
📱 Портативка FLUX.1 dev NF4 Portable
🔍 Апскейлер 4x-NMKD-Superscale
Пути:
Положите модель в models\Stable-diffusion.
Положите VAE в models\VAE
Положите clip-l и t5 в models\text_encoder
Положите Hyper лоры в models\lora
Положите 4x-NMKD-Superscale в models\ESRGN
В мире искусственного интеллекта произошло нечто невероятное - компания Pika Labs представила обновление своей нейросети для генерации видео, Pika 1.5. Это обновление не просто улучшает качество генерируемого контента, оно буквально взрывает наши представления о том, на что способен ИИ, и эта игра слов в заголовке не спроста, а потому что в новом обновлении вы можете взорвать и расплющить все что угодно!
Главная изюминка обновления - функция Pikaffects. Эта инновационная технология позволяет пользователям применять сюрреалистические эффекты к объектам в видео простым нажатием кнопки. Хотите увидеть, как ваша любимая чашка кофе превращается в воздушный шар? Или как символ вашей компании эффектно взрывается? Теперь это возможно!
Вот некоторые из доступных эффектов:
Explode it: объекты эффектно взрываются
Squish it: расплющить как пластелин
Melt it: расплавьте что угодно, словно свечку
Crush it: сплющите объект, как под гидравлическим прессом
Inflate it: раздуйте предметы, словно воздушные шары
Cake-ify it: превратите любой объект в аппетитный торт
Чтобы показать вам всю мощь Pika 1.5, я создал несколько изображений с помощью лучшей модели для генерации изображений - Flux, а затем применил к ним эффекты Pikaffects и просто без промпта. Ниже то, что у меня получилось.
Промпт и настройки генерации:
A hyper-realistic portrait, photorealistic photo close-up image of A tiny knight, dressed in shining silver armor that glints in the sunlight, rides atop a fluffy white bunny through a peaceful meadow filled with wildflowers. The knight’s helmet is slightly too big, causing it to tilt to one side, but his tiny sword is held high as he bravely surveys the landscape. The bunny hops along gently, its soft fur brushing against the knight’s armor with each bounce, creating a comical yet adorable sight. Around them, butterflies flit through the air, and birds sing from the branches of nearby trees, adding to the idyllic atmosphere. The knight, despite his small size, exudes a sense of courage and determination, as if ready to take on any challenge that might come their way. The meadow is awash with color, from the vibrant flowers to the lush green grass, making it feel like a perfect day for an adventure. The scene is both charming and whimsical, with the tiny knight and his bunny steed looking like they’ve stepped out of a fairy (photography, high-resolution, dynamic, energetic,hyper-realistic, dramatic lighting, shallow depth of field.), detailmaximizer, MythP0rt<lora:midjourney_whisper_flux_lora_v01:0.55><lora:aidmaMJ6.1-FLUX-V0.1:0.4><lora:FluxMythP0rtr4itStyle:0.4><lora:detailed_flux_ntc:2.2><lora:aidmaImageUpgrader-FLUX-V0.1:0.65>
Steps: 8, Sampler: [Forge] Flux Realistic, Schedule type: Simple, CFG scale: 1, Distilled CFG Scale: 3.5, Seed: 2315469810, Size: 768x1280, Model hash: 6e3e5990e9, Model: flux1DevHyperNF4Flux1DevBNB_flux1DevHyperNF4, Denoising strength: 0.35, Original Size: 768x1280, Hires CFG Scale: 1, Hires Distilled CFG Scale: 3.5, Hires schedule type: Simple, Hires upscale: 1.5, Hires upscaler: 4x_NMKD-Superscale-SP_178000_G, Version: f2.0.1v1.10.1-previous-546-gf4d5e8ca, Diffusion in Low Bits: Automatic (fp16 LoRA)
Без промпта
Explode it
Melt it
Crush it
Inflate it
Cake-ify it
Squish it
Промпт и настройки генерации:
aidmaponystyle. cow with shaggy fur, little horns, and a grumpy expression, sitting on a white background, highly stylized cartoon with ultra-realistic texturing, fur or skin with micro-detail visible, extremely expressive and exaggerated grumpy facial features, deep frown, narrowed eyes, furrowed brows, drooping mouth corners, body language reflecting annoyance (crossed arms where applicable, slumped posture), vibrant and intensely saturated colors, sharp and glossy highlights with realistic specular effects, 3D-render-like quality with strong shading and precise lighting to enhance depth, complex digital illustration technique, whimsical, humorous tone, cute appearance with adorable proportions, big eyes, rounded features, with bold black text saying "I HATE PEOPLE" next to the animal, ultra-sharp focus, intricate reflections, ambient occlusion for added realism, subtle backlighting to highlight character edges ,
<lora:Hyper-FLUX.1-dev-8steps-lora:.125>
Steps: 8, Sampler: [Forge] Flux Realistic, Schedule type: Simple, CFG scale: 1, Distilled CFG Scale: 3.5, Seed: 2106997802, Size: 1280x768, Model hash: 46947cfc89, Model: STOIQONewrealityFLUXSD_F1DAlpha, Denoising strength: 0.35, Original Size: 1280x768, Hires CFG Scale: 1, Hires Distilled CFG Scale: 3.5, Hires schedule type: Simple, Hires upscale: 1.5, Hires upscaler: 4x_NMKD-Superscale-SP_178000_G, Lora hashes: "Hyper-FLUX.1-dev-8steps-lora: 795f8f372bfb", Version: f2.0.1v1.10.1-previous-546-gf4d5e8ca, Diffusion in Low Bits: Automatic (fp16 LoRA), Module 1: ae, Module 2: clip_l, Module 3: t5xxl_fp8_e4m3fn
Без промпта
Explode it
Squish it
Melt it
Crush it
Inflate it
Промпт и настройки генерации:
dark and cyberpunk themed and displays an advertisement for a popular DJ. the poster depicts a DJ who is working the turntables at a rave; the poster focuses on the DJ and his turntables. the DJ is an adorable green kitten with alien ears wearing sunglasses and large headphones. the DJ is focusing completely on his turntables. there is a light show at the rave and different color lights illuminate the DJ from various angles. to either side of him are two huge full stack speakers vibrating with the music. at the top of the poster there is bright neon purple text: "DJ Kitty: most humble bro you know." at the bottom of the poster is also bright neon purple text: "Nostalgic Retro Synthwave."
<lora:Hyper-FLUX.1-dev-8steps-lora:.125>
Steps: 8, Sampler: [Forge] Flux Realistic, Schedule type: Simple, CFG scale: 1, Distilled CFG Scale: 3.5, Seed: 3696537514, Size: 768x1024, Model hash: 46947cfc89, Model: STOIQONewrealityFLUXSD_F1DAlpha, Denoising strength: 0.35, Original Size: 768x1024, Hires CFG Scale: 1, Hires Distilled CFG Scale: 3.5, Hires schedule type: Simple, Hires upscale: 1.5, Hires upscaler: 4x_NMKD-Superscale-SP_178000_G, Lora hashes: "Hyper-FLUX.1-dev-8steps-lora: 795f8f372bfb", Version: f2.0.1v1.10.1-previous-546-gf4d5e8ca, Diffusion in Low Bits: Automatic (fp16 LoRA), Module 1: ae, Module 2: clip_l, Module 3: t5xxl_fp8_e4m3fn
Без прмопта
Explode it
Squish it
Melt it
Crush it
Inflate it
Помимо захватывающих визуальных эффектов, Pika 1.5 предлагает ряд технических улучшений:
Увеличенная длительность видео (до 5 секунд)
Улучшенное качество изображения
Возможность управления движением камеры через текстовые запросы
Поддержка эмодзи в качестве запросов
Pika Labs - это не просто очередной стартап. Основанная бывшими PhD-студентами Стэнфордской лаборатории ИИ, Деми Го и Ченлинг Менг, компания привлекла внимание серьезных инвесторов. В 2023 году Pika Labs получила финансирование в размере $55 миллионов, возглавляемое Lightspeed Venture Partners. Среди инвесторов также значатся основатель Quora Адам Д'Анджело и сооснователь Giphy Алекс Чанг.
Обновление Pika 1.5 открывает новые горизонты для создателей контента, маркетологов и всех, кто хочет добавить в свои видео немного волшебства. Команда Pika Labs обещает и дальше совершенствовать свою технологию, делая создание захватывающих видео доступным для каждого.
Вот такую прелесть сгенерировал на днях в Forge.
Вот промпт и настройки генерации:
A hyper-realistic portrait, photorealistic photo close-up image of A tiny knight, dressed in shining silver armor that glints in the sunlight, rides atop a fluffy white bunny through a peaceful meadow filled with wildflowers. The knightâs helmet is slightly too big, causing it to tilt to one side, but his tiny sword is held high as he bravely surveys the landscape. The bunny hops along gently, its soft fur brushing against the knightâs armor with each bounce, creating a comical yet adorable sight. Around them, butterflies flit through the air, and birds sing from the branches of nearby trees, adding to the idyllic atmosphere. The knight, despite his small size, exudes a sense of courage and determination, as if ready to take on any challenge that might come their way. The meadow is awash with color, from the vibrant flowers to the lush green grass, making it feel like a perfect day for an adventure. The scene is both charming and whimsical, with the tiny knight and his bunny steed looking like theyâve stepped out of a fairy (photography, high-resolution, dynamic, energetic,hyper-realistic, dramatic lighting, shallow depth of field.), detailmaximizer, MythP0rt<lora:midjourney_whisper_flux_lora_v01:0.55><lora:aidmaMJ6.1-FLUX-V0.1:0.4><lora:FluxMythP0rtr4itStyle:0.4><lora:detailed_flux_ntc:2.2><lora:aidmaImageUpgrader-FLUX-V0.1:0.65>
Steps: 8, Sampler: [Forge] Flux Realistic, Schedule type: Simple, CFG scale: 1, Distilled CFG Scale: 3.5, Seed: 2315469810, Size: 768x1280, Model hash: 6e3e5990e9, Model: flux1DevHyperNF4Flux1DevBNB_flux1DevHyperNF4, Denoising strength: 0.35, Original Size: 768x1280, Hires CFG Scale: 1, Hires Distilled CFG Scale: 3.5, Hires schedule type: Simple, Hires upscale: 1.5, Hires upscaler: 4x_NMKD-Superscale-SP_178000_G, Version: f2.0.1v1.10.1-previous-546-gf4d5e8ca, Diffusion in Low Bits: Automatic (fp16 LoRA)
Технологии развиваются так быстро, что невольно задашься таким вопросом. Арт придумали на стриме, в стиле классического Призрака в Доспехах сделан в Forge, с помощью Лоры.
Промпт и настройки генерации:
source_anime, retrostyle photo in cyberpunk setting, ghostshell,
epic scene, born of the cyborg, A scientific laboratory, a stand to which a cyborg girl is strapped, her body consists entirely of (mechanical parts:1.2), no skin. wearing a top with a logo "Flux". A beautiful female face with intelligent eyes. Nearby, an elderly Japanese professor is repairing the stand with a wrench. The space is supplemented by many monitors, all with the same text "are"
<lora:Ghost_in_Shell_1995_Flux:1> ghostshell, retrostyle
Steps: 8, Sampler: [Forge] Flux Realistic, Schedule type: Simple, CFG scale: 1, Distilled CFG Scale: 3.5, Seed: 2605332661, Size: 1280x768, Model hash: 6e3e5990e9, Model: flux1DevHyperNF4Flux1DevBNB_flux1DevHyperNF4, Denoising strength: 0.45, Mask blur: 4, Inpaint area: Only masked, Masked area padding: 140, Lora hashes: "Ghost_in_Shell_1995_Flux: da5ae6a6889e", Version: f2.0.1v1.10.1-previous-540-gc2d290e6
Будем вам рады в нашем сообществе любителей генерации Stable Diffusion & Flux на Пикабу.