
Stable Diffusion для ЛЛ
24 поста
24 поста
Улучшенная версия и теперь близняшку играет Скарлет Йохансон. Автор обещал поделиться инструкцией того как он это сделал, но позже. Выглядит как TemporalKit + Ebsynth
__
Мой канал с гайдами по SD. Где бесплатно обучаю с нуля и до самостоятельного обучения моделей.
Используется нейросеть Stable Diffusion.
__
Нейроновости - новости обо всем что касается нейронок. Midjourney, Stable Diffusion, ChatGPT и о тех о которых вы могли не слышать.
Мой канал с гайдами по SD. Где бесплатно обучаю с нуля и до самостоятельного обучения моделей.
По факту вы говорите как носитель. На данный момент из текста. В будущем будет доступна генерация из вашего голоса. С повторением всех интонаций и пауз.
Шаг 1. Загружаете семпл своего голоса.
Шаг 2. Генерируем по этому тексту аудио на 8 языках и делаем с ним что хотим.
Пример работы копирования голоса:
Но есть нюанс. Пока что нет поддержки русского языка.
Пример мультиязычной озвучки:
Из плюсов очень высокое качество, а из минусов, на данный момент нет поддержки русского языка. Статус перевода голоса в голос пока coming soons. Но сервис уже умеет клонировать ваш голос и озвучивать текст именно им. И делает он это ооочень хорошо.
Идеальное будущее я вижу так. Чат гпт пишет сценарий, элевен озвучивает его на всех популярных языках. Стабильная дифузия с помощью чата гпт генерирует слайды. А вы работаете на заводе 😐.
Кстати недавно я писал о нейросети которую можно установить локально, которая так же может синтезировать речь, делает она это бесплатно, но не так хорошо как данный сервис, но надеюсь догонит.
__
Нейроновости - новости обо всем что касается нейронок. Midjourney, Stable Diffusion, ChatGPT и о тех о которых вы могли не слышать.
Мой канал с гайдами по SD. Где бесплатно обучаю с нуля и до самостоятельного обучения моделей.
Создано с помощью Stable Diffusion и смешивания запросов [lion:lionfish:15] и т.д. Как это работает подробно писал у себя в ТГ, где обучаю всем этим штукам.
Модель для генерации: Realistic Vision.
Там крипота, а тут красота. Одни объекты перетекают в другие. Так работает плагин, который называется Deforum в связке со Stable Diffusion.
__
Мой канал с гайдами по SD. Где бесплатно обучаю с нуля и до самостоятельного обучения моделей.
На видео можно увидеть то как легко можно вписывать совершенно новые объекты в сцену, заменять фон, создавать изображения из каракулей и стилизовать текст под окружение.
Чем отличается / что нового по сравнению с другими интерфейсами для Stable Diffsusion:
- прежде всего, это сделано с учетом реального приложения для редактирования изображений, поэтому оно больше похоже на сам Photoshop. Следовательно, это профессиональный инструмент, и ему нужно немного освоиться с новым рабочим процессом.
- Удаление фона AI
- Замена фона AI
- функция векторизации
- классный новый текстовый инструмент для генерации текста AI
- healing brush
- очень важно: управление слоями
- 3D слои с библиотекой ресурсов и простыми примитивами
- Слой Pose с 3D pose и pose library
- Слои Scribble и сегментации с предварительным просмотром в реальном времени
- отличная комбинация ControlNet 1.1 и T2I Coadapter для обоих миров
- специальная также поддерживается функция outpainting, infinitiy canvas
- все можно комбинировать с inpainting, что очень полезно
- поддержка пользовательских кистей, layer brush от поколений искусственного интеллекта
Так же доступен нейросетевой апскейл и другие базовые вещи для Stable Diffusion.
Требования: Видеокарта Nvidia с не менее 4gb видеопамяти.
Для установки необходимо перейти на сайт: https://gyre.ai/docs/install/gyre-installer
Download the bundle installer. <- Нажать на это. Можно сделать прямо отсюда
Распаковать архив и запустить install_or_update. Ждать, первый запуск будет дольше последующих так как будут скачиваться необходимые зависимости. А после его работы в папке появится еще один файл run.cmd. Запустите его. Первый запуск снова будет дольше последующих. Когда процесс будет завершен, в браузере перейдите по адресу: http://localhost:5000/. Пользуемся. Для последующих запусков просто запускаем run и переходим по адресу.
Дополнительные примеры работы где можно увидеть работу по удалению объектов и дорисовыванию изображений.
__
Нейроновости (источник )- новости обо всем что касается нейронок. Midjourney, Stable Diffusion, ChatGPT и о тех о которых вы могли не слышать.
Мой канал с гайдами по SD. Где бесплатно обучаю с нуля и до самостоятельного обучения моделей.
Нейросеть TANGO (ссылка на Github), умеет генерировать пенье птиц, шум толпы, апплодисменты, звуки природы и так далее.
Пример грома и аплодисментов:
TANGO обучен на небольшом наборе данных AudioCaps, поэтому он может не генерировать хорошие аудиообразцы, связанные с понятиями, которые он не видел в обучении (например, пение). Из-за этой же причины TANGO не всегда может тонко управлять своими генерациями по текстовым подсказкам. Например, очень похожи поколения для подсказок Рубка помидоров на деревянном столе и Резка картошки на металлическом столе. Нарезание овощей на столе также производит аналогичные звуковые сэмплы.
Но на гитхабе есть инструкция как натренировать нейросеть на своём дата сете. Так что если у вас завалялось несколько сотен или тысяч размеченных аудиофайлов они могут сослужить вам службу) Ну или ждем когда сообщество сделает всю работу 😐
__
Нейроновости - новости обо всем что касается нейронок. Midjourney, Stable Diffusion, ChatGPT и о тех о которых вы могли не слышать.
Мой канал с гайдами по SD. Где бесплатно обучаю с нуля и до самостоятельного обучения моделей.
Существует не одно такое расширение, но автор использовал это, для веб интерфейса automatic1111. Оно разделяет генерацию на части и повзоляет писать подсказки для каждого региона в отдельности. В итоге это выглядело вот так:
Подсказка:
side view of a giant boulder <lora:sxzBlizzardStyleWarcraft_sxzBlizzV2:0.25> <lora:mermaidsLoha_v120:1> (pascal campion:0.3) long shot, (side view), lake, masterpiece, high quality ADDBASE blue sky, bright day light ADDROW side view, above water, lake, bright, clear skies, day light ADDCOL low angle, long shot, yellow clear bright day light, above water, teal lake water, side view of a (woman mermaid:1.5) with fish tail sitting on a rock boulder ADDCOL lake, above water, bright, clear skies
ADDROW (semi translucent water ripples), foam, transition between above water and (underwater), side view of boulder in the center
ADDROW submerged, underwater, dark ADDCOL long shot, ((underwater)), submerged, deep, dark, side view (glow:0.4), volumetric fog, monolith boulder made from a piles of small bones and many human skulls ADDCOL submerged, underwater, dark ADDROW underwater, sand, bedrock, blue fog, volumetric
Negative prompt
easynegative, nsfw, perspective, ADDCOMM
Settings
Steps: 25, Sampler: Euler a, CFG scale: 7, Seed: 2768402191, Size: 512x768, Model hash: f57b21e57b, Model: revAnimated_v121, Clip skip: 2,
Настройки для регионов:
RP Active: True, RP Divide mode: Horizontal, RP Calc Mode: Attention, RP Ratios: "1;2,1,2,1;1;5,1,4,1;1", RP Base Ratios: 0.2, RP Use Base: True, RP Use Common: False, RP Use Ncommon: True
Для создания горы черепов использовалась Лора. Автор сделал ее через инпейнт.
__
Мой канал с гайдами по SD. Где бесплатно обучаю с нуля и до самостоятельного обучения моделей.