Профиль Neural.Academy на Пикабу

9

2 года назад

Продолжение поста «Близняшки. Stable Diffusion + TemporalKit»⁠⁠1

Улучшенная версия и теперь близняшку играет Скарлет Йохансон. Автор обещал поделиться инструкцией того как он это сделал, но позже. Выглядит как TemporalKit + Ebsynth
__
Мой канал с гайдами по SD. Где бесплатно обучаю с нуля и до самостоятельного обучения моделей.

Показать полностью

2

40

Neural.Academy

2 года назад

Stable Diffusion & Flux

Энтузиасты сделали машину по стилизации изображений нейросетью из старого телефонного коммутатора. Люблю такие штуки⁠⁠

Используется нейросеть Stable Diffusion.

__

Нейроновости - новости обо всем что касается нейронок. Midjourney, Stable Diffusion, ChatGPT и о тех о которых вы могли не слышать.

Мой канал с гайдами по SD. Где бесплатно обучаю с нуля и до самостоятельного обучения моделей.

Показать полностью

Stable Diffusion Арты нейросетей Нейронные сети Вертикальное видео Видео

2

152

Neural.Academy

2 года назад

Озвучка

Нейросеть которая озвучит вас, вашим голосом сразу на 8 языках⁠⁠

По факту вы говорите как носитель. На данный момент из текста. В будущем будет доступна генерация из вашего голоса. С повторением всех интонаций и пауз.

Шаг 1. Загружаете семпл своего голоса.

Шаг 2. Генерируем по этому тексту аудио на 8 языках и делаем с ним что хотим.

Пример работы копирования голоса:

Но есть нюанс. Пока что нет поддержки русского языка.

Пример мультиязычной озвучки:

Сайт: https://beta.elevenlabs.io/voice-lab

Из плюсов очень высокое качество, а из минусов, на данный момент нет поддержки русского языка. Статус перевода голоса в голос пока coming soons. Но сервис уже умеет клонировать ваш голос и озвучивать текст именно им. И делает он это ооочень хорошо.

Идеальное будущее я вижу так. Чат гпт пишет сценарий, элевен озвучивает его на всех популярных языках. Стабильная дифузия с помощью чата гпт генерирует слайды. А вы работаете на заводе 😐.

Кстати недавно я писал о нейросети которую можно установить локально, которая так же может синтезировать речь, делает она это бесплатно, но не так хорошо как данный сервис, но надеюсь догонит.

__

Нейроновости - новости обо всем что касается нейронок. Midjourney, Stable Diffusion, ChatGPT и о тех о которых вы могли не слышать.

Мой канал с гайдами по SD. Где бесплатно обучаю с нуля и до самостоятельного обучения моделей.

Показать полностью 1

Нейронные сети Обучение Сервис Озвучка Видео Вертикальное видео YouTube Длиннопост

21

45

Neural.Academy

2 года назад

Stable Diffusion & Flux

Как на самом деле должны выглядеть морские котики⁠⁠

Создано с помощью Stable Diffusion и смешивания запросов [lion:lionfish:15] и т.д. Как это работает подробно писал у себя в ТГ, где обучаю всем этим штукам.

Модель для генерации: Realistic Vision.

Показать полностью 2

Stable Diffusion Нейронные сети Арты нейросетей Обучение

1

25

Neural.Academy

2 года назад

Видеохостинг на Пикабу

Ответ на пост «Завораживающая крипота»⁠⁠1

Там крипота, а тут красота. Одни объекты перетекают в другие. Так работает плагин, который называется Deforum в связке со Stable Diffusion.
__

Мой канал с гайдами по SD. Где бесплатно обучаю с нуля и до самостоятельного обучения моделей.

Показать полностью

Кот Вертикальное видео Видео Нейронные сети Кислота Арты нейросетей Stable Diffusion Ответ на пост

2

1803

Neural.Academy

2 года назад

Лига фотожоперов

Бесплатный редактор изображений с возможностями ИИ на вашем ПК⁠⁠

На видео можно увидеть то как легко можно вписывать совершенно новые объекты в сцену, заменять фон, создавать изображения из каракулей и стилизовать текст под окружение.

Чем отличается / что нового по сравнению с другими интерфейсами для Stable Diffsusion:

- прежде всего, это сделано с учетом реального приложения для редактирования изображений, поэтому оно больше похоже на сам Photoshop. Следовательно, это профессиональный инструмент, и ему нужно немного освоиться с новым рабочим процессом.
- Удаление фона AI
- Замена фона AI
- функция векторизации
- классный новый текстовый инструмент для генерации текста AI
- healing brush
- очень важно: управление слоями
- 3D слои с библиотекой ресурсов и простыми примитивами
- Слой Pose с 3D pose и pose library
- Слои Scribble и сегментации с предварительным просмотром в реальном времени
- отличная комбинация ControlNet 1.1 и T2I Coadapter для обоих миров
- специальная также поддерживается функция outpainting, infinitiy canvas
- все можно комбинировать с inpainting, что очень полезно
- поддержка пользовательских кистей, layer brush от поколений искусственного интеллекта

Так же доступен нейросетевой апскейл и другие базовые вещи для Stable Diffusion.

Требования: Видеокарта Nvidia с не менее 4gb видеопамяти.

Для установки необходимо перейти на сайт: https://gyre.ai/docs/install/gyre-installer

Download the bundle installer. <- Нажать на это. Можно сделать прямо отсюда

Распаковать архив и запустить install_or_update. Ждать, первый запуск будет дольше последующих так как будут скачиваться необходимые зависимости. А после его работы в папке появится еще один файл run.cmd. Запустите его. Первый запуск снова будет дольше последующих. Когда процесс будет завершен, в браузере перейдите по адресу: http://localhost:5000/. Пользуемся. Для последующих запусков просто запускаем run и переходим по адресу.

Дополнительные примеры работы где можно увидеть работу по удалению объектов и дорисовыванию изображений.

__

Нейроновости (источник )- новости обо всем что касается нейронок. Midjourney, Stable Diffusion, ChatGPT и о тех о которых вы могли не слышать.

Мой канал с гайдами по SD. Где бесплатно обучаю с нуля и до самостоятельного обучения моделей.

Показать полностью 1

Нейронные сети Stable Diffusion Обучение Гайд Видео YouTube Длиннопост

145

37

Neural.Academy

2 года назад

Лига Разработчиков Видеоигр

Новая нейросеть которая генерирует звуки окружения. Работа саунд дизайнеров должна стать проще⁠⁠

Нейросеть TANGO (ссылка на Github), умеет генерировать пенье птиц, шум толпы, апплодисменты, звуки природы и так далее.

Пример грома и аплодисментов:

TANGO обучен на небольшом наборе данных AudioCaps, поэтому он может не генерировать хорошие аудиообразцы, связанные с понятиями, которые он не видел в обучении (например, пение). Из-за этой же причины TANGO не всегда может тонко управлять своими генерациями по текстовым подсказкам. Например, очень похожи поколения для подсказок Рубка помидоров на деревянном столе и Резка картошки на металлическом столе. Нарезание овощей на столе также производит аналогичные звуковые сэмплы.

Но на гитхабе есть инструкция как натренировать нейросеть на своём дата сете. Так что если у вас завалялось несколько сотен или тысяч размеченных аудиофайлов они могут сослужить вам службу) Ну или ждем когда сообщество сделает всю работу 😐

__

Нейроновости - новости обо всем что касается нейронок. Midjourney, Stable Diffusion, ChatGPT и о тех о которых вы могли не слышать.

Мой канал с гайдами по SD. Где бесплатно обучаю с нуля и до самостоятельного обучения моделей.

Показать полностью

Нейронные сети Обучение Видео

2

85

Neural.Academy

2 года назад

Stable Diffusion & Flux

Классный нейроарт который возможен только благодаря нескольким плагинам для управления генерацией⁠⁠

Существует не одно такое расширение, но автор использовал это, для веб интерфейса automatic1111. Оно разделяет генерацию на части и повзоляет писать подсказки для каждого региона в отдельности. В итоге это выглядело вот так:

Подсказка:

side view of a giant boulder <lora:sxzBlizzardStyleWarcraft_sxzBlizzV2:0.25> <lora:mermaidsLoha_v120:1> (pascal campion:0.3) long shot, (side view), lake, masterpiece, high quality ADDBASE blue sky, bright day light ADDROW side view, above water, lake, bright, clear skies, day light ADDCOL low angle, long shot, yellow clear bright day light, above water, teal lake water, side view of a (woman mermaid:1.5) with fish tail sitting on a rock boulder ADDCOL lake, above water, bright, clear skies

ADDROW (semi translucent water ripples), foam, transition between above water and (underwater), side view of boulder in the center

ADDROW submerged, underwater, dark ADDCOL long shot, ((underwater)), submerged, deep, dark, side view (glow:0.4), volumetric fog, monolith boulder made from a piles of small bones and many human skulls ADDCOL submerged, underwater, dark ADDROW underwater, sand, bedrock, blue fog, volumetric

Negative prompt

easynegative, nsfw, perspective, ADDCOMM

Settings

Steps: 25, Sampler: Euler a, CFG scale: 7, Seed: 2768402191, Size: 512x768, Model hash: f57b21e57b, Model: revAnimated_v121, Clip skip: 2,

Настройки для регионов:

RP Active: True, RP Divide mode: Horizontal, RP Calc Mode: Attention, RP Ratios: "1;2,1,2,1;1;5,1,4,1;1", RP Base Ratios: 0.2, RP Use Base: True, RP Use Common: False, RP Use Ncommon: True

Для создания горы черепов использовалась Лора. Автор сделал ее через инпейнт.

__

Мой канал с гайдами по SD. Где бесплатно обучаю с нуля и до самостоятельного обучения моделей.

Показать полностью 2

Арты нейросетей Нейронные сети Stable Diffusion Цифровой рисунок Обои на телефон Длиннопост

2

Neural.Academy

Серии постов

Stable Diffusion для ЛЛ

Продолжение поста «Близняшки. Stable Diffusion + TemporalKit»⁠⁠1

Энтузиасты сделали машину по стилизации изображений нейросетью из старого телефонного коммутатора. Люблю такие штуки⁠⁠

Нейросеть которая озвучит вас, вашим голосом сразу на 8 языках⁠⁠

Как на самом деле должны выглядеть морские котики⁠⁠

Ответ на пост «Завораживающая крипота»⁠⁠1

Бесплатный редактор изображений с возможностями ИИ на вашем ПК⁠⁠

Новая нейросеть которая генерирует звуки окружения. Работа саунд дизайнеров должна стать проще⁠⁠

Классный нейроарт который возможен только благодаря нескольким плагинам для управления генерацией⁠⁠