Серия «Полезные и интересные нейросети»

113

Fish Speech - Нейросеть для озвучки текста вашим голосом. Портативная версия1

🎙 Fish Speech 1.5 – это модель преобразования текста в речь, созданная для генерации естественного и качественного голоса. Она идеально подходит для разработчиков, создателей контента и всех, кто ищет продвинутую TTS-технологию.

Fish Speech - Нейросеть для озвучки текста вашим голосом. Портативная версия Нейронные сети, Программа, Deepfake

🔥 Ключевые особенности:

- Поддержка клонирования голоса – добавь уникальность, просто загрузив референсный аудио-файл. Достаточно 10-30 секунд для копирования вашей речи.

- Высокое качество генерации – реалистичная речь с интонациями.

- Гибкая настройка – параметры Top-P, Temperature и Seed позволяют контролировать стиль и выразительность голоса.

- Поддержка мультиязычности – используйте модель для различных языков: английский, китайский, японский, немецкий, французский, испанский, корейский, арабский, русский, нидерландский, итальянский, польский и португальский.

- Простой интерфейс – минималистичный и понятный UI через Gradio.

💡 Для кого подходит?

Создатели подкастов, разработчики приложений, голосовые ассистенты, генераторы контента для видео, образовательные платформы.

---

Пошаговый гайд:

1. Ввод текста:

- В поле Input Text напишите текст на любом поддерживаемом языке.

2. Референсное аудио (опционально):

- Для клонирования голоса переключитесь на вкладку Reference Audio и загрузите образец голоса.

3. Настройка параметров:

- Используйте Advanced Config, чтобы настроить параметры синтеза под свои нужды.

Расширенные настройки:

- Iterative Prompt Length – определяет длину итерации текста (0 отключает эту функцию).

- Top-P – отвечает за разнообразие текста, чем выше значение, тем более свободной будет речь.

- Temperature – регулирует степень "творчества" в синтезе речи.

- Repetition Penalty – снижает повторяемость слов для более естественного результата.

- Seed – задаёт случайность генерации, 0 для случайного результата, любое число – для детерминированного.

4. Генерация:

- Нажмите Generate. После генерации аудио появится в правой части интерфейса. Вы можете прослушать результат или скачать его.

5. Эксперименты:

- Изменяйте параметры, такие как Top-P и Temperature, чтобы добиться нужного стиля речи.

Программа достаточно неприхотлива к видеопамяти и использует всего несколько гигабайт видеопамяти.

Я подготовил для вас портативную версию, которая позволяет запустить программу всего в пару кликов:

1) Распакйте архив
2) Запустите файл start_fish_audio_portable.bat

Скачать портативный Fish Speech 1.5 можно:

С моего хранилища | С зеркала (Yandex Disk)


Больше различных сборок, в том числе и будущие обновления, гайдов и новостей из мира AI и нейросетей доступно в моем Телеграм канале:

Neurogen

Показать полностью
45

Stable Video Diffusion - генератор видео у вас на ПК. Портативная версия

Всем привет с вами Neurogen, думаю, с момента релиза, уже многие знакомы со Stable Video Diffusion или хотя бы слышали - модель, позволяющая локально, у вас на ПК, генерировать короткие видео из изображения или же по текстовому промпту.

Сегодня на обзоре будет версия img2vid, создающая видео на основе изображения. Для комфортной работы понадобится видеокарта Nvidia с количеством видеопамяти не менее 16 гигабайт. Если у вас меньше, но приличное количество оперативной памяти - вы тоже можете попробовать, но главное обновите драйвер до последней версии.

Интерфейс программы достаточно простой и по факту процесс генерации заключается в двух действиях:

Stable Video Diffusion - генератор видео у вас на ПК. Портативная версия Нейронные сети, Видеомонтаж, Гайд, Компьютерная графика, Арты нейросетей, Stable Diffusion, Видео, Без звука, Длиннопост
  • Прикрепить изображение

  • Нажать Generate

Но, здесь есть и дополнительные настройки.

Seed - по умолчанию, каждая попытка выдает рандомный результат. Если вы хотите повторить попытку, используйте один и тот же seed

Number of frames decoded at a time - Параметр, который должен влиять на скорость работы, но по факту его влияние не так ощутимо. Для уменьшения потребления видеопамяти рекомендуется выставить на 1

Number of frames in video - Количество кадров в видео. Параметр экспериментальный и работает нестабильно, лучше оставить как есть

Motion bucket id - влияет на количество и тип анимаций в видео.
Frames per second - FPS, сколько кадров в секунду будет у вашего видео

Получившиеся результаты сохраняются в папку outputs

Портативная версия отличается тем, что всё уже готово для работы, вам не надо устанавливать Python, Cuda и т.д. - качаете, распаковываете и запускаете.

Скачать архивом и через torrent можно тут:

Скачать
Качаете все файлы, затем распаковываете архив который заканчивается на 001. Остальные файлы подтянутся сами, другие архивы распаковывать не надо. Затем просто запускаете start_portable_nvidia.bat и ждете когда откроется вкладка с WebUI в браузере. Если этого не произошло то просто откройте сами адрес http://127.0.0.1:7860

Что же касается генерации по текстовому промпту - релиз данной версии будет в моем Телеграм канале. Также там можно найти и другие портативные сборки различных нейронок.

А если захочется обсудить данную сборку или же просто пообщаться на тему ИИ, то вступайте в наш чат.

Показать полностью 1 2
35

Нейросеть, которая анимирует любое лицо

Данную нейросеть очень сильно просили ребята с моего телеграм канала по этому я решил сделать её портативную версию.

В целом, нейросеть максимально простая. На вход мы подаем изображение и видео, с которого будет захватываться анимация, подогнанное друг под друга. Затем нажимаем генерировать и получаем видео анимированного лица. Пример можно посмотреть в небольшом обзоре выше.

Что же касается работы, в целом программа работает как с GPU ускорением, если у вас видеокарта Nvidia так и без него, но уже на вашем процессоре.

Саму нейросеть можно найти тут: Github

В чем отличие портативной версии:

  • Есть графический интерфейс

  • Все готово к работе, не надо ничего качать и устанавливать

  • Последние версии библиотек для работы с GPU

Нейросеть, которая анимирует любое лицо Нейронные сети, Deepfake, Анимация, Компьютерная графика, Видео, YouTube

Графический интерфейс программы на базе WebUI

Скачать портативную версию можно тут.

Ну а если вам интересны другие прикладные нейронки, а также их портативные сборки, то подписывайтесь на мой Телеграм канал.

Если же вы просто хотите пообщаться на тематику нейросетей, у вас есть какие-то вопросы, то добро пожаловать в наш чат.

Показать полностью 1
197

Lama Cleaner - нейронная альтернатива Photoshop | Портативная версия

Нейросеть для обработки фото и изображений, позволяющая редактировать, ретушировать и изменять объекты на изображении.



В целом, думаю, многие слышали про Lama Cleaner и уже активно пользуются, поэтому информация дальше будет для тех, кто не знаком с данной программой.

Кому полезно: дизайнерам, фотографам, цифровым художникам и другим пользователям, работающим с изображениями.

Основные функции Lama Cleaner включают в себя:

  1. Удаление объекта: Это ключевая функция, позволяющая пользователям выделить и удалить любой объект на фотографии. Программа использует различные нейросетевые модели для замены удаленного объекта и сохранения естественного вида изображения.

  2. Добавление объекта: Lama Cleaner функцию Inpaint, которая позволяет пользователям добавлять новые объекты на изображение, при помощи моделей Stable Diffusion.

Официальная страница программы тут: GitHub

По просьбе моих подписчиков, подготовил портативную версию данной программы. В отличие от официальной версии, она не требует установки Python и других зависимостей, всё уже идет в комплекте.

Особенности сборки:

- Установлены самые последние версии Torch и Xformers

- Предзагружена базовая модель

Для запуска необходимо:

- Загрузить архив:

Торрент | Яндекс Диск

Полная версия, со всеми загруженными моделями (20 гигабайт):
Торрент | Яндекс Диск

- Распаковать, запустить start_portable_nvidia.bat (для нормальной работы нужна видеокарта Nvidia, в ином случае придется работать на CPU).

После чего, открываем в браузере адрес: http://127.0.0.1:8080

После этого у нас откроется интерфейс для работы. Загружаем изображение, начинаем работу.

Ну, а больше портативных сборок различных нейросетей, а также бесплатный ChatGPT можно найти в моем телеграм канале.

А обсудить программу можно в нашем чате.

Показать полностью 1
19

Бесплатный доступ к ChatGPT на вашем iPhone

С историей диалога, и возможностью общения через Siri.

Для начала качаем нашего чат бота с iCloud: https://www.icloud.com/shortcuts/d0f4de78d4bb44fdbdb3208dce3...

Бот сделан через приложение Команды и использует наш API сервер проекта NeuroGPT. GitHub проекта: https://github.com/Em1tSan/NeuroGPT

После загрузки нажимаете Настроить, а затем Добавить. Теперь в списке команд у нас появился Нейробот. Для удобства можете добавить его как виджет на рабочий стол.

Бесплатный доступ к ChatGPT на вашем iPhone Нейронные сети, Инструкция, Программа, Apple, iOS, iPhone, ChatGPT, Длиннопост

Для того чтобы начать чат, просто нажмите на виджет и введите свой текст, к примеру мы попросим рассказать его про Нептун.

Бесплатный доступ к ChatGPT на вашем iPhone Нейронные сети, Инструкция, Программа, Apple, iOS, iPhone, ChatGPT, Длиннопост
Бесплатный доступ к ChatGPT на вашем iPhone Нейронные сети, Инструкция, Программа, Apple, iOS, iPhone, ChatGPT, Длиннопост

Если текст отображен не полностью то просто нажмите на сообщение и оно откроется целиком.

Кнопка Отмена закрывает чат, кнопка Готово перейдет к след запросу.

Для активации Siri необходимо сказать "Siri, Нейробот" и она запустит команду.

Будущие обновления будут выходить в моем Telegram канале: https://t.me/neurogen_news

Также можно найти другую информацию по различным нейросетям.

Ну а если у вас возникнут трудности, спросить помощи можно в нашем чате: https://t.me/neurogen_chat

Показать полностью 3
189

Обзор FaceFusion - перевоплощение популярного дипфейка Roop. Портативная версия в конце статьи

Обзор FaceFusion - перевоплощение популярного дипфейка Roop. Портативная версия в конце статьи Нейронные сети, Гайд, Deepfake, Face swap, Portable, Обзор, Монтаж, Видеомонтаж, Длиннопост

FaceFusion - это продукт одного из разработчиков популярного дипфейка Roop. Дело в том, что у них произошел разлад, проект Roop закрался, а команда разошлась.

В целом, FaceFusion - это тот же самый Roop, только с интерфейсом на базе Gradio, который многие знают по Stable Diffusion от Automatic1111

Тем не менее множество функций тут вынесены из командной строки в интерфейс.

Обзор FaceFusion - перевоплощение популярного дипфейка Roop. Портативная версия в конце статьи Нейронные сети, Гайд, Deepfake, Face swap, Portable, Обзор, Монтаж, Видеомонтаж, Длиннопост



FRAME PROCESSORS - этот модуль отвечает за обработку кадров.
face_swapper - просто замена лица
face_enhancer - улучшение лица (через GFPGAN)
frame_enhancer - новая опция, апскейлит весь кадр.

EXECUTION PROVIDERS - тут вы выбираете ваш бэкенд, через что будет идти обработка. На видеокартах Nvidia это Cuda либо TensoRT, на AMD это DirectML (DML), если запускать на Windows.

Остальные же параметры в блоке EXECUTION отвечают за скорость обработки. Больше потоков - больше скорость, больше потребление видеопамяти. Поэтому выставляйте в меру, большое количество потоков может привести к вылету либо к замедлению работы.

MAX MEMORY - лимит потребления оперативной памяти.

OUTPUT VIDEO ENCODER - через какой енкодер будут собраны кадры в видео, после замены лица. Для видеокарт Nvidia можно использовать NVENC, так как он базируется на аппаратном ускорении.


KEEP FPS, KEEP TEMP, SKIP AUDIO - Отвечают за то, чтобы Сохранить фпс оригинального видео, оставить временную папку с раскадровками и пропустить аудио.

Обзор FaceFusion - перевоплощение популярного дипфейка Roop. Портативная версия в конце статьи Нейронные сети, Гайд, Deepfake, Face swap, Portable, Обзор, Монтаж, Видеомонтаж, Длиннопост

Средний блок отвечает за выбор файлов с которыми мы будем работать.

SOURCE - фото с лицом, на которое будем менять

TARGET - фото или видео, в котором будем менять лицо

OUTPUT PATH - где будет сохранено видео. Также в Output появится итоговое видео

Обзор FaceFusion - перевоплощение популярного дипфейка Roop. Портативная версия в конце статьи Нейронные сети, Гайд, Deepfake, Face swap, Portable, Обзор, Монтаж, Видеомонтаж, Длиннопост

Третий блок содержит в себе:

PREVIEW - Тут вы можете посмотреть как будет выглядеть замена.
FACE RECOGNITION - выбор распознавания лиц. Либо на основе референса, либо все лица.

REFERENCE FACE - тут как раз и будут лица, распознанные на кадре из превью. Выбирая их, вы выбираете какое лицо будет меняться в кадре.

Оставшиеся параметры отвечают за настройки анализа лиц.

Что касается скорости работы - я не заметил разницы с последней версией Roop. Все примерно точно так же, шустро, но можно и шустрее (Refacer и Rope тому примеры)

Как обычно, я сделал портативную версию с запуском в 1 клик. Пока что готова версия для Nvidia, версия для AMD будет позже, ссылку на нее оставлю у себя в Телеграм канале.

Скачать портативную версию можно по ссылкам:

Мое облако | Яндекс Диск

Особенности портативной сборки:
- Запуск в 1 клик, не надо ничего устанавливать
- Удалена 18+ цензура.
- Обновлены библиотеки CUDA (Cudnn 8.9.4)

После открытия программы, откройте в браузере адрес, который будет написан в консоли (обычно http://127.0.0.1:7860)

Последующие обновления, а так же другие дипфейки можно найти у меня в Телеграм канале, а пообщаться на тематику всего, что связано с нейронками - можно в нашем чате.

Показать полностью 4
401

DeepFake Swap Mukham - всё в одном. Универсальный DeepFake

Тут есть замена лиц в видео, фото и даже пакетная обработка. Работает на Nvidia, AMD и CPU.

DeepFake Swap Mukham - всё в одном. Универсальный DeepFake Нейронные сети, Deepfake, Face swap, Монтаж, Обзор, Видеоредактор, Видео, YouTube, Длиннопост

Подробный обзор функционала в данном видео:

Ну а в этом посте мы кратко пробежимся по ключевым особенностям:

GitHub оригинального проекта. Я убрал NSFW цензуру и добавил ряд оптимизаций.

  • Большой список определения лиц: по полу, возрасту, положению в кадре, по сходству.

  • Тонкие настройки маски: Вы можете контролировать какие части лица менять, а какие оставить.

DeepFake Swap Mukham - всё в одном. Универсальный DeepFake Нейронные сети, Deepfake, Face swap, Монтаж, Обзор, Видеоредактор, Видео, YouTube, Длиннопост
  • Поддержка улучшителей лица: GFPGAN, GPEN, CODEFORMER, RESTOREFORMER

DeepFake Swap Mukham - всё в одном. Универсальный DeepFake Нейронные сети, Deepfake, Face swap, Монтаж, Обзор, Видеоредактор, Видео, YouTube, Длиннопост

Скачать портативную версию, не требующую установки и доп. программ и зависимостей можно тут и с Яндекс Диска.

Ну, а будущие обновления, а также портативные версии roop, refacer и других полезных нейронок можно найти в моем телеграм канале.

Показать полностью 2
486

Портативная версия улучшенной версии Stable Diffusion с запуском в 1 клик (работает на видеокартах Nvidia и AMD)

Многие просили меня сделать собственную версию портативной версии Stable Diffusion, и вот наконец-то у меня дошли руки.

Портативная версия улучшенной версии Stable Diffusion с запуском в 1 клик (работает на видеокартах Nvidia и AMD) Stable Diffusion, Нейронные сети, Гайд, Сборка, Арты нейросетей, AMD, Nvidia, Видео, YouTube, Длиннопост


За основу взят форк stable-diffusion-webui под названием SD.Next (он же automatic от vladmandic). У меня был его обзор на YouTube канале, сейчас он конечно сильно изменился, но функции из видео все еще остались на месте.

В чем отличие от automatic1111:

  • SD.Next отличается глубокой оптимизацией и улучшенной производительностью, а также расширенным функционалом.

  • Больший диапазон настроек.

  • Предустановлен и интегрирован в систему ряд расширений: ControlNet, Tiled VAE, Image Browser и другие.

  • Возможность переключиться на diffusers, что расширяет поддержку моделей, добавляя поддержку Kandinsky 2.1 и других.

  • Работа на GPU Nvidia, AMD, Intel и в том числе на процессорах из коробки.

Особенности портативной версии:

- Не требует установки Python, GIT, Cuda toolkit и т.д. Скачали, распаковали, пользуетесь.

- Предустановлен VAE и универсальная модель dreamshaper v8

- Предустановлены кастомные ESRGAN апскейлеры

- Предустановлено расширение roop (замена лица на изображениях)

- Предустановлено расширение swap-mukham (замена лица на изображениях, видео)

- Обновляется автоматически при каждом запуске

Поддерживаются видеокарты Nvidia и AMD и Intel ARC

Скачать портативную версию можно по этой ссылке

Для запуска необходимо распаковать архив через WinRAR или 7zip и запустить файл universal_start.bat


Будущие обновления сборки, а также другие полезные нейросети с простым запуском можно найти в моем телеграм канале Neurogen

Показать полностью 1 1
Отличная работа, все прочитано!