PsyEyesOfficial

PsyEyesOfficial

Креатив + AI + Web3... и мемы Личная страница https://t.me/+U6skQIZEFgAxZjEy
На Пикабу
поставил 64 плюса и 1 минус
отредактировал 1 пост
проголосовал за 0 редактирований
2939 рейтинг 22 подписчика 17 подписок 49 постов 6 в горячем

Triniti: меняем голос в песне или записии речи

CreateSafe: добавили в свою звуковую модель Triniti возможность менять голос из любой песни / записи речи на голос Grimes, DAOuda, или Adrienne. Достаточно скормить ссылку на YouTube, файлик, или сделать запись с микрофона. Работает даже на русском.

На генерацию уходит пара минут. Качество на выходе отличное: музыка почти не обрезается по частотам и не тонет в шумах, а голос звучит гармонично, не задвигая инструменты на задний план.

В сложных фрагментах (скрим, эффекты на голосе, итд) сгенерированный вокал может проседать, потому что этого не было в тренировочных данных. В этом плане RVC и работа ручками всё также в топе.

Через Triniti можно будет клонировать свой голос, регистрировать его на блокчейн, и монетизировать через смарт контракты. Помимо этого там можно генерить музыку, получать от нейронки ответы про музыкальную индустрию, вычислять роялти со сделок, и скоро делать дистрибуцию, в том числе и генератива.

Трек: Васса Железнова — Дети Балконов

Больше интересностей у меня в телеге Psy Eyes: https://t.me/+U6skQIZEFgAxZjEy

Показать полностью

Киберпанк "Криминальная Россия"

Новая фича "Avatar In Motion" от Heygen, прямо хороша. Есть и блики, и шум города, и слышно дыхание. А липсинк и жестикуляция! Жаль только ограничение в 400 символов, пришлось в два захода делать. Зато теперь мы знаем, что можно генерить в разных локациях (пока двух похоже).

Вот такие видео, как и то видео в поезде от Sora и есть показатель уровня нейросетей сейчас.

Генерится очень быстро без регистрации, и видео в течение пары минут приходит тебе на почту. Помню раньше это занимало больше часа. Думаю ресурсы наброшены лишь на время промо, так что не щёлкайте.

Дневной лимит: 2 видео на один IP-адрес, но я думаю вы знаете, что делать.

PS: "Умрёшь в игре — умрёшь в реальности" почти без акцента, заметьте.

Другие аватары и варианты генераций на сайте Heygen

Больше интересностей у меня в канале Psy Eyes: https://t.me/+U6skQIZEFgAxZjEy

Показать полностью

Генерим 3D модели в Luma: Genie

Luma представили Genie, модель для генерации 3D в дискорде.

Выбираем любую ветку #genie и пишем /genie промт. Превью из 4 вариантов генерится за секунды, им можно поделиться по ссылке для детального рассмотрения, и поиграться с цветом/материалом. Понравившийся в превью вариант можно послать на детальную обработку нажав Refine в дискорде (отобразится в ветке #genie-refine), и далее скачать 3D модельку в .glb, чтобы закинуть в Blender или куда ещё.

Фича бесплатная на время, так что не щёлкаем.

Больше интересностей у меня в телеге Psy Eyes

Показать полностью 1

Генерация MIDI в Ableton по тексту

Генерация MIDI в Ableton по тексту Искусственный интеллект, Нейронные сети, Музыка

Чуваки из KORUS делают плагин для Ableton, чтобы генерить MIDI по описанию. Вписаться потестить можно тут (получите доступ - делитесь).

Осталось скормить папку со своими неразборчивыми напеваниями с диктофона для получения MIDI, промтом задать стиль звучания, а дальше ручками — навык никто не отменял.

А там и до нейро-компьютерных интерфейсов недалеко.

Больше интересностей у меня в телеге Psy Eyes

Показать полностью 1

Множество интересных игр с GMTK Game Jam 2023

7-9 июля прошло соревнование по разработке игр GMTK Game Jam, где главной темой была выбрана: смена ролей (отставь мемы про бдсм всяк сюда входящий). То есть, ты на стороне NPC:

  • вместо игры рыцарем, который убивает полчища монстров, наоборот ты играешь группой скелетов в охоте за рыцарем — Underlevel;

  • вместо чувака, пытающегося разобраться с проблемами в жизни, ты играешь его котом, который помогает своему человеку избавиться от депрессии — One Day Better;

  • вместо Фримена, играешь хэдкрабом летающим с одной головы на другую и валящям толпы людей аки кроля из "Монти Пайтон и Священный Грааль" — Crabjuice;

  • вместо классического аркадного разрушения набора кубиков отбивая шарик, наоборот ты переключаешься в изометрию и становишься этим набором кубиков, стараясь защитить ядро — Bricker Breaks Free;

  • вместо игры за змейку, ты стараешься отвлечь её яблоками, чтобы не попасться ей — VERSUS SNAKE;

Отдельного упоминания как по мне стоит UVSU, где ты по факту играешь сам против себя. Сначала ты проходишь ангелом до двери на экране --> затем чертом, который не должен дать ангелу пройти уровень --> затем снова ангелом, против чёрта... Своего рода шахматы.

Всего в GMTK Game Jam 2023 приняло участие 6,834 игр все из которых доступны на itch. Разбивка по платформам: браузер (3941), Windows (2993), Mac (448), Linux (543), Android (35).

Топ игры по результатам голосования:

Показать полностью

Ускоряем генерацию в Stable Diffusion с 4,5 минут до 14 сек

Я её уже упоминал на своём канале распределённую сеть Stable Horde, с помощью которой можно ускорить генерацию в Stable Diffusion в разы. Время показать её в действии. Особенно это зайдёт тем, у кого старое/слабое железо.

Что такое распределёнка — это сеть компьютеров по всему миру, которые могут делиться своими мощностями, чтобы ускорить генерацию контента. Когда вы нажимаете Generate ваш запрос по кусочкам разлетается на множество машин. Каждая из них будет обрабатывать свою часть картинки, а к вам придёт уже готовое изображение целиком.

Через Stable Horde можно генерить не только картинки, но и текст, голос, а также я думаю скоро сюда добавятся видео и музыка.

У проекта открытый исходный код, все репозитории можно посмотреть. В статистике на сайте видно, что он пользуется популярностью:

  • Сгенерировано 65 млн изображений и 10 млн текстов

  • Средняя скорость генераций 54 Мегапикселя/сек, а текста 674 токена/сек

  • Обработано 843 Терапикселя

Сервис бесплатный, но генерация в порядке очереди. Чтобы ускорить процесс, просто регаетесь, берёте API ключ, вставляете его в автоматике во вкладке с настройками Stable Horde и вперёд.

Для генерации изображений через Stable Horde есть разные веб-интерфейсы (остальные на сайте) и приложения как под Android, так и iOS (раз и два). Для генерации текста есть только веб-клиенты. Мне больше всего понравился Agnaistic как по количеству функций так и по интерфейсу.

Помимо этого для Stable Horde есть много инструментов. Боты:

Плагины ускоряющие генерации в:

Актуальные ссылки на всё смотрите на сайте Stable Horde.

1) И вот как раз про расширение для A1111 мы и поговорим. Для начала, поставим его. Это можно сделать зайдя в Extensions —> Available —> нажав Load from —> в поле поиска вбив Horde. Жмём Install напротив опции Stable Horde Client.

Ускоряем генерацию в Stable Diffusion с 4,5 минут  до 14 сек Искусственный интеллект, Нейронные сети, Арт, Распределенные вычисления, Stable Diffusion, Видео, YouTube, Длиннопост

Если у вас хорошая видюха с 4+ Гб RAM вы можете поставить и Stable Horde Worker, чтобы помогать генерить другим людям. За это вам начисляются баллы в KUDOS. Так вы поддержите сообщество и получите приоритет в очереди на генерации.

2) Когда поставили, идите в Settings и перезагрузите интерфейс нажав Reload UI.

Ускоряем генерацию в Stable Diffusion с 4,5 минут  до 14 сек Искусственный интеллект, Нейронные сети, Арт, Распределенные вычисления, Stable Diffusion, Видео, YouTube, Длиннопост

У вас появятся две новые вкладки Stable Horde Interrogation и Stable Horde Settings. Первая нужна, чтобы получать из картинок по ссылкам в интернете промт, а вторая для настроек и конкретно указания API ключа.

Ускоряем генерацию в Stable Diffusion с 4,5 минут  до 14 сек Искусственный интеллект, Нейронные сети, Арт, Распределенные вычисления, Stable Diffusion, Видео, YouTube, Длиннопост

3) Сам API ключ нужен, чтобы иметь приоритет при генерациях. Получить его можно зарегистрировавшись на сайте проекта. Причем регистрация заключается просто в указании Display Name, после чего отобразится API ключ, копируем его.

Ускоряем генерацию в Stable Diffusion с 4,5 минут  до 14 сек Искусственный интеллект, Нейронные сети, Арт, Распределенные вычисления, Stable Diffusion, Видео, YouTube, Длиннопост

Учтите, что сайт не хранит ваш API ключ и его лучше сохранить где-то отдельно, или залогиниться сначала аккаунтами Google, Discord, Github. Это важно для тех, кто хочет, чтобы KUDOS, начисленные за раздачу мощностей у них не пропадали.

4) Скопировав API ключ, идём в Stable Horde Settings и вставляем его в поле API key. Далее нажимаем Apply Settings.... и по сути всё, можно генерить.

Ускоряем генерацию в Stable Diffusion с 4,5 минут  до 14 сек Искусственный интеллект, Нейронные сети, Арт, Распределенные вычисления, Stable Diffusion, Видео, YouTube, Длиннопост

Для этого идём в раздел txt2img и в Scripts выбираем Run on Stable Horde, а также целевую модель и эффекты для постобработки.

Ускоряем генерацию в Stable Diffusion с 4,5 минут  до 14 сек Искусственный интеллект, Нейронные сети, Арт, Распределенные вычисления, Stable Diffusion, Видео, YouTube, Длиннопост

Что означает каждое поле:

  • Model — в стиле какой модели вы хотите генерить. Чем больше цифра рядом с названием, тем больше воркеров её поддерживают, и тем быстрее будет генерация.

  • Share With LAION — возможность поделиться сгенерированным с LAION, которые помогали создавать Stable Diffusion. Так вы помогаете создавать публичные датасеты.

  • Post processing — какие эффекты будут применены к картинке. Есть апскейлинг (повышение разрещения) и face restoration (улучшение лиц). Можно применять цепочкой.

Ускоряем генерацию в Stable Diffusion с 4,5 минут  до 14 сек Искусственный интеллект, Нейронные сети, Арт, Распределенные вычисления, Stable Diffusion, Видео, YouTube, Длиннопост

На видео в начале поста я сгенерил сначала локально на своей видюхе на ноуте GTX 1050 с 2 Гб VRAM без Stable Horde и на это ушло 4 м 33 сек, а потом через распределёнку.... и результат уже стал 14 сек. Разница почти в 20 раз!

Да оно будет прыгать от количества воркеров в сети, выбранной модели, настроек генерации, но это в любом случае буст и меньше необходимости покупать новое дорогостоящее железо. Чем больше будет воркеров, тем быстрее можно будет генерить. А с учетом того, что Microsoft, Nvidia, и AMD начали делать движения в сторону оптимизации для генераций (ONNX модели, DirectML, драйвера), а отец Stable Diffusion, Эмад Мостак, сказал на недавнем интервью, что вложил свои кровные в языковую модель, заточенную под кластеры, думаю эта тема будет развиваться.

YouTube обзор

Сайт Stable Horde

Расширение для A1111 (Client)

Расширение для A1111 (Worker)

Больше интересностей у меня в телеге Psy Eyes

Показать полностью 7

Апгрейд графики PS1 нейронками

Автор использовал SD через интерфейс Dreamstudio. Музыку сгенерировал.

YouTube

Reddit

Больше интересностей у меня в телеге Psy Eyes

Показать полностью

Генерации музыки через удобный интерфейс CoffeeVampir3

На днях один из подписчиков (Aamir Khan) поделился webui для генерации музыки и я вчера радостно на весь день залип.

Это тоже MusicGen, о котором я писал ранее на Пикабу.

Но в вариантах расшаренных до этого в основном использовался Hugging Face, вкладка с которым, как выяснилось опытным путём, после нескольких генераций начинает дико нагружать проц.

Интерфейс от CoffeeVampir3 намного ловчей:

  • Работает локально

  • Модели всех размеров (small, medium, large) подгружаются сами при первом использовании

  • Можно ставить треки в очередь

  • Можно генерить на основе своей мелодии

  • Справа можно послушать, что сгенерил

  • Нагружается только видюха, а не проц

Чем больше модель, тем лучше качество звучания, но тем и требовательней она к железу и генерация может занять больше времени.

В тексте дальше я выделил команды для установки "кавычками", чтобы тем, кто первый раз с таким сталкивается понимали, что надо вписывать. Сами команды пишутся в командную строку без кавычек.

Установка:

  1. Создаём папку на компе и в адресной строке (C:\MusicGen или где вы её сделали) пишем "cmd"

  2. В открытой командной строке пишем "git clone https://github.com/CoffeeVampir3/audiocraft-webui.git" чтобы скопировать webui к нам на комп

  3. Идём вглубь скопированного webui командой "cd audiocraft-webui"

  4. Далее устанавливаем необходимые для webui вещи командой "pip install -r requirements.txt"

Генерации музыки через удобный интерфейс CoffeeVampir3 Искусственный интеллект, Нейронные сети, Арт, Музыка, Видео, Длиннопост

Готово — запускаем проект командой "python webui.py" (не обращаете внимание на ошибку про тритон, фласк и дебаг мод). Веб интерфейс открывается по адресу http://127.0.0.1:5000/

Чтобы генерить на основе своего трека в Model выберите Melody и укажите путь к треку.

Генерации музыки через удобный интерфейс CoffeeVampir3 Искусственный интеллект, Нейронные сети, Арт, Музыка, Видео, Длиннопост

За что отвечают параметры (спасибо Dmitry за подсказку):

  • Top-k - сколько токенов используется. Больше - больше разнообразных звуков будет в треке, но больше какофония. Меньше - более повторяющимся и однородным будет трек.

  • Тоp-P - альтернативный метод, 0 - выключен.

  • Duration: длительность генерируемой музыки.

  • Temperature - более\менее активное фантазирование. По опыту изменения в обе стороны от дефолта делают хуже.

  • Classifier Free Guidance - тоже в обе стороны от дефолта хуже получалось. Типа строгость следования промту, как в стейбле для картинок.

  • Segments - количество генерируемых сегментов. Каждый сегмент будет иметь длину равную duration минус overlap. Поэтому если duration стоит 30 секунд, а overlap - 5 секунд, то при использовании 3 сегментов вы получите 75 секунд аудио.

  • Overlap - перекрытие между сегментами. Больше перекрытие = более структурированная музыка между каждым из них.

Музыка сохраняется в папку statc/audio/ , либо вы можете её правым кликом в webui сохранить куда вам угодно.

Важно отметить, что лицензия софта не позволяет использовать сгенерированное в коммерческих целях. Вот только как они будут определять, что сгенерировано, а что нет, если оно создано локально?

В общем, для создания полноценных треков оно пока не годится, а вот семплы пилить, вполне себе. Да тут нет гибкости и их надо мастерить, но это уже ускорение процессов для артистов и существенное снижение планки входа для тех, кто только начинает.

Гитхаб

Больше интересностей у меня в телеге Psy Eyes

Показать полностью 2
Отличная работа, все прочитано!