1

Помогите найти нейросети

Всем здравствуйте. Так случилось, что юной толкиенистке в моем лице пришло в голову создать кавер на песню. С переводом сильных проблем не оказалось. Ну как. Делаю до сих пор, но не суть важно. Загвоздочка оказалась когда стало понятно, что чтобы полноценно создания полноценного кавера мне нужны три вещи: текст, арты и, собственно, исполнение. С третьим пунктом у меня и загвоздочка. Решила прибегнуть к помощи нейросетей, однако не могу найти ничего толкового. Видела уже и на ютубе, и здесь видео, где авторы указывали что создавали при помощи нейронок. Прошу подсказать, какая нейросеть может подойти для исполнения песни (музыка есть, слова почти), при учете что я работаю с телефона. (Для компьютера тоже подойдет, просто мне пока удобно работать с телефоном).

Поиск по описанию

20.8K постов7.7K подписчика

Правила сообщества

Если в комментариях поста кто-либо написал название того что вы ищете, отпишитесь под его комментарием, что это то, что вы искали.

Если ответ был дан до истечения срока редактирования поста - добавьте [Найдено] в заголовке и ссылку на комментарий с ответом в теле поста.


Никакой политики, не относящейся к теме поискового запроса.

Обвинение авторов в накрутках рейтинга и ботоводстве = блокировка в сообществе.

2
Автор поста оценил этот комментарий
Как юной толкиенистке, вам никогда не попадалась песня на известный мотив "Здесь эльфы не поют и энты не растут..."?
Когда-то давно выдал людям эту строчку, они насочиняли, а полный текст зажимают.
раскрыть ветку (1)
2
Автор поста оценил этот комментарий

Нет, но уточню у наших менестрелей, если найду скину

1
Автор поста оценил этот комментарий

Я думаю лучший результат можно будет получить только тонкой настройкой нейронки.

Если вы в теме, то берите интерфейс по типу ComfyUI, Качайте с Hugging нейронку на "текст в аудио", там надо построить техпроцесс (или найти в инете .json техпроцесса)

Если возможно подключить модели LORA для уточнения стиля музыки. Дальше включить генерацию на 50-100 штук, и идти пить пиво.


Как по мне - хуйня делов, неделя ебли))

раскрыть ветку (1)
2
Автор поста оценил этот комментарий

А если я не сильно в теме, можете немного поподробнее?

показать ответы
0
Автор поста оценил этот комментарий

Что создать-то надо? Песню с помощью нейросети? Да ещё и такую, чтобы она кого-то заинтересовала?


По мне - фантастика.

раскрыть ветку (1)
1
Автор поста оценил этот комментарий

Мне нужна нейросеть, которая сможет спеть определенные слова под определенную музыку. Я не создаю песню с нуля, а просто перевожу. И эта песня однозначно заинтерисует, как минимум Союз

показать ответы
Автор поста оценил этот комментарий
раскрыть ветку (1)
1
Автор поста оценил этот комментарий

У меня с тг не очень, однако попробую

1
Автор поста оценил этот комментарий

Suno ai

раскрыть ветку (1)
1
Автор поста оценил этот комментарий

Класс👍👍👍. Попробую, может так будет даже лучше🙂

0
Автор поста оценил этот комментарий

Можно, но сначала какой у вас компьютер?

Если видеокарта ниже 30-й серии инвидиа, и оперативной памяти меньше 16-ти гигов, то этот вариант не для вас, для него требуется довольно много вычислительной мощности.

Если таковой нет в наличии, то придётся пользоваться онлайн-сервисами нейросетей.


Если есть в наличии подходящий компьютер, то для использования данного метода надо:

1. Установить python (ибо нейросети в основном на питоне работают)

2. Установить интерфейс (я использую ComfyUI)

3. Найти на Hugging Face устраивающую вас модель (их там тысячи, на любой вкус и цвет, и генераторы текстов, и изображений на основе текстов, и генераторы изображений на основе изображений, генераторы аудио, и т.д.)

4. Скачать из репозитория GitHab выбранную модель.

5. Прошерстить сайты Hugging Face и CivitAI на предмет техпроцесса (workflow)

6. Основываясь на правильном положении звёзд на небе разложить сказанное в нужные папки.

7. Найти и загрузить с сайта CivitAI модели LORA. (Лора это такие маленькие кусочки нейросети, обученные на конкретных данных. Пример: обучить модель Лора на фентези пейзажах, чтобы получать более лучшие фентези пейзажи. В контексте музыки эти модели будут устанавливать нужный голос, или требуемый стиль музыки.)

АХТУНГ: Если не хотите увидеть того, что не сможете потом развидеть, не выключайте на CivitAI фильтры контента.

8. Ввести запрос, поставить побольше генераций, и идти по своим делам.

9.. Выбрать из кучи сгенерированных вариантов тот, который вас устроит.


Привожу ниже пример полученной мной генерации изображения с использованием следующих штуковин:

1. Железо: проц райзен 5600, видеокарта 4060, оперативка 32 гига.

2. Интерфейс: ComfyUI

3. Модель: FLUXdev, и fluxfp16

4. Техпроцесс взял с канала " Айтинос " на Ютуб.

5. LORA: NEBULA (умеет красивый космос рисовать)

6. Генерировал 4 изображения. Все вышли вполне себе. ~290-320 секунд на каждое.


Но это мне как то больше понравилось.

С музыкой аналогично, но до того чтобы самому генерировать музыку я наверное только после нового года дойду. Я пока ещё с генерацией изображений не наигрался)

Иллюстрация к комментарию
раскрыть ветку (1)
0
Автор поста оценил этот комментарий

Честно говоря я о таких деталях не сильно в курсе). Моя работа с нейронками пока ограничивалась парочкой для артов и чатом джипити. Питон мне кажется прийдется наконец выучить. Большое спасибо за консультацию

показать ответы