Толкни меня на русском
Т.к. Пикабу не умеет вставлять видео в комментарии, получился такой пост.
Т.к. Пикабу не умеет вставлять видео в комментарии, получился такой пост.
Озвучка диалогов из текста может сильно упростить и ускорить работу во многих ситуациях: подкасты, аудиокниги, обучающие материалы, рекламные ролики, создание игр, reels и даже фильмов.
Часто записать аудио крайне трудно: нет доступа к микрофону, шумная обстановка или ограниченные временные рамки. Или просто лень.
Поэтому сегодня на обзоре нейросеть Fishspeech, которая реалистично озвучит текст, сохраняя интонации и эмоциональную окраску. Так ещё можно добавлять свои голоса или использовать уже готовые 50+ голосов от сообщества Нейро-Софт. Вообще сказка! Давайте к обзору.
Fish Speech Dialogue — современный инструмент для озвучивания диалогов и реплик с использованием разнообразных голосов.
Благодаря портативной версии не нужна установка базового Fish Speech MOD, а функциональность доступна «из коробки»:
Поддержка до 10 говорящих. Идеально для одиночных реплик и сложных диалогов.
Автоматическое распределение голосов. Экономит время, подбирая подходящие голоса для каждого персонажа.
Библиотека из 50+ голосов от сообщества. От Жириновского до Яндекс Алисы.
Форматирование диалогов. Автоматическое оформление в формате «Говорящий: текст».
Различные форматы сохранения. Поддерживаются WAV, MP3 и FLAC.
Мультиязычный интерфейс. Доступны русский и английский.
Автообновления и интеграция с GitHub.
Нас встречает такой интерфейс. В самой верхней строке можно выбрать язык интерфейса, изначально будет английский.
Левое окно «Статистика диалога» — основное рабочее поле. В верхней части окна отображается количество говорящих, число реплик и общее количество символов. Нижняя часть содержит текст диалога.
Диалоги необходимо оформлять так: каждая реплика должна начинаться с имени говорящего и двоеточия. Пример видно на скриншоте выше.
В правой части интерфейса находится блок с итоговым результатом и кнопка «Сгенерировать диалог».
Плавно спускаемся ниже.
Количество говорящих — это автоматический параметр, который определяется системой в зависимости от структуры диалога.
Для каждого говорящего доступна отдельная панель настроек. Здесь можно:
Указать имя говорящего, которое должно совпадать с именем в тексте диалога.
Выбрать референсный голос из доступных вариантов.
Загрузить собственную аудиодорожку и использовать голос из неё. Также необходимо подписать транскрипцию. В этом случае нейросеть будет использовать загруженный голос для генерации диалога. Транскрипцию пишем сплошным текстом.
Последняя функция очень полезна. Когда ваш профессиональный диктор заболел, можно чуть схитрить и продолжить процесс записи и озвучки :D
В самом низу находятся расширенные настройки:
Честно, расширенные параметры я не щупал, меня интересовал лишь принцип работы и результаты. Но я попросил ассистента Perplexity пояснить, что это, кому интересно, вот выжимка:
В общем, всё до безумия просто. Пишем или генерируем диалог, выбираем голоса и получаем озвучку. Давайте посмотрим на неё в деле.
Начнём с простого — рассуждения Винни-Пуха.
Давайте усложним и представим миниатюру: бытовой диалог Джонни Сильверхенда и Яндекс Алисы.
Сгенерируем диалог с тремя участниками - Шерлок Холмс, Сергей Дружко и Кот Матроскин. Такого вы ещё не слышали.
Далее я решил попробовать сгенерировать что-нибудь на английском с голосом Матроскина. И вышло очень даже неплохо и похоже.
Дмитрий Нагиев и Чебурашка:
Ну и напоследок я попросил свою знакомую записать пару голосовых для теста. Дальше скачал их в формате .ogg, конвертировал в .mp3 и загрузил в нейросеть. Для транскрипции я использую крутую нейронку Whisper, скачать её можно на GitHub. Там всё интуитивно понятно, думаю, разберётесь. Вот что получилось.
Ещё пара примеров:
Как итог, FishSpeech — удобный инструмент, который помогает озвучивать тексты даже в ситуациях, когда запись голоса невозможна. Простота и гибкость делают его отличным решением для создания игр, подкастов, аудиокниг и других проектов, где важна качественная озвучка.
Скачать портативную версию FishSpeech с установкой в один клик для самых ленивых вы можете тут.
Подписывайтесь на 👾Нейро-Софт, канал с портативными версиями ваших любимых нейросетей!
Здравствуйте,
в-общем, вопрос в заголовке.
есть ли специальные места, где можно скачать только звуковую дорожку с озвучкой? допустим, у меня есть фильм в оригинале (английский, в частности), и я бы хотел добавить канал с дубляжом или озвучкой к этому фильму.
Благодарю заранее.
Видеоряд: Одно из выступлений Брежнева
Голос Брежнева (Шкипер): Анатолий Дубанов (Мадагаскар 2005)
Музыка: Madagascar Soundtrack 05 Whacked Out Conspiracy - James Dooley
Давненько у ElevenLabs не было достойных конкурентов - чтобы и голос клонировал, и мультиязычный перевод был, и библиотека голосов с редактором. Представляю Wondercraft - инструмент для подкастеров, для звукорежиссеров и рекламщиков.
ИИ запишет подкаст по вашим запросам, можно выбрать из 200 реалистичных голосов, автоматически сделать дубляж на другой язык и сгенерировать сценарий.
Есть ИИ-генератор рекламы, где можно вставить ссылку на товар, который необходимо прорекламировать и получить аудиорекламу, длительностью 30 или 60 секунд. Ее можно отредактировать по своему вкусу, изменить голос, язык и содержание. Есть бесплатные аудиосемплы и музыка.
Клонирование голоса доступно только платных подписках, и нужно сначала подписаться на ElevenLabs за 11$, так как Wondercraft используют их технологии. А Wondercraft ,в свою очередь, покроет стоимость. Здесь подробнее можно почитать
Так же заявлено, что можно сделать успокаивающие и выразительные медитации и продающие аудио e-mail’s
Понравилось, что на сайте есть статьи, как расставить паузы и настроить произношение, руководства по использованию
Нейронка знает много акцентов, 30 языков и в их числе русский.
Бесплатно — 10 минут на генерацию аудио и 40 голосов.
Хорошая озвучка
Платный план начинается от 35$/мес, когда у ElevenLabs от 5$/мес.
Хоть Wondercraft, в отличие от ElevenLabs, генерирует по текстовому запросу аудиорекламу с уже готовыми звуковыми эффектами и музыкой, все равно я не нашла русский язык. Кстати, как и многих других, которые представлены на сайте в списке доступных языков.
Как видите, при работе с сервисом, в выпадающем списке я не нашла русского языка, хотя на самом сайте он заявлен
По этой причине не рекомендую Wondercraft, сама использую ElevenLabs, у него есть русский язык, бесплатно дается 10 000 знаков каждый месяц, которые можно потратить по своему усмотрению - на перевод и дубляж, генерация аудио из текста, создание звуковых эффектов, шумоподавление в озвучке, хоть на все сразу. Хотите узнавать о полезных сервисах с искусственным интеллектом для работы, учебы и облегчения жизни? Подпиcывайтесь на телеграм канал НейроProfit, там я рассказываю, как можно использовать нейросети для бизнеса.
Всем привет друзья!
Занимаюсь созданием многосерийного игрофильма по Red Dead Redemption 2 с русской озвучкой (монтаж, перевод, подбор музыки, в общем всё как полагается).
Канал на YouTube новый, так что широкой публики пока нет, так что очень хотелось бы расширить круг зрителей, которым такой формат нравится и подарить вам приятные эмоции от просмотра своего творчества!:)
С учетом трудностей доступа к YouTube дублирую свой контент и на Dzen - https://dzen.ru/andreevpgs
В общем жду ваши комментарии и мнения и желаю всем приятнейшего просмотра
Плейлист со всеми сериями - https://www.youtube.com/playlist?list=PLYuKLj7GzAZXtTyQouERr...