Искусственный интеллект и Синтез речи: истории из жизни, советы, новости и юмор — Все посты, страница 4

2 года назад

Ответ на пост «Наш бот, который озвучивает текст голосами из Warcraft 3, стал еще лучше»⁠⁠4

Искусственный интеллект Нейронные сети Синтез речи Warcraft Озвучка Русская озвучка Telegram Видео Вертикальное видео Артас Менетил Тралл Большой куш Мат Ответ на пост

1

snakers4

2 года назад

Лига Геймеров

Наш бот, который озвучивает текст голосами из Warcraft 3, стал еще лучше⁠⁠4

Бот доступен по той же ссылке - t.me/silero_voice_bot или просто @silero_voice_bot в телеграме.

Что стало лучше:

- Мы сильно ускорили работу бота и пофиксили баги, которые воспринимались пользователями как зависание;

- Боту сделали инлайн режим. Идем в самого бота, проходим капчу, потом уже можно пользоваться просто через @silero_voice_bot (подробности в /help или /inline);

- Мы вернули функцию генерации видосов. В начале сильно тормозила именно заливка видосов в телегу, но мы решили это, просто добавив мощности серверу, где крутится бот;

- У бота убрали характерное "заикание", которое возникало на запятых;

- Боту дали возможность генерации сразу целых небольших диалогов. Подробнее в /help и /speak, а тут просто пример команды:

/speak arthas Весь город должен быть уничтожен!

/speak uther Как ты мог даже подумать об этом?
/speak uther Должен быть какой-то другой путь!

/speak arthas Проклятье, Утер!
/speak arthas Как будущий король я приказываю тебе очистить этот город от солдат тьмы!

PS

Инструкция как делать такие видосы.

Телеграм канал с новостями бота.

Показать полностью

[моё] Искусственный интеллект Нейронные сети Синтез речи Warcraft Озвучка Русская озвучка Telegram Видео Вертикальное видео

120

AndrewAnavrin

2 года назад

Лига Геймеров

Ответ на пост «Озвучиваем что угодно оригинальными голосами любимых героев Warcraft»⁠⁠2

Радиоспектакль)

[моё] Синтез речи Искусственный интеллект Warcraft Озвучка Нейронные сети Видео Длиннопост Числа Ответ на пост

8

Zlowpoke

2 года назад

Лига Геймеров

Ответ на пост «Озвучиваем что угодно оригинальными голосами любимых героев Warcraft»⁠⁠2

Осторожно, тупой юмор.

Спасибо разработчикам, за такой богатый инструментарий.

Показать полностью 1

[моё] Синтез речи Искусственный интеллект Warcraft Озвучка Нейронные сети Warcraft 3 Telegram бот Странный юмор Юмор Видео Без звука Ответ на пост

9

snakers4

2 года назад

Лига Геймеров

Озвучиваем что угодно оригинальными голосами любимых героев Warcraft⁠⁠2

Всем известно, что Blizzard сделали с Warcraft-ом и его божественной оригинальной озвучкой.

Поэтому мы сделали бота в телеге, которым можно озвучивать любые фразы голосом своего любимого персонажа из Warcraft 3! Доступны не все, но самые популярные персонажи.

Чтобы сделать свою озвучку нужно зайти в бота по ссылке, выбрать персонажа и ввести текст. И все, озвучка готова! Также есть опция генерации голосовых портретов, но она работает относительно долго (долго работает именно отправка в телегу). Так что пользуйтесь ей осторожнее!

На данный момент доступны следующие голоса:

Озвучиваем что угодно оригинальными голосами любимых героев Warcraft Синтез речи, Искусственный интеллект, Warcraft, Озвучка, Нейронные сети, Видео, Длиннопост

И за сим, не нужно кланяться =)

Update - фичу с генерацией видосиков скорее всего выключим, так как из-за нее ffmpeg ложится в бесконечный цикл и ломает бота.

Показать полностью 1

[моё] Синтез речи Искусственный интеллект Warcraft Озвучка Нейронные сети Видео Длиннопост

376

MindSimulation

2 года назад

Лига Разработчиков Видеоигр

Гейб Ньюэлл и G-man говорят по-русски. Даём бесплатно погонять синтез речи⁠⁠

Привет всем! Меня зовут Леонид, я являюсь СЕО Mind Simulation – лаборатории, ведущей исследования и разработки в направлении Общего Искусственного Интеллекта. Некоторое время назад мы показывали на примере Геральта из Ривии то, как собираемся оживлять NPC в играх. Это большая работа, которая постепенно продвигается.

Сегодня хочу поделиться достижениями и дать погонять бесплатно синтез речи, которым мы тоже занимаемся, чтобы неписей было приятно слушать. Благодаря последнему обновлению мы теперь можем переносить голоса между языками, что даёт возможность использовать один и тот же голос в разных локализациях, подбирать подходящие для персонажей голоса, не ограничиваясь поиском только нативных спикеров и озвучивать Инди на разных языках.

С момента выхода видео проект мы переименовали в SteosVoice, домен остался тот же. Голос G-man'а мы создали на основе английских реплик из HL:Alyx, там примерно 2 минуты. Сейчас наш синтез знает два языка: русский и английский. Неважно на каком языке говорит источник, система воспроизводит голос, манеру и говорит сразу на обоих языках. Добавим новый язык, голоса заговорят и на третьем языке.

Разработка развитие синтеза речи (да и распознавания тоже) для нас очень важна: если мы собираемся оживлять NPC, то нам нужно закрывать полный цикл, ведь персонажи должны озвучивать свои мысли тем же голосом и манерой, что и актёр, который записывал для них сюжетные реплики.

Зависимость от сторонних сервисов — неприемлемо. К тому же в нашем случае выдвигаются высокие требования:

• Минимальное количество аудио для воспроизведения голоса. Просить «несколько часов» исходных данных нереально, так как такое количество аудио наберётся только у двух-трёх главных персонажей большой RPG.

• Высокое качество звука. Звук должен быть такой же насыщенный, плотный, как и в оригинале.

• Быстрый синтез, чтобы не было ожидания между вопросом и ответом.

• Работа оффлайн, например, на четвёртой плойке. Потому как во-первых, ни одна студия не потянет такие расходы на облака, а во-вторых, игрок должен быть независим от интернет-соединения, особенно если он играет в сингл.

Нам это удалось. Чтобы создать цифровую копию любого голоса в высоком качестве, нам нужно всего семь минут речи спикера в идеальных условиях. С некоторыми компромиссами в финальном качестве достаточно и одной минуты аудио. Голос Гейба Ньюэлла (в рамках демонстрации, естественно, голос на платформе не доступен) мы создали на основе одной минуты аудио из документари HL2: Lost Coast. Да, есть ещё, но голос в силу возраста на них отличается, плюс у аудио в разном качестве и на большинстве присутствуют сторонние звуки, вроде шума вентилятора. Ниже пример (видео сжато).

SteosVoice как создаёт собственные уникальные голоса, так и сотрудничает с актёрами, выплачивая 20% роялти с каждого синтезированного символа на платформе авторам голосов.

Однако сейчас сервис бесплатен для всех желающих. Мы сделали это, чтобы поддержать сообщество разработчиков и создателей контента. Так что если вы хотели попробовать синтез речи в своих проектах или вам нужна озвучка, приглашаю. Также будем рады обратной связи!:)

Следующие обновления будут посвящены полному избавлению от акцента при переносе между языками, более точечной настройке эмоций и новым языкам. Бонусом сейчас в работе около 60 новых голосов, которые в ближайшее время будут добавлены на платформу.

Ссылка на проект, где можно попробовать синтез: https://cybervoice.io/ru/

Показать полностью 1

[моё] Разработка Gamedev Звук Искусственный интеллект Синтез речи Tts Опыт Видео YouTube Длиннопост

57

snakers4

2 года назад

Искусственный интеллект

Теперь наш публичный синтез в супер-высоком качестве, в 10 раз быстрее и без детских болячек⁠⁠

Я хотел бы поделиться нашими новыми публичными моделями синтеза речи. Они стали радикально лучше, качественнее и обзавелись целым рядом фич:

Модели в 10 раз быстрее и в 2 раза меньше (и все голоса внутри одной модели)
Теперь там появился новый высококачественный диктор, а также модель умеет генерировать случайных дикторов (пример на видео ниже)
Мы научили их делать паузы, менять скорость и тон речи
Они могут генерировать аудио разного качества - от телефонии до диктора из студии (8, 24, 48 kHz)
Теперь нет детских болячек таких как зависание или пропуск слов

Попробовать модель как обычно можно в нашем репозитории и в колабе.

Насколько Пикабу позволяет, вот примеры звучания моделей:

Показать полностью 1 1

[моё] Синтез речи Text-to-speech Машинное обучение Искусственный интеллект Видео

128

Искусственный интеллект + Синтез речи

С этим тегом используют

Ответ на пост «Наш бот, который озвучивает текст голосами из Warcraft 3, стал еще лучше»⁠⁠4

Наш бот, который озвучивает текст голосами из Warcraft 3, стал еще лучше⁠⁠4

Ответ на пост «Озвучиваем что угодно оригинальными голосами любимых героев Warcraft»⁠⁠2

Ответ на пост «Озвучиваем что угодно оригинальными голосами любимых героев Warcraft»⁠⁠2

Озвучиваем что угодно оригинальными голосами любимых героев Warcraft⁠⁠2

Гейб Ньюэлл и G-man говорят по-русски. Даём бесплатно погонять синтез речи⁠⁠

Теперь наш публичный синтез в супер-высоком качестве, в 10 раз быстрее и без детских болячек⁠⁠