snakers4

snakers4

Делаем проекты в сфере ML, которые приносят пользу людям.
Пикабушник
Дата рождения: 8 октября
15К рейтинг 55 подписчиков 3 подписки 98 постов 59 в горячем
Награды:
За неравнодушие к судьбе Пикабу
11

Мы решили задачу омографов и ударений в русском языке

Трудный поход длиной в 3 года

Трудный поход длиной в 3 года

Мы опубликовали библиотеку silero-stress для расстановки ударений в обычных словах и омографах:

1️⃣ Расставляет ударения, решает омографы, ставит букву ё;

2️⃣ "Знает" порядка 4М русских слов и словоформ и порядка 2K омографов;

3️⃣ Простановка ударения в обычном 1 слове занимает где-то 0.5 ms, а в предложении на 400 символов с 2 омографами - порядка 30 ms;

4️⃣ Общий размер библиотеки составляет порядка 50 мегабайт (архив весит порядка 30 мегабайт), что является сжатием словарей и всех датасетов примерно в 400 раз;

5️⃣ Опубликована под популярной и простой лицензией (MIT);

6️⃣ Не содержит раздутого кода, лишних библиотек, гигабайтов академических артефактов;

7️⃣ Зависит только от стандартной библиотеки питона и работает на всех последних версиях PyTorch.

Ставим ⭐️ https://github.com/snakers4/silero-stress

Ставим ⬆️ habr.com/ru/articles/955130/

Показать полностью 1
1

Делаем быстрый, качественный и доступный синтез на языках России — нужно ваше участие

Фонтан "Дружба народов"

Фонтан "Дружба народов"

Привет, Пикабу!

Наверное ни для кого не секрет, что в последнее время усиливаются как интеграционные, так и дезинтеграционные процессы у нас в стране и вокруг неё. Вот, например, в метро можно увидеть вот такую рекламу (затёр логотипы):

Понятно, что нынче Пикабу состоит из баянов, розжига, сисек, срачей про мигрантов и бездомных собак (вы сами знаете всё остальное), но остались же тут адекватные люди, кто ещё верит в дружбу народов и всё подобное, хотя бы в рамках нашей страны?

В этом году мы делаем проект Фонда Бортника по разработке модели синтеза речи языков России и СНГ. Возможно, вы знаете нас через одного популярного бота для озвучки в Телеграме.

Наша основная задача - сделать удобный, быстрый, устойчивый, качественный и нетребовательный к вычислительным ресурсам синтез на самых популярных у нас в стране и в ближайшем зарубежье языках.

По итогу проекта планируется публикация общедоступных моделей синтеза языка под свободной лицензией (MIT). Мы бы хотели покрыть как минимум 10 популярных языков. Всего популярных языков (более 100 тысяч носителей) 30+, так что, в принципе, тут есть, где разгуляться.

Поэтому ищем людей, у которых два родных языка (русский и второй родной), которые бы помогли нам с рядом вещей:

  • Помощь в поиске актуальных текстов на родном языке;

  • Запись голоса (как на русском, так и на втором родном языке);

  • Минимальные консультации по фонетике, ударениям и грамматике.

✉️ Контакты для связи, условия участия оговариваем в каждом случае отдельно.

Показать полностью 1
2

Голоса из третьего Варика - в супер-пупер качестве!

Помните бот с кружками из Warcraft 3? Сегодня он обзавёлся голосами в HD качестве. Вот это вот синтез из бота (да это синтез):

🆕 Всего доступно 1082 голоса в супер-пупер качестве.

📌 Попробовать просто - или тыкнуть галкой в паке, или командой /hd в боте.

⚙️ Пока HD голоса доступны для всех юзеров, но новую генерацию нельзя начать, не закончив старую.

🔗 Ссылка на бот https://t.me/silero_voice_bot

ЗЫ

HD голос бандита из Сталкера тоже есть. И вообще почти у всех персонажей тоже есть.

Показать полностью
49

Ответ на пост «Мисс Пикабу 2024: самый яркий конкурс этого года!»398

Меня зовут Пушинчик. Хрен знает сколько мне лет, меня нашли на улице. И я явно достойна стать Мисс Пикабу больше, чем лысые обезьяны в минимальном количестве одежды. Смотрите какая у меня шуба!

Просто посмотрите какая я милая и роскошая. А не вот эти все мерзкие кармадрочеры и боты, которые повылазили из-за запрета минусов на Пикабу.

Показать полностью 3
Отличная работа, все прочитано!