Горячее
Лучшее
Свежее
Подписки
Сообщества
Блоги
Эксперты
#Круги добра
Войти
Забыли пароль?
или продолжите с
Создать аккаунт
Я хочу получать рассылки с лучшими постами за неделю
или
Восстановление пароля
Восстановление пароля
Получить код в Telegram
Войти с Яндекс ID Войти через VK ID
Создавая аккаунт, я соглашаюсь с правилами Пикабу и даю согласие на обработку персональных данных.
ПромокодыРаботаКурсыРекламаИгрыПополнение Steam
Пикабу Игры +1000 бесплатных онлайн игр Новый хит для любителей игры жанра Соедини 3! Кот Ученый уже прячет предметы по таинственному лесу, чтобы вы получили удовольствие от поиска вещей и заработали как можно больше изумрудов. Котик рад новым гостям!

Северное слияние - тайна леса

Казуальные, Приключения, Логическая

Играть

Топ прошлой недели

  • SpongeGod SpongeGod 1 пост
  • Uncleyogurt007 Uncleyogurt007 9 постов
  • ZaTaS ZaTaS 3 поста
Посмотреть весь топ

Лучшие посты недели

Рассылка Пикабу: отправляем самые рейтинговые материалы за 7 дней 🔥

Нажимая кнопку «Подписаться на рассылку», я соглашаюсь с Правилами Пикабу и даю согласие на обработку персональных данных.

Спасибо, что подписались!
Пожалуйста, проверьте почту 😊

Помощь Кодекс Пикабу Команда Пикабу Моб. приложение
Правила соцсети О рекомендациях О компании
Промокоды Биг Гик Промокоды Lamoda Промокоды МВидео Промокоды Яндекс Директ Промокоды Отелло Промокоды Aroma Butik Промокоды Яндекс Путешествия Постила Футбол сегодня
0 просмотренных постов скрыто
22
wonderlove
wonderlove
6 месяцев назад
Искусственный интеллект

Озвучка диалогов с помощью нейросети FishSpeech⁠⁠

Озвучка диалогов с помощью нейросети FishSpeech Нейронные сети, Искусственный интеллект, Digital, Видеомонтаж, Озвучка, Звук, Звукорежиссура, Машинное обучение, Монтаж, Обработка звука, Транскрипция, Русская озвучка, Видео, Видео ВК, Короткие видео, Длиннопост

Озвучка диалогов из текста может сильно упростить и ускорить работу во многих ситуациях: подкасты, аудиокниги, обучающие материалы, рекламные ролики, создание игр, reels и даже фильмов.

Часто записать аудио крайне трудно: нет доступа к микрофону, шумная обстановка или ограниченные временные рамки. Или просто лень.

Поэтому сегодня на обзоре нейросеть Fishspeech, которая реалистично озвучит текст, сохраняя интонации и эмоциональную окраску. Так ещё можно добавлять свои голоса или использовать уже готовые 50+ голосов от сообщества Нейро-Софт. Вообще сказка! Давайте к обзору.


❯ Основные особенности FishSpeech🐠

Fish Speech Dialogue — современный инструмент для озвучивания диалогов и реплик с использованием разнообразных голосов.

Благодаря портативной версии не нужна установка базового Fish Speech MOD, а функциональность доступна «из коробки»:

  • Поддержка до 10 говорящих. Идеально для одиночных реплик и сложных диалогов.

  • Автоматическое распределение голосов. Экономит время, подбирая подходящие голоса для каждого персонажа.

  • Библиотека из 50+ голосов от сообщества. От Жириновского до Яндекс Алисы.

  • Форматирование диалогов. Автоматическое оформление в формате «Говорящий: текст».

  • Различные форматы сохранения. Поддерживаются WAV, MP3 и FLAC.

  • Мультиязычный интерфейс. Доступны русский и английский.

  • Автообновления и интеграция с GitHub.

❯ Обзор интерфейса

Озвучка диалогов с помощью нейросети FishSpeech Нейронные сети, Искусственный интеллект, Digital, Видеомонтаж, Озвучка, Звук, Звукорежиссура, Машинное обучение, Монтаж, Обработка звука, Транскрипция, Русская озвучка, Видео, Видео ВК, Короткие видео, Длиннопост

Интерфейс FishSpeech Dialogue

Нас встречает такой интерфейс. В самой верхней строке можно выбрать язык интерфейса, изначально будет английский.

Левое окно «Статистика диалога» — основное рабочее поле. В верхней части окна отображается количество говорящих, число реплик и общее количество символов. Нижняя часть содержит текст диалога.

Диалоги необходимо оформлять так: каждая реплика должна начинаться с имени говорящего и двоеточия. Пример видно на скриншоте выше.

В правой части интерфейса находится блок с итоговым результатом и кнопка «Сгенерировать диалог».

Плавно спускаемся ниже.

Озвучка диалогов с помощью нейросети FishSpeech Нейронные сети, Искусственный интеллект, Digital, Видеомонтаж, Озвучка, Звук, Звукорежиссура, Машинное обучение, Монтаж, Обработка звука, Транскрипция, Русская озвучка, Видео, Видео ВК, Короткие видео, Длиннопост

Количество говорящих — это автоматический параметр, который определяется системой в зависимости от структуры диалога.

Для каждого говорящего доступна отдельная панель настроек. Здесь можно:

  1. Указать имя говорящего, которое должно совпадать с именем в тексте диалога.

  2. Выбрать референсный голос из доступных вариантов.

  3. Загрузить собственную аудиодорожку и использовать голос из неё. Также необходимо подписать транскрипцию. В этом случае нейросеть будет использовать загруженный голос для генерации диалога. Транскрипцию пишем сплошным текстом.

Последняя функция очень полезна. Когда ваш профессиональный диктор заболел, можно чуть схитрить и продолжить процесс записи и озвучки :D

В самом низу находятся расширенные настройки:

Озвучка диалогов с помощью нейросети FishSpeech Нейронные сети, Искусственный интеллект, Digital, Видеомонтаж, Озвучка, Звук, Звукорежиссура, Машинное обучение, Монтаж, Обработка звука, Транскрипция, Русская озвучка, Видео, Видео ВК, Короткие видео, Длиннопост

Честно, расширенные параметры я не щупал, меня интересовал лишь принцип работы и результаты. Но я попросил ассистента Perplexity пояснить, что это, кому интересно, вот выжимка:

Озвучка диалогов с помощью нейросети FishSpeech Нейронные сети, Искусственный интеллект, Digital, Видеомонтаж, Озвучка, Звук, Звукорежиссура, Машинное обучение, Монтаж, Обработка звука, Транскрипция, Русская озвучка, Видео, Видео ВК, Короткие видео, Длиннопост

В общем, всё до безумия просто. Пишем или генерируем диалог, выбираем голоса и получаем озвучку. Давайте посмотрим на неё в деле.

❯ Примеры и возможности

Начнём с простого — рассуждения Винни-Пуха.

Давайте усложним и представим миниатюру: бытовой диалог Джонни Сильверхенда и Яндекс Алисы.

Сгенерируем диалог с тремя участниками - Шерлок Холмс, Сергей Дружко и Кот Матроскин. Такого вы ещё не слышали.

Далее я решил попробовать сгенерировать что-нибудь на английском с голосом Матроскина. И вышло очень даже неплохо и похоже.

Дмитрий Нагиев и Чебурашка:

Ну и напоследок я попросил свою знакомую записать пару голосовых для теста. Дальше скачал их в формате .ogg, конвертировал в .mp3 и загрузил в нейросеть. Для транскрипции я использую крутую нейронку Whisper, скачать её можно на GitHub. Там всё интуитивно понятно, думаю, разберётесь. Вот что получилось.

Ещё пара примеров:

Как итог, FishSpeech — удобный инструмент, который помогает озвучивать тексты даже в ситуациях, когда запись голоса невозможна. Простота и гибкость делают его отличным решением для создания игр, подкастов, аудиокниг и других проектов, где важна качественная озвучка.

Скачать портативную версию FishSpeech с установкой в один клик для самых ленивых вы можете тут.

Озвучка диалогов с помощью нейросети FishSpeech Нейронные сети, Искусственный интеллект, Digital, Видеомонтаж, Озвучка, Звук, Звукорежиссура, Машинное обучение, Монтаж, Обработка звука, Транскрипция, Русская озвучка, Видео, Видео ВК, Короткие видео, Длиннопост

Подписывайтесь на 👾Нейро-Софт, канал с портативными версиями ваших любимых нейросетей!

Показать полностью 6 8
[моё] Нейронные сети Искусственный интеллект Digital Видеомонтаж Озвучка Звук Звукорежиссура Машинное обучение Монтаж Обработка звука Транскрипция Русская озвучка Видео Видео ВК Короткие видео Длиннопост
6
5
Shingatsuru
Shingatsuru
6 месяцев назад

Ночная тишина⁠⁠

Снег и морозы —
Город крепко спит в ночи.
Лис пьет крепкий чай.

大雪や
街眠る夜
狐茶や

О:юки я / Мати нэмуру ёру / Кицунэ тя я

Ночная тишина Хокку, Мысли, Зима, Холод, Чай, Арты нейросетей, Шедеврум (Яндекс), Японский язык, Транскрипция, Лиса
[моё] Хокку Мысли Зима Холод Чай Арты нейросетей Шедеврум (Яндекс) Японский язык Транскрипция Лиса
0
3
Shingatsuru
Shingatsuru
6 месяцев назад

Холодно⁠⁠

Я люблю зиму,
Но не люблю холода.
Вот чай с зефиром.

冬愛す
寒さは嫌い
茶と菓子

Транскрипция на русском, как просили:
Фую айсу / Самуса ва кирай / Тя то каси

Холодно Хокку, Мысли, Зима, Холод, Чай, Арты нейросетей, Шедеврум (Яндекс), Японский язык, Транскрипция
[моё] Хокку Мысли Зима Холод Чай Арты нейросетей Шедеврум (Яндекс) Японский язык Транскрипция
7
Stas9191
Stas9191
7 месяцев назад

Ибеба - Будущее транскрибации или куда я попал?⁠⁠

Приветствую всех снова, недавно был опубликован мною пост о транскрибации видео и аудио потоков в текст, скажем так демо версия) без дизайна, без оптимизации и вобще смотрелось это ужасно)))

За неделю много чего случилось, бессонные ночи, занятые выходные дни, и все же реализовал то что хотел)

Дизайн, фронт, бек и девопс фитчи все приходилось совмещать одному)

Теперь хочу поделиться нововведениями с вами)

  1. У приложения появилось название и логотип)

  2. Добавлен прелоудер для пред загрузки зависимостей

  3. Аутентификация на сайте и проверка лицензии (решил добавить сразу) что бы понимать кому это вобще надо)

  4. Добавлены авто-обновления приложения перед каждым запуском

  5. Изменился дизайн (симпатично но думаю доработать)

  6. Добавлены функции для автоматического прослушивания аудио потоков в тексте (плеер снизу)

  7. Добавлен функционал прослушивания выбранного сегмента (плеер снизу)

  8. Добавлена функция объединить (если вдруг ИИ не верно распознал текст предложения)

  9. Возможность отредактировать любой текст

  10. Возможность отредактировать спикера (автоматически определяется ИИ количество говорящих)

  11. Возможность добавить спикера (если не хватает участников в беседе вы можете их заменить)

  12. Удаление текстового потока

  13. Экспорт в такие форматы как Word, Json, Src, Txt

И многое другое, смотрите видео, оставляйте комментарии, в феврале будет первый запуск с бесплатной лицензией на 2 - 3 месяца для теста основного функционала для релиза

** Приложение достаточно требовательно к ресурсам, так как использует вашу видео кару или процессор для транскрибации. Если ваш ПК не соответствует рекомендуемым требованиям, скорее всего оно вам не подойдет.

** Рекомендуемые требования будут изложены после теста, но минимально вам необходимо

Минимум: I5 13 поколения или RTX4 серии...

Сразу скажу:

  1. Приложение не отправляет ваши аудио видео и текстовые сообщения кому либо

  2. Приложение не использует стороннее API , все происходит на вашем PC

  3. Приложение будет использовать только наше API для проверки аутентификации и лицензии

Показать полностью 2
[моё] Транскрипция Журналисты Интервью Обработка Видео RUTUBE
3
2
Stas9191
Stas9191
7 месяцев назад

Транскрибация видео и аудио в текст и передача информации 3 лицам... НЕТ!⁠⁠

Всем снова привет) предыдущий проект пока в заморозке из за дороговизны обслуживания... Увы не потяну на данный момент... Так что решил реализовать не большой проект, который вылился в пол года работы) Много прочитал про транскрибацию аудио и видео в текст, так же обошел множество проектов которые занимаются этим.

Но встает вопрос, все они онлайн проекты... то-есть информация отправляется на их сервера... что они делают с ней дальше только им известно... а что если, транскрибировать на своем компьютере?) и редактировать сразу сегментированный текст? На своем компьютере... задался я этим вопросом и вот что получилось) стоит ли проект свеч посмотрим дальше :) пока в разработке)

Вопросы:

Вопрос: Почему запускается калькулятор при старте приложения?

Ответ: Скомпилированный транскрибатор весит почти 2гб ^_^ и это без моделек, а мне для разработки нужно запускать его ежеминутно) из за этого для теста подсунул калькулятор))) Готовая версия не будет запускать калькулятор)))

Вопрос: Дизайн ужасный

Ответ: Да, в работе, все будет чики пуки) это как сейчас называют менеджеры МВиПи)) или коротко MVP))) Пока что для лично использования))

Вопрос: Приложение использует GPU или CPU?

Ответ: Это будет завесить от вашего устройства, если ваше устройство поддерживает CUDA то транскрибация будет происходить раз в 20 быстрее, иначе обработка будет происходить на CPU

Вопрос: Что такое CUDA? Где ее всзять?

Ответ: Если у вас видео карта больше 8400 или RTX/GTX или мать твою кто ты такой TITAN... то сможете использовать GPU, иначе CPU с значительно медленной транскрибацией..

Вопрос: Главный вопрос, будет ли программа платной?

Ответ: Да но пробный период будет присутствовать :) А может просто сделаю бесплатный транскрибатор но редактор будет платный, не могу обещать не думал еще :(

Предлагайте идеи, рассмотрю, возможно они появятся в приложении :)

Показать полностью
Интервью Новости Программирование Собеседование Отдел кадров Работа HR Обработка Транскрипция Вертикальное видео Работа Маркетинг Видео
6
user9911831
8 месяцев назад

ЗвукоПоток: Бот для Извлечения Аудио из Видео + транскрипция⁠⁠

Всем привет! Спешу поделиться своим небольшим обновлением.
Это полностью бесплатный бот для извлечения аудио из видео, который теперь стал ещё лучше!

🆕 Что нового:

  • 🎯 Поддержка Google Drive - теперь работаем и с видео из вашего облака

  • 🗣️ Умная транскрибация - превращаем голос в текст одним сообщением

  • 📱 Обработка голосовых - работаем с голосовыми сообщениями и аудиофайлами

  • 🌍 Мультиязычность - автоматически определяем язык речи

💫 Как это работает:

  • Для видео: Отправьте ссылку с YouTube, VK или Google Drive

  • Для транскрибации: Добавьте слово "текст" к ссылке

  • Для голосовых: Просто отправьте голосовое сообщение

⚠️ Важные моменты:

  • Это некоммерческий проект, созданный для личного использования

  • Бот абсолютно бесплатный, без скрытых платежей и премиум-функций

  • Сервер небольшой, поэтому есть технические ограничения:

  • 3️⃣ минуты между запросами на видео

  • 2️⃣0️⃣ МБ максимальный размер для голосовых

  • Всё работает в порядке живой очереди

🤖 Найти бота:

Telegram: ЗвукоПоток

🙏 Просьба к пользователям:

Так как это личный проект с ограниченными ресурсами, пожалуйста:

  • Используйте бота разумно

  • Соблюдайте перерывы между запросами

  • Не пытайтесь обойти ограничения

Ваше бережное отношение поможет сохранить бота доступным для всех! Буду рад вашим отзывам и предложениям в комментариях! 🎧

Показать полностью
Telegram Социальные сети Приложение Программа Бот Google Drive Telegram бот YouTube ВКонтакте Видео ВК Технологии Транскрипция Текст Telegram (ссылка)
0
MaxsimilianLi
MaxsimilianLi
8 месяцев назад
Лига Полиглотов
Серия Лингвистика

Алфавиты №1. Абазинский язык⁠⁠

Алфавиты №1. Абазинский язык Лингвистика, Алфавит, Иностранные языки, Язык, Буквы, Кириллица, Список, Кавказ, Карачаево-Черкесия, Картинка с текстом, Картинки, Транскрипция, Письменность, Рувики, История (наука), Латиница, Длиннопост

Абазинский язык (абаза бызшва) национальный язык абазин, относится к абхазо-абазинской ветви абхазо-адыгской языковой семьи группы языков Кавказа. Наиболее близок к абхазскому языку. Имеет официальный статус в одном из субъектов Российской Федерации - Республика Карачаево-Черкесия.

Абазинская письменность развивалась на основе разных алфавитов, XIX — начало XX веков — попытки создания письменности на арабской основе, с 1932 до 1938 года состояла из латиницы.

Алфавиты №1. Абазинский язык Лингвистика, Алфавит, Иностранные языки, Язык, Буквы, Кириллица, Список, Кавказ, Карачаево-Черкесия, Картинка с текстом, Картинки, Транскрипция, Письменность, Рувики, История (наука), Латиница, Длиннопост

л

С 13 мая 1938 года решением народного комиссариата просвещения РСФСР введён кириллический алфавит. На данный момент состоит из 71 букв + 2 буквы ФI и ЛI встречаются в диалектах и отсутствуют в официальном алфавите. Далее алфавит с транскрипцией по Международному Фонетическому Алфавиту:

  1. А а - /a/

  2. Б б - /b/

  3. В в - /v/

  4. Г г - /g/

  5. Гв гв - /gʷ/

  6. Гъ гъ - /ɣ/

  7. Гъв гъв - /ɣʷ/

  8. Гъь гъь - /ɣʲ/

  9. Гь гь - /gʲ/

  10. ГӀ гӀ - /ɦ/~/ʕ/

  11. ГӀв гӀв - /ʕʷ/

  12. Д д - /d/

  13. Дж дж - /ʤ/

  14. Джв дж - /ʤʷ/

  15. Джь джь - /dʑ/

  16. Дз дз - /dz/

  17. Е е - /je/, /e/

  18. Ё ё - /jo/

  19. Ж ж - /ʒ/

  20. Жв жв - /ʒʷ/

  21. Жь жь - /ʑ/

  22. З з - /z/

  23. И и - /i/

  24. Й й - /j/

  25. К к - /k/

  26. Кв кв - /kʷ/

  27. Къ къ - /q'/

  28. Къв къв - /q'ʷ/

  29. Къь къь - /q'ʲ/

  30. Кь кь - /kʲ/

  31. КӀ кӀ - /k'/

  32. КӀв кӀв - /k'ʷ/

  33. КӀь кӀь - /k'ʲ/

  34. Л л - /l/

  35. Ль ль - /ɮ/

  36. М м - /m/

  37. Н н - /n/

  38. О о - /o/

  39. П п - /p/

  40. ПӀ пӀ - /p'/

  41. Р р - /r/

  42. С с - /s/

  43. Т т - /t/

  44. Тл тл - /ɬ/

  45. Тш тш - /ʧ/

  46. ТӀ тӀ - /t'/

  47. У у - /u/, /w/

  48. Ф ф - /f/

  49. Х х - /x/

  50. Хв хв - /xʷ/

  51. Хъ хъ - /q/

  52. Хъв хъв - /qʷ/

  53. Хь хь - /xʲ/

  54. ХӀ хӀ - /ħ/

  55. ХӀв хӀв - /ħʷ/

  56. Ц ц - /ʦ/

  57. ЦӀ цӀ - /ʦ'/

  58. Ч ч - /tɕ/

  59. Чв чв - /tɕʷ/

  60. ЧӀ чӀ - /tɕ'/

  61. ЧӀв чӀв - /tɕ'ʷ/

  62. Ш ш - /ʃ/

  63. Шв шв - /ʃʷ/

  64. ШӀ шӀ - /ʧ'/

  65. Щ щ - /ɕ/

  66. Ъ ъ - /ʔ/

  67. Ы ы - /ə/

  68. Ь ь - /ʲ/

  69. Э э - /e/

  70. Ю ю - /ju/

  71. Я я - /ja/

  • ФӀ фӀ - /f'/

  • ЛӀ лӀ - /ɬ/

https://ru.ruwiki.ru/wiki/Абазинская_письменность

Показать полностью 1
[моё] Лингвистика Алфавит Иностранные языки Язык Буквы Кириллица Список Кавказ Карачаево-Черкесия Картинка с текстом Картинки Транскрипция Письменность Рувики История (наука) Латиница Длиннопост
6
0
DELETED
8 месяцев назад

Всем не любителям голосовых в WhatsApp посвящается⁠⁠

В веб версии есть расшифровка голосовых сообщений с помощью расширения

Всем не любителям голосовых в WhatsApp посвящается WhatsApp, Голосовые сообщения, Транскрипция, Windows

Пример 1, конечно , есть сложности с профессиональными словами

Ссылка на расширение для Гугл Хрома

WhatsApp Голосовые сообщения Транскрипция Windows
19
Посты не найдены
О нас
О Пикабу Контакты Реклама Сообщить об ошибке Сообщить о нарушении законодательства Отзывы и предложения Новости Пикабу Мобильное приложение RSS
Информация
Помощь Кодекс Пикабу Команда Пикабу Конфиденциальность Правила соцсети О рекомендациях О компании
Наши проекты
Блоги Работа Промокоды Игры Курсы
Партнёры
Промокоды Биг Гик Промокоды Lamoda Промокоды Мвидео Промокоды Яндекс Директ Промокоды Отелло Промокоды Aroma Butik Промокоды Яндекс Путешествия Постила Футбол сегодня
На информационном ресурсе Pikabu.ru применяются рекомендательные технологии