Нейросеть в реальном времени переводит и распознает любую речь

Whisper WebGPU - мгновенно распознаёт речь со 100 языков! Можно загрузить файл - как аудио, так и видео, либо вставить ссылку, либо надиктовать в режиме реального времени. 

Что может

  • Преобразует аудио в текст

  • Мгновенно переводит распознанный текст на разные языки, может быть полезно для международных видеозвонков. 

    Или, как вариант, включить запись на совещании на иностранном языке и получить мгновенный перевод. Плюсом текст совещания останется с вами

  • Так же хорошо подходит для создания субтитров - за секунды транскрибирует речь из видео и аудио.

  • Голосовое управление - использование голосовых команд для управления веб-интерфейсами.

Сервис бесплатный. Модель работает локально, данные останутся на вашем устройстве, скачать можно в Discord , протестировать можно на сайте HuggingFace

Источник НейроProfit - авторский канал про полезные нейросети

Полезные нейросети

311 постов715 подписчиков

Правила сообщества

Друзья, давайте уважать друг друга, и не разводить политических дебатов, не разжигать ненависть по национальному признаку, не превращать группу в 18+, уверена, вам тоже не хочется сидеть в помойке, а хочется сильного окружения, которое будет тянуть вас вперед. Как знать, может вскоре мы будем устраивать хакатоны