Нейросеть в реальном времени переводит и распознает любую речь
Whisper WebGPU - мгновенно распознаёт речь со 100 языков! Можно загрузить файл - как аудио, так и видео, либо вставить ссылку, либо надиктовать в режиме реального времени.
Что может
Преобразует аудио в текст
Мгновенно переводит распознанный текст на разные языки, может быть полезно для международных видеозвонков.
Или, как вариант, включить запись на совещании на иностранном языке и получить мгновенный перевод. Плюсом текст совещания останется с вами
Так же хорошо подходит для создания субтитров - за секунды транскрибирует речь из видео и аудио.
Голосовое управление - использование голосовых команд для управления веб-интерфейсами.
Сервис бесплатный. Модель работает локально, данные останутся на вашем устройстве, скачать можно в Discord , протестировать можно на сайте HuggingFace
Источник НейроProfit - авторский канал про полезные нейросети