Кто такой этот ваш DimaTorzok? Субтитры сделал DimaTorzok
Почему при использовании распознавания голоса в телеграм (и не только) то можно наткнутся на какого-то DimaTorzok.
не "добавил", а "сделал"
Чаще всего там написано что-то типо "Субтитры создавал/сделал/ предоставил DimaTorzok". При этом эту фигню можно встретить не только в телеграме, но и на рандомных сайтах которые хоть немного связаны с распознаванием речи.
Спрашивается кто это такой и почему он может появится абсолютно везде где присутствует распознавание речи? Неужели вся речь распознаётся у какой-то одной системы распознавания речи и у неё есть такой баг и большинство компании просто установили её в свои приложения и сайты? Субтитры сделал DimaTorzok.
Явление наблюдается при использовании модели преобразования речи в текст Whisper от OpenAI. Чаще всего "DimaTorzok" встречается, когда модель обрабатывает аудиофрагменты с шумом или низкого качества, когда выставлен русский язык в настройках обработки.
В целом, модель эффективно расшифровывает речь на многих языках и может быть запущена на ПК с видеокартой Nvidia 30 или 40 серии. Альтернативных моделей, обладающих аналогичными возможностями, практически нет или их очень мало, поэтому
"вся речь распознаётся у какой-то одной системы распознавания речи и у неё есть такой баг и большинство компании просто установили её в свои приложения и сайты",
потому что не надо изобретать велосипед, а скачал модель и погнал, ибо бесплатно.
не "делал", а "你懂中文吗"
Пример использования модели Whisper Large v3 с Silero VAD, где из-за шумного аудио "DimaTorzok" встречается часто.
P.S: Почему DimaTorzok? Может быть, когда-то действительно был такой дядька, который делал субтитры, и это попало в набор данных для обучения.