Кто такой этот ваш DimaTorzok? Субтитры сделал DimaTorzok

Почему при использовании распознавания голоса в телеграм (и не только) то можно наткнутся на какого-то DimaTorzok.

Кто такой этот ваш DimaTorzok? Субтитры сделал DimaTorzok Технологии, Распознавание голоса, Мемология, Инновации, Изобретения, Длиннопост

не "добавил", а "сделал"

Чаще всего там написано что-то типо "Субтитры создавал/сделал/ предоставил DimaTorzok". При этом эту фигню можно встретить не только в телеграме, но и на рандомных сайтах которые хоть немного связаны с распознаванием речи.

Кто такой этот ваш DimaTorzok? Субтитры сделал DimaTorzok Технологии, Распознавание голоса, Мемология, Инновации, Изобретения, Длиннопост

Спрашивается кто это такой и почему он может появится абсолютно везде где присутствует распознавание речи? Неужели вся речь распознаётся у какой-то одной системы распознавания речи и у неё есть такой баг и большинство компании просто установили её в свои приложения и сайты? Субтитры сделал DimaTorzok.

Кто такой этот ваш DimaTorzok? Субтитры сделал DimaTorzok Технологии, Распознавание голоса, Мемология, Инновации, Изобретения, Длиннопост

Явление наблюдается при использовании модели преобразования речи в текст Whisper от OpenAI. Чаще всего "DimaTorzok" встречается, когда модель обрабатывает аудиофрагменты с шумом или низкого качества, когда выставлен русский язык в настройках обработки.

В целом, модель эффективно расшифровывает речь на многих языках и может быть запущена на ПК с видеокартой Nvidia 30 или 40 серии. Альтернативных моделей, обладающих аналогичными возможностями, практически нет или их очень мало, поэтому

"вся речь распознаётся у какой-то одной системы распознавания речи и у неё есть такой баг и большинство компании просто установили её в свои приложения и сайты",

потому что не надо изобретать велосипед, а скачал модель и погнал, ибо бесплатно.

Кто такой этот ваш DimaTorzok? Субтитры сделал DimaTorzok Технологии, Распознавание голоса, Мемология, Инновации, Изобретения, Длиннопост

не "делал", а "你懂中文吗"

Пример использования модели Whisper Large v3 с Silero VAD, где из-за шумного аудио "DimaTorzok" встречается часто.

Кто такой этот ваш DimaTorzok? Субтитры сделал DimaTorzok Технологии, Распознавание голоса, Мемология, Инновации, Изобретения, Длиннопост

P.S: Почему DimaTorzok? Может быть, когда-то действительно был такой дядька, который делал субтитры, и это попало в набор данных для обучения.

Кто такой этот ваш DimaTorzok? Субтитры сделал DimaTorzok Технологии, Распознавание голоса, Мемология, Инновации, Изобретения, Длиннопост