Прошу совета у Пикабу (Аудио в текст)
Дано: Wav файл (два часа!!!), студийная запись, два голоса, иногда фоновая музыка, русский язык с включениями английского с сильным русским акцентом.
Нужно: Распознать диалог в текстовый файл, желательно конечно с удобным интерфейсом, совмещающим текст и аудио по таймингу, но можно и вовсе без интерфейса.
Спасибо.