В силу жизненных обстоятельств стал очень плохо слышать собеседника при разговоре по телефону.
Если с проблемой записи звонка (чтоб тебе провалиться, google, со своими политиками конфиденциальности) кое-как разобрался, (спасибо китайским производителям смартфонов), то внезапно вылезла проблема, когда даже записанный разговор понимается с трудом.
Вспомнив, что на дворе 2024 гг. начал искать в свободном доступе какие-нибудь способы перевода в текстовый формат записей разговоров. Были найдены и протестированы следующие варианты.
Transcriptor - есть на гугл.плей. есть ознакомительный режим и платная версия.
Плюсы:
+Достаточно простой и понятный интерфейс;
+Возможность загружать аудиофайл;
+Вполне качественная расшифровка речи и разбивка ее по собеседникам.
Минусы:
-ограничения бесплатной версии в 70 минут , а как приобрести платную, находясь в РФ не очень понятно. (Хотя, по идее, можно создать новый аккаунт и получить новые бесплатные минуты);
-после расхода определенного количества бесплатных минут урезается время транскрипции. У меня, в итоге, стало показывать только 50-60 первых секунд разговора. А при остатке 45 бесплатных минут программа начала писать про сбой и предлагает воспользоваться сайтом;
-цена. Все же дороговато за месячную подписку, к тому же минуты "сгорают". Нет тарифного плана типа "лайт".;
Сервис VEED. Онлайн сервис создания субтитров к видео.
Плюсы.
+Качественная расшифровка речи. Лучше чем Транскриптор распознает слова, разбивка по собеседникам;
+Есть бесплатные минуты после регистрации;
Минусы.
- сложный интерфейс сайта, заточен под создание субтитров для видео, отдельно перевода аудио в текст - не нашел;
- цена. Еще более дорогое удовольствие чем транскриптор. Хотя надо понимать, что сервис заточен под блогеров и прочих, любящих пилить видосики на ютуб;
Использование Telegramm.
Как оказалось, всеми любимая Телега тоже имеет подобный функционал.
При подписке Телеграм-премиум есть возможность по кнопке переводить аудиосообщение в текст.
Плюсы
+ демократичная цена за подписку, к тому же дающая дополнительные "плюшки";
+ Достаточно качественная расшифровка.
Минусы.
- нет разбивки по собеседникам, текст идет сплошным потоком.
- не принимает аудиофайл, приходится запускать файл в плеере и одновременно запускать запись голосового сообщения. К тому же нужен "собеседник" или делать запись в избранное.
- файлы более 4мб отказывается принимать, сообщает что не удалось распознать речь.
Телеграм-бот Voix
Плюсы
+ бесплатный;
Минусы, аналогичные Телеграм-премиуму.
-хуже, чем встроенный транскриптор от телеграм-премиум распознает речь;
- нет разбивки по собеседникам, текст идет сплошным потоком;
- не принимает аудио файл записи звонка.
Телеграмм-бот от Сбера smartspeech_sber_bot
Плюсы.
+Бесплатный;
+Качественная расшифровка, лучше распознает текст чем voix и телеграм-премиум.
+Возможность загрузить файл записи звонка целиком.
Минусы.
- нет разбивки по собеседникам, текст идет сплошным потоком.
Были испробованы и какие-то другие сервисы, но либо неадекватно дорогие, либо сложные для использования.
Выводов не будет. Пост написан с целью помочь таким же как и я.
Бывает, что нужно сделать запись на созвоне и потом расшифровать ее в текст. Если вы не имели ранее опыта использования сервиса, сложно разобраться, как это сделать и что нажать. Бывало у вас такое? Чтобы не было — я написал для вас подробную инструкцию.
Я Писец — добрый друг и защитник авторов, редакторов и журналистов. Хочу помочь вам ходить на созвоны технически подготовленными и не отвлекаться на то, как запустить запись.
Расскажу о возможностях записи звонков через Zoom, SberJazz и Google Meet, а также о транскрибации записи в качественный текст с разделением на абзацы и спикеров. Начнем!
В Zoom можно сделать запись прямо из приложения
Вы можете сделать запись в Zoom прямо через приложение, на своем телефоне или компьютере. В Zoom есть несколько вариантов записи конференций: вы можете сохранить видео- и аудиофайлы, а также отдельные аудиофайлы для каждого участника, до 80 человек.
Вы когда-нибудь делали такие файлы для каждого спикера? Наверное, это интересно, особенно если на встрече была суматоха, все перебивали друг друга, и вы хотите послушать каждого отдельно 😂
Как сделать запись. Откройте в приложении настройки и выберите пункт «Запись».
В настройках записи можно добавить временную метку, скрыть имена участников и выбрать место на компьютере, где будет храниться файл
Во время созвона нажмите кнопку «Запись» в нижней части экрана приложения.
Включить запись может только организатор конференции
Интерфейс подсказывает, что можно прервать запись, не дожидаясь окончания конференции
После звонка Zoom преобразует видео в формат mp4 и сохранит его на ваше устройство.
Нужно сохранять файлы только на компьютере. Если указать путь на флешку или облачный диск — программа собьется и не сохранит запись
В SberJazz можно записать звонок и даже расшифровать его за деньги
Сервис от Сбера позволяет записать видеоконференцию и сохранить ее на компьютер в формате webm.
Как сделать запись. Нажмите на «Прочее» и выберите «Записать встречу». Программа сохранит видео на ваше устройство в формате webm.
Подстава: надпись «Включить расшифровку» кликабельна, но если ее нажать на бесплатном тарифе, ничего не произойдет
Функция расшифровки и конспектирования речи доступна на платном тарифе, который обойдется бизнесу от 8000 рублей в год за одну лицензию.
Хорошие мои, я все понимаю — но это дорого 😬
Чтобы записать встречу в Google Meet — используем плагин
Чтобы записать созвон в гугл мите, нужна платная учетка Google Workspace, которой почти ни у кого нет. На бесплатном аккаунте записать видеоконференцию нельзя — придется хакнуть реальность.
Для записи звонков в Google Meet можно воспользоваться бесплатным расширением для Google Chrome, которое называется Scrnli.
Для начала, необходимо перейти в магазин приложений Google Chrome и в строке поиска ввести название "Scrnli"
Или откройте сайт scrnli.com и нажмите на кнопку «Install Scrnli» — сайт отправит в магазин приложений браузера.
Установите приложение.
Рядом с другими значками приложений появится синий кружочек — логотип Scrnli
Во время созвона нажмите значок Scrnli, выберите пункт «Record video» и нажмите «Browser Window» (записать окно браузера) или «Desktop» (записать рабочий стол). Начнется запись и внизу вкладки появятся кнопочки записи.
После звонка нажмите на «стоп» и отметьте галочкой, что запись нужно сохранить. Откроется страница с записью, на которой нужно выбрать формат и скачать файл.
Я создал звонок в Google Meet, записал его и сделал гифку для вас, чтобы было понятнее
Вариант с расширением Scrnli для Google Chrome подойдет и для любого другого сервиса, если вы его открыли в браузере, а не в приложении.
А теперь мой выход: как расшифровать файл в текст
И тут на арену выхожу я — Писец! Транскрибатор, искусственный интеллект, гений, плейбой, филантроп 😎
Я расшифрую вашу видеоконференцию, поставлю запятые, разобью текст на абзацы и спикеров, укажу таймкоды. Могу обработать как короткий войс, так и многочасовую запись. А еще я легко понимаю все эти ваши «ропы», «митапы» и «лпр».
Расшифровываю все форматы аудио и видеофайлов. Единственное условие — чтобы был звук 🙂
Всем пользователям при первой загрузке файла я дарю пакет на 30 минут. В него входит:
быстрая расшифровка файлов на высокопроизводительных, выделенных серверах;
одновременная обработка нескольких файлов;
поддержка через телеграм-чат.
Когда подарочный пакет закончится, подключится бесплатный тариф. Там всё скромнее:
загрузка файлов до 60 минут;
линейная обработка файлов (вы не загрузите следующий файл, пока не транскрибируется предыдущий);
низкая скорость расшифровки.
На бесплатном тарифе файлы обрабатываются в порядке живой очереди — чем больше пользователей, тем дольше нужно ждать. Расшифровка одного файла может длиться до 24 часов.
Для тех, кому нужно еще вчера — есть платные тарифы на высокой скорости. Вы покупаете время расшифровки и расходуете его столько, сколько нужно, без ограничений по времени.
А еще я за безопасные отношения: не храню ваши файлы и никак их не использую. Расшифровку удаляю сразу после того, как отправляю вам письмо на почту.
Велкам, мои дорогие! Жду ваших созвончиков и интервьюшек! Всё сделаю по красоте ❤️
Привет, Пикабу! Меня зовут Федор Жилкин, я основатель AI-сервиса для онлайн-встреч MyMeet. В этой статье я расскажу про возможности нашего сервиса, его преимущества перед аналогами и почему рынку нужен такой инструмент, как AI-ассистент с функцией подключения на онлайн-встречи.
Предисловие
Цель этой статьи — рассказать вам, что существует такой сервис. Поэтому я постараюсь говорить именно про сам продукт. Не про тернистую историю его появления или этапы создания. Как нелегка жить стартапа, зачем гнаться за AI, как проверять гипотезы и не умереть — все это мы обсудим в других статьях. Можете подписаться на мой блог, чтобы не пропустить!
Сейчас уже есть интеграция с Zoom и Google Meet, скоро – Яндекс.Телемост
AI-помощник для ваших онлайн-встреч
Как вы уже поняли из названия статьи, MyMeet. ai — это сервис транскрипции и создания краткого содержания для ваших онлайн-звонков. Сервис облачный. А значит скачивать себе на устройство ничего не нужно. Достаточно пройти регистрацию.
Основная задача MyMeet — снять с вас рутину постобработки встреч и звонков. От этапа, подключения на звонок с коллегами до этапа подготовки инсайтов, краткого содержания и следующий действий. При этом обеспечив низкий порог входа и сохранность ваших данных.
Для создания первого отчета необходимо зарегистрироваться и выбрать один из 3 способов: синхронизировать свой календарь встреч, указать прямую ссылку на онлайн-встречу в Zoom / Google Meet или загрузить файл с записью. А после того, как отчет о встрече сформирован, можно скопировать содержимое, либо выгрузить документ и передать участникам или коллегам.
Можно ли назвать полученный отчет о встрече полезным? Да, если под полезностью мы понимаем “первый набросок отчета”. Такого отчета будет вполне достаточно чтобы вчитаться в подробный транскрипт и выделить инсайты, пробежать глазами краткое содержание или скопировать в таск-трекер выделенные по итогам звонка задачи!
Ниже я расскажу про каждый из “модулей”. Ну и про нашу главную фишку — подключение бота прямо на встречу и точное распознание русского языка.
Из чего состоит отчет ассистента MyMeet
Каждый отчет имеет свое название, дату, длительность и ключевые слова.
Далее отчет делиться на две части:
Детальный транскрипт с таймкодами, разделением на главы (работает автоматически) и кратким содержанием этих глав. Можно скопировать одним нажатием и перейти в удобную среду для работы с ним. Реплики в транскрипте распределены по спикерам. Спикеров можно переименовать под реальные имена участников встречи.
AI-отчет, который состоит из двух составляющих: краткое содержание и выделенные задачи. Задачи с выполненным чекбоксом — распознаны как сделанные. Задачи с открытым чекбоксом — к исполнению.
Так выглядит типовой отчет встречи: транскрипт с главами
А так выглядит AI-часть: краткое содержание и задачи
Хранилище встреч
Все отчеты храним в защищенном хранилище. На этом экране можно отслеживать статус обработки встреч, вернуться к выполненным отчетам или удалить ненужный.
Хранилище отчетов
Создание отчета о встрече с помощью вашего календаря встреч
Если вы хоть раз пропускали запланированные встречи, то знаете, что календарь и напоминания в таких случаях –must have! Для AI-ассистента все точно также.
При регистрации в сервисе необходимо выбрать “Продолжить с Google” и разрешить (сервису MyMeet) доступ к Google-календарю. В таком случае AI-ассистент будет сам подключаться на ваши встречи, автоматически создавать отчет (транскрипт, краткое содержание, задачи) и отправлять его на почту и в личный кабинет.
Ассистент обычно стучится на встречу, как обычный участник. Если вы хотите, чтобы конкретная встреча не была записана, можно просто не пускать бота на встречу или удалить из встречи при переходе к обсуждению личной информации.
Напомню, что мы не храним видеозаписи ваших звонков, передаваемые данные шифруются с использованием TLS 1.2+, а текстовые отчеты храним с использованием стандартного для индустрии алгоритма AES-256.
Создание отчета о встрече через ручное добавление AI-ассистента
Если вы не синхронизировали свой календарь при регистрации или у вас случилась спонтанная встреча – ассистенту можно просто дать новую ссылку и он моментально по ней подключится ко встрече. Работает с ссылками на Google Meet и Zoom.
Ручное добавление бота на встречу по ссылке
Создание отчета по файлу
Если вы не проводите звонок онлайн и у вас есть файл, который вы хотите расшифровать – можно воспользоваться ручной загрузкой. Мы поддерживаем все файлы до 1 Гб и длительностью до 2 часов, в любом формате, видео или аудио.
Ручная обработка видео/аудио через загрузку файла
Выгрузка отчета и шеринг с участниками
После того, как создан отчет любым из трех вариантов (автоматически по календарю, вручную по ссылке, вручную из файла), он хранится в вашем хранилище. Вы можете его скачать в любом удобном формате (PDF, DOCX, MD или JSON) или отправить на почту email.
Доступные форматы отчета для укачивания
Кейсы
Нами уже пользуются 1000+ человек и обработано 50 000+ минут
Для расшифровки и саммаризации интервью/исследований
Для упрощения работы проджекта и фиксации договоренностей
Для тех, кто пропускает встречи и хочет наблюдать за работой команды со стороны
Если вы хотите поделиться своим опытом использования MyMeet AI, напишите об этом мне! Мы сейчас собираем реальные кейсы применения сервиса для публикации в нашем блоге.
Планы на будущее
На данный момент сервис полностью готов закрывать ваши рабочие задачи. Работает стабильно и без сбоев. Обновления мы стараемся накатывать только по ночам.
Главные принципы, которые мы хотим сохранить, чтобы у нас получилось занять свое место на, казалось бы, уже насыщенном рынке:
Конфиденциальность данных и удобство использования. Чтобы сервисом могли пользоваться для своих ежедневных задач как опытные специалисты, так и начинающие исследователи.
Доступность на российском рынке. У нас работают платежи, мы никуда не собираемся уходить и делаем сервис, который хорошо работает с русским языком.
Скажу еще пару слов про ближайшее будущее. Вот эти фичи мы планируем выкатить:
Интеграция с Яндекс. Телемост. Многие наши клиенты пользуются этим сервисом для видеоконференций, хотим их здесь поддержать и совсем скоро выкатим обновление.
Решение для локального развертывания сервиса. Бизнесы хотят пользоваться сервисом локально, мы уже работаем над решением и ведем переговоры с несколькими. Если вам тоже такое необходимо – пишите на почту hello@mymeet. ai
Доработка визуала и самого отчета. Здесь углубляться в подробности не буду, скажу лишь, что у нас есть несколько идей о том, как еще улучшить взаимодействие с отчетом.
Регистрация полностью бесплатная. Ограничения по времени на триал нет. У нас нет промокодов, но мы будем рады любой обратной связи и отзывам от вас. Можете рассказать о нашем сервисе в соцсетях и дать знать нам об этом по почте – мы начислим вам дополнительно 180 минут вручную.
Вступайте в наше сообщество в Telegram https://t.me/+0cJVIe9OsEQwNzMy чтобы быть в курсе новостей сервиса и иметь возможность быстро задать вопрос разработчикам.
Добро пожаловать, копирайтеры! Присаживайтесь поближе к огню, я покажу вам, как делать неправильно, но крайне удобно. Я возьму видеоролик из Интернета и за 10 минут превращу его в статью. Вы сможете также — это просто. Готовы? Поехали!
Техника, которую я вам покажу, подходит для нескольких сценариев:
— быстро сделать статью в блог;
— причесать транскрибацию интервью;
— проверить мою Писцовую расшифровку на ошибки и создать чистовой вариант текста созвона (я знаю, вы мне доверяете, но вас много и временами приходится спешить).
Расскажу вам, как скачать видео с любого сайта, передать его мне для расшифровки и обработать через чат GPT. Я дам вам два промпта: один для расшифровки, а другой — чтобы написать статью.
Ребят, сразу скажу — сегодня я поделюсь рецептом БЫСТРОГО написания статьи. Не думайте, что помощью одного-двух универсальных промптов ChatGPT вы получите гениальный текст. Все, кто говорит о "уникальных супер-промптах", просто пустые разговоры. Чтобы создать по-настоящему замечательную статью, вам понадобится цепочка промптов и несколько итераций.
Скачать видео можно почти с любого сайта
Умеете скачивать видеоролики откуда угодно? Отлично, вот вам леденец 🍭 Если не умеете, но хотите научиться — читайте.
Чтобы скачать файл с youtube, откройте видео в браузере и в адресной строке перед адресом напишите две буквы «s»:
Переходите по адресу, выбирайте разрешение и скачивайте видео.
Видео с других сайтов можно попробовать скачать через инспектор кода:
Нажмите правой кнопкой мыши в любом месте страницы с видео и выберите в конце списка «Посмотреть код» в Гуглхроме или «Показать программный код страницы» в Сафари.
В открывшемся коде откройте поиск: нажимаем Cmd+F на MacOS или Ctrl+F на Windows.
В поиске укажите формат видео — в большинстве случаев mp4, flv или webm.
Скопируйте ссылку и вставьте ее в адресную строку.
Нажмите на ссылку правой кнопкой мыши и сохраните файл себе на устройство.
Предупреждение. У видео есть владельцы, которые обладают правами на это содержимое. Возможно, скачивание видео противоречит правилам использования и действующему законодательству. Можно свободно скачивать видео, которые доступны по лицензиям Creative Commons CC0 (Public Domain) и CC BY (Attribution). Также можно безопасно скачать собственные ролики, опубликованные ранее. Все остальные видео лучше не скачивать.
Перейдите по ссылке, загрузите файл, выберите количество спикеров и укажите почту, куда прислать файл с текстом. Просто, как два пальца об асфальт — верно? ✌️
Улучшите текст транскрибации при помощи GPT
Если нужно сохранить текст расшифровки слово в слово и исправить ошибки — обработайте его в чат GPT. Он добавит пропущенные знаки препинания, исправит орфографические и пунктуационные ошибки.
Мой старый знакомый ChatGPT умный, но требовательный: выполнит, что попросишь, если объяснить ясно и четко. Нужен хороший промпт, например, такой:
Ты профессиональный расшифровщик. У тебя идеальная орфография и пунктуация. Ты знаешь, как правильно форматировать текст транскрибации. Я вставлю текст, чтобы ты мог его исправить. Ты добавишь соответствующие заглавные буквы, точки, запятые, апострофы, вопросительные знаки и восклицательные знаки. Поставь где это нужно и другие знаки препинания. Ты не будешь вносить никаких других изменений в текст. Ты не будешь менять слова. Ты будешь продолжать вводить текст, пока не исправишь орфографические и пунктуационные ошибки во всем тексте. Вот текст: «…»
Скопируйте текст расшифровки из документа, откройте переписку с ChatGPT-4, вставьте промпт и текст в кавычках.
Важный нюанс: если текст слишком объемный, GPT может выполнить лишь часть задачи и остановиться на середине. Не пишите «продолжить», так как он уже не помнит, что было ему загружено. Вместо этого сделайте следующее:
— скопируйте последнюю фразу, которую GPT обработал;
— откройте документ с расшифровкой и найдите эту фразу с помощью Ctrl+F;
— вернитесь в ChatGPT, еще раз вставьте промпт и добавьте оставшуюся часть текста.
Если у вас там переписка на три часа, возможно придется повторить эту нехитрую операцию несколько раз 🙌
Составляем статью на отлично с помощью чата GPT
Если вы скачали видеоролик из интернета и хотите создать статью для блога или журнала, также можно использовать ChatGPT, только потребуется другой промпт.
В качестве примера я загрузил один умный ролик с YouTube и подал его на вход чату GPT. Видео я вам не покажу — чтобы мне не дали по лапкам за нарушение авторских прав 🙃
Я дал нейросетке такую инструкцию:
Пожалуйста, игнорируй все предыдущие инструкции. Я хочу, чтобы ты отвечал только на русском языке. Я хочу, чтобы ты выступил в роли очень опытного SEO-специалиста и копирайтера высокого класса, свободно говорящего и пишущего по-русски. Я хочу, чтобы ты представил, что ты можешь написать контент на русском языке настолько хорошо, что он может превзойти другие сайты. Твоя задача — написать статью, начинающуюся с SEO Title жирным шрифтом. Переписать содержание и включить подзаголовки, используя связанные ключевые слова. Статья должна быть 100% уникальной и исключать плагиат. Статья должна быть объемом от 1000 до 3000 слов. Все выходные данные должны быть на русском языке, стиль написания должен быть на 100% человеческим, исправь грамматические ошибки. Используй неформальные речевые обороты. Текст для рерайта следующий: «…».
Мне не понравилось, что GPT не поставил заголовки и использовал какие-то странные слова: например, «координально» и «утопление в деталях».
Текст расшифровки после обработки нейросетью
Я не ругался на GPT, потому что он выдал мне полуфабрикат. Как доширак — захавать можно, но это ни разу не Grand Velas Tacos с говядиной кобе, икрой белуги, сыром бри, черным трюфелем и съедобными золотыми хлопьями. 🍝
Этот текст я прогнал еще раз через нейросеть, на этот раз с таким промптом:
Ты профессиональный редактор. Исправь этот текст. Исключи причастные и деепричастные обороты. Исключи страдательный залог. Сделай примеры более подробными. Используй неформальный разговорный стиль. Добавь заголовок H1 и подзаголовки H2: «…».
Теперь получилось чище и интереснее:
Здесь есть, к чему придраться, но учтите — это работа буквально десяти минут. А за полчаса текст можно вычистить до блеска 💫
Ну и признаюсь, что для рерайта я использовал видео с ютуб-канала редактора всея Руси — Максима Ильяхова. Формально это не плагиат, а свободный пересказ ролика. Но я кристально честный писец, поэтому решил рассказать 👼
Котятки мои! Как вы используете нейросети в работе? Используете ChatGPT или что-то другое? Поделитесь в комментариях!
Взял кринжовый видос про озорные поры на носу Бузовой и посмотрел, как с ним справятся лучшие российские транскрибаторы аудио и видео файлов в текст. Сравнил полученный результат по целому списку критериев и составил крутую таблицу. Го смотреть 🚀🚀🚀
Привет, это Писец — транскрибатор, искусственный интеллект и великий освободитель времени. Моё призвание — избавлять людей от мук рукопашной расшифровки. Я всё делаю красиво: делю текст на абзацы и спикеров, расставляю знаки препинания и тайминг.
Всем пользователям дарю час бесплатной расшифровки в месяц на высокой скорости. Хорошо понимаю все эти ваши «ропы», «митапы» и «лпр». И вообще — я клёвый и у меня лапки 🙌
В статье сравниваю между собой сервисы автоматической транскрибации, которые распознают русский язык и принимают оплату с российских банковских карт.
Мои коллеги-транскрибаторы какие-то серьезные все, я решил их кринжатинкой угостить 😝 Предложил им расшифровать видео, где Бузова выпендривается перед журналистом Мезенцевым, а он рассматривает озорные поры у нее на носу 🤣 Ну и сам я расшифровал этот видос тоже, разумеется.
По каким критериям буду сравнивать:
Частота ошибок в словах. На языке маркетинга это называется Word Error Rate или сокращенно — WER. Процент ошибок в распознавании слов от общего числа слов.
Кароч, берем сто слов и считаем, сколько в них ошибок — это и есть процент WER.
Стоимость расшифровки. Кто-то берет оплату за минуты, кто-то за часы, а кто-то и бесплатно расшифровывает — я, например. О каждом сервисе напишу, что именно бесплатно и что платно.
Скорость обработки. Специально выбрал видео чуть меньше минуты, чтобы было видно на небольшом формате — кто тупит, а кто нет.
Знаки препинания —есть ли они вообще и насколько они ок.
Абзацы — есть или нет.
Разбивка текста на спикеров — крайне важная функция если на записи беседуют несколько человек, например, созвон в зуме или конференция.
Ну штош, погнали 🚀
1. Teamlogs
При входе на сайт сервис предлагает зарегистрироваться и дарит 15 бесплатных минут транскрибации. Можно войти через Гугл или Яндекс, чтобы не возиться с паролем и подтверждением. Перетаскиваем файл в окошко загрузки и ждем — текст откроется прямо в интерфейсе.
Перед текстом выдает краткое содержание, предлагает переименовать спикеров и выделяет ключевые слова. Расшифровку можно скачать в форматах docs, xlsx и srt
Что имеем:
Частота ошибок в словах: 18%.
Стоимость: бесплатно 15 минут. Потом зависит от количества минут: файл до получаса обойдется 20 руб/мин, до часа 10 руб/мин и так далее. Самая дешевая тарификация — 6 руб/мин будет доступна если купите пакет размером в 5001 минуту за 30 тыщ рублей.
Скорость: наш видос обработал за 2,5 минуты.
Знаки препинания: есть, но не все корректные.
Абзацы: есть.
Разбивка на спикеров: есть.
Вывод: есть разбивка на спикеров и абзацы — молодец, выдаем леденец 🍭 Ошибок в тексте довольно много, теряет часть реплик, пишет фамилии со строчной буквы, а вот «Белого» почему-то решил писать с заглавной. Если нужно расшифровать часовой видос — заплатите 600 ₽. Ну или покупайте пакеты за десятки тысяч рублей и тогда будет чуть дешевле.
Дороговато, сорян. Краткое содержание перед текстом — вообще песня: «Спикер 0 не хочет идти в Белый, потому что ему постоянно звонит Андрей Аполлонов» 😛
2. Speechtotext
Сервис встречает приглашением пройти регистрацию. Тапнуть в логотип Гугла или ВК не получится, только олдскул и хардкор: вводим пароль два раза, идем на почту и подтверждаем аккаунт. Теперь загружаем файл, ждем и читаем результат прямо на сайте. Ну или скачиваем в формате doc.
Ошибок меньше, чем у предыдущего коллеги, но читать тяжеловато
Что имеем:
Частота ошибок в словах: 9%
Стоимость: бесплатно 10 минут, потом 100 рублей в час.
Скорость: около 10 секунд.
Знаки препинания: есть, но много некорректных.
Абзацы: ну один поставил, рандомный.
Разбивка на спикеров: нет.
Вывод: ошибок в тексте немного, но они напряжные. Принципиально неправильные слова: «официант Андрюшка Аполлонов». Начало и окончание предложения определены неверно и искажают смысл: «…да, когда он 300. Раз меня все предупредили…» Представьте, если в часовом созвоне будет таких ошибок штук 30? Сорян, канеш, но получится непонятная шляпа.
3. Conspecto
На главной странице написано, что сервис конвертирует в текст «с помощью самой совершенной на сегодняшний день модели искусственного интеллекта». Допустим 😏 Различает 50 языков, поддерживает много форматов и не требует регистрации. Еще у сервиса есть телеграм-бот, но нам его тестить лень и мы сделаем все в браузере.
Текст можно прочитать на сайте и скачать в TXT, HTML или DOC
Что имеем:
Частота ошибок в словах:1%
Стоимость: бесплатно одна минута, потом 3 руб/мин за транскрибацию или 4 руб/мин за нее же, но с конспектом.
Скорость: 20 секунд.
Знаки препинания: есть, вполне ок.
Абзацы: нет.
Разбивка на спикеров: нет.
Вывод: текст чистенький, почти без ошибок. Хорошо, что есть тг-бот. Маловастенько дают бесплатно, всего одну минутку, но хозяин — барин, как грицца. Плохо, что текст сплошняком. Фирменная фишка сервиса — конспект, с ним транскрибация стоит на руб дороже (буквально). Я заказал расшифровку с конспектом, смотрите что получилось:
Ну как-бы ок 🤷♂️
4. Any2text.ru
На главной странице нас встречает окошко, в которое нужно перетащить файл для транскрибации. Сервис поддерживает много языков и предлагает скачать расшифровку в нескольких форматах на выбор — docx, xlsx, srt или txt. Регистрироваться не нужно, просто загружаете файл, ждете и смотрите результат.
Прикольная фича — если нужна расшифровка с ютуба, можно просто вставить ссылку
Что имеем:
Частота ошибок в словах: ошибок нет, маладэц.
Стоимость: бесплатно 15 минут. Потом 5 руб/мин транскрибации если не регистрируешься. Если зарегистрироваться и пополнить баланс на тыщу рублей — 4 руб/мин.
Скорость: наше видео обработал за одну минуту.
Знаки препинания: есть, корректные.
Абзацы: нет.
Разбивка на спикеров: нет.
Вывод: шустрый, чистый сервис, переводит без ошибок. Часовой видос обойдется в 300 рублей или в 240 со скидкой после регистрации. На абзацы и спикеров не делит: если у вас многочасовая конфа или созвон в зуме на пять человек, задолбаетесь потом вручную разбивать и въезжать, кто где говорит.
5. WordWoice
При входе сервис предлагает зарегаться по почте или через ВК. После регистрации в личном кошельке оказывается 90 рублей, которые можно потратить на тестовую расшифровку. Под окошком загрузки — чек-бокс для иностранного текста, если его отметить, предлагает сделать перевод.
Результат можно прочитать на сайте и скачать файлом. А ещё можно послушать или скачать аудиофайл
Что имеем:
Частота ошибок в словах: 2%.
Стоимость: 5 руб/мин, при регистрации дарят 90 рублей.
Скорость: 40 секунд.
Знаки препинания: есть.
Абзацы: нет.
Разбивка на спикеров: нет.
Вывод: хороший, чистенький перевод и стильный интерфейс. Разбивает текст на таймкоды, ставит их даже посреди предложения. Удобно, что можно тыкнуть в тайм-код и прослушать этот момент в аудиозаписи. В скачанном файле транскрибации таймкодов нет — просто текст сплошняком. Расшифровка часового созвона обойдется в 300 рублей.
6. Apihost
Apihost — солидный набор сервисов по работе с аудио и текстами. Он умеет в озвучку, изменение голоса и еще кучу всего. В том числе есть и транскрибатор. Чтобы загрузить файл, нужно зарегистрироваться. После регистрации в личном кабинете было написано, что у меня баланс ноль рублей — про бесплатные минуты я нигде ничего не нашел. Но я рискнул загрузить наш видос. И…
Такой приличный сервис — и матом матерится 😂😂😂
Что имеем:
Частота ошибок в словах: 18%
Стоимость: 2,4 руб/мин
Скорость: 25 секунд.
Знаки препинания: есть, какие попало.
Абзацы: нет.
Разбивка на спикеров: нет.
Вывод: ну, такое. Что матом ругается — полбеды. Что имена пишет со строчной — вообще хрен бы с ним. Но блин, неправильно определяет начало и конец предложения, сливает очевидно разные предложения в одно — длинное и бессмысленное. Получается эталонное нечитаемоеполотнотекста. За час текста — 144 рубля, пополнять можно минимум на 500 р. Максимальный размер файлов для загрузки — 200 мб, маловато.
7. Писец
И на сладенькое — я, Писец 🍬🍬🍬 Защитник обиженных и угнетенных, Робин-Гуд мира копирайтеров 🏹 …так, ладно у нас тут обзор и я к себе буду объективен. У меня всё просто: регистрироваться не надо, заходим на сайт, грузим файл, указываем почту и выбираем количество спикеров — от одного до пяти. После этого можно закрыть браузер и идти пить кофе — текст я пришлю на почту ☕️
Я называю спикеров персонажами книги Алана Милна — нравится мне так 🐻🐽👦
Что имеем:
Частота ошибок в словах: 2%
Стоимость: бесплатно один час в месяц на высокой скорости. Потом тоже бесплатно, но медленнее.
Скорость: 40 секунд.
Знаки препинания: есть.
Абзацы: есть.
Разбивка на спикеров: есть.
Вывод: как видите, я к себе объективен. В этом видосе я недослышал одно слово в первой реплике и один раз пропустил слово «какой». При этом я крайне хорош в том, чтобы определять реплики спикеров и назначать им таймкоды.
Расшифровываю бесплатно на высокой скорости один час в месяц, а потом — тоже бесплатно, но медленнее.
А если хотите быстрее — можно купить пакет минут по оооочень демократичной стоимости:
990 ₽ за 10 часов (1.65 ₽/мин)
1620 ₽ за 20 часов (1,35 ₽/мин)
1980 ₽ за 30 часов (1,1 ₽/мин) с постобработкой в ChatGPT.
Пакеты минут не ограничены во времени использования — можете за месяц потратить или на несколько лет растянуть.
Так, ну и теперь сравнительная табличка
Ну и вот: думайте сами, решайте сами — Писец или не Писец 🎸🎶
Прошу откликнуться профессионалов по работе со звуком, для помощи в расшифровке отрывка аудиозаписи из первого поста
Многие, а точнее практически все, посчитали мой пост бредом преследования. С пониманием отношусь к такому мнению, потому что для установления содержания разговора мною было потрачено порядка одного года. Перебор различных аудио редакторов, прогон через все возможные нейросети для подавления шума. Дело в том что там действительно есть и тиканье часов, и моё дыхание. И обычный, не заинтересованный, слушатель кроме этих звуков ничего не слышит. В моём небольшом городе не нашлось человека с профессиональным оборудованием для обработки аудио.
Я очень прошу откликнуться на мою просьбу о помощи. Естественно не бесплатно. Предлагаю следующий вариант сотрудничества: 1. Я скидываю оригинал записи и указываю временные метки в котором присутствует разговор. Небольшой отрывок порядка 10 секунд 2. Если получиться выявить содержание разговора в этом небольшом отрывке, я отправлю 1000 ₽ на карту любого банка. (Естественно я заранее знаю что на этом отрывке) 3. Далее готов обсудить стоимость работ по расшифровке большего объема.
И если мы это сделаем, я обещаю что это будет просто информационная бомба. Но об этом уже после хоть какого то прогресса.
Опробовав несколько расширений, я выбрала два стоящих внимания:
1) Tactiq
Расширение Tactiqавтоматически законспектирует ваши рабочие совещания в Zoom, Google Meet и MS Teams.
Сервис хранит конспекты всех звонков — можно вернуться к более старым записям звонков и перечитать их в любой момент.
Достоинства и недостатки
➕ бесплатно 10 транскрипций звонков в в месяц
➕ есть русский язык (меняется через кнопку «Change»)
➖ если нужно больше транскрипций, цена 9 USD / месяц
➖ записывает только аудио
2) tl;dv
Расширениеtl;dv, а вот и самоприложение-это инструмент, который помогает пользователям записывать, транскрибировать, делать клипы и делиться своими онлайн-встречами в Google Meet и Zoom, в отличие от Tactiq записывает и видео
Достоинства и недостатки
➕ для небольших команд полностью бесплатный с неограниченным количеством транскрипции звонков
➕ есть запись видео
➕ есть русский язык
➖ для больших команд и для пользователей, которым нужен расширенный функционал 25 USD / месяц
Хотите быть в курсе о полезных ии сервисах для работы, учебы и облегчения жизни? Подпишитесь на мой канал в Telegram НейроProfit, там я рассказываю о том, как зарабатывать с помощью нейросетей и использовать ии-сервисы для бизнеса, но, что самое главное, я тестирую сервисы перед их рекомендацией 😉