Я устал слушать голосовые по 5 минут в Telegram и WhatsApp и создал бот с кратким пересказом

С активным развитием мессенджеров все общество поделилось на любителей и противников голосовых сообщений.

Я устал слушать голосовые по 5 минут в Telegram и WhatsApp и создал бот с кратким пересказом Telegram бот, Telegram, Голосовые сообщения, ChatGPT, Искусственный интеллект, WhatsApp, Длиннопост

Проблема: я занят и мне некогда слушать длинные голосовые сообщения

Основные доводы против использования голосовых:

- Слишком долгое повествование с использованием лишних подробностей

- Нельзя быстро пробежаться глазами как по тексту и понять ключевые моменты

- Не всегда удобно слушать в людных и шумных местах

- Нельзя пользоваться поиском по голосовым для нахождения важной информации

Решение: Pop Audio Bot

Я сделал простого телеграм бота, который расшифровывает голосовые и видео сообщения в текст. Если сообщение длиннее 25 секунд, то бот пришлет дополнительно краткое изложение. Для того чтобы воспользоваться ботом необходимо переслать сообщение из любого диалога Telegram (также можно из WhatsApp). Бот поддерживает формат голосовых сообщений, аудио, видео и видео-кружочков. Главное, чтобы ваш файл был меньше 20 Мб.

Я устал слушать голосовые по 5 минут в Telegram и WhatsApp и создал бот с кратким пересказом Telegram бот, Telegram, Голосовые сообщения, ChatGPT, Искусственный интеллект, WhatsApp, Длиннопост

Как работает бот?

Бот написан целиком и полностью с использованием API OpenAI. Голосовая модель whisper используется для расшифровки аудио, что позволяет обрабатывать 96 различных языков. За выжимку основной мысли из текста отвечает модель gpt-3.5-turbo.

Что по безопасности моих данных?

Ваши голосовые файлы не хранятся на нашем сервере. Они скачиваются, преобразуются в необходимый формат для отправки в Open AI и мгновенно удаляются. История переписки с ботом также не хранится.

Зачем это все, если есть Telegram Premium и другие боты?

Да, действительно, существует уже не мало ботов, которые предоставляют похожий функционал. Но большинство из них поддерживают только файлы до 90 секунд или только голосовые сообщения. Я же постарался объединить все лучшее, чтобы можно было максимально удобно пользоваться ботом. Что касается конкуренции с Telegram Premium, то главное отличие и преимущество - это краткая выжимка из текста, которая сэкономит уйму времени клиентов.

Ботом можно пользоваться бесплатно?

Я решил с самого старта сделать бесплатную версию с урезанным функционалом и платную. Бесплатная дает возможность расшифровывать до 3 сообщений в сутки длиной до 60 секунд каждое. Платная версия дает безлимит на количество запросов в сутки и увеличивает длительность до 10 минут. Стоимость 149 рублей - месяц.

Сама возможность пользоваться API OpenAI является достаточно не дешевой. Так что не думайте, что с этих 149 рублей можно купить Ламбу и зажить красивую жизнь в Дубае. По моим оценкам, эта стоимость должна лишь покрывать затраты.

Про автора и байт на телегу.

Если немного раскрыть карты, то я не программист и не маркетолог. Я совершенно не знал python и любой другой язык программирования. Я не знаю, как продвигать свой проект. Но огромное желание пытаться что-то делать подтолкнуло меня ввязаться в эту авантюру. За 4 дня с нуля я базово изучил python, aiogram, SQL и написал бота (спасибо ChatGBT). Если вам интересно, что из этого всего получится - то можете подписаться на мой Telergam-канал, где я буду освещать подробно с цифрами все свои результаты и факапы, а их, я уверен, будет много.

Также очень интересно услышать ваши отзывы и предложения по улучшению продукта. Хейтеры, не стесняйтесь, приглашаю всех оставить свое мнение ниже.

Бот - ТЫК

Блог - ТЫК

Искусственный интеллект

2.5K постов9.8K подписчиков

Добавить пост

Правила сообщества

Здесь вы можете свободно создавать посты по теме Искусственного интеллекта. Добро пожаловать :)


Разрешено:


- Делиться вопросами, мыслями, гипотезами, юмором на эту тему.

- Делиться статьями, понятными большинству аудитории Пикабу.

- Делиться опытом создания моделей машинного обучения.

- Рассказывать, как работает та или иная фиговина в анализе данных.

- Век жить, век учиться.


Запрещено:


I) Невостребованный контент

  I.1) Создавать контент, сложный для понимания. Такие посты уйдут в минуса лишь потому, что большинству неинтересно пробрасывать градиенты в каждом тензоре реккурентной сетки с AdaGrad оптимизатором.

  I.2) Создавать контент на "олбанском языке" / нарочно игнорируя правила РЯ даже в шутку. Это ведет к нечитаемости контента.


II) Нетематический контент

  II.1) Создавать контент, несвязанный с Data Science, математикой, программированием.

  II.2) Создавать контент, входящий в противоречие существующей базе теорем математики. Например, "Земля плоская" или "Любое действительное число представимо в виде дроби двух целых".

  II.3) Создавать контент, входящий в противоречие с правилами Пикабу.


III) Непотребный контент

  III.1) Эротика, порнография (даже с NSFW).

  III.2) Жесть.


За нарушение I - предупреждение

За нарушение II - предупреждение и перемещение поста в общую ленту

За нарушение III - бан