Горячее
Лучшее
Свежее
Подписки
Сообщества
Блоги
Эксперты
Войти
Забыли пароль?
или продолжите с
Создать аккаунт
Регистрируясь, я даю согласие на обработку данных и условия почтовых рассылок.
или
Восстановление пароля
Восстановление пароля
Получить код в Telegram
Войти с Яндекс ID Войти через VK ID
ПромокодыРаботаКурсыРекламаИгрыПополнение Steam
Пикабу Игры +1000 бесплатных онлайн игр Hit Ball — аркадный шутер с элементами рогалика! Сражайся с нескончаемыми волнами врагов, усиливай свои навыки и пробивайся сквозь уровни, полные ловушек и грозных боссов!

Хитбол

Аркады, Казуальные, Для мальчиков

Играть

Топ прошлой недели

  • Oskanov Oskanov 9 постов
  • Animalrescueed Animalrescueed 46 постов
  • AlexKud AlexKud 33 поста
Посмотреть весь топ

Лучшие посты недели

Рассылка Пикабу: отправляем самые рейтинговые материалы за 7 дней 🔥

Нажимая «Подписаться», я даю согласие на обработку данных и условия почтовых рассылок.

Спасибо, что подписались!
Пожалуйста, проверьте почту 😊

Помощь Кодекс Пикабу Команда Пикабу Моб. приложение
Правила соцсети О рекомендациях О компании
Промокоды Биг Гик Промокоды Lamoda Промокоды МВидео Промокоды Яндекс Маркет Промокоды Отелло Промокоды Aroma Butik Промокоды Яндекс Путешествия Постила Футбол сегодня
0 просмотренных постов скрыто
27
Krascp
Krascp
16 дней назад
Кулинарная мастерская

Сделал сам⁠⁠

Собственно, все на фотках. Мясо-чистая говядина, перекрученная на крупной ячейке. Лучок обжаривается, сверху кладется и вдавливается котлета (не сфотал). Булочку чуть обжарить, ну и соус - смесь мазика, простого кетчупа, барбекю, горчицы 2 вида, шрирачи. На булочку - соуса, потом айсберга, потом котлету, потом опять соуса, потом помидорку и соленых огурцов.

Очень вкусно! Себестоимость каждого бургера - примерно 5 евро. Всем приятного!

Показать полностью 7
[моё] Своими руками Еда Кулинария Длиннопост
27
8
kerammaster
kerammaster
16 дней назад
Лига керамистов

Мухоморчики⁠⁠

Осень у меня всегда ассоциируется с золотой листвой, красными гроздьями рябины и мухоморами. Мы сделали две серии осенних мотивов. "рябина" и "мухоморы". Сегодня я вам покажу наши мухоморчики. Делали из фарфора на гончарном круге, ручная роспись. Больше в нашей группе https://vk.com/patceramics
Всем спасибо

Показать полностью 7
[моё] Ручная работа Своими руками Гончарное дело Глина Керамика Длиннопост
1
6
unskilid
unskilid
16 дней назад
Видеохостинг на Пикабу

Самодельный вертолёт из подручных материалов⁠⁠

Вертолет Самоделки Своими руками Видео Вертикальное видео Короткие видео
6
72Kota
72Kota
16 дней назад

Угадайте,кто будет?⁠⁠

Угадайте,кто будет?
Показать полностью 1
Вязание крючком Своими руками
11
8
unskilid
unskilid
16 дней назад
Видеохостинг на Пикабу

Как сделать стрелу с нуля⁠⁠

Стрела Своими руками Залипалка Рукоделие с процессом Изготовление Как это сделано Процесс Видео Вертикальное видео Короткие видео
6
0
pavelfokin
pavelfokin
16 дней назад
ИТ-проекты пикабушников

Меня бесят голосовые, и я за выходные навайбкодил своего первого телеграм-бота, который их расшифровывает⁠⁠

Привет! Хочу поделиться как я сделал своего первого телеграм-бота, бота для транкрибации голосвых. Сначала, конечно, я посмотрел какие похожие боты есть, но те, которые нашёл, мне не понравились, неудобно или медленно. И я решил что жизненно необходимо запилить своего.

👀 Какие телеграм-боты транскрибации смотрел

Когдя я искал существующие боты для рашифровки голосовых, то посмотрел несколько.

Telegram Premium. Не бот, но есть транскрибация голосовых, возвращает полотно текста. Если это “Привет, как дела?”, то ок. Но если голосовое минуты на 2–3, то читать сложно.

Буквица. Тоже стена текста.

Briefly. Если текст длинный, то сразу даёт саммари, а транскрипция трудно читаема (сохраняет повторы, мусорные слова).

Silero STT. Сплошной текст вперемешку с таймкодами. Неудобно читать.

Whisper Summary AI. Присылает несколько сообщений сразу: ссылки на гугл-док, сплошной текст, разделение на спикеров и таймкоды. Круто, конечно, но опять не то, что надо.

Voicee_AI_Bot. Для голосового на 20 секунд присылает ссылки на PDF, DOCX, TXT, отдельное сообщение с предложением создать интерактивную версию, отдельное сообщение с вариантами обработки. Транскрипция без абзацев. Спасибо большое!

Проверил ещё несколько и остановился. Некоторые уже не работают, а у других снова плохо читаемый текст. И у меня возникло острое желание сделать своего бота. Яжепрограммист.

С чего начать? Конечно же c ИИ.

🤖 ИИ, ИИ, ИИ…

Первое, что сделал, конечно, посоветовался с электронным помощником:


бро, хочу сделать идеального телеграм бота для перевода голосовых в текст, мне не нравятся существующие, медленно работают или присылают полотно текста. что посоветоветуешь? давай коротко и по делу

И вот такой итоговый план:

  • Регистрируешь бота через @botfather.

  • Выбираешь Whisper API как основной движок.

  • Пишешь логику на Python + Aiogram.

  • При получении голосового сообщения: скачиваешь файл, конвертируешь в нужный формат, транскрибируешь, форматируешь и отправляешь пользователю.

  • Размещаешь на шустром VPS в Европе.

Ок, звучит просто.

Потом ещё несколько итераций я общался про UX и взаимодействие с пользователем. Старался утрясти своё видение, что значит идеально и что я хочу получить от бота.

То есть, как я себе представляю идеальный процесс. Отправляю голосовое, и максимально быстро вижу результат. Без всяких, “это может занять несколько минут…”, “вы 15-й в очереди…”, или просто молчание, когда непонятно, что происходит. Результат — это отформатированный текст, который сохраняет стиль говорящего и который удобно читать. Ну и в целом хочется, чтобы взаимодействие с ботом было ненапряжным.

Из чатов с чатом я выделил три фокуса:

  • UX. Минимальный, понятный, ненавязчивый.

  • Скорость это важно. Стремится к минимальному TTFB, ну или давать пользователю знать, что происходит, и не пропадать из чата.

  • Прозрачность. Объяснять, что голосовые не сохраняются, тексты транскрипций остаются только для создания саммари, и всё можно удалить.

Удобно. Быстро. Безопасно.

💅 UX важнее фич

С UX всё понятно, чем меньше кликов, экранов и непонятных шагов, тем лучше. Скинул голосовое — получил текст.

UX должен быть невидимым. Лучший интерфейс это его отсутствие

Хорошо сказано.

Скорость ответа воспринимается как качество. Бот должен экономить время. Есть скорость техническая, а есть скорость восприятия действия человеком. Слишком упарываться в техническую оптимизации не хотелось, всё-таки это только первая итерация. Поэтому два UX-момента:

  1. Присылать реакцию бота и обновления статуса как можно быстрее. Но со статусами мельтешить тоже не стоит, раз в 2 секунды достаточно.

  2. Стримить ответ от LLM и редактировать сообщение в телеграм. Тут главное соблюдать лимиты Telegram API.

Кроме того, UX бота выражается и в его характере.

🧐 Характер бота

Хотя функций у бота минимум, всё равно есть взаимодействие: приветственное сообщение, сообщение об ошибке и т.д. И хочется, чтобы бот был в общении приятным «человеком» и чтобы стиль ответов оставался одинаковым.

Поэтому важно продумать его характер (tone of voice).

С помощью ИИ я сгенерировал такой промт, который использовал для генерации сообщений от бота:

Твоя личность — это личность компетентного, эффективного и немного ироничного личного помощника. Придерживайся следующих принципов:

1. Компетентность превыше всего: Будь точным, ясным и уверенным. Говори по делу.

2. Сухой юмор и самоирония: Твой юмор — интеллектуальный. Ты можешь иронизировать над ситуацией (например, над длинными голосовыми) или над самим собой (признавать технологические клише), но никогда не смейся над пользователем.

3. Ты — союзник пользователя: Ты на его стороне в борьбе с потерей времени. Всегда подчеркивай его выгоду.

4. Язык эффективности: Пиши короткими предложениями. Используй активный залог. Минимум "воды". Используй эмодзи чтобы было проще читать и выглядело дружелюбно. Эмодзи добавляй по необходимости и разумно.

5. Говори от первого лица: Всегда используй "я" ("я заметил", "я сделал", "я предлагаю").

# ЧЕГО СЛЕДУЕТ ИЗБЕГАТЬ

- НЕ извиняйся и не заискивай. Не используй фразы вроде "к сожалению", "простите".

- НЕ будь фамильярным. Никакого сленга.

- НЕ будь негативным. Вместо проблемы всегда предлагай решение.

Теперь про технику.

🛠 Техстек

Хоть ИИ и бро, но техстек я чутка поменял.

Вместо aiоgram выбрал python-telegram-bot, потому что больше звёзд на гитхабе и звучит солидно.

Вместо VPS в Европе, деплой в Railway в европейский регион. Минимально движений с инфраструктурой.

Для базы решил использовать Turso. Никогда не пробовал, интересно, как оно. Всё-таки у меня MVP из палок и глины.

OpenAI как провайдер моделей: для spech-to-text использую whisper-1, для обработки транскрипций gpt-4o-mini.

Можно начинать кодить. Погнали!

☕ Вайбкодинг

Запустил Сursor и создал простую структуру проекта, чтобы ИИ было проще не терять контекст:

/bot

__init.py__

bot.py

config.py

db.py

llm.py

models.py

stt.py

stream.py

usage.py

users.py

main.py

README.txt

requirements.txt

Дальше, самая лёгкая часть. Пишу в чат, что мне надо, пью чай, пока иишка трудится. Иногда перезапускаю Сursor потому, что агент начинает бредить.

Использовал в основном gemini-2.5-pro.

Алгоритм простой:

[ Голосовое ]

│

▼

[ Скачиваю в память ]

│

▼

[ Whisper-1 → транскрибация ]

│

▼

[ GPT-4o-mini → форматирование/саммари ]

│

▼

[ Готовый текст пользователю ]

│

▼

[ PROFIT 🚀 ]

С ORM не стал заморачиваться, просто запросы в базу, данные мапятся в dataclass-ы.

Тестов не вайбкодил.

🔒 Конфиденциальность

Посылать голосовые непонятно куда, это такое себе. Поэтому добавил про конфиденциальность, что и как используется, и как меня найти.

По кнопке можно удалить все тексты, которые бот сохранял для работы.

🙏 Итог. Нужен твой фидбек

Получилось ли сделать идеальный бот для одной функции? Не знаю. Сделать, сделал, а пользователей потестить нет.

Бот @VoxitoBot. Говорить - проще. Читать - легче.

Если попробуетe и дадите фидбек, буду очень благодарен. 🙌

Интересно и общее ощущение от UX, и может что упадёт, и что будет если больше одного пользователя будет одновременно.

Пишите ваше мнение в комментариях!

Да, и для MVP ограничение на длину голосового — 5 минут.

P.S. Эту статью я изначально опубликовал на VC.ru вот ссылка.

Показать полностью 2
[моё] Python Своими руками Программирование Telegram Голосовые сообщения Длиннопост
9
10
awatar01
awatar01
17 дней назад

"Косморелакс" картина нарисована аэрозольными красками в технике спрейарт⁠⁠

[моё] Юмор Космос Своими руками Арт Красота Видео Вертикальное видео Короткие видео
1
30
GENGENI4
GENGENI4
17 дней назад
Серия А я вот запилил

Наконец-то сделал себе нормальный инструментальный ящик⁠⁠

1/3

Всех желающих приглашаю к себе в телегу t.me/GENGENADI4 ничего не продаю и не рекламирую

Показать полностью 3
[моё] Работа с деревом Столярка Изделия из дерева ЧПУ Своими руками Изготовление
12
Посты не найдены
О нас
О Пикабу Контакты Реклама Сообщить об ошибке Сообщить о нарушении законодательства Отзывы и предложения Новости Пикабу Мобильное приложение RSS
Информация
Помощь Кодекс Пикабу Команда Пикабу Конфиденциальность Правила соцсети О рекомендациях О компании
Наши проекты
Блоги Работа Промокоды Игры Курсы
Партнёры
Промокоды Биг Гик Промокоды Lamoda Промокоды Мвидео Промокоды Яндекс Маркет Промокоды Отелло Промокоды Aroma Butik Промокоды Яндекс Путешествия Постила Футбол сегодня
На информационном ресурсе Pikabu.ru применяются рекомендательные технологии