Написал приложение для голосовой транскрибации — работает на gemini 2.5 flash бесплатно
В последний месяц активно ушёл в создание приложений с помощью ИИ агентов (привет Kiro IDE о котором уже писал пост )
Учусь дружить с фриланс биржами и находить заказы. Как раз выполняя последний проект столкнулся с проблемой
Чтобы ИИ качественно написал код, ему нужно дать качественный промт, а качественный промт это еб@ть сколько делов и зачастую символов.
Писать в ручную полотно 2000-3000 символов это:
1) Банально долго
2) Рутина убивает мотивацию - т.к промтов за проект набегает десятки.
➖➖➖➖➖➖➖➖➖➖➖
Прикинув, как оптимизировать данную ситуацию нашёл 2 выхода:
▪️Телепатия
▪️Голосовой ввод
С Илоном Маском я ещё побрататься не успел, чтобы он встроил мне Neuralink чип в голову (а я не против)
Пришлось пойти на компромисс и остановиться на голосовом вводе.
Опробовал встроенный ввод на windows 11:
Вставили курсор в текстовое поле и нажимаете Win + H = что-то пишет, но с косяками.
Например вместо "Gemini" (это ИИ модель от гугл) - пишет "Гении"
Ну и знаки препинания похоже модели от Microsoft религия запрещает расставлять.. 😐
Вроде полезно, но минус вайб от того, что эту кашу без знаков препинания приходится перечитывать и исправлять.
Мои поиски продолжились...
➖➖➖➖➖➖➖➖➖➖➖
Пошёл в интернеты искать альтернативу и нашёл - MacWhisper
Думаю по названию вы уже поняли, что она подходит только для владельцев MacBook - а я пока не разбогател, чтобы такими девайсами пользоваться.
Ещё из минусов, там под капотом модель Whisper от OpenAi и нужно минимум 10$ закинуть на баланс.
Фурычит действительно хорошо судя по обзорам. Но я подготовил для вас кое что поинтереснее и бесплатное 👇
➖➖➖➖➖➖➖➖➖➖➖
GeminiVoiceWriter - моё приложении для простых ребят без макбуков и желания платить за транскрибацию
Бесплатное оно т.к в Google Ai Studio даже на обычном аккаунте можно получить API ключ для работы с ИИ.
Квота ключа 250 запросов (в нашем случае транскрибаций аудио) в день бесплатно.
1. Получаем ключ
2. Скачиваем приложение (лежит в моём тг портфолио)
P.S: код открытый и лежит на github если боитесь .exe файлов
3. Добавляем ключ в приложение
4. Пользуемся и вспоминаем меня время от времени добрым словом
🌀Нажал сочетание клавиш - проговорил текст - нажал сочетание клавиш - текст транскрибировался и вставился в буфер обмена.
Мой тг блог где делюсь своим опытом работы с ИИ - Чай с GPT (+ записал туда кружочки с обзором приложения для наглядности)


Искусственный интеллект
5.1K постов11.5K подписчика
Правила сообщества
ВНИМАНИЕ! В сообществе запрещена публикация генеративного контента без детального описания промтов и процесса получения публикуемого результата.
Разрешено:
- Делиться вопросами, мыслями, гипотезами, юмором на эту тему.
- Делиться статьями, понятными большинству аудитории Пикабу.
- Делиться опытом создания моделей машинного обучения.
- Рассказывать, как работает та или иная фиговина в анализе данных.
- Век жить, век учиться.
Запрещено:
I) Невостребованный контент
I.1) Создавать контент, сложный для понимания. Такие посты уйдут в минуса лишь потому, что большинству неинтересно пробрасывать градиенты в каждом тензоре реккурентной сетки с AdaGrad оптимизатором.
I.2) Создавать контент на "олбанском языке" / нарочно игнорируя правила РЯ даже в шутку. Это ведет к нечитаемости контента.
I.3) Добавлять посты, которые содержат лишь генеративный контент или нейросетевой Арт без какой-то дополнительной полезной или интересной информации по теме, без промтов или описания методик создания и т.д.
II) Нетематический контент
II.1) Создавать контент, несвязанный с Data Science, математикой, программированием.
II.2) Создавать контент, входящий в противоречие существующей базе теорем математики. Например, "Земля плоская" или "Любое действительное число представимо в виде дроби двух целых".
II.3) Создавать контент, входящий в противоречие с правилами Пикабу.
III) Непотребный контент
III.1) Эротика, порнография (даже с NSFW).
III.2) Жесть.
За нарушение I - предупреждение
За нарушение II - предупреждение и перемещение поста в общую ленту
За нарушение III - бан