3

Написал приложение для голосовой транскрибации — работает на gemini 2.5 flash бесплатно

Написал приложение для голосовой транскрибации — работает на gemini 2.5 flash бесплатно

В последний месяц активно ушёл в создание приложений с помощью ИИ агентов (привет Kiro IDE о котором уже писал пост )

Учусь дружить с фриланс биржами и находить заказы. Как раз выполняя последний проект столкнулся с проблемой

Чтобы ИИ качественно написал код, ему нужно дать качественный промт, а качественный промт это еб@ть сколько делов и зачастую символов.

Писать в ручную полотно 2000-3000 символов это:

1) Банально долго
2) Рутина убивает мотивацию - т.к промтов за проект набегает десятки.

➖➖➖➖➖➖➖➖➖➖➖

Прикинув, как оптимизировать данную ситуацию нашёл 2 выхода:

▪️Телепатия

▪️Голосовой ввод

С Илоном Маском я ещё побрататься не успел, чтобы он встроил мне Neuralink чип в голову (а я не против)

Пришлось пойти на компромисс и остановиться на голосовом вводе.

Опробовал встроенный ввод на windows 11:


Вставили курсор в текстовое поле и нажимаете Win + H = что-то пишет, но с косяками.


Например вместо "Gemini" (это ИИ модель от гугл) - пишет "Гении"


Ну и знаки препинания похоже модели от Microsoft религия запрещает расставлять.. 😐

Вроде полезно, но минус вайб от того, что эту кашу без знаков препинания приходится перечитывать и исправлять.

Мои поиски продолжились...

➖➖➖➖➖➖➖➖➖➖➖

Пошёл в интернеты искать альтернативу и нашёл - MacWhisper

Думаю по названию вы уже поняли, что она подходит только для владельцев MacBook - а я пока не разбогател, чтобы такими девайсами пользоваться.

Ещё из минусов, там под капотом модель Whisper от OpenAi и нужно минимум 10$ закинуть на баланс.

Фурычит действительно хорошо судя по обзорам. Но я подготовил для вас кое что поинтереснее и бесплатное 👇

➖➖➖➖➖➖➖➖➖➖➖

GeminiVoiceWriter - моё приложении для простых ребят без макбуков и желания платить за транскрибацию

Бесплатное оно т.к в Google Ai Studio даже на обычном аккаунте можно получить API ключ для работы с ИИ.

Квота ключа 250 запросов (в нашем случае транскрибаций аудио) в день бесплатно.


1. Получаем ключ
2. Скачиваем приложение (лежит в моём тг портфолио)
P.S: код открытый и лежит на github если боитесь .exe файлов

3. Добавляем ключ в приложение
4. Пользуемся и вспоминаем меня время от времени добрым словом

Написал приложение для голосовой транскрибации — работает на gemini 2.5 flash бесплатно

🌀Нажал сочетание клавиш - проговорил текст - нажал сочетание клавиш - текст транскрибировался и вставился в буфер обмена.

Мой тг блог где делюсь своим опытом работы с ИИ - Чай с GPT (+ записал туда кружочки с обзором приложения для наглядности)

Искусственный интеллект

5.1K постов11.5K подписчика

Правила сообщества

ВНИМАНИЕ! В сообществе запрещена публикация генеративного контента без детального описания промтов и процесса получения публикуемого результата.


Разрешено:


- Делиться вопросами, мыслями, гипотезами, юмором на эту тему.

- Делиться статьями, понятными большинству аудитории Пикабу.

- Делиться опытом создания моделей машинного обучения.

- Рассказывать, как работает та или иная фиговина в анализе данных.

- Век жить, век учиться.


Запрещено:


I) Невостребованный контент

  I.1) Создавать контент, сложный для понимания. Такие посты уйдут в минуса лишь потому, что большинству неинтересно пробрасывать градиенты в каждом тензоре реккурентной сетки с AdaGrad оптимизатором.

  I.2) Создавать контент на "олбанском языке" / нарочно игнорируя правила РЯ даже в шутку. Это ведет к нечитаемости контента.

  I.3) Добавлять посты, которые содержат лишь генеративный контент или нейросетевой Арт без какой-то дополнительной полезной или интересной информации по теме, без промтов или описания методик создания и т.д.


II) Нетематический контент

  II.1) Создавать контент, несвязанный с Data Science, математикой, программированием.

  II.2) Создавать контент, входящий в противоречие существующей базе теорем математики. Например, "Земля плоская" или "Любое действительное число представимо в виде дроби двух целых".

  II.3) Создавать контент, входящий в противоречие с правилами Пикабу.


III) Непотребный контент

  III.1) Эротика, порнография (даже с NSFW).

  III.2) Жесть.


За нарушение I - предупреждение

За нарушение II - предупреждение и перемещение поста в общую ленту

За нарушение III - бан

Темы

Политика

Теги

Популярные авторы

Сообщества

18+

Теги

Популярные авторы

Сообщества

Игры

Теги

Популярные авторы

Сообщества

Юмор

Теги

Популярные авторы

Сообщества

Отношения

Теги

Популярные авторы

Сообщества

Здоровье

Теги

Популярные авторы

Сообщества

Путешествия

Теги

Популярные авторы

Сообщества

Спорт

Теги

Популярные авторы

Сообщества

Хобби

Теги

Популярные авторы

Сообщества

Сервис

Теги

Популярные авторы

Сообщества

Природа

Теги

Популярные авторы

Сообщества

Бизнес

Теги

Популярные авторы

Сообщества

Транспорт

Теги

Популярные авторы

Сообщества

Общение

Теги

Популярные авторы

Сообщества

Юриспруденция

Теги

Популярные авторы

Сообщества

Наука

Теги

Популярные авторы

Сообщества

IT

Теги

Популярные авторы

Сообщества

Животные

Теги

Популярные авторы

Сообщества

Кино и сериалы

Теги

Популярные авторы

Сообщества

Экономика

Теги

Популярные авторы

Сообщества

Кулинария

Теги

Популярные авторы

Сообщества

История

Теги

Популярные авторы

Сообщества