Бесплатный голосовой Android DeepSeek
Скажу сразу у меня есть легкая дислексия. Поэтому в тексте могут быть небольшие ошибки.
Что если создать на основе образцов открытого исходного кода бесплатный Android браузер с открытым кодом для DeepSeek.
В этом браузере пользователь может входить на свой профиль в DeepSeek. Что бы в этом Android браузере отправлять DeepSeek текст, полученный через STT обработанный на стороне Android устройства созданный на основе образцов открытого исходного кода не требующего доступ к интернету что бы избежать сторонних договоренностей. Потока запросов не будет если все слова говорящего пользователя будут уходит в одно сообщения пока он не перестанет говорить больше 1 секунды. И за тем в этом Android браузере озвучивать на стороне Android устройства DeepSeek ответы через TTS созданный на основе образцов открытого исходного кода не требующего доступ к интернету что бы избежать сторонних договоренностей. Также можно в этой программе наверно попробовать задавать приписку которая будет всегда писаться перед началом сообщения отправляемого DeepSeek что бы DeepSeek лучше понимал как ему ответить на такие сообщения. Внешне это может выглядеть как надпись DeepSeek и зеленая трубка при нажимания на которую пользователь как бы звонит DeepSeek и после примерно секунды DeepSeek как бы готов слушать и появляется красная трубка если пользователь захочет прекратить звонок. После того как пользователь заканчивает говорить и молчит секунду может появиться надпись DeepSeek думает и потом начнется озвучивания ответа. Сложно ли создать на основе образцов открытого исходного кода такую программу для Android? DeepSeek не против такой программы? Google Play примет такую программу?
Я спросил об этом DeepSeek и вот его ответ:
Ваша идея интересна и технически реализуема, но требует проработки нескольких аспектов:
1. Техническая реализация
Создать такой браузер на основе открытого исходного кода вполне возможно. Вот ключевые компоненты:
Браузер на базе WebView (например, Chromium или GeckoView).
STT (Speech-to-Text) оффлайн – можно использовать Vosk или Mozilla DeepSpeech.
TTS (Text-to-Speech) оффлайн – например, RHVoice или eSpeak NG.
Интеграция с DeepSeek API – через WebView или прямое API (если DeepSeek предоставляет).
Обработка диалога – задержка в 1 секунду перед отправкой, префикс-подсказка для модели.
Сложность – средняя, если есть опыт Android-разработки.
2. Отношение DeepSeek к такой программе
DeepSeek пока не публиковал официальных правил использования своей модели, но:
Если вы используете официальное API, нужно соблюдать их условия (например, лимиты, запрет на коммерческое использование и т. д.).
Если вы просто встраиваете WebView с их сайтом, то это ближе к обычному браузеру, и проблем быть не должно.
Если же вы эмулируете API без разрешения, это может нарушать их политику.
Рекомендую написать в поддержку DeepSeek и уточнить.
3. Публикация в Google Play
Google Play разрешает браузеры и приложения с STT/TTS, но:
Оффлайн-распознавание не запрещено, но нужно указать в описании.
Запись микрофона – потребует объяснения, зачем нужен доступ.
Использование DeepSeek – если это просто WebView, проблем нет. Если свое API, нужно соблюдать их правила.
Название и логотип – нельзя использовать "DeepSeek" в названии, если это не официальное приложение.
Такую программу можно создать, но:
Использовать оффлайн STT/TTS – безопасно.
WebView с сайтом DeepSeek – скорее всего, разрешено.
Свое API-взаимодействие – нужно уточнять у DeepSeek.
Публикация в Google Play – возможна, но с правильным описанием.
Если хотите начать, можно взять за основу открытые браузеры (например, FOSS Browser) и доработать под свои нужды.
Хотите, помогу с выбором конкретных технологий или архитектурой?
У меня вопрос: Тут есть программисты которые могут такое сделать или может написать создателям DeepSeek?