Скачать можно тут, нажав на логотип: http://brutalplayer.ru/Laitis (Так как я не могу себе позволить покупку сертификата подписи кода за 200-600$, могут вылезти различные предупреждения при загрузке и запуске установщика). Демонстрация набора текста: http://youtu.be/Kdkw0uMxyVc Группа приложения вконтакте: http://vk.com/laitisgroup (Добра пикабушнику, который сделает ссылки кликабельными) Дополнительная информация и ответы на часто задаваемые вопросы находятся внутри приложения в разделе “Помощь”.
О программе: Цель - дать пользователю возможность управлять компьютером и набирать текст без использования клавиатуры. Целевая аудитория - люди с ограниченными возможностями и люди, которым будет удобно использовать речь, как средство набора текста. Программа не используется для плохих целей (воровство паролей, сохранение речи пользователя и т.п.). Весь функционал - бесплатный.
История (от лица разработчика): 2012 год. Идея создания программы возникла после прочтения статьи на ресурсе habrahabr.ru про Google Speech API. Там был пример, который мог отправлять звуковой файл формата flac на сервер Google и получал ответ. Мне сразу же захотелось добавить в пример запись голоса с микрофона и пошло-поехало. Я создал программу, которая могла считывать голос пользователя с микрофона, разрезала речь на словосочетания и вставляла текст в любое текстовое поле на компьютере. Опубликовал свой пример на pikabu.ru, т.к. не имею аккаунта на habrahabr.ru. Пример был сырой, имел страшный интерфейс и статья была очень сложной для простого пользователя. Многим идея понравилась, появился энтузиазм, и я решил добавить функционал управления компьютером. 2013 год. Пример стал отдельным компонентом моего проигрывателя. 2014 год. Когда пришло время писать диплом на 4 курсе университета(факультет - информатика), я решил улучшить приложение и показать его. Позже я понял, что нужно сделать отдельное приложение, в котором каждый пользователь сможет добавлять свои команды управления компьютером и делиться ими с сообществом. Назвал проект Laitis и с большим энтузиазмом приступил к работе.
Используемые библиотеки и технологии: Google Speech API NAudio CUETools.Codecs.Flake SharpZipLib Raphael Vector Icons
При разработке пострадали: • 2 микрофона • 1 клавиатура • килограммы кофе • сервера google • разработчик • пользователи, тестировавшие сырые версии программы
Если программа бесплатна, почему бы не дать исходники народу/опубликовать под GPL? Или хотя бы версию под Linux. UPD: Ясно, dotnet. Возможно, заведётся с Mono.
Привет. Никакого моно. Если писать под линукс, нужно писать с нуля в моно нет винапи и WPF. Исходники закрытые, потому что я так хочу. Я даю пользователям бесплатно пользоваться своей программой, но не собираюсь дарить свои исходники всем подряд. Извеняйте.
Скачать можно тут, нажав на логотип: http://brutalplayer.ru/Laitis (Так как я не могу себе позволить покупку сертификата подписи кода за 200-600$, могут вылезти различные предупреждения при загрузке и запуске установщика). Демонстрация набора текста: http://youtu.be/Kdkw0uMxyVc Группа приложения вконтакте: http://vk.com/laitisgroup (Добра пикабушнику, который сделает ссылки кликабельными) Дополнительная информация и ответы на часто задаваемые вопросы находятся внутри приложения в разделе “Помощь”.
О программе: Цель - дать пользователю возможность управлять компьютером и набирать текст без использования клавиатуры. Целевая аудитория - люди с ограниченными возможностями и люди, которым будет удобно использовать речь, как средство набора текста. Программа не используется для плохих целей (воровство паролей, сохранение речи пользователя и т.п.). Весь функционал - бесплатный.
История (от лица разработчика): 2012 год. Идея создания программы возникла после прочтения статьи на ресурсе habrahabr.ru про Google Speech API. Там был пример, который мог отправлять звуковой файл формата flac на сервер Google и получал ответ. Мне сразу же захотелось добавить в пример запись голоса с микрофона и пошло-поехало. Я создал программу, которая могла считывать голос пользователя с микрофона, разрезала речь на словосочетания и вставляла текст в любое текстовое поле на компьютере. Опубликовал свой пример на pikabu.ru, т.к. не имею аккаунта на habrahabr.ru. Пример был сырой, имел страшный интерфейс и статья была очень сложной для простого пользователя. Многим идея понравилась, появился энтузиазм, и я решил добавить функционал управления компьютером. 2013 год. Пример стал отдельным компонентом моего проигрывателя. 2014 год. Когда пришло время писать диплом на 4 курсе университета(факультет - информатика), я решил улучшить приложение и показать его. Позже я понял, что нужно сделать отдельное приложение, в котором каждый пользователь сможет добавлять свои команды управления компьютером и делиться ими с сообществом. Назвал проект Laitis и с большим энтузиазмом приступил к работе.
Используемые библиотеки и технологии: Google Speech API NAudio CUETools.Codecs.Flake SharpZipLib Raphael Vector Icons
При разработке пострадали: • 2 микрофона • 1 клавиатура • килограммы кофе • сервера google • разработчик • пользователи, тестировавшие сырые версии программы
. А вот и первый вопрос. Почему когда начинаешь писать предложения голосом. Там начале предложения ставится точка или запятая? Кстати это сообщение я тоже пишу голосом
При смене текстового поля либо клике мышки где-нибудь точка не поставиться для первого предложения. ко всем следующим будет ставиться, в зависимости от паузы. Советую почитать алгоритм в разделе "Помощь".
Смотри. Гугл открыл. В строку ввел. А как ему сказать искать? говорю искать - а он по странице ищет. И еще. Когда сообщения вк открыты - команды не исполняет, а пишет их
В коллекции "Windows хоткеи" есть запись про Enter. Голосовая команда по-моему "Подтвердить". Ты можешь добавить через запятую слово "Отправить" и будет все работать. Насчет вк - у меня все ок. Если не заработает - пиши в личку, контакты я оставил выше.
а я думаю, что flash самый незащищенный. Ява тоже не далеко от .net. Вообще кому очень надо - скорей сам быстрее напишет подобную программу, нежели будет разбирать обфусцированный мусор из моей сборки.
У вас сбрасываются настройки после каждого обновления? Сбрасываются только обычные настройки из раздела "Настройки", или так же сбрасываются пользовательские команды и элементы автозамены?
подскажи пожалуйста.хочу через эту программу комп выключать и перезагружать одной фразой.есть какие-нибудь команды для этого кроме ait+F4,alt+ctrl+del,ctri+esc?через эти команды он не сразу выключается,а нужно еще добавочные фразы говорить(типо- подтвердить)заранее спасибо
погугли про shutdown.exe и запускай ее с параметрами по голосовой команде, но я не советую тебе прикручивать выключение компа к голосовой команде. Вдруг случайно скажешь в неподходящий момент...
Спасибо, Очень интересно! это сообщение ввел с помощью программы очень понравилось как любитель танков очень хотелось бы профиль для голосовых сообщений в танках заранее благодарен
Если вся ваша программа - набор хуков и хендлеров для ОС, то никак, но тогда так и пишите. Это мало того что не самодостаточный проект, это просто мост между ОСЬю и гуглом, с кучей зависимостей.
@Mikolaytis , а вы не думали предоставить эту программу в какую нибудь лечебницу или фонд людям с ограниченными возможностями. Они могли бы голосом попробовать работать на компьютере. Привлекли бы внимание и возможно инвесторов для развития проекта.
Мне не нужны инвестиции в данный момент. Я рассказал о программе здесь и если у пикабушников есть знакомые с ограниченными возможностями - то отлично, пусть пользуются и оставляют отзывы.
Я не хочу в серьез заниматься рекламой своей программы, если программа хороша - она сама себя прорекламирует.
Добавляй новые команды, коллекции команд. Придумывай идеи и пиши их в группу вк. Можешь и денег подонатить. информация в разделе Благодарность вкладки "Помощь" в программе.
привет) я ищу себе партнера по бизнесу и думаю что твой опыт будет очень кстати для того, что я хочу увидеть в конце работы. Напиши, пожалуйста, на vk /antlarionov, я расскажу конкретнее, что я вижу и как я это хочу реализовать.
я потому и использую последний дотнет, чтобы не мучаться с XP. Можно и на машинном коде этот функционал реализовать, но меня устраивает последний дотнет с его плюшками.
Можно ли её настроить так, чтобы набор шёл в строку чата в играх например? Очень хочется такую прогу, ибо не всегда удобно говорить, т.к. бывают люди с выключенным голосовым чатом(
установил, все заработало после регистрации. Спасибо, все именно как написано в Помощи. КРитически важно качество микрофона и настройка обрезания уровня шумов. Врпрос 1: как изменить браузер? чтобы при запуске ссылок включался мой chrome а не встроенный броузер Вопрос 2: если в комнате играет музыка то ессно, команды не работают. Как в таких случаях выходят из положения? кто как решает эту проблему? Можно конечно увеличить порог обрезания шумов (т.е. музыки) и потом кричать команды (проверял, работает) но это глупо и не удобно. Вопрос 3: когда играет музыка то программа воспринимает все звуки выше порога как команды и регулярно отправляет звук на сервер для распознавания. Ненужная загрузка СРU, сервера и трафик ненужный. Есть способ как-то устранить это? Типа, программа распознает, что это не речь, а музыка и НЕ отправляет пакеты звуков на сервер.
1) отключить функцию голосового управления браузером. 2) в таких случаях покупают микрофон с активной защитой от шумов или выбирайте алгоритм записи "при зажатии клавиши Ctrl" 3) ставьте алгоритм записи на паузу, или выбирайте алгоритм записи "при зажатии клавиши Ctrl" 4) вопросы пишите в группу вк vk.com/laitisgroup
...а на счет мощности, её должно хватить и орфисному компу, а все почему? Потому что слоги и слова состоят из звуков, и у каждого звука есть своя частота колебания, тон. Разбиваем звуковой сигнал по частотам, фильтруем фоновые шумы и анализируем. Благо библиотек для работы с аудио - вал. Можно работать даже с сырым входным сигналом, не кодируюя "на лету" в звуковой файл, а просто временно храня его в кеше до конца анализа.
апи для линукса, апи для винды, апи для макоси и т.д. для управления компьютером + апи для винды/макоси/линукса и т.п. для записи звука в одной сборке с кучей лишней логики? Просто не понимаю как вы собираетесь в одном приложении совместить логическую работу винды, линукса, макоси. Наборы команд и т.д. Опишите пожалуйста идею, как бы вы все это реализовали и совместили.
Я знаю qt и писал на нем не раз приложения кроссплатформенные, но одного названия QT недостаточно для весомого аргумента с вашей стороны.
Слышу нотки юношеского максимализма. Программа действительно хорошо уже на данном этапе. Ее целевая аудитория это люди, которые много пишут или предпочитают диктовать, чем писать И (!) люди с ограниченными возможностями, которые сами вряд ли найдут и установят вашу программу, если им ее не покажут и не помогут. А в пост советском пространстве сами знаете как относятся к таким людям. Так что на благое дело, можно было бы как то порекламировтаь программу в правильном направлении. В сети видел пару аналогов вашей программы и все они, извините, кал.
" если программа хороша - она сама себя прорекламирует" под лежачий камень вода не течет. все требует каких либо усилий. Если бы не пикабу, о программе никто бы и не узнал, а это и есть реклама.
Я не умею и не хочу заниматься раскруткой/рекламой на всех ресурсах и т.п.(Я всегда пишу пост на пикабу и все), я лучше потрачу свое время на исправление ошибок и добавление нового, очень нужного функционала.
Если вы(или кто-то) хотите и/или можете мою программу прорекламировать на ресурсах/фондах/лечебницах, то я буду вам только благодарен.
пишу через контрл почему-то не работает в автоматическом режиме не слышит меня шум на нуле ползунок поставил на 5 это правильно отправить вася энтер Не хочет отправлять сообщения на
Скачал. Установил - все ок. Программа запустилась, команды выполняла и набор текста тоже без проблем. Перезагрузился - ошибка и в подробностях:
Сигнатура проблемы: Имя события проблемы: APPCRASH Имя приложения: Laitis.exe Версия приложения: 1.0.3.8 Отметка времени приложения: 541bd8de Имя модуля с ошибкой: clr.dll Версия модуля с ошибкой: 4.0.30319.17929 Отметка времени модуля с ошибкой: 4ffa5753 Код исключения: c00000fd Смещение исключения: 0000802d Версия ОС: 6.1.7601.2.1.0.768.2 Код языка: 1049 Дополнительные сведения 1: 2c8d Дополнительные сведения 2: 2c8d8992e4c48b43e8ba38eafc6ad3f0 Дополнительные сведения 3: cf49 Дополнительные сведения 4: cf49f806ebbdb9479dd1feb88d6ef349
Переустановка (восстановление, а также снос программы и повторная установка) не помогает.
У меня не получилось. В общем, сперва все хорошо, пишут, что программа установлена и просит перезагрузки системы, а потом при попытке запуска пишет, что ярлык ссылается на несуществующий файл. Два раза устанавливала( Сейчас третий попробую и забью.
Хах. Ты бы хотя бы подумал перед тем, как писать. Как можно сделать программу, с помощью которой можно управлять операционной системой кроссплатформенной? :)))
Нет. "•Потому что это старая операционная система, которая не поддерживает последние .NET Framework. Поддержка этой ОС требует больших усилий: создание отдельного проекта для этой ОС, переписывание многих участков кода, установка виртуалки с Windows XP, дополнительное тестирование и т.п. Тратить на это время совсем не хочется, даже за деньги."
У меня есть настоящая мечта студента - проект "Рефератор", который любой текст с википедии и т.п. превращает в реферат(форматируется титульный лист, абзацы, убираются сноски и т.п.). Программы нет в общем доступе. Если интересно - пиши в личку.
Скачай руками .net framework 4.5 с интернета и установи, а так же зайди в группу вк, там один из первый постов содержит архив с программой без установщика.
Весь функционал доступный сейчас. Останется бесплатным. Если вдруг у меня совсем будет беда с финансами, может быть я придумаю и добавлю какой нибудь классный функционал, который будет доступен премиум аккаунту.