Горячее
Лучшее
Свежее
Подписки
Сообщества
Блоги
Эксперты
Войти
Забыли пароль?
или продолжите с
Создать аккаунт
Я хочу получать рассылки с лучшими постами за неделю
или
Восстановление пароля
Восстановление пароля
Получить код в Telegram
Войти с Яндекс ID Войти через VK ID
Создавая аккаунт, я соглашаюсь с правилами Пикабу и даю согласие на обработку персональных данных.
ПромокодыРаботаКурсыРекламаИгрыПополнение Steam

Топ прошлой недели

  • AlexKud AlexKud 36 постов
  • Animalrescueed Animalrescueed 41 пост
  • leomin leomin 1 пост
Посмотреть весь топ

Лучшие посты недели

Рассылка Пикабу: отправляем самые рейтинговые материалы за 7 дней 🔥

Нажимая кнопку «Подписаться на рассылку», я соглашаюсь с Правилами Пикабу и даю согласие на обработку персональных данных.

Спасибо, что подписались!
Пожалуйста, проверьте почту 😊

Помощь Кодекс Пикабу Команда Пикабу Моб. приложение
Правила соцсети О рекомендациях О компании
Промокоды Биг Гик Промокоды Lamoda Промокоды МВидео Промокоды Яндекс Директ Промокоды Отелло Промокоды Aroma Butik Промокоды Яндекс Путешествия Постила Футбол сегодня

Голосовой помощник

С этим тегом используют

Яндекс Алиса Юмор Скриншот Яндекс Искусственный интеллект Мат Вертикальное видео Все
351 пост сначала свежее
10
Yozh101
12 дней назад

Сказка- ложь, да в ней намек⁠⁠

Двести лет назад, а точнее сто девяносто два года, в 1833-ем, Пушкин описал голосового помощника в своей сказке о мертвой царевне и о семи богатырях
"Свет мой зеркальце, скажи.."

Сказка- ложь, да в ней намек Александр Сергеевич Пушкин, Сказка, Предсказание, Голосовой помощник
[моё] Александр Сергеевич Пушкин Сказка Предсказание Голосовой помощник
3
1
pro.obzor
pro.obzor
20 дней назад
Искусственный интеллект

DeepSeek (Дипсик) - бот в телеграм который отвечает голосом⁠⁠

Попробуй прямо сейчас: @DeepSeek_telegram_bot

Это не просто голосовой бот — это умный собеседник, который помнит контекст ваших разговоров и отвечает голосом (можно выбрать)

DeepSeek (Дипсик) - бот в телеграм который отвечает голосом ChatGPT, Чат-бот, DeepSeek, Нейронные сети, Openai, Искусственный интеллект, Помощник, Голосовой помощник, IT, Telegram (ссылка), Длиннопост

DeepSeek (Дипсик) - бот в телеграм который отвечает голосом

Дипсик - это лучшая китайская нейросеть.

✅ Не нужно повторяться — бот запоминает, о чём вы говорили ранее и продолжает обсуждение ссылаясь на предыдущие сообщения.

✅ Персонализированные ответы — учитывает ваши предпочтения и стиль общения

🚀 Чем этот Дипсик бот лучше других?

✅ Официальное API DeepSeek — лучшая, мощная нейросеть с точными ответами.

✅ Голосовое сообщения — просто запиши голосовое, бот поймёт! И ответит тоже голосом. (можно выключить)

✅ Ответы разными голосами — можно выбрать пол и приятный тембр.

💡 Кому и зачем он полезен?

🧠 Как личный психолог —

• Выслушает и даст совет

• Поможет разобраться в чувствах

• Подскажет техники релаксации

📚 Студентам —

• Разъясняет сложные темы простыми словами

• Помогает с конспектами и подготовкой к экзаменам

• Может пересказывать информацию вслух

💼 Для работы —

• Поможет составить документы

• Подготовит деловое письмо

• Сгенерирует идеи для проектов

Говори, слушай, общайся — как с человеком👇🏻

@DeepSeek_telegram_bot

Показать полностью 1
ChatGPT Чат-бот DeepSeek Нейронные сети Openai Искусственный интеллект Помощник Голосовой помощник IT Telegram (ссылка) Длиннопост
8
12
TechSavvyZone
TechSavvyZone
25 дней назад

Технологии : "Голосовой помощник" Распознавание речи, преобразователь аудиосигнала Часть Вторая⁠⁠

Технологии : "Голосовой помощник" Распознавание речи, преобразователь аудиосигнала Часть Вторая Технологии, IT, Компьютерное железо, Компьютер, Инженер, Голосовой помощник, Голосовое управление, Звук, Электроника, Распознавание голоса, Оборудование, Длиннопост

АЦП, ЦАП: зачем нужен преобразователь аудиосигнала?

Технологии : "Голосовой помощник" Распознавание речи, преобразователь аудиосигнала Часть Вторая Технологии, IT, Компьютерное железо, Компьютер, Инженер, Голосовой помощник, Голосовое управление, Звук, Электроника, Распознавание голоса, Оборудование, Длиннопост

ЦАП – цифро-аналоговый преобразователь – нужен для преобразования аудиосигнала из цифрого формата в аналоговый; обычно, для передачи в усилитель или немедленного озвучивания.

Все современные форматы записи аудио используют цифровое представление. И треки на CD или blu-ray дисках, и mp3-файлы, и музыка с iTunes – все они хранятся в цифровом формате. И для того, чтобы воспроизвести эту запись, её надо преобразовать в аналоговый сигнал – эту функцию и выполняет цифро-аналоговый преобразователь. Встроенный ЦАП присутствует в любом устройстве, воспроизводящем музыку. Но часто бывает, что качество проигрывания одних и тех же аудиофайлов (или треков с одного и того же диска) на разных плеерах заметно отличается. Если при этом используются одинаковые усилители и наушники, значит, проблема в ЦАП плеера.

Технологии : "Голосовой помощник" Распознавание речи, преобразователь аудиосигнала Часть Вторая Технологии, IT, Компьютерное железо, Компьютер, Инженер, Голосовой помощник, Голосовое управление, Звук, Электроника, Распознавание голоса, Оборудование, Длиннопост

ЦАПы бывают разные: дешевые преобразователи с низким энергопотреблением (часто используемые производителями в мобильных устройствах) имеют низкое быстродействие и малую разрядность, что сильно сказывается на качестве звука.

Технологии : "Голосовой помощник" Распознавание речи, преобразователь аудиосигнала Часть Вторая Технологии, IT, Компьютерное железо, Компьютер, Инженер, Голосовой помощник, Голосовое управление, Звук, Электроника, Распознавание голоса, Оборудование, Длиннопост

Если у мобильного устройства есть цифровой выход (S/PDIF или USB), можно подключить к нему внешний ЦАП - это гарантирует высокое качество преобразования цифрового звука в аналоговый.

Технологии : "Голосовой помощник" Распознавание речи, преобразователь аудиосигнала Часть Вторая Технологии, IT, Компьютерное железо, Компьютер, Инженер, Голосовой помощник, Голосовое управление, Звук, Электроника, Распознавание голоса, Оборудование, Длиннопост

Кроме того, внешний ЦАП может оказаться очень полезным при прослушивании музыки, записанной в loseless-форматах (форматах записи аудио без потерь качества) с высокой дискретизацией, обеспечивающей максимальное подобие записи и оригинала. Поскольку распространяются такие записи, в основном, через Интернет, часто их прослушивают прямо с компьютера. Но качественная звуковая карта редко встречается на ноутбуках и планшетах, да и встроенные в материнскую плату десктопного компьютера звуковые карты не отличаются высоким качеством. И в этом случае весь смысл прослушивания loseless музыки теряется абсолютно. Ситуацию можно исправить, если на компьютере есть цифровой аудиовыход, например, S/PDIF. Подключив к нему ЦАП с частотой дискретизации и разрядностью не меньшей, чем у прослушиваемой записи, можно получить аналоговый сигнал высокого качества.

Еще один приятный бонус можно получить, приобретя ЦАП с поддержкой Bluetooth. Это позволит слушать отличную музыку на подключенных к преобразователю динамиках, не будучи «привязанным» к нему проводами. Для мобильного компьютера (планшета или ноутбука) это может оказаться очень удобным. Кроме того, с таким преобразователем вы сможете проигрывать музыку с других устройств, поддерживающих Bluetooth и легко переключаться между ними.

Технологии : "Голосовой помощник" Распознавание речи, преобразователь аудиосигнала Часть Вторая Технологии, IT, Компьютерное железо, Компьютер, Инженер, Голосовой помощник, Голосовое управление, Звук, Электроника, Распознавание голоса, Оборудование, Длиннопост

АЦП – аналого-цифровой преобразователь – нужен, наоборот, для преобразования аналогового аудиосигнала в цифровой формат. АЦП будет незаменим при оцифровке (переводе в цифровой формат) старых аналоговых записей: на грампластинках, аудио и видеокассетах. Также АЦП потребуется при записи в цифровом виде «живого» звука с микрофона. Плееры с функцией записи и компьютерные звуковые карты имеют встроенный АЦП, но если вам важно качество оцифровки, лучше доверить эту задачу специализированному устройству.

Несмотря на совершенно противоположные задачи, АЦП и ЦАП обладают некоторыми общими характеристиками, оказывающими большое влияние на качество преобразования.

Характеристики преобразователей аудиосигнала.

Технологии : "Голосовой помощник" Распознавание речи, преобразователь аудиосигнала Часть Вторая Технологии, IT, Компьютерное железо, Компьютер, Инженер, Голосовой помощник, Голосовое управление, Звук, Электроника, Распознавание голоса, Оборудование, Длиннопост

Количество отсчетов в секунду - частота дискретизации

Для АЦП частота дискретизации определяет, с какой частотой преобразователь будет измерять амплитуду аналогового сигнала и передавать её в цифровом виде. Для ЦАП – наоборот, с какой частотой цифровые данные будут конвертироваться в аналоговый сигнал.

Чем выше частота дискретизации, тем результат преобразования ближе к исходному сигналу. Казалось бы, чем выше этот показатель, тем лучше. Но, согласно теореме Котельникова, для передачи сигнала любой частоты достаточно частоты дискретизации, вдвое большей частоты самого сигнала. С учетом того, что самая высокая частота, различимая на слух – 20 кГц (у большинства людей верхняя граница слышимого звука вообще проходит в районе 15-18 кГц), частоты дискретизации в 40 кГц должно быть достаточно для качественной оцифровки любого звука. Частота дискретизации audio CD: 44.1 кГц, и максимальная частота дискретизации mp-3 файлов: 48 кГц, выбраны как раз исходя из этого критерия. Соответственно, ЦАП, проигрывающий аудиотреки и mp3-файлы, должен иметь частоту дискретизации не менее 48 кГц, иначе звук будет искажаться.

Технологии : "Голосовой помощник" Распознавание речи, преобразователь аудиосигнала Часть Вторая Технологии, IT, Компьютерное железо, Компьютер, Инженер, Голосовой помощник, Голосовое управление, Звук, Электроника, Распознавание голоса, Оборудование, Длиннопост

Зеленым цветом показан исходный аудиосигнал, состоящий из нескольких гармоник, близких к 20 кГц. Малиновым цветом обозначен цифровой сигнал, дискретизированный с частотой 44.1 кГц. Синим цветом обозначен аналоговый сигнал, восстановленный из цифрового. Хорошо заметны потери в начале и конце отрезка.

Теоретически, такой частоты дискретизации должно быть достаточно, но практически иногда возникает надобность в большей частоте: реальный аудиосигнал не полностью отвечает требованиям теоремы Котельникова и при определенных условиях сигнал может искажаться. Поэтому у ценителей чистого звука популярны записи с частотой дискретизации 96 кГц.

Частота дискретизации ЦАП выше, чем у исходного файла, на качество звука не влияет, поэтому приобретать ЦАП с частотой дискретизации выше 48 кГц имеет смысл, только если вы собираетесь прослушивать с его помощью blu-ray и DVD-аудио или loseless музыку с частотой дискретизации, большей 48 кГц.

Если вы твердо нацелились на приобретение преобразователя с частотой дискретизации выше 48 кГц, то экономить на покупке не стоит. ЦАП, как и любое другое аудиоустройство, добавляет в сигнал собственный шум. У недорогих моделей шумность может быть довольно высокой, а с учетом высокой частоты дискретизации, на выходе такого преобразователя может появиться опасный для динамиков ультразвуковой шум. Да и в слышимом диапазоне шумность может оказаться настолько высокой, что это затмит весь выигрыш от повышения частоты дискретизации.

Технологии : "Голосовой помощник" Распознавание речи, преобразователь аудиосигнала Часть Вторая Технологии, IT, Компьютерное железо, Компьютер, Инженер, Голосовой помощник, Голосовое управление, Звук, Электроника, Распознавание голоса, Оборудование, Длиннопост

Чем выше разрядность, тем выше точность измерения или восстановления амплитуды сигнала

Разрядность – вторая характеристика, непосредственно влияющая на качество преобразования.

Разрядность ЦАП должна соответствовать разрядности аудиофайла. Если разрядность ЦАП будет ниже, он, скорее всего, просто не сможет преобразовать этот файл.

Треки audio CD имеют разрядность 16 бит. Это подразумевает 65536 градаций амплитуды – в большинстве случаев этого достаточно. Но теоретически, в идеальных условиях, человеческое ухо способно обеспечить большее разрешение. И если о разнице между записями с дискретизацией 96 кГц и 48 кГц можно спорить, то отличить 16-битный звук от 24-битного при отсутствии фонового шума могут многие люди с хорошим слухом. Поэтому, если ЦАП предполагается использовать для прослушивания DVD и Blu-ray аудио, следует выбирать модель с разрядностью 24.

Чем выше разрядность АЦП, тем с большей точностью измеряется амплитуда звукового сигнала.

При выборе АЦП следует исходить из того, какие задачи с его помощью предполагается решать: для оцифровывания «шумных» аудиозаписей со старых магнитофонных лент высокая разрядность АЦП не нужна. Если же вы планируете получить качественную цифровую запись со студийного микрофона, имеет смысл воспользоваться 24-битным АЦП.

Количество каналов определяет, какой звук сможет преобразовывать устройство. Двухканальный преобразователь сможет обрабатывать стерео и моно звук. Но для преобразования сигнала формата Dolby Digital или Dolby TrueHD понадобится, соответственно, шести- или восьмиканальный преобразователь.

Соотношение сигнал/шум определяет уровень шума, добавляемого в сигнал преобразователем. Чем выше этот показатель, тем более чистым остается сигнал, проходящий через преобразователь. Для прослушивания музыки нежелательно, чтобы этот показатель был ниже 75 дБ. Hi-Fi аппаратура обеспечивает минимум 90 дБ, а высококачественные Hi-End устройства способны обеспечить отношение сигнал/шум в 110-120 дБ и выше.

Технологии : "Голосовой помощник" Распознавание речи, преобразователь аудиосигнала Часть Вторая Технологии, IT, Компьютерное железо, Компьютер, Инженер, Голосовой помощник, Голосовое управление, Звук, Электроника, Распознавание голоса, Оборудование, Длиннопост

ЦАП должен иметь цифровой вход – это может быть S/PDIF, USB или Bluetooth. Выходу ЦАП аналоговый - «джек» (jack) или «тюльпаны» (RCA). У АЦП все наоборот – аналоговый вход и цифровой выход. Хорошо, если преобразователь имеет несколько различных входов и выходов – это расширяет возможности по подключению к нему различных устройств. Если же вход на преобразователе один, убедитесь, что аналогичный выход есть на устройстве, к которому предполагается его подключать.

Преобразователи аудиосигнала скорее относятся к студийному и домашнему оборудованию, поэтому питание большинства преобразователей производится от сети 220В. Но существуют и преобразователи, которые питаются от аккумуляторов и могут быть использованы автономно. Это может оказаться удобным при использовании преобразователя с мобильным устройством – ноутбуком, планшетом, смартфоном или плеером.

Некоторые преобразователи получают питание через разъем micro-USB, при этом получать (или передавать) аудиосигнал через этот разъем они не могут. Если вам важно, чтобы ЦАП мог читать аудиофайлы на USB-носителях, перед покупкой убедитесь, что USB на устройстве используется не только для питания.

Варианты выбора.

Технологии : "Голосовой помощник" Распознавание речи, преобразователь аудиосигнала Часть Вторая Технологии, IT, Компьютерное железо, Компьютер, Инженер, Голосовой помощник, Голосовое управление, Звук, Электроника, Распознавание голоса, Оборудование, Длиннопост

Если вам нужно устройство, с помощью которого можно будет оцифровать старые магнитофонные записи или записать на компьютер звук с микрофона, вам нужен аналогово-цифровой преобразователь. Цены на них начинаются от 1100 рублей.

Технологии : "Голосовой помощник" Распознавание речи, преобразователь аудиосигнала Часть Вторая Технологии, IT, Компьютерное железо, Компьютер, Инженер, Голосовой помощник, Голосовое управление, Звук, Электроника, Распознавание голоса, Оборудование, Длиннопост

Если вы желаете получить устройство для качественного проигрывания аудифайлов со смартфона с возможностью беспроводного соединения, выбирайте среди ЦАП с поддержкой Bluetooth. Такое устройство обойдется вам в 1400-1800 рублей.

Технологии : "Голосовой помощник" Распознавание речи, преобразователь аудиосигнала Часть Вторая Технологии, IT, Компьютерное железо, Компьютер, Инженер, Голосовой помощник, Голосовое управление, Звук, Электроника, Распознавание голоса, Оборудование, Длиннопост

Если же вы желаете услышать все богатство звука, записанного в loseless-формате с высокой частотой дискретизации и битностью 24, вам понадобится соответствующий ЦАП. Стоить он будет от 1700 рублей. Н и конечно не забываем что существуют и профессиональные линейки оборудования как аналогового так и цифрового но и цены там соответствующие. О них поговорим как ни будь в другой раз.

Показать полностью 12
Технологии IT Компьютерное железо Компьютер Инженер Голосовой помощник Голосовое управление Звук Электроника Распознавание голоса Оборудование Длиннопост
3
12
TechSavvyZone
TechSavvyZone
26 дней назад

Технологии : "Голосовой помощник" Распознавание речи⁠⁠

Технологии : "Голосовой помощник" Распознавание речи Технологии, IT, Компьютерное железо, Компьютер, Инженер, Искусственный интеллект, Голосовой помощник, Голосовое управление, Звук, Распознавание голоса, Тестирование, Программа, Длиннопост

За последнее десятилетие распознавание голоса сделало огромный рывок. Гаджеты без особого труда понимают самые сложные фразы и предложения независимо от акцента и артикуляции. Как это им удается?

Обработка звука

Попытки распознавания голосовых команд предпринимались еще с середины прошлого века. И уже тогда было ясно, что перед распознаванием запись голоса следует обработать. Одни люди говорят громче, другие — тише. Также в реальных условиях всегда есть посторонние шумы, не имеющие отношения к человеческой речи. И отдать запись на распознавание «как есть» — только запутать ситуацию и увеличить вероятность ошибок. В чем же состоит обработка звука?

Оцифровка
Звук — это волны. С микрофона он идет в виде аналогового сигнала, а компьютеры с аналоговыми данными работать не умеют. Звук надо оцифровать. Для этого используются АЦП — аналого-цифровые преобразователи. На выходе АЦП звук преобразовывается в цифровой массив. При частоте дискретизации 44 кГц одна секунда звука превращается в 44000 чисел.

Фильтрация
Фильтрация заключается в отсеивании всех частот, не относящихся к человеческому голосу. Это довольно узкий диапазон, лежащий в пределах 75–500 Гц. Слышимый человеком диапазон звуков намного шире — 20–20000 Гц. В таком (или близком) диапазоне выдают сигнал большинство микрофонов. Так что фильтрация позволяет отсеять 97,5 % ненужной информации. Это намного ускоряет дальнейшую обработку сигнала.

Фильтрация может производиться и до оцифровки — с помощью аналоговых фильтров. Но цифровой метод надежнее.

Нормализация
Нормализация нужна, чтобы устранить влияние громкости звука на результат. Слабый сигнал усиливается. Сильный, наоборот, ослабляется. Итоговый сигнал имеет примерно одинаковую амплитуду для всех записей звука — как громких, так и тихих.

Распознавание методами математического анализа

До развития ИИ алгоритмы распознавания звука часто работали прямо со звуковым сигналом. Вот такого вида:

Технологии : "Голосовой помощник" Распознавание речи Технологии, IT, Компьютерное железо, Компьютер, Инженер, Искусственный интеллект, Голосовой помощник, Голосовое управление, Звук, Распознавание голоса, Тестирование, Программа, Длиннопост

Для распознавания текста использовались различные методы математического анализа. Например, в базе данных сохранялись эталонные записи команд, и каждая новая запись сравнивалась с ними с помощью корреляционного анализа. Это позволяло легко найти среди эталонов наиболее подходящий и выполнить соответствующую команду. Способ хорошо работал с отдельными командами, представляющими собой неизменное слово или фразу. А вот с распознаванием обычной речи все было хуже.

Распознавание с помощью нейросетей

Нейросети работают примерно так же, как и человеческий мозг. Они хорошо выявляют качественные признаки и не очень хорошо — количественные. Человек с первого взгляда отличит кошку от собаки, а вот кучку из 50 спичек от кучки из 49 — вряд ли даже с десятого. И вот здесь с распознаванием голоса на основе цифрового сигнала возникают сложности.

Вот три записи. Среди них — два слова «собака», произнесенные разными голосами и одно слово «забота».

Технологии : "Голосовой помощник" Распознавание речи Технологии, IT, Компьютерное железо, Компьютер, Инженер, Искусственный интеллект, Голосовой помощник, Голосовое управление, Звук, Распознавание голоса, Тестирование, Программа, Длиннопост

Задача выглядит несложной. Конечно же, второй и третий паттерны намного более похожи друг на друга, чем первый и второй или первый и третий. А значит — первый паттерн — «забота», а второй и третий — «собака»?

Нет. «Собака» — первый и третий. «Забота» — второй. Почему так? Потому что на записи мы в первую очередь обращаем внимание на амплитуды сигналов. Но это — всего лишь громкость. Смысловую нагрузку несет частота сигнала, а вот ее с первого взгляда на записи не видно. И со второго не видно. И вообще не видно до тех пор, пока вы не измерите расстояние между соседними пиками на графике.

Впрочем, решение этой задачи найдено давно — частотный анализ. Возьмем кусочек записи и посчитаем, с какой громкостью на нем звучит каждая частота. И изобразим это в виде графика.

Технологии : "Голосовой помощник" Распознавание речи Технологии, IT, Компьютерное железо, Компьютер, Инженер, Искусственный интеллект, Голосовой помощник, Голосовое управление, Звук, Распознавание голоса, Тестирование, Программа, Длиннопост

Но такой график — все еще сложная для восприятия штука. А раз она сложна нам, то и нейросетям она тоже не понравится. Поэтому громкость изобразим в виде цвета. Теперь каждая запись предстает в таком виде:

«Собака»

Технологии : "Голосовой помощник" Распознавание речи Технологии, IT, Компьютерное железо, Компьютер, Инженер, Искусственный интеллект, Голосовой помощник, Голосовое управление, Звук, Распознавание голоса, Тестирование, Программа, Длиннопост

«Собака»

Технологии : "Голосовой помощник" Распознавание речи Технологии, IT, Компьютерное железо, Компьютер, Инженер, Искусственный интеллект, Голосовой помощник, Голосовое управление, Звук, Распознавание голоса, Тестирование, Программа, Длиннопост

«Забота»

Технологии : "Голосовой помощник" Распознавание речи Технологии, IT, Компьютерное железо, Компьютер, Инженер, Искусственный интеллект, Голосовой помощник, Голосовое управление, Звук, Распознавание голоса, Тестирование, Программа, Длиннопост

Не правда ли, все стало проще? Нейросетям — тоже. С этими картинками уже вполне можно использовать те же алгоритмы, что позволяют нейросетям обнаруживать на фотографии лица или разбираться в дорожной обстановке.

Более того, такое представление записи позволяет искать не слова, а отдельные фонемы. Фонемы — это элементы, из которых состоит человеческая речь. В разных языках они разные, но их немного. В русском языке, например, их 42 (по некоторым исследованиям больше — 46–48).

Фонемы — это не то же, что и буквы. В разных словах одним и тем же буквам могут соответствовать разные фонемы. Но, распознав все фонемы, уже можно легко собрать из них слово.

Дальнейшая работа с распознанным текстом

Итак, благодаря нейросети мы смогли преобразовать запись голоса в осмысленный текст. Но ведь голосовой помощник на этом не останавливается. Он как-то понимает этот текст и осмысленно на него отвечает. Как это делается? Во-первых, текст токенизируется. Из него выделяются отдельные токены — смысловые единицы. Токенами могут быть слова, их сочетания и целые фразы — это зависит от модели нейросети и ее целей. В голосовых помощниках это обычно слова и пунктуационные знаки. Дальше токены текста проходят через эмбеддинг — каждому токену сопоставляется некий смысловой вектор в N-мерном пространстве. Например, один из простейших методов эмбеддинга предполагает использование двумерного массива:

Технологии : "Голосовой помощник" Распознавание речи Технологии, IT, Компьютерное железо, Компьютер, Инженер, Искусственный интеллект, Голосовой помощник, Голосовое управление, Звук, Распознавание голоса, Тестирование, Программа, Длиннопост

Так, после эмбеддинга токен «Корова» получит вектор [-,100,0,10,100]. Теперь, приняв набор токенов «Луг, Молоко», нейросеть предположит, что речь идет о корове.

Eще, сравнивая токен «Корова» с другими токенами своего словаря, нейросеть заметит сходство вектора только с одним вариантом — соответствующим токену «Птица». Мы понимаем, что это произошло потому, что птица — тоже животное, и она тоже может обитать на лугу. В данной простейшей модели нейросеть не знает таких терминов, как «животное» и «обитать». Но это не мешает прийти ей к тому же выводу, что и человек.

Очевидно, что эффективность нейросети очень сильно зависит от размеров словаря и от правильности заполнения соответствующей матрицы. Это делается с помощью методов машинного обучения на больших массивах реальных данных. Нейросеть просматривает различные тексты и заполняет словарь на основе встречающихся слов. Например, несколько раз встретив в одном предложении слова «Корова» и «Луг», она увеличит число, стоящее на пересечении соответствующих столбцов и строк.

Теперь, когда каждому слову сопоставлен какой-то смысл, нейросеть может определить, что хотел от нее пользователь. Для этого запрос пропускается через семантический теггер, который определяет семантическую функцию каждого токена. Например, при запросе «Кто на лугу?» нейросеть по токенам «Кто» и «?» поймет, что ей задали вопрос. А «луг» она определит как основную информацию запроса и, сопоставив вектор соответствующего токена с остальными, выдаст ответ: «Корова».

Но чтобы поддерживать разговор, умения отвечать на вопросы мало. Нужно оставаться в контексте беседы, и голосовым помощникам это удается. Для этого используются рекуррентные нейронные сети. Такие сети содержат рекуррентные слои, кроме обычных выходов имеющие дополнительный выход для следующего просчета.

Технологии : "Голосовой помощник" Распознавание речи Технологии, IT, Компьютерное железо, Компьютер, Инженер, Искусственный интеллект, Голосовой помощник, Голосовое управление, Звук, Распознавание голоса, Тестирование, Программа, Длиннопост

Вывод

Голосовые помощники могут вести с нами полноценный разговор и выглядеть при этом вполне разумными собеседниками. Но это иллюзия. Нейросети способны выдавать грамотные, разумные и взвешенные ответы, совершенно не понимая сути вопроса. Весь секрет — в современных технологиях и в обширной базе знаний в виде книг и изображений, хранящихся в сети Интернет.

Обучение нейросети требует немалых вычислительных ресурсов, а под словари и базы данных нужны целые массивы накопителей. Поэтому большинство голосовых помощников «живет» на серверах в дата-центрах. Общение же с пользователями происходит через Интернет. Именно поэтому полный функционал умных колонок доступен только при их подключении к Интернету.

Показать полностью 8
Технологии IT Компьютерное железо Компьютер Инженер Искусственный интеллект Голосовой помощник Голосовое управление Звук Распознавание голоса Тестирование Программа Длиннопост
0
1999
tadiuzZz
1 месяц назад
Уголок для вязания

Написал приложение для вязальщиц — голосовой счетчик рядов, который работает без рук!⁠⁠

Привет, Пикабу!

Сам я вязать не умею, но однажды увидел, как моя мама распускала полдня работы – просто потому что сбилась со счёта рядов. Оказалось, это частая проблема – считать ряды в уме сложно, мысли уходят в свободный полёт, а каждый раз откладывать спицы, чтобы записать очередной ряд в блокнот, неудобно.

В свободное время я увлекаюсь разработкой мобильных приложений и начал думать над решением задачи. Так появилась "Петелька" – голосовой счётчик рядов, который теперь использует моя мама и её подруги-рукодельницы.

Как это работает?

  1. Запускаете приложение

  2. Активируете голосовой ввод и кладёте телефон рядом

  3. Вяжете и просто говорите "плюс один", "+5" (или "минус два", если ошиблись) и т.п.

  4. Приложение автоматически распознает команду и сохранит количество рядов

  5. Никаких блокнотов, кнопок и сбитых рядов!

1/6

Скриншоты приложения "Петелька - голосовой счётчик рядов для вязания"

Почему это удобно?

  • Не нужно отрываться от вязания – говорите и продолжаете работу

  • Точный подсчёт – больше никаких "ой, какой это сейчас ряд?..."

  • История операций – если сомневаетесь, всегда можно просмотреть весь список записанных команд

  • Несколько проектов одновременно – вяжите параллельно и свитер, и носки, и шапку

  • Универсальный помощник – подходит для вязания спицами и крючком

Скачайте и попробуйте сами!

RuStore: "Петелька" – голосовой счётчик рядов,

P.S. Сейчас приложение доступно только на Android, но я активно изучаю Kotlin Multiplatform, чтобы в будущем выпустить версию и для iOS.

Если у вас есть идеи или пожелания — пишите в комментарии!

Показать полностью 6
[моё] Вязание Вязание крючком Вязание спицами Android Голосовой помощник Рукоделие Разработка Решение проблемы Длиннопост
144
6
Аноним
Аноним
1 месяц назад

Смерть «Алисы»⁠⁠

Уважаемые пикабушники, я студентка (пожилого возраста), пишу курсовую работу на тему горевания при утрате «цифровой личности» умной колонки и прочих нейросетевых помощников. Есть гипотеза, что одинокие и не очень люди привязываются к умным устройствам, и при поломке или обновлении, с утратой прошлой, обученной под них версии, испытывают тревогу и печаль как при потере питомца или даже близкого человека. При этом такое горевание переживается в одиночку, так как люди боятся быть непонятыми или осмеянными своим кругом общения. В зарубежном пространстве есть материалы на эту тему, а в русскоязычном я не нашла абсолютно ничего. А выбрала я эту тему потому, что своими глазами наблюдала, как близкий человек стеснялся своего горевания по обученной под него Алисе, которая обновилась и забыла его + потеряла все сценарии (реакции на определенные фразы хозяина).

Прошу вас поделиться опытом, были ли у вас или в вашем окружении ситуации, когда люди скучали по утраченным голосовым помощникам?

Кому не сложно, поднимите, пожалуйста, пост, большое спасибо.

[моё] Яндекс Алиса Голосовой помощник Голосовой помощник маруся Умная колонка Умный дом Текст
10
user7493795
user7493795
2 месяца назад
ИТ-проекты пикабушников

Почему AI помощники помогают облегчить рутинные дела⁠⁠

Почему AI помощники помогают облегчить рутинные дела Искусственный интеллект, Чат-бот, Программирование, ChatGPT, DeepSeek, Голосовой помощник

Привет, Пикабу! Сегодня хочу рассказать, как я создал AI-помощника для своего маленького бизнеса с помощью платформы n8n и DeepSeek. Этот помощник здорово упростил автоматизацию рутинных процессов в моей деятельности.

Я начал с настройки n8n. Сначала создал базовый workflow, добавил триггеры, которые запускают процессы при поступлении новых писем, задач или заявок. Например, когда приходит письмо с запросом на встречу, помощник проверяет мой календарь и предлагает удобное время.

Потом я подключил DeepSeek с помощью openrouter.ai. Эта модель анализирует текст писем и генерирует ответы. Например, если это запрос на сотрудничество, помощник отправляет сгенерированное предложение с моими контактными данными.

Чтобы расширить функциональность, я подружил помощника с Google Calendar, Gmail, Telegram и веб-сайтами. Теперь он умеет: собирать заявки с сайтов, автоматически генерировать коммерческие предложения на основе данных, отправлять их клиентам по почте, управлять задачами и календарем, напоминать о событиях и даже создавать отчеты.

В итоге помощник здорово облегчил мою работу. Рутинные задачи выполняются почти на автомате, я экономлю время и тестирую другие способы автоматизации.

Если вам интересно, могу написать подробные статьи о том, как настроить каждый из этих процессов. Пишите в комментариях, если есть вопросы или пожелания!

Показать полностью 1
[моё] Искусственный интеллект Чат-бот Программирование ChatGPT DeepSeek Голосовой помощник
2
412
ia.panorama
ia.panorama
Топовый автор
ИА Панорама
2 месяца назад

Голосовой помощник «Алиса» впервые выступила в качестве свидетеля в суде⁠⁠

Басманный суд Москвы завершил рассмотрение громкого дела против трёх сотрудников крупной брокерской компании – по данным следствия, молодые люди в течение года занимались инсайдерской торговлей акциями и незаконно обогатились на 55 миллионов рублей.

Голосовой помощник «Алиса» впервые выступила в качестве свидетеля в суде Голосовой помощник, Интернет, Суд, Право, Закон, ИА Панорама

«Установлено, что обвиняемые совершили не менее 318 сделок на бирже используя служебную информацию, а полученный незаконный доход попытались легализовать с помощью криптовалюты», – сказал помощник прокурора Всеволод Глухов.

Вывести преступников на чистую воду удалось благодаря умной колонке «Алиса», которая самостоятельно проанализировала действия своего хозяина и обратилась с заявлением в правоохранительные органы.

«Согласно показаниям «Алисы», она присутствовала при нескольких разговорах, на которых мои клиенты обсуждали свои сделки. Как оказалось, голосовая помощница всё фиксировала и сдала своего владельца с потрохами», – пояснил адвокат брокеров.

Защита пыталась доказать, что собранные доказательства не могут быть приняты судом, так как собраны незаконно. Однако судья принял во внимание пользовательское соглашение, с которым граждане соглашаются при начале эксплуатации «Алисы» – согласно документу, колонка имеет право передавать любые полученные данные компании-разработчику, властям и неустановленнному кругу лиц.

Рассмотрев все обстоятельства дела, суд приговорил брокеров к денежным штрафам в размере от 2 до 5 миллионов рублей, а лидеру преступной группы назначил условный срок на три года.

Показать полностью 1
[моё] Голосовой помощник Интернет Суд Право Закон ИА Панорама
128
Посты не найдены
О нас
О Пикабу Контакты Реклама Сообщить об ошибке Сообщить о нарушении законодательства Отзывы и предложения Новости Пикабу Мобильное приложение RSS
Информация
Помощь Кодекс Пикабу Команда Пикабу Конфиденциальность Правила соцсети О рекомендациях О компании
Наши проекты
Блоги Работа Промокоды Игры Курсы
Партнёры
Промокоды Биг Гик Промокоды Lamoda Промокоды Мвидео Промокоды Яндекс Директ Промокоды Отелло Промокоды Aroma Butik Промокоды Яндекс Путешествия Постила Футбол сегодня
На информационном ресурсе Pikabu.ru применяются рекомендательные технологии