Добавляем в ChatGPT голосовое произношение и слух
Описанное здесь решение для голосовых функций в СhatGPT не единственное, но именно оно собрало уже множество хороших отзывов и 100 тыс.+ пользователей (на 23.5.2023 - дату этой статьи!).
Речь пойдет о расширении Talk-to-ChatGPT для бразуера.
Внимание: на сегодня расширение доступно в браузерах Google Chrome и Microsoft Edge.
______
Поехали
Если вы ищете самый простой способ общаться с ChatGPT голосом, то попробуйте Talk-to-ChatGPT. Расширение может использоваться на всех настольных компьютерах - Mac или Windows, при условии, что у вас установлен соответствующий браузер.
Расширение Talk-to-ChatGPT бесплатное.
Для работы с Talk-to-ChatGPT вам потребуется запустить ChatGPT в браузере активном режиме.
Что может делать Talk-to-ChatGPT?
Расширение может произносить ответы ChatGPT, делая беседу более естественной.
Оно также может распознавать ваш голос, и в этом случае вам не нужно вводить запросы или ответы вручную.
Чтобы начать работать с Talk-to-ChatGPT, все, что вам нужно сделать, это перейти по ссылке на расширение Talk-to-ChatGPT в Chrome Web Store или в аналогичном разделе с расширениями для Microsoft Edge и добавить его в браузер. Таким образом, расширение будет активировано при запуске ChatGPT в вашем браузере.
_______
Начало работы
Когда загружается домашняя страница ChatGPT, вы должны увидеть кнопку "Старт" в правом верхнем углу. Нажав на эту кнопку, вы активируете расширение для взаимодействия с ChatGPT от вашего имени.
Возможно, вам придется предоставить расширению доступ к микрофону перед заданием первого голосового запроса.
Когда вы начнете, вы можете произнести вопрос, который хотите задать ChatGPT, и когда чат-бот даст вам ответ, Talk-to-ChatGPT преобразует его в речь.
Когда расширение активно, в правом верхнем углу экрана появляется блок с четырьмя различными опциями.
Эти опции позволяют вам
(1) включать / выключать распознавание голоса,
(2) включать / выключать синтез речи,
(3) пропустить текущий ответ и
(4) получить доступ к меню настроек расширения.
Другие настройки
Нажав на кнопку (4), в меню настроек Talk-to-ChatGPT вы можете настроить ряд других параметров:
изменить голос и язык искусственного интеллекта на что-то отличное от английского,
изменить скорость речи для получаемых ответов,
изменить высоту голоса,
изменить язык распознавания речи или
изменить ключевые слова для остановки или приостановки расширения.
____
Автор: создатель и автор телеграм-канала "Изучение языков с ChatGPT". (На канале - подробные инструкции, лайфхаки, техники, советы по изучению иностранных языков с помощью ChatGPT).
____
Помогите найти расширение для Google Chrome, позволяющее заходить на сайты, требующие регистрации, используя базу учётных записей расширения
Подскажите, пожалуйста, как оно называется.
Два коммента для минусов прилагаются.
API для управления плеерами на сайтах
1. Предыстория
В 2012-2013 годах я нашёл одно онлайн-радио, которое «зацепило» меня большим выбором хорошей музыки и тем, что там (почти) не было рекламы.
По своей должности я — web-разработчик, да ещё интересуюсь различными технологиями и происходящим в науке, и посему у меня довольно часто открыто большое количество вкладок в браузере, а зачастую ещё и несколько профилей в браузере. А если ещё добавить к этому среду разработки, графический редактор, открытые папки, то хоть заводи навигатор по всем открытым окнам и вкладкам.
Музыка во вкладке в браузере у меня играла большую часть времени. Когда мне нужно было приостановить воспроизведение, чтобы ответить на звонок или посмотреть интересный видеоролик, приходилось сначала найти нужное окно браузера, потом — нужную вкладку и только после этого можно было нажать заветную кнопку паузы.
Такое происходило часто, и я всё чаще стал задаваться мыслью найти решение этой проблемы.
Недолго думая, решил написать расширение для браузера, которое позволяло бы с помощью горячих клавиш (в терминологии некоторых браузеров — быстрые клавиши) контролировать воспроизведение.
А ещё часто мне было интересно узнать исполнителя и название произведения, поэтому было решено добавить всплывающие оповещения с этой информацией.
2. Готовое расширение
Сегодня моё расширение позволяет контролировать воспроизведение уже на нескольких сайтах (SoundCloud, Digitally Imported, ВКонтакте, Одноклассники, Онлайн-радио 101.ru, VGM Radio), а также некоторые другие действия (добавлять текущий трек в плейлист, отмечать трек как понравившийся, изменять громкость звука). Делается это как с помощью быстрых клавиш, так и при помощи кнопок в оповещении (кнопки не отображаются в Opera).
Ещё есть (отключаемые) оповещения с информацией о треке при изменении статуса плеера либо по нажатию быстрых клавиш.
Также ведётся список десяти последних треков с возможностью поиска оных ВКонтакте, в Google и Amazon.
3. API
У расширения имеется API для добавления поддержки других сайтов.
Каждый сайт (плеер) добавляется как модуль. Имеются встроенные и внешние модули.
3.1. Встроенные модули
Встроенные модули являются частью моего расширения и их настройки доступны на странице параметров расширения. Для того, чтобы подключить модуль, пользователь должен дать расширению своё разрешение на доступ к вкладкам и содержанию страниц соответствующих доменов.
3.2. Внешние модули
Внешние модули являются отдельными расширениями, которые подсоединяются к моему расширению посредством API и имеют доступ ко всем возможностям моего расширения (управление плеерами посредством быстрых клавиш и кнопок в оповещении, а также список последних треков). Их настройки тоже доступны на странице параметров моего расширения.
3.2.1. Для чего нужны внешние модули
- Некоторые модули могут требовать доступ ко всем доменам (например, модуль для виджета SoundCloud на любых сайтах), и чтобы не пугать пользователя моего расширения запросом такого разрешения (чтобы сохранить доверие пользователя).
Такие модули могут получать это разрешение сразу при установке либо в любое другое время (на усмотрение разработчика).
- Внешние модули позволяют сторонним разработчикам публиковать расширения под своим именем. Разработчики, которые хотят пополнить своё портфолио, вместо того, чтобы участвовать в чужом проекте, создают свой собственный проект.
3.3. Где найти API и как с ним работать
API доступен по лицензии MIT на GitHub (см. Ссылки ниже).
Написан он на ES5, чтобы понизить входной барьер для сторонних разработчиков, но это не должно остановить тех, кто хочет написать свой модуль на более современных спецификациях и технологиях.
3.4. Примеры использования API
Имеется: два внешних модуля (доступны в качестве отдельных расширений), а также один встроенный модуль, использующий API.
3.5. Встроенный или внешний модуль
Встроенный или внешний модуль? «... вот в чём вопрос», — как говорил классик.
Если вы хотите воспользоваться API и добавить поддержку нового плеера, воспользуйтесь следующими подсказками:
- встроенный модуль:
а) ваш модуль поддерживает плеер только на одном или небольшом количестве доменов (например, модуль для youtube.com, модуль для play.google.com/music/listen);
б) вас устроит упоминание о вашем вкладе на странице readme моего расширения и в социальных сетях;
- внешний модуль:
а) вы хотите опубликовать свой модуль под своим именем;
б) ваш модуль требует доступ к содержанию страниц на большом количестве или всех доменах.
4. Ссылки
- Моё расширение — https://github.com/PoziWorld/PoziTone.
- API — https://github.com/PoziWorld/PoziTone-module-API (пока только на английском).
- Примеры использования API:
а) встроенный модуль — https://github.com/PoziWorld/PoziTone/tree/develop/modules/c...;
б) внешние модули:
1) https://github.com/PoziWorld/SoundCloud-Widget-external-Pozi...;
2) https://github.com/PoziWorld/Sovyatnik-external-PoziTone-mod....
5. Обратная связь
Вопросы, жалобы и предложения приветствуются. Оставляйте их в комментариях либо воспользуйтесь одним из других способов — https://github.com/PoziWorld/PoziTone/blob/develop/README_ru....
Поиграем в бизнесменов?
Одна вакансия, два кандидата. Сможете выбрать лучшего? И так пять раз.