В одном из прошлых постов я писала, что ElevenLabs анонсировали возможность заработать пользователям на клонировании голоса. И вот теперь все желающие могут загрузить свой голос и получать деньги за его использование.
Как работает:
Пользователь загружает 30 минут аудио голоса, добавляет описание, затем назначает цену и указывает реквизиты.
Голосом будет озвучиваться реклама и прочий контент, а взамен обещают пассивный доход.
Хотите быть в курсе полезных ии сервисов для работы, учебы и облегчения жизни? Подпишитесь на мой канал в Telegram НейроProfit, там я рассказываю о том, как зарабатывать с помощью нейросетей и использовать ии-сервисы для бизнеса 😉
Дадра Ми зашла в медкапсулу для периодического самосохранения. И закрыла глаза и открыв глаза она, а точнее не она, а другое существо. Но с точки зрения само восприятия это была Дадра Ми. Она увидела, что находиться не на станции. Это был явно был пляж, кругом были инопланетные пальмы. Цветовая гамма всего мира была странной. Так что, Дадра ми поняла что явно не дома. Увидев Р`эээм в одетую в гавайском стиле, Дадра Ми стала догадываться, что произошло. И удивлялась тому, как подруга могла такое сделать. Причем больше удивляла техническая сторона дела чем моральная. - Добро пожаловать на Райский Сад, ты не Дадра ми, ты гиперианская ретрансляция ее! - Как ты могла?! - Твой оригинал надолго застрял в другой метагалактике. И я очень по тебе скучала! - Я не про моральную сторону, как ты смогла это технически провернуть. - Это долгая история. Скажу сразу с точки законов официально ты Сален! - Что?!!! Ты совсем уже. - Да расслабься сейчас мы тобой будем веселиться с классными парнями, кстати они Салены! Не волнуйся тебе понравится. Ты же знаешь у нас куда более лучшие ощущение чем у людей. А Салены вообще чудеса творят.
ElevenLabs - Один из самых продвинутых сервисов – предоставляет библиотеку максимально реалистичных голосов, которые можно настраивать как угодно. Клонирование голоса, опция создания уникального синтетического голоса с нуля. Можно клонировать свой голос и заставить его говорить на любом из поддерживаемых языков.
Кому интересно, я писала серию постов про этот действительно лучший в своем роде сервис.
Free Text To Speech Online - Использует библиотеку Microsoft AI Speech для синтеза речи. Простые настройки темпа и тона, предусмотрено скачивание аудио в mp3.
PlayHT - Генерирует человеческие голоса, неотличимые от настоящих. Имеет редактор для создания уникальных голосов персонажей. Предоставляет огромный выбор голосов – более 800, поддерживает 130+ языков.
RHVoice - Голосовой синтезатор с качественными русскими голосами, поддерживает 13 других языков.
Mimic - Быстрый и легкий голосовой синтезатор, созданный на основе CMU Flite.а.
Murf - Предоставляет более 120 реалистичных мужских и женских голосов, которые можно настраивать и кастомизировать. Поддерживает 20+ языков.
Speechify - Озвучивает любой текстовый контент, быстро переводит видео.
Mozilla TTS - Включает большой набор обученных моделей. Поддерживает 20+ языков, генерирует нейтральную по эмоциональной окраске реалистичную речь.
Deepgram - Сервис использует 4 модели для синтеза реалистичной речи – Nova-2, Enhanced, Base, Whisper Large.
Tortoise TTS - Синтезирует речь с использованием множества реалистичных голосов, учитывает указания на эмоции в тексте, клонирует голос.
Wondercraft AI - Располагает библиотекой реалистичных голосов для озвучивания текста, есть опция клонирования голоса. Предусмотрено автоматическое создание транскрипта и заметок.
Coqui - Предоставляет 5 реалистичных голосов, поддерживает 7 языков.
Fluxon - 5 голосов на выбор, возможность клонировать любой голос по образцу, перевод аудио на другой язык.
Recast AI - Превращает лонгриды в сжатые интересные подкасты.
Хотите быть в курсе полезных ии сервисов для работы, учебы и облегчения жизни? Подпишитесь на мой канал в Telegram НейроProfit, там я рассказываю о том, как зарабатывать с помощью нейросетей и использовать ии-сервисы для бизнеса 😉
В одном из прошлых постов я показывала как я "украла голос Илона Маска" - результат получился крутой, но вот сервис был платный.
В этот раз я сделала обзор на бесплатный аналог с открытым кодом (к тому же можно попробовать на huggingface) и опять клонировала голос Илона Маска, и в качестве русского образца голос Вероники Степановой. Забегая вперед скажу, что все получилось очень похоже!
Whisper Speech - мощный синтезатор речи, а заодно он очень хорошо клонирует голоса, бесплатный и без впн. Но есть и минусы, которые я обнаружила, пока записывала этот обзор
Минусы
Он без проблем переводит на английский, но... Как я не старалась, русскую речь он не поддерживает. Но, Вы можете загрузить русский голос и написать промпт на английском - и ваш исходный голос зазвучит на английском, не смотря на то, что исходник на русском. Пробовала ставить <ru> - тоже бесполезно.
Сервис крутой, если вам надо клонировать голос, например, знаменитости и озвучить текстна английском языке. Сервис будет работать, даже если знаменитость русскоговорящая, когда вы загрузите образец голоса на русском и пропишете промпт на английском, сервис без проблем озвучит английский текст исходным голосом знаменитости.
Хотите быть в курсе полезных ии сервисов для работы, учебы и облегчения жизни? Подпишитесь на мой канал в Telegram НейроProfit, там я рассказываю о том, как зарабатывать с помощью нейросетей и использовать ии-сервисы для бизнеса 😉
Пользователи смогут продать голос, созданный или клонированный
Честно говоря, хотела ограничиться небольшим постом, но информация интересная, так что пока готовила пост, увлеклась и получился такой лонгрид.
С момента своего публичного запуска ElevenLabs лидирует в отрасли синтеза естественной речи, позволяя пользователям создавать и проектировать голоса искусственного интеллекта для огромного количества языков и акцентов, способные передавать широкий спектр эмоций и интонаций.
За это время ElevenLabs создали аудио за более чем 100 лет. Сегодня их технологию используют сотрудники 41% компаний из списка Fortune 500. Дальше они будут только развиваться еще больше:
Теперь можно перевести любое видео на один из 29 языков (в том числе русский) с учетом тона голоса говорящего, его акцента или фонового шума, сохраняя при этом голос и эмоции оригинального говорящего. Вот например этот ролик о себе самом перевел ElevenLabs с английского на русский с сохранением голоса.
В предыдущей версии, ролик, который вы видите наверху, перевелся бы с кучей искажений, голосовых артефактов, и искаженным переводом. Язык вывода я указала Английский, хотя в видео присутствует несколько языков. Не смотря на это, сервис без проблем перевел мне видос на русский, не теряя смысл.
Каждый месяц в ElevenLabsбесплатно дается 10 000 знаков, которые можно использовать по своему усмотрению - перевести видео с сохранением голоса в разделе Dubbing, или сделать реалистичную озвучку текста, или и то, и то.
Новые продукты
Сегодня компания также представляет ряд новых продуктов, включая Dubbing Studio , торговую площадку Voice Library , раннюю предварительную версию приложения Mobile Reader , а также новые модели с улучшенной скоростью и языковым охватом. А еще они пошли по пути OpenAI и дадут возможность пользователям заработать, загружая созданные или клонированные голоса.
Подробнее о каждом продукте
ElevenLabs также представляет несколько новых разработок продуктов, которые будут запущены в эксплуатацию в ближайшие недели:
Dubbing Studio
Теперь мощности нейросети позволят пользователям дублировать фильмы целиком, а также создавать и редактировать их расшифровки, переводы и тайм-коды, обеспечивая дополнительный контроль над созданием контента. Эти возможности дополняют уже существующую функцию искусственного дубляжа, которая обеспечивает автоматическую комплексную локализацию видео на 29 языках.
Voice Library (голосовая библиотека)
ElevenLabsпредоставит пользователям безопасную платформу для заработка на версиях собственных голосов, созданных искусственным интеллектом. Пользователи могут создать свою профессиональную реплику голоса AI, проверить ее и поделиться ею через голосовую библиотеку. Когда другие используют эти проверенные голоса, оригинальные создатели получают компенсацию. Пользователи всегда сохраняют контроль над доступностью своего голоса и условиями компенсации. Маркетплейс уже приносит доход небольшой группе альфа-пользователей. Кстати, у них сервиса есть классификатор речи с использованием искусственного интеллекта, который может проверить, содержит ли аудиосэмпл контент, созданный ElevenLabs. Кстати, это они тоже улучшат - включат и другие голосовые модели в свой классификатор.
Приложение Mobile Reader
Ранняя предварительная версия мобильного приложения для чтения, которая позволяет мгновенно преобразовывать текст и URL-адреса в аудио, упрощая пользователям доступ к контенту на другом носителе во время движения. В качестве ознакомительной пробной версии приложение будет доступно бесплатно в течение первых трех месяцев, и пользователи смогут зарегистрироваться для получения раннего доступа через список ожидания.
ElevenLabs реально молодцы, пока это мой топ из синтеза речи - самая натуральная озвучка получается, с паузами, придыханиями, эмоциями. Если бы они еще в клонирование голоса (который Professional Voice Cloning) добавили бы русский голос - им бы вообще цены не было. Пока эта опция доступна только на английском, я записала 40 минут своего голоса на английском и через 3 недели должны сделать мой голосовой клон, поделюсь впечатлениями. Но лучшие они в переводе видео с сохранением голоса, даже Heygen пользуются их технологией, если кто не знал. То, что они принимают дополнительные меры для повышения безопасности голосовых данных дает им еще плюсик в карму.
Хотите быть в курсе полезных ии сервисов для работы, учебы и облегчения жизни? Подпишитесь на мой канал в Telegram НейроProfit, там я рассказываю о том, как зарабатывать с помощью нейросетей и использовать ии-сервисы для бизнеса 😉