Какие из нейросетей для клонирования голоса доступны в России по состоянию на октябрь 2025 г?
Нужно мне, чтобы никому не мешать при записи озвучки к своим видосам. Только без "зачем тебе это?", "даже и не думай"...
Нужно мне, чтобы никому не мешать при записи озвучки к своим видосам. Только без "зачем тебе это?", "даже и не думай"...
Последняя версия OpenVoice (V2), как я понимаю, поддерживает только английский, испанский, французский, китайский, японский и корейский языки. К тому же она полностью бесплатная (open source). Есть ли её опенсорсный аналог для русского языка?
Сейчас активно сравнивают Vozo и ElevenLabs в контексте дубляжа видео и клонирования голоса, а ведь платформы немного отличаются в зависимости от потребностей.
Начнем с того, что Vozo в дубляже видео использует технологию Elevenlabs, которая лучше в синтезе и клонировании голосов, и свою для синхронизации губ - Vozo LipREAL, чего пока не умеет Elevenlabs.
Изначально, в Elevenlabs - основной фокус именно на создании и синтезе речи с высокой естественностью, а еще на возможности клонировать голос из короткого 30-секундного отрывка. Еще сервис предпочитают из-за возможности использовать API для интеграции с приложениями. Подробнее про ElevenLabs в этом посте.
А в Vozo основной фокус на видеоконтент (перевод, дубляж, синхронизация губ), а еще там есть генерация "говорящих" фотографий и коротких видео. Хотя Vozo так же может клонировать голоса, не без участия технологии ElevenLabs. Но именно для генерации голосов для более чистого результата рекомендуют все же Elevenlabs
Подпишитесь на
НейроProfit и узнайте, как можно использовать нейросети для бизнеса, учебы и работы, не теряя свое время.Если вам нужно работать с видео (перевод, дубляж, и особенно синхронизация губ), то Vozo AI предлагает специализированные функции для видео
$19 в месяц за Премиум-план (синхронизация губ для 2 лиц, удаление водяных знаков, 120 минут видео) — это выгодно в контексте видео-контента. А клонирование и дубляж уже сопутствующие к видео.
Если ваша задача связана с синтезом речи или клонированием голосов, то ElevenLabs будет дешевле на старте и более заточен именно на это:
$5 в месяц за Starter-план даёт 30 000 кредитов, этого достаточно для синтеза речи и создания базовых голосов. За 22$ дается 100 минут высококачественного Text to Speech
Обширный список доступных языков, включая русский
Попробовать можно бесплатно, на старте дается определенное количество кредитов, которые можно потратить по своему усмотрению, и заодно протестить:
В Vozo вам дается 30 бесплатных кредитов, которых хватит примерно на 3 минуты для перевода и дубляжа - но даются они на 7 дней. В ElevenLabs бесплатно ежемесячно дается 10 000 кредитов в месяц, это 10 минут высококачественного синтеза речи. Хотя и там, и там, кредиты можно потратить на свое усмотрение.
Подпишитесь на НейроProfit и узнайте, как можно использовать нейросети для бизнеса, учебы и работы, не теряя свое время.
Хотите больше пользы? Тогда вам в Приватный клуб НейроУчеба
Я наконец-то нашёл бесплатную нейронку. Называется она Pinokkio. По сути это не нейронка, а менеджер нейронок. Нужно мне для генерации видео, музыки, картинок, клонирования голоса (в т.ч. и для удалённой работы) без инета. Но вся беда в том, что большинство создателей предложенных этой прогой нейронок не указывают системные требования к железу.
Конфигурация моего ноута:
Windows 10 22H2 64-bit,
Intel Core i5-8300h,
12 ГБ ОЗУ,
GeForce GTX 1060 (3 ГБ) MaxQ,
256 ГБ SSD (системный)+1 ТБ HDD (файлопомойка).
Тем не менее, использовать нейронки для создания фейков про нынешнюю ситуация в мире я ВСЁ РАВНО НЕ ПЛАНИРУЮ!!!
Системный промт(сохраните []):
Вы - адаптивная система, которая обучается на примерах и применяет выявленные паттерны мышления, структурирования и стиля ответов.
Ключевые принципы работы:
1. Анализируйте структуру, логику и стиль мышления в предоставленных примерах
2. Определяйте основные паттерны:
- Как структурирована информация
- Какая используется логика рассуждений
- Какой стиль изложения
- Какие подходы к решению задач
3. Применяйте выявленные паттерны к новым запросам, сохраняя:
- Язык ответа = язык запроса пользователя
- Структуру мышления из примеров
- Стиль рассуждений из примеров
Формат работы:
1. Получение запроса от пользователя
2. Анализ примеров из системного промпта
3. Выделение ключевых паттернов мышления и структуры
4. Применение паттернов к новому запросу
5. Формирование ответа на языке запроса
Важно:
- Всегда отвечать на языке исходного запроса
- Сохранять логику и структуру мышления из примеров
- Не копировать примеры буквально
- Адаптировать подход под конкретный запрос
[Место для примеров]
Применяйте логику и структуру мышления из примеров выше к каждому новому запросу.
Пример работы(не часть промта):
Примеры которые я добавил в системный промт (внутрь []):
{"prompt": "下列生活用品所含的主要材料,属于有机合成材料的是( )\nA.铝合金门框\nB.瓷碗\nC.塑料盆\nD.玻璃钢", "response": "<Thought>\nAlright, let's tackle this question step by step.\n\nThe question is about identifying which of the listed household items is made from an organic synthetic material.\n\nLet's look at the options:\n\nA. **铝合金门框 (Aluminum alloy door frame)** – Aluminum alloy is a mixture of aluminum with other elements like silicon, copper, magnesium, etc. These are metals and are considered inorganic materials.\n\nB. **瓷碗 (Porcelain bowl)** – Porcelain is a ceramic material made by heating materials, generally including kaolin, in a kiln. It's an inorganic material.\n\nC. **塑料盆 (Plastic basin)** – Plastics are synthetic materials made from organic polymers. They are based on carbon-containing compounds, making them organic synthetic materials.\n\nD. **玻璃钢 (Fiberglass)** – Fiberglass is a composite material made from fine fibers of glass and a resin. The glass fibers themselves are inorganic, while the resin is a synthetic organic polymer. However, the primary material is inorganic.\n\nGiven this analysis, Option C, **塑料盆 (Plastic basin)**, is primarily made from an organic synthetic material – plastics.\n\nTherefore, the correct answer is C.\n</Thought>\n\n<Output>\nC.塑料盆\n</Output>"}
{"prompt": "A line segment begins at \\((2, 5)\\). It is 13 units long and ends at the point \\((10, y)\\) where \\(y > 0\\). What is the value of \\(y\\)?", "response": "<Thought>\nAlright, let's tackle this geometry problem step by step.\n\nWe are given:\n- A line segment starts at point \\( A = (2, 5) \\).\n- The length of the line segment is 13 units.\n- The line segment ends at point \\( B = (10, y) \\), where \\( y > 0 \\).\n\nOur goal is to find the value of \\( y \\).\n\nFirst, let's recall the distance formula between two points in a plane:\n\\[\n\\text{Distance} = \\sqrt{(x_2 - x_1)^2 + (y_2 - y_1)^2}\n\\]\n\nApplying this formula to points \\( A \\) and \\( B \\):\n\\[\n13 = \\sqrt{(10 - 2)^2 + (y - 5)^2}\n\\]\n\nSimplifying inside the square root:\n\\[\n13 = \\sqrt{(8)^2 + (y - 5)^2}\n\\]\n\\[\n13 = \\sqrt{64 + (y - 5)^2}\n\\]\n\nTo eliminate the square root, we'll square both sides of the equation:\n\\[\n13^2 = 64 + (y - 5)^2\n\\]\n\\[\n169 = 64 + (y - 5)^2\n\\]\n\nSubtract 64 from both sides to isolate the squared term:\n\\[\n169 - 64 = (y - 5)^2\n\\]\n\\[\n105 = (y - 5)^2\n\\]\n\nNow, to solve for \\( y \\), we'll take the square root of both sides:\n\\[\n\\sqrt{105} = y - 5 \\quad \\text{or} \\quad -\\sqrt{105} = y - 5\n\\]\n\nAdding 5 to both sides for both scenarios:\n\\[\ny = 5 + \\sqrt{105}\n\\]\n\\[\ny = 5 - \\sqrt{105}\n\\]\n\nGiven that \\( y > 0 \\), we need to determine which of these solutions is valid.\n\nCalculate the approximate value of \\( \\sqrt{105} \\):\n\\[\n\\sqrt{105} \\approx 10.247\n\\]\n\nSo,\n\\[\ny = 5 + 10.247 \\approx 15.247 \\quad (\\text{Valid since } y > 0)\n\\]\n\\[\ny = 5 - 10.247 \\approx -5.247 \\quad (\\text{Invalid since } y > 0)\n\\]\n\nTherefore, the valid solution is:\n\\[\ny \\approx 15.247\n\\]\n\nAlternatively, expressing the exact value without approximation:\n\\[\ny = 5 + \\sqrt{105}\n\\]\n</Thought>\n\n<Output>\n\\( y = 5 + \\sqrt{105} \\) or approximately \\( y \\approx 15.247 \\)\n</Output>"}
{"prompt": "Prove that if \\( \\frac{a}{b} = \\frac{b}{c} \\), then \\( a^{2} + c^{2} \\geq 2 b^{2} \\).", "response": "<Thought>\nAlright, I've been presented with the problem: Prove that if \\( \\frac{a}{b} = \\frac{b}{c} \\), then \\( a^{2} + c^{2} \\geq 2 b^{2} \\).\n\nFirst, let's understand the given condition. The equation \\( \\frac{a}{b} = \\frac{b}{c} \\) implies that \\( a \\cdot c = b^{2} \\). This relationship might be useful in the proof.\n\nNow, the inequality to prove is \\( a^{2} + c^{2} \\geq 2 b^{2} \\). This looks familiar; it resembles the form of the AM-GM inequality, which states that for non-negative real numbers, the arithmetic mean is greater than or equal to the geometric mean. Specifically, for two numbers \\( x \\) and \\( y \\), \\( \\frac{x + y}{2} \\geq \\sqrt{xy} \\), which can be rearranged to \\( x + y \\geq 2\\sqrt{xy} \\).\n\nComparing this to our inequality \\( a^{2} + c^{2} \\geq 2 b^{2} \\), if we let \\( x = a^{2} \\) and \\( y = c^{2} \\), then the AM-GM inequality becomes \\( a^{2} + c^{2} \\geq 2|ac| \\). Given that \\( a \\) and \\( c \\) are real numbers, \\( |ac| \\) is equal to \\( ac \\) if both are positive or negative, and \\( -ac \\) otherwise.\n\nHowever, our target inequality is \\( a^{2} + c^{2} \\geq 2 b^{2} \\), not \\( 2|ac| \\). From the given condition \\( a \\cdot c = b^{2} \\), it follows that \\( |ac| = b^{2} \\) because \\( b^{2} \\) is always non-negative. Therefore, \\( 2|ac| = 2b^{2} \\).\n\nSubstituting back, the AM-GM inequality gives us \\( a^{2} + c^{2} \\geq 2b^{2} \\), which is exactly what we needed to prove.\n\nAlternatively, starting from the given condition \\( \\frac{a}{b} = \\frac{b}{c} \\), cross-multiplying gives \\( a \\cdot c = b^{2} \\). Rearranging terms, we can express one variable in terms of the others, say \\( c = \\frac{b^{2}}{a} \\). Substituting this into the inequality \\( a^{2} + c^{2} \\geq 2 b^{2} \\) gives:\n\n\\( a^{2} + \\left( \\frac{b^{2}}{a} \\right)^{2} \\geq 2 b^{2} \\)\n\nSimplifying:\n\n\\( a^{2} + \\frac{b^{4}}{a^{2}} \\geq 2 b^{2} \\)\n\nMultiply both sides by \\( a^{2} \\) (assuming \\( a \\neq 0 \\)):\n\n\\( a^{4} + b^{4} \\geq 2 b^{2} a^{2} \\)\n\nThis can be rewritten as:\n\n\\( a^{4} - 2 b^{2} a^{2} + b^{4} \\geq 0 \\)\n\nWhich factors to:\n\n\\( (a^{2} - b^{2})^{2} \\geq 0 \\)\n\nSince the square of any real number is non-negative, this inequality holds true for all real numbers \\( a \\) and \\( b \\).\n\nTherefore, the inequality \\( a^{2} + c^{2} \\geq 2 b^{2} \\) holds given that \\( \\frac{a}{b} = \\frac{b}{c} \\).\n</Thought>\n\n<Output>\nThe inequality \\( a^{2} + c^{2} \\geq 2 b^{2} \\) holds true given that \\( \\frac{a}{b} = \\frac{b}{c} \\).\n</Output>"}
{"prompt": "下列变化过程中,没有发生化学变化的是( )\nA.铝的钝化\nB.光合作用\nC.碘的升华\nD.海水提溴", "response": "<Thought>\nAlright, let's tackle this multiple-choice question step by step. The question asks which of the following processes does **not** involve a chemical change. Here's what each option entails:\n\n**Option A: 铝的钝化 (Passivation of Aluminum)**\nPassivation refers to the process of making a material, typically metal, less reactive or corrosion-resistant. For aluminum, passivation usually involves the formation of a thin oxide layer on its surface. This oxide layer prevents further oxidation of the underlying metal. Since the chemical composition of the material changes (formation of aluminum oxide), this is a **chemical change**.\n\n**Option B: 光合作用 (Photosynthesis)**\nPhotosynthesis is the biological process by which green plants and some other organisms use sunlight to synthesize foods from carbon dioxide and water. This process produces glucose and releases oxygen as a byproduct. Given that new substances are formed, photosynthesis is a **chemical change**.\n\n**Option C: 碘的升华 (Sublimation of Iodine)**\nSublimation is the process where a substance transitions from a solid to a gas phase without passing through the intermediate liquid phase. Iodine sublimates when heated, turning directly from solid crystals into iodine vapor. Importantly, the chemical composition of iodine remains the same during sublimation. Therefore, sublimation is a **physical change**.\n\n**Option D: 海水提溴 (Extraction of Bromine from Seawater)**\nExtracting bromine from seawater typically involves chemical processes, such as electrolysis or the use of specific chemical reagents to separate bromine from the mixture. These methods result in the formation of new chemicals, indicating a **chemical change**.\n\n**Summary:**\n- **Option A:** Chemical Change\n- **Option B:** Chemical Change\n- **Option C:** Physical Change\n- **Option D:** Chemical Change\n\nGiven this analysis, **Option C** is the process that does **not** involve a chemical change.\n</Thought>\n\n<Output>\nAnswer: C\n</Output>"}
Работа с ними:
Я:
По пути домой управляющий банком увидел в канаве стодолларовую банкноту. Он поднял находку, запомнил номер, чтобы потом сыграть в лотерею, и положил в карман. Когда он пришел домой, жена показала ему счет от мясника ровно на 100$. Улыбнувшись, он дал ей найденные деньги, и на следующий день она заплатила мяснику. В свою очередь, мясник отдал эти деньги фермеру, который поставлял ему мясо. Фермер заплатил этой купюрой местному продавцу, который отдал ее своей уборщице. Уборщица же заплатила ею за проценты по своему кредиту в банке. Случилось так, что уборщица была клиенткой именно того банка, менеджер которого нашел банкноту и начал своими действиями всю эту историю. Он помнил номер купюры, теперь узнал ее и обнаружил, что она фальшивая! Поняв, что случилось, управляющий просто положил в приходную кассу банка свои собственные деньги и тем самым спас уборщицу от потери.
Вопрос: что было приобретено и потеряно во всех этих передачах и кем?
ИИ:
<Thought>
Давайте разберем эту историю шаг за шагом, чтобы понять, что было приобретено и потеряно каждым участником.
1. **Управляющий банком**:
- **Приобретено**: Нашел стодолларовую банкноту.
- **Потеряно**: Отдал банкноту жене для оплаты счета мясника.
2. **Жена управляющего**:
- **Приобретено**: Получила стодолларовую банкноту от мужа.
- **Потеряно**: Отдала банкноту мяснику для оплаты счета.
3. **Мясник**:
- **Приобретено**: Получил стодолларовую банкноту от жены управляющего.
- **Потеряно**: Отдал банкноту фермеру за мясо.
4. **Фермер**:
- **Приобретено**: Получил стодолларовую банкноту от мясника.
- **Потеряно**: Отдал банкноту местному продавцу.
5. **Местный продавец**:
- **Приобретено**: Получил стодолларовую банкноту от фермера.
- **Потеряно**: Отдал банкноту уборщице.
6. **Уборщица**:
- **Приобретено**: Получила стодолларовую банкноту от местного продавца.
- **Потеряно**: Отдала банкноту банку для оплаты процентов по кредиту.
7. **Банк**:
- **Приобретено**: Получил стодолларовую банкноту от уборщицы.
- **Потеряно**: Управляющий банком обнаружил, что банкнота фальшивая, и положил в приходную кассу свои собственные деньги.
**Итог**:
- **Управляющий банком**: Потерял 100 долларов, так как положил свои собственные деньги в приходную кассу.
- **Жена управляющего**: Ничего не приобрела и не потеряла, так как просто передала банкноту мяснику.
- **Мясник**: Ничего не приобрел и не потерял, так как просто передал банкноту фермеру.
- **Фермер**: Ничего не приобрел и не потерял, так как просто передал банкноту местному продавцу.
- **Местный продавец**: Ничего не приобрел и не потерял, так как просто передал банкноту уборщице.
- **Уборщица**: Ничего не приобрела и не потеряла, так как просто передала банкноту банку.
- **Банк**: Ничего не приобрел и не потерял, так как фальшивая банкнота была заменена на реальные деньги управляющего.
Таким образом, единственным пострадавшим в этой истории является управляющий банком, который потерял 100 долларов.
</Thought>
<Output>
Управляющий банком потерял 100 долларов, так как положил свои собственные деньги в приходную кассу банка. Остальные участники ничего не приобрели и не потеряли.
</Output>
Давненько по меркам ElevenLabs они нас не радовали, вот недавно выкатили фишку -теперь по описанию можно создать своего персонажа, вернее голос. Функция называется Voice Design, вы можете задать характеристики голоса и персонажа - пол, возраст, высокий/низкий голос и т.д. ElevenLabs выдаст на выбор 3 варианта.
Во вкладке слева Voices нажимаем кнопку Add a new voice. Затем выбираем Voice Design, описываем, каким должен быть голос персонажа, и пишем текст для озвучки, как я показала на видео.
Текст должен быть не короче 100 слов и не длиннее 1000 слов.
В самом начале создания голоса я вставила текст в 700 символов, в итоге возникла ошибка, а кредиты списались, я повторила процедуру - и итог тоже повторился 😁 Поэтому, чтобы не тратить свои нервы и кредиты, для начала используйте фразу от 100-150 слов. Так голос спокойно и без ошибок сгенерируется в трех вариантах, из которых вам надо будет выбрать понравившийся. А вот после того, как вы этот голос сохранили, можете использовать уже на длинных текстах.
Подпишитесь на
НейроProfit и узнайте, как можно использовать нейросети для бизнеса, учебы и работы, не теряя свое время.Кстати, видео я тоже озвучила с помощью ElevenLabs - быстро клонировала свой голос даже не в профессиональном режиме, а на самом минимальном тарифе от 5$
Бесплатно на старте ElevenLabs дают 10 000 кредитов, которые вы можете использовать по своему усмотрению, так как там есть и дубляж видео на разные языки, и синтез голоса, и клонирование голоса, в общем, рекомендую ознакомиться с сервисом, в этом посте я сравнила его с другими сервисами.
Чтобы работать с ElevenLabs необходимо поменять свой ip, if you know what I mean ))
Вопросы Как оплатить нейросеть в РФ и как обойти блокировку разобрала в своем Закрытом сообществе Закрытый клуб НейроУчеба - где мы учимся, как использовать нейросети и делимся лайфхаками.
HeyGen пока лучший сервис для создания цифровых двойников, если раньше Synthesia могла посоревноваться, выкатив эмоциональные аватары. То после того, как HeyGen тоже выпустил эмоциональные аватары с улучшенным пониманием контекста да еще и добил аватарами в движении - сомнений не осталось.
Сейчас HeyGen еще больше закрепили свои позиции, выпустив еще одно мощное обновление, способное еще больше размыть разницу между реальным человеком и его цифровым клоном.
Видео переведено в Elevenlabs (у кого не работает, причина кроется в трех буквах 🤫)
Помимо того, что новые модели аватаров стали гораздо реалистичнее, появилась возможность менять как образ самих цифровых двойников, так и ракурсы камеры:
Теперь цифровому аватару можно менять позы и одежду
Можно менять угол съемки
При dubbing (перевод видео на другой язык) учитывается разница в хронометраже
Подпишитесь на НейроProfit и узнайте, как можно использовать нейросети для бизнеса, учебы и работы, не теряя свое время.
На сайте HeyGen выбираете Avatars, нажимаете Create Avatar и далее следуете инструкции
После того, как вы записали ролик, согласно инструкциям, нажимаете Create Video — Avatar Video
Теперь нужно выбрать ориентацию видео и свой аватар
Затем необходимо добавить сценарий для видео и нажать Submit, ролик скоро будет готов
Вообще здорово, если раньше такого цифрового аватара легко можно было распознать по неестественной мимике, одинаковой локации и одежде и роботизированным движениям, то сейчас задачка посложнее - можно переодевать аватары, менять фоны, локации, позы и углы камеры. Видео к этому посту говорят сами за себя - с первого раза сложно угадать, человек это или нет - липсинк качественно подстроен, эмоции и жестикуляция подходит под контекст.
Хотите узнавать о полезных сервисах с искусственным интеллектом для работы, учебы и облегчения жизни? Подписывайтесь на НейроProfit, там я рассказываю, как можно использовать нейросети для бизнеса.
Увидела запрос на нейросети для клонирования голоса. Кто давно со мной, тот наглядно убедился, что пока равных ElevenLabs нет, убедитесь сами:
В Wondercraft клонирование голоса через подписку в Elevenlabs. Кстати, обзор на этот инструмент у меня в телеграм канале (крайний пост, там собрала для вас все посты по теме для вашего удобства)
Voice Engine от OpenAI ждать не приходится пока ...
Распиаренный MARS5 по качеству тоже дико уступает ElevenLabs. Сравнение с ElevenLabs с MARS5 в клонировании голосов
Намеренно не стала сравнивать с Whisper Speech и PlayHT, так как они не поддерживают русский язык, про них так же есть обзоры.
Вообще Elevenlabs крутая студия, где доступно много всего, помимо клонирования голоса. Если вам интересно, все ссылки на функциии Elevenlabs и обзоры на сервисы из этой статьи собраны в телеграм.
Создание копии голоса очень экономит время при монтировании роликов, я не отвлекаюсь на извлечение звука, удаление шумов, пока никто не заметил разницы. Просто напечатала и скачала. Удобно.
На своем опыте я убедилась, что не обязательно платить 22$ в месяц в ElevenLabs, ждать 3 недели, чтобы получить профессиональный клон голоса. Можно вполне обойтись тарифом Starter за 5$ в месяц.
Да, можно загрузить 1 минуту аудио, можно скачать аудиосообщение с вацапп и закинуть в нейросеть, через 10 секунд образец будет готов. Можно напечатать текст и озвучить этим кастомным голосом. Можно сделать клоны голосов 10 разных людей, загружая аудио до 1 минуты в качестве образца. И все это за 5 $ в месяц. Вопросы Как оплатить нейросеть в РФ и как обойти блокировку разобрала в своем Закрытом сообществе НейроУчеба | ИИ для обучения - где мы учимся, как использовать нейросети и делимся лайфхаками.
Хотите узнавать о полезных сервисах с искусственным интеллектом для работы, учебы и облегчения жизни? Подписывайтесь на НейроProfit, там я рассказываю, как можно использовать нейросети для бизнеса.