Suno и Udio
Сейчас есть два основных сервиса для генерации песен - Suno и Udio.
Я сначала познакомился с Udio и долгое время пользовался только им, но потом попробовал и Suno, и теперь готов жаловаться на оба сервиса.
Стоит сразу уточнить, что они работают немного по разному - Suno создаёт песню целиком (но не более четырёх минут), а Udio изначально создаёт кусочек песни в тридцать две секунды, а потом можно добавлять фрагменты до и после, собирая песню целиком. Правда, сейчас уже есть возможность сразу создавать в Udio песню длиной более двух минут, но сколько я ни пользовался этой фичей - получается фигня (возможно, дело во мне).
Тут же можно сразу обратить внимание на то, что если мы создали в Udio первый куплет, а потом хотим добавить инструментальное вступление, то вступление будет 32 секунды, иногда это хорошо, а иногда хотелось бы и покороче. В Suno, как правило, обратная проблема - вступление почти всегда будет коротким, и способов регулировать длину вступления я не нашёл.
Udio генерит кусочки песни, поэтому самый очевидный вариант - на первом этапе подобрать теги и особенности исполнения для первого куплета, а потом уже доделывать начало и продолжение по вкусу.
Suno генерит сразу всю песню, поэтому нужно изначально метатегами структурировать текст, подобрать правильные теги или описание.
Udio дополняет исходный набор тегов. Т.е. можно задать "acoustic guitar, male vocalist, passionate", а Udio еще добавит каких-нибудь тегов (например, "longing, indie folk, bittersweet") и сгенерит песню. С одной стороны, это странно - делать то, о чём тебя не просили, с другой стороны - иногда получаются интересные сочетания, которые я вряд ли мог себе представить. Чем больше тегов задашь, тем меньше будут разброс результатов. Отдельная боль - иногда он добавляет теги, которых бы не хотелось видеть, но возможность игнорирования тегов есть только в платной версии.
Suno генерирует строго то, что ты его попросил (не считая добавления куплетов и еще по мелочи). Но результат, как правило, будет средним, и плюс к этому - почти всегда в мажоре и насколько это возможно попсово. Предсказуемость с одной стороны радует, а с другой - начинает надоедать. Но интересные "переиначивания" иногда тоже случаются.
И в Suno и в Udio можно задать тональность, а в Suno еще и последовательность аккордов, причем даже прямо в тексте.
Suno создает песню целиком, поэтому, если не понравился припев или вступление, то ничего с этим поделать нельзя (в платной версии есть какие-то варианты исправления, но проверить их работу не довелось). Можно попробовать создать новую песню и надеяться, что результат больше понравится.
Udio - это музыкальный конструктор, можно сколько угодно добавлять кусочки в начало или в конец, пока не удовлетворит результат.
Udio подсказывает возможные теги, начинаешь набирать - появляется список того, что можно выбрать. Suno просто предлагает какие-то теги, причем набор обычно какой-то странный. При этом в Suno можно скормить какое-то описание типа "грустная медленная песня с красивой мелодией" и можно получить примерно то, что описал. В Udio как-то даже в голову не приходило писать такие запросы, список тегов перед глазами - выбирай.
В Suno почти нет подсказок на странице создания песни, и есть большая suno wiki, где описываются метатеги, теги и другие советы по составлению промтов и текстов. У Udio тоже есть расширенные описания возможностей, но и на самом сайте их хватает, особенно для начала.
Для достижения одного результата иногда приходится задавать разные теги в Suno и Udio, например, в Suno - "slow", а в Udio - "downtempo"; в Suno - "sad", а в Udio - "melancholic". Стоит это учитывать.
Слева Suno - нет контекстных подсказок, справа Udio - есть контекстные подсказки
И Suno и Udio картавят, иногда больше, иногда меньше, но почти всегда картавят. Особенно Udio, конечно.
Мужские голоса в Udio - это почти всегда ужас. Не знаю, как они этого добились, но складывается ощущение, что набор мужских голосов там не более десятка (по крайней мере, для русского языка), и в итоге слушать приходится почти одно и то же (особенно, если выбрать что-то типа "folk", "melodic" или "country" - сразу привет Борис Борисыч). С женскими голосами дело намного лучше.
В Udio голоса похожи на живые, и лишь изредка уходят в автотюн, в Suno - наоборот.
Ударения. Udio в любой неочевидной ситуации поставит ударение не там, где нужно. Но он поймёт, где нужно ставить ударение, если поставить нужный символ (букву со знаком ударения, нужно откуда-то её копировать). Suno очень редко ставит не то ударение. И если нужно показать ему ударный слог, то достаточно написать нужную гласную в верхнем регистре (с одной стороны - это удобно делать, с другой стороны - выглядит это некрасиво).
Гласные с ударениями для Udio
Отдельная боль - буква "ё". Оба приложения иногда произносят обычную "е" как "ё". Иногда можно поставить над "е" ударение, чтобы было понятней, но иногда - просто беда.
Udio иногда не хочет читать текст, просто ни с того и с сего начинает пороть псевдославянскую отсебятину.
Suno иногда добавляет куплеты, особенно если, как ему кажется, не хватает третьего. Написано два куплета, а он повторит второй и их станет три, он так видит.
В Udio можно бесконечно долго генерировать обложку для песни (обложка здесь квадратная), пока не получится то, что понравится. Потом с этой обложкой можно сделать клип, а потом еще и клип "перегенерировать", если были какие-то правки (например, поправили ошибку в тексте, можно пересоздать клип и в нём будет уже исправленный текст).
Suno создаёт обложку при генерации песни, перегенерировать её нельзя, но можно поменять на какую-то другую картинку из тех, что у вас есть. Обложка вертикальная, для мобильного телефона. В клипе будет показываться не только текст песни, но и все метатеги, смотрится странно. Клип создаётся с автогенерённой обложкой, перегенерировать его можно только в платной версии.
Udio медленно генерирует кусочки, по ощущениям отрезки в 30 секунд генерируются около минуты и послушать их можно только когда они полностью созданы.
Suno генерирует первые секунды песни и тут же даёт возможность их послушать, а пока вы их слушаете, Suno доделывает продолжение и даёт послушать его и так далее. С точки зрения пользователя это выглядит так, будто бы песня сгенерирована секунд за 15.
Suno подкупает тем, что за пару кликов можно получить песню. Да, голос будет звучать странно, да, ты получаешь кота в мешке, но зато один клик - и вот она песня.
Udio - это возможность почувствовать себя начальником в студии звукозаписи - сначала подбираешь интересную мелодию и голос ("Давай по новой, Миша, всё херня"), а потом собираешь песню.
Еще пару лет назад такие сервисы казались невозможными.
Песни для примера.