Сочиняем музыку с помощью искуственного интеллекта: подражаем Бетховену и Моцарту и продлеваем тему Gravity Falls в восемь раз

Всем привет! Хочу рассказать про одно своё несерьёзное увлечение. Как известно, ИИ переживает сейчас самый бум и грозит автоматизировать примерно все профессии на планете. Наконец, он добрался и до креативных людей:

Сочиняем музыку с помощью искуственного интеллекта: подражаем Бетховену и Моцарту и продлеваем тему Gravity Falls в восемь раз Музыка, Искусственный интеллект, Gravity Falls, Моцарт, Людвиг Ван Бетховен, Видео, Длиннопост

Если серьёзно, то о шедеврах речь пока не идёт, но прототипы, существующие уже сейчас, впечатляют. Я использую модель MuseNet, разработанную компанией OpenAI, одним из основателей которой был Илон Маск. Если дать ей небольшой стартовый фрагмент, она пытается предсказать, что будет дальше, и таким образом «пишет» новую музыку в меру своего разумения. Важно отметить, что не используются никакие заданные алгоритмы или шаблоны сочинения, модель просто натренировали на огромном массиве существующих композиций в разных стилях и велели креативить исходя из этого.


Когда я узнал про эту разработку, то первым делом запихнул в модель тему мультсериала Gravity Falls. Его фанатам, к которым я отношусь, прекрасно известно, что главная тема крайне выразительна, но, к сожалению, очень коротка. С помощью MuseNet я продлил её до четырёх минут. На видео первые 30 секунд — это оригинальная тема, данная в качестве затравки, а после этого оно переходит в сочинительство машины:

Знатоки теории музыки, я уверен, найдут в результате множество неидеальностей и шероховатостей. Но лично у меня, который начинал знакомство с технологиями в начале века на четвёртом Пентиуме и диалапе, от таких результатов происходит отвал башки. Напомню, это прототип, технология даже ещё не отполирована.


Модель способна также работать вообще без шаблона, при этом можно выбрать стиль сочинения из небольшого списка вариантов. Я попросил модель сочинить что-то в стиле Бетховена, и с энной попытки получилось вот такое безумие:

Опять-таки — не идеально, но большинство людей даже с музыкальным образованием (включая меня) не смогли бы сочинить и такое. Забавно, что модель в целом имитирует стиль Бетховена, но при этом не ограничена соображениями вроде «у пианиста максимум 2 руки по 5 пальцев + в крайнем случае 1 нос», и если нужно для выразительности — фигачит аккорды по 20 нот.


И последнее, что я пока попробовал — это импровизация в стиле Моцарта. Получилось не так безумно, но тоже на мой вкус симпатично, и это даже, пожалуй, мог бы исполнить живой пианист (с некоторыми модификациями):

Если интересно, в следующих постах расскажу подробнее, как пишутся такие композиции (там всё чуть сложнее, чем просто нажать кнопочку «Сочини»), и покажу больше мелодий, когда они у меня будут.


А, ну и да. Если вы вместе со мной переживаете, что такими темпами ИИ оставит без работы вообще всех, то пусть Бендер попробует нас подбодрить:

Сочиняем музыку с помощью искуственного интеллекта: подражаем Бетховену и Моцарту и продлеваем тему Gravity Falls в восемь раз Музыка, Искусственный интеллект, Gravity Falls, Моцарт, Людвиг Ван Бетховен, Видео, Длиннопост

Искусственный интеллект

2.6K поста9.9K подписчиков

Добавить пост

Правила сообщества

Здесь вы можете свободно создавать посты по теме Искусственного интеллекта. Добро пожаловать :)


Разрешено:


- Делиться вопросами, мыслями, гипотезами, юмором на эту тему.

- Делиться статьями, понятными большинству аудитории Пикабу.

- Делиться опытом создания моделей машинного обучения.

- Рассказывать, как работает та или иная фиговина в анализе данных.

- Век жить, век учиться.


Запрещено:


I) Невостребованный контент

  I.1) Создавать контент, сложный для понимания. Такие посты уйдут в минуса лишь потому, что большинству неинтересно пробрасывать градиенты в каждом тензоре реккурентной сетки с AdaGrad оптимизатором.

  I.2) Создавать контент на "олбанском языке" / нарочно игнорируя правила РЯ даже в шутку. Это ведет к нечитаемости контента.

  I.3) Добавлять посты, которые содержат лишь генеративный контент или нейросетевой Арт без какой-то дополнительной полезной или интересной информации по теме, без промтов или описания методик создания и т.д.


II) Нетематический контент

  II.1) Создавать контент, несвязанный с Data Science, математикой, программированием.

  II.2) Создавать контент, входящий в противоречие существующей базе теорем математики. Например, "Земля плоская" или "Любое действительное число представимо в виде дроби двух целых".

  II.3) Создавать контент, входящий в противоречие с правилами Пикабу.


III) Непотребный контент

  III.1) Эротика, порнография (даже с NSFW).

  III.2) Жесть.


За нарушение I - предупреждение

За нарушение II - предупреждение и перемещение поста в общую ленту

За нарушение III - бан

38
DELETED
Автор поста оценил этот комментарий

Любителям всунуть в видеорецепт или в технопрон (или даже в ход хирургической операции) какую-нить патетику - просто отличное пособие не заморачиваться авторскими правами.

раскрыть ветку (1)
34
Автор поста оценил этот комментарий

Да, кстати, отличное наблюдение. И хотя Ханса Циммера и Дэнни Эльфмана эта технология пока (а вполне возможно, что и никогда) не заменит, но какую-то нишу рынка у композиторов средней руки она реально может отнять. Артхаусные низкобюджетные короткометражки, сериалы, любительские ролики.

показать ответы
90
Автор поста оценил этот комментарий
ИИ:
выдаёт сгенерированные ноты
Музыканты:
Как это играть?! (((
Иллюстрация к комментарию
раскрыть ветку (1)
41
Автор поста оценил этот комментарий

ИИ: не волнуйтесь, я это предусмотрел! Правда, музыканты теперь тоже уже не понадобятся...

Предпросмотр
YouTube4:46
показать ответы
11
Автор поста оценил этот комментарий

. Важно отметить, что не используются никакие заданные алгоритмы или шаблоны сочинения, модель просто натренировали на огромном массиве существующих композиций в разных стилях и велели креативить исходя из этого.

Ну так это одно и тоже, заранее обученная на имеющихся шаблонах

раскрыть ветку (1)
21
Автор поста оценил этот комментарий

А я вот что имею в виду. Традиционные методы генерации компьютерной музыки использовали шаблоны, заданные их программистами: определенные сочетания аккордов, гамм, гармоник, и способы их комбинировать. И это сильно ограничило спектр музыки, который они могли сочинить.


А эта модель в теории может воспроизвести и «переосмыслить» любой приём, встреченный ей в любой композиции, будь то Лист или Франк Синатра.

показать ответы
4
DELETED
Автор поста оценил этот комментарий

Скептически отношусь к нейронкам которые рисуют и пишут музыку. Как помощь человеку - возможно, как полноценный автор - никогда. На мой взгляд. Искусство это тонкая вещь, это то, что, как любят говорить, "трогает нас за струны души". Искусство это мысли и чувства творца, то, чего у нейронки нет и быть не может.


Нейронками стоит заменять раздутый госаппарат, всех этих бюрократов и прочую ересь, вот уж где чувств нет, не было и не будет, а значит и нейронка отлично справится)

раскрыть ветку (1)
7
Автор поста оценил этот комментарий

Это очень хорошая тема для размышлений. С одной стороны, да, в текущем состоянии нейронки 100% не дотягивают до настоящих людей искусства даже близко. С другой — с развитием технологий может оказаться, что барьер всё же не непреодолимый, а струны души таки раскладываются на тензоры. Посмотрим!

показать ответы
8
Автор поста оценил этот комментарий

На мой взгляд, ИИ пока не умеет развивать музыку вглубь. В данных произведениях не чувствуется глубина, чтобы можно было бы начать чувствовать. Звучит как набор занятных звуков.

раскрыть ветку (1)
4
Автор поста оценил этот комментарий

Всё именно так, поэтому про шедевры — это пока только шутка. Но автопереводчики тоже начинали с едва осмысленных текстов, а сейчас уже шпарят почти как живые люди. Так что посмотрим, куда это всё придёт!

показать ответы
7
Автор поста оценил этот комментарий

А кому это нужно? Ну реально, зачем мне слушать вариации Бетховена или Синатру, если я могу их послушать в оригинальном варианте?


Разве кому-то нужна музыка только ради музыки? Лишь бы что-нить послушать, чтоб тишины не было?


Да и звучит хреново, куча лишних нот, нет лаконичности, именно потому что "фигачит аккорды по 20 нот".


Так-то и в звуке упомянутого диалапа тоже "музыку" можно найти, но зачем?

раскрыть ветку (1)
11
Автор поста оценил этот комментарий

Вы правы в том, что в текущем состоянии это не то чтобы кому-нибудь было нужно. Хотя, как было замечено в какой-то ветке, есть ниша низкобюджетных любительских роликов, которым важно, чтобы музыка была свободной от авторских прав, но не так важно качество, где эта штука может пригодиться уже сейчас.

Но вообще же это вопрос где-то между развлечением и фундаментальными исследованиями. Точно так же как шахматные компьютеры не то чтобы приносили какую-то пользу напрямую, но работа над ними двигает вперёд отрасль ИИ. То же самое и здесь.

Ну и кстати, про звук диалапа. Музыку действительно можно найти в самых неожиданных местах, и мне кажется, это прикольно. Вот например, экзешник mspain.exe качает неплохой такой бит:

Предпросмотр
YouTube2:02
11
Автор поста оценил этот комментарий

если нужно для выразительности — фигачит аккорды по 20 нот
Считайте, что ИИ написал целиком произведение, а не партию только для пианиста
Басовые ноты отдаём басовому инструменту (1-2 ноты), сверху мелодичность - какой нибудь скрипочке или духовым (1 нота), пианист, предположим, может играть по два сложных аккорда (8 нот). Остаётся добавить гитарку и второй клавишный инструмент и всё ок, всё придуманное компом можно сыграть коллективом, просто придётся над расчленением на партии посидеть.

Плюс не в 19-м веке же живём, куча педалей, которые можно ткнуть и к гитаре, и к клавишам, и к духовым - октаверы, хорусы, дилеи, которые при желании и прямых руках позволят сыграть, ну, вдвое больше нот

раскрыть ветку (1)
3
Автор поста оценил этот комментарий

О, а про партии для разных инструментов это хорошая идея!

показать ответы
6
Автор поста оценил этот комментарий

Моцарт лучше звучит на скорости 0,75. В идеале 0,8, но ютуб так не умеет, а мне лень.
Бетховен явно просит оркестровки.

Следующий шаг - механический тапёр. Задаешь трафики эмоционального напряжения и процедурная генерация соберёт саундтрек.

раскрыть ветку (1)
5
Автор поста оценил этот комментарий

Сейчас попробовал — вы абсолютно правы, Моцарта было бы лучше замедлить. Я как-то при редактуре вообще не подумал о том, что можно поиграться с темпом, оставил дефолтный, как модель выдала. В следующие разы обязательно учту, спасибо большое за совет!

показать ответы
3
Автор поста оценил этот комментарий

Скоро за вас жён роботы будут е..ть

раскрыть ветку (1)
5
Автор поста оценил этот комментарий

Таки вы не поверите, уже! Ну, по крайней мере, в продакшне — скоро: https://fightthenewdrug.org/meet-henry-the-worlds-first-gene...

1
Автор поста оценил этот комментарий

ТС, нет такого слова "продляем", есть слово "продлеваем".

раскрыть ветку (1)
2
Автор поста оценил этот комментарий

Ой. Точно, адский фейспалм. Спасибо, исправил!

показать ответы
1
Автор поста оценил этот комментарий

А это запрещённое изображение, что его нельзя выложить? Но да, налажала нейросеть неслабо.

Иллюстрация к комментарию
раскрыть ветку (1)
3
Автор поста оценил этот комментарий

Такое ощущение, что с настройками чувствительности переборщили. Камни на фоне нейросеть тоже попыталась превратить в зебр!

показать ответы
1
Автор поста оценил этот комментарий

Так, я помню что писала ответ, но видимо это была новогодняя кома )
Спасибо большое, "Моцарта" уже потихоньку ковыряю ))

раскрыть ветку (1)
1
Автор поста оценил этот комментарий

Ахаха, поздравляю с выходом из новогодней комы! :) Если вдруг у вас случится настроение записать, как это играется вживую, и куда-нибудь выложить, то пришлите ссылку, пожалуйста — я бы с удовольствием послушал

1
Автор поста оценил этот комментарий

Как же это круто!!!! "Бетховен" повеселил, похож, чертяка ))
А про "Моцарта" хочется спросить, где взять ноты? :3

раскрыть ветку (1)
1
Автор поста оценил этот комментарий

Спасибо! :3

MIDI для "Моцарта" залил сюда: https://drive.google.com/drive/folders/1JWYbynaRRwCRqsGswV7o.... Но хочу предупредить, что квантизация на ноты может быть местами сложной (я именно поэтому, начиная с этого ролика, использую вместо Musescore просто визуализацию MIDI напрямую без квантизации)

показать ответы
1
Автор поста оценил этот комментарий

прикольно! а можно нотки Гравити фолз?  помучаю пианинку...

раскрыть ветку (1)
1
Автор поста оценил этот комментарий

Да, пожалуйста, вот здесь MIDI: https://drive.google.com/drive/folders/1JWYbynaRRwCRqsGswV7o...

показать ответы
1
Автор поста оценил этот комментарий
А туда только классика загоняется?? Или электронику тоже можно??
Просто существует одна знаковая композиция, но из неё официально издана только минута с небольшим. Вот и интересно стало..
раскрыть ветку (1)
2
Автор поста оценил этот комментарий

Загнать в качестве затравки можно абсолютно любой MIDI-файл, а вот стиль сочинения приходится выбирать из заранее заготовленного списка. Электроники там нет, но можно попробовать аппроксимировать её моделью «Video games», может, и сработает:

Иллюстрация к комментарию
показать ответы
Автор поста оценил этот комментарий

Сначала подумал, что это через сайт делается, но на сайте функциональных элементов для этого не нашел (его похоже тоже нейросеть делала).То есть это не через сайт и не через готовый экзешник, который можно скачать, делается ?  Надо самому ее компилировать чтобы использовать ?

раскрыть ветку (1)
Автор поста оценил этот комментарий

Да, MuseNet доступен только через сайт — надо зайти на  https://openai.com/blog/musenet/ и  промотать до раздела Try MuseNet

Автор поста оценил этот комментарий

кстати, да!)
я заметил, что композиция идет не в ту сторону, т.е. что-то не так
Еще один вопрос, с Вашего позволения)
Вы добавили свою собственную композицию, но её можно "продолжить" только с выбранным каким то стилем. Какой стиль Вы выбрали для темы "граффити фолс"?

раскрыть ветку (1)
Автор поста оценил этот комментарий

Если я правильно помню, то Gravity Falls продлевал на модели Disney — для всяких там саундтреков она подходит лучше всего

Автор поста оценил этот комментарий

еще вопрос: что такое NUMBER OF TOKENS?
пытался перевести, но не понятно

раскрыть ветку (1)
Автор поста оценил этот комментарий

Это сколько нот модель генерирует за раз. Чем больше, тем длиннее фрагмент, но зато с увеличением числа токенов может начать деградировать качество

показать ответы
Автор поста оценил этот комментарий

Жаль, что люди работают в этих направлениях. Электронные переводчики, программы для написания песен и книг... Сейчас технарям интересно, а через лет 50-100 это может дойти до такого уровня, что гуманитариям и артистам средней руки не будет места в этом мире, кроме самых гениальных и тех, кто будет обслуживать этот софт. Ладно там работу шоферов и грузчиков автоматизируют, это прогресс, но занятия, которые как раз составляют смысл жизни для многих людей, лучше бы не трогали. Это уже антипрогресс, он не высвобождает время, а лишает смысла занятия, которыми время стоит наполнять

раскрыть ветку (1)
Автор поста оценил этот комментарий

Прогресс не остановить ¯\_(ツ)_/¯ Да, скоро может оказаться, что люди вообще ни для чего не нужны. Ну штош.

Автор поста оценил этот комментарий

А как добавлять свою собственную композицию?

раскрыть ветку (1)
Автор поста оценил этот комментарий

Надо нажать на Advanced settings и выбрать Source: Custom (MIDI upload)

показать ответы
DELETED
Автор поста оценил этот комментарий

@f3681, а ему можно только ноты скармливать?

раскрыть ветку (1)
Автор поста оценил этот комментарий

Да, только ноты в MIDI

1
DELETED
Автор поста оценил этот комментарий

@f3681, спасибо тебе большое! Это просто офигенно! Я очень люблю lofi, но не очень понимаю в джазовом построении и гармонии. Берем понравившуюся тональность, делаем пару тройку аккордов, заливаем нашему Бендеру, сохраняем в midi, засовываем обратно в DAW и работаем с материалом ))))

раскрыть ветку (1)
Автор поста оценил этот комментарий

Супер! Да, звучит как хороший подход :)

показать ответы
1
Автор поста оценил этот комментарий
А есть где в мр3 тема из гравити фол?
раскрыть ветку (1)
Автор поста оценил этот комментарий

там аудио, а сами ноты можно?

раскрыть ветку (1)
Автор поста оценил этот комментарий

MIDI, по идее — это и есть ноты в особом формате, их можно открыть в каком-нибудь редакторе (я использую MuseScore) и посмотреть. Но специально для вашего удобства сейчас добавил и ноты в PDF, в той же папке :)

показать ответы