Согласно Теории информации, информацией можно описать вообще всё, что есть во вселенной, включая конечно же и музыку. При этом описываемое можно представить, как некую математическую функцию, равную сумме других функций:
F(X) = f1(x) + f2(x) + f3(x) + ... + fn(x)
где f(x) - это некие функции, описывающие различные части описываемого, "n" - количество таких составляющих функций
Таким образом что, чем больше число "n", тем более точно описание.
Так, например, работает Искусственный Интеллект - нейросеть. Она не помнит все пропущенные через неё данные, иначе бы никаких серверов не хватило бы, а последующий поиск записанной информации отнимал бы очень много времени. ИИ помнит лишь сами функции, которые всё точнее и точнее приближаются к описываемому по мере того, как растёт объём введённых в нейросеть данных. Так же работает и естественная нейросеть внутри наших голов, запоминая всё, что мы встречаем по мере надобности, которая определяется количеством повторений и силой наших впечатлений.
Музыка - это одно из сравнительно простых физических явлений, которое можно описать математически вышеупомянутым способом, так как звук - это волна, получаемая прямым сложением различных более простых волн.
Чем больше человек слушает некую мелодию, тем точнее в его голове определяется формула того, что он слышит. Причём, в отличии от искусственного разума, человеческий разум аналоговый, то есть ему ещё проще вычленить аналоговые функции, составляющие мелодию и запомнить их в виде результирующей функции, так как аналоговую изначально звуковую волну не нужно преобразовывать в цифру и обратно.
Упрощает процесс запоминания и узнавания так же и начитанность "наслушанность" композиций в различных направлениях. Кто-то силён в классике, кто-то в роке, кто-то в попсе, а кто-то и вовсе меломан и силён во всем сразу.
Даже диджейская обработка не может существенно и неузнаваемо изменить результирующую функцию F(X) , так как меняются только некоторые неглавные составляющие f(x), а основные остаются неизменными. Иначе бы это была уже совсем другая, новая, ни на что не похожая композиция.
Вот так это и работает.
Кстати, таким образом мы можем не только узнавать то, что слышали ранее, но и предсказывать то, что ещё не слышали - в определённых стилях, которых наслушались достаточно. "Вот сейчас будет проигрыш, или припев, вот за этим, наверное, последует подъем, а вот тут будет пауза или сбивка, так как она обычно тут есть. " И т.д.
Почему мы узнаем любимую песню, насвистываемую прохожим, сыгранную на непривычном музыкальном инструменте или смиксованную диджеем? Дело в «аудиотеке», которая хранится в нашем мозге. Включайте фоном любимый трек — и давайте вместе разбираться, как это работает.
«Аудиотека» в голове
Звук — любой, не только музыка — по сути представляет собой колебания воздуха. Звуковые волны достигают нашего уха и натыкаются на тонкую барабанную перепонку, которая под их воздействием начинает вибрировать. Эта вибрация передается во внутреннее ухо, где расположен особый орган — улитка. Внутри заполненной жидкостью улитки находятся тысячи особых волосковых клеток. Из-за звуковой вибрации они изгибаются и передают сигнал в мозг по цепочке нервных клеток: так механическая вибрация барабанной перепонки преобразуется в электрический сигнал.
При игре на музыкальном инструменте активизируется почти весь мозг, ведь ему приходится «слышать», «видеть», «чувствовать», запоминать и контролировать движения.
Обработка музыки в мозгу — процесс комплексный: одна его часть отвечает за выявление ритма в услышанной мелодии, другая определяет высоту звуков. Например, в префронтальной коре мозга идет анализ устойчивости и предсказуемости ритма, а в гиппокампе, расположенном в височных частях полушарий, хранится «аудиотека» — информация о ранее услышанной музыке, будь то детская песенка или саундтрек давным-давно просмотренного фильма.
По активности слуховой коры мозга ученые научились «вытаскивать» мелодию из человеческой головы! Судя по статье, опубликованной в научном журнале PLOS Biology, участникам эксперимента дали прослушать песню группы Pink Floyd, одновременно с этим фиксируя их мозговую активность. Используя эти данные и компьютерную модель, исследователи смогли воссоздать мелодию, напоминающую мелодию песни.
Прослушивание музыки может «задевать» и другие части мозга, напрямую с обработкой звука не связанные. Почувствовали прилив грусти или радости, узнав некогда любимый хит? Значит, активизировались области мозга, ответственные за эмоции: прилежащее ядро, миндалевидное тело и мозжечок. Сами начали играть на инструментах или пустились в пляс? К мозжечку присоединились сенсорная, зрительная и моторная кора больших полушарий — и вот уже почти весь ваш мозг активизировался из-за мелодии.
Угадай мелодию
Если музыкальную композицию немного переделать, сможем ли мы ее узнать? Смотря насколько драматичными будут изменения. Если поменять темп музыки — исполнять ее быстрее либо медленнее, это никак не помешает узнать ее. Если не менять соотношение между звуками мелодии, а взять ее целиком и переместить вверх или вниз — то есть транспонировать в другую тональность, подмену услышат только люди с абсолютным слухом (те, кто на слух определяют конкретную высоту звука): для остальных мелодия останется прежней. Можно немного отклониться от исходника и заменить некоторые звуки отличающимися по высоте — например, веселую мажорную мелодию сыграть в грустном миноре или случайно сфальшивить. В таком случае музыка тоже останется узнаваемой. Можно исполнить мелодию на другом музыкальном инструменте либо изменить аранжировку с классики на хеви-метал: это все равно не помешает узнать ее.
Занятия в музыкальной мастерской народного артиста России Юрия Розума, проходящие при поддержке программы социальных инвестиций «Газпром нефти» «Родные города».
Даже если сделать все перечисленное сразу, вы все равно распознаете знакомую песню. Секрет — в многоэтапной обработке мелодии нашим мозгом: мы не просто запоминаем набор отдельных звуков, а анализируем всю звуковую картину целиком — с учетом длительности каждого звука и расстояния между ними. В результате в памяти остается «нотная запись» музыкального произведения.
Как показали исследования, обычному человеку требуется всего 0,4 секунды прослушивания, чтобы опознать знакомую песню — особенно если в прошлом она была эмоционально подкреплена: вы слушали ее на свидании или этот трек звучал в ваших наушниках во время звонка с сообщением об увольнении с работы.
Насколько точно партитура в нашей памяти соответствует оригиналу, зависит от музыкального слуха человека. Им одарен не каждый, и мозг как бы заранее размывает рамки узнавания, относя в одну категорию ту самую песню и другие, что на нее похожи. Иногда, слыша что-то знакомое, мы можем подумать, что наткнулись на очередной ремикс, после чего начинаем мысленно достраивать музыкальную композицию по своим воспоминаниям — и можем сильно удивиться, если внезапно мелодия повернет в другом направлении.
Почему многие люди любят измененные песни и даже сами готовы их создавать? Причин немало: чувство приобщенности к любимому исполнителю, желание сделать полюбившийся трек популярнее или придать ему другое настроение и даже попытка обмануть собственный мозг, позволив ему еще раз насладиться мелодией под маской чего-то новенького.
«Энергия+» подготовила яркий музыкальный сюрприз для участников самого красивого фестиваля Санкт-Петербурга — «ЗСД Фонтанка Фест». В эту субботу, 25 мая, проверим, смогут ли его гости угадать мелодии из нашего плейлиста, пока крутят педали своих велосипедов.
Вот такие прикольные клипы я получила из песен, которые сгенерировала в Suno и Udio:
Здесь мне песня напомнила любую песню Тейлор Свифт, поэтому я просто сгенерировала клип для Тейлор Свифт)
Noisee — бесплатная нейросеть, которая создаст музыкальный клип на основе трека.
Можно использовать ссылку на песню из Suno, Youtube, Udio, Stable Audio и Soundcloud. Можно так же загрузить свой mp3-файл. Работает пока только через платформу Discord.
Для примера, я сгенерировала треки в Suno и Udio, и затем вставила ссылку на каждый в Noisee, прописала, что должно быть в клипе, при желании можно добавить референсы в виде изображений. Нейросеть довольно быстро генерирует.
Заодно сами сможете сравнить, кто из генераторов музыки лучше справился с изначальной текстовой подсказкой.
Что крутого в нейросети Noisee?
Если в видео что-то не понравилось, его можно отредактировать. Просто нажимаете Edit и вас переносит на сайт Noisee, где можно ПОКАДРОВО отредактировать, изменить автоматически сгенерированный промпт для КАЖДОЙ картинки.
Ограничения:
Использовать можно 3 раза за 3 часа
Хотите узнавать первыми о полезных сервисах с искусственным интеллектом для работы, учебы и облегчения жизни? В своем телеграм канале НейроProfit я рассказываю, как можно использовать нейросети для бизнеса
Он часто мелькает в тиктоке и рислах в паре с треком "fify fifty - cupid". Когда в видео происходит екнш - играет "этот трек", а когда в видео более спокойная обстановка - играет "fify fifty - cupid".
У меня уходит много времени на монтаж видео, примерно 4-6 часов, несмотря на применение нейронных сетей. Главной проблемой является подбор материалов, из которых генерируются ролики, чтобы полученный результат не слишком деформировался, при этом более менее нормальная генерация получается не с первого раза. И пришла мысль для эксперимента: автоматизировать этот процесс, предоставив ChatGPT написать сценарий через API на основе текста песни с выбором тайминга, а Gen-2 сгенерировать все ролики из текста. При этом я не буду влиять никак на процесс, пусть результат будет каким он получится, только склею ролики в одно видео.
Если перестать выбирать и пытаться ролик сделать лучше или иначе, весь монтаж можно выполнить всего за 30 минут. И получилось...экспериментальненько и настолько упоротым, что просто не могу не поделиться этим роликом.
Немного поиграем с цветами, после вернемся к видео и сделаем цветокоррекцию, чуть-чуть поправим и переставим, совсем немного подкорректируем, и вот — упоротый финальный шедевр!
Очень интересный сервис я обнаружила. Alteredпозволяет изменять свой голос на любой из тщательно подобранных в портфолио, можно даже попробовать пользовательские голоса и создать убедительные профессиональные голосовые выступления.
Плюсы:
➕ Есть большой выбор голосов
➕можно начать абсолютно бесплатно и уже по своему желанию перейти на платный тариф 😉
Больше полезных сервисов для работы и учебы у меня в ТГ (ссылка в описании профиля), там я показываю, как можно зарабатывать и использовать нейросети для бизнеса