Сообщество - Машинное обучение
Машинное обучение
188 постов 2 904 подписчика
742

Нейросеть "оживила" голос Владимира Высоцкого

В «Театре на Таганке» вновь зазвучал голос Владимира Высоцкого. Нейронная сеть, обученная на записях великого артиста, выступила с обращением к зрителям.

Как сообщает директор театра, Ирина Апексимова, в скором времени все желающее смогут лично пообщаться с Владимиром Семёновичем. Специальная комната будет оборудована в Государственном музее Владимира Высоцкого («Дом Высоцкого на Таганке») к 40-й годовщине со дня смерти артиста.

Интересно, чьи еще голоса мы услышим в скором времени!?

162

Как разделить музыкальный трек на составные части

Французская компания Deezer, известная своим одноименным музыкальным сервисом потоковой передачи музыки через Интернет, выложила в открытый доступ нейронную сеть, которая умеет разделять любую музыкальную композицию на составные части. Они выложили три варианта:

* разделение на голос и фонограмму

* разделение на голос, гитару, барабаны и остальное

* третий вариант дополнительно включает пианино


Над качественным решением данной задачи давно бьются исследователи. В интернете есть софт, онлайн-сервисы и гайды как это делать, например, в Audacity. Но результаты всегда оставляли желать лучшего или требовали существенной ручной доработки. И теперь мы на шаг ближе к полностью автоматическому решению этой задачи за счёт успехов в обучении нейронных сетей.


Посмотреть примеры можно в видео ниже. Видно что иногда артефакты проскакивают, но разделение в большинстве случаев происходит почти идеально. Этого удалось добиться за счёт использования огромного датасета для обучения, который в наличии у Deezer, чей каталог на данный момент включает 56 миллионов музыкальных композиций.

Софт для сплита треков написан на базе библиотеки tensorflow от google и выложен под полностью свободной лицензией на Github. Легко устанавливается и запускается с командной строки. Работает достаточно быстро даже на CPU.


Для желающих поиграться с разделением треков на базе spleeter, есть сервис, где это можно сделать в пару кликов онлайн: mvsep.com


Так же в своём пресс-релизе Deezer дали ссылку на похожий софт, от других исследователей со схожим качеством разделения треков. А так же на сайт где собирают работу различных нейронных сетей для решения этой задачи - тут интересно сравнить как один и тот же трек разбивают на части разные алгоритмы. На форуме программы пользователи предлагают доработки идеи, такие как добавить к spleeter музыкальные инструменты, например флейту или использовать spleeter для удаления музыки с фона спортивных видео чтобы Youtube не банил ролики за нарушение копирайта.

Показать полностью
11

Когда «цифровой» человек неотличим от настоящего

Samsung представили технологию для генерации цифровых людей под названием Neon.

В основе Samsung NEON лежит фирменная технология Core R3, позволяющая создавать виртуальных людей. Компьютер генерирует внешность человека, его мимику, движения, голос и прочее. В представленном ролике, полученном с официального сайта проекта neon.life, показано несколько цифровых человек, созданных искусственным интеллектом. Отличить их от настоящих невозможно.


Источник: http://4pda.ru/2020/01/06/366256/

46

ИИ научился играть в динозаврика из Chrome

ИИ научился играть в динозаврика из Chrome Google Chrome, Динозавры, Компьютерные игры, Нейронные сети, Машинное обучение, Код, Искусственный интеллект, Видео, Длиннопост

В браузере Google Chrome есть игра с динозавриком. Когда нет интернета, браузер показывает такое:

ИИ научился играть в динозаврика из Chrome Google Chrome, Динозавры, Компьютерные игры, Нейронные сети, Машинное обучение, Код, Искусственный интеллект, Видео, Длиннопост

Если нажать на пробел, то динозаврик оживёт, и ваша задача — управлять им с помощью пробела (прыжок) и стрелочки вниз (присесть), чтобы не сталкиваться с препятствиями.


Недавно в Chrome добавили возможность поиграть в эту игру даже с интернетом: вбейте в адрес chrome://dino


Программист из Австралии по имени Эван (на Ютубе — CodeBullet) написал нейросеть, которая сама играет в эту игру, и выложил об этом видео:

Спойлер: в конце ИИ просто рвёт игру на части.


Давайте по шагам разберём, что он сделал и что у него получилось в итоге. Сам ролик на английском, поэтому, если вы не знаете английского, считайте эту статью смысловым переводом происходящего.


Создание игры

Можно научить ИИ играть в игру, просто глядя на экран и анализируя всё, что там происходит. Но тогда быстродействие ИИ будет ограничено скоростью работы экрана, то есть на каких-то сверхскоростях ИИ играть уже не сможет. А мы хотим играть на сверхскоростях, поэтому эффективнее будет встроить ИИ прямо в игру.


Пол и прыгучий персонаж. Чтобы попробовать первую версию игры как можно быстрее, Эван не рисует динозавра, а делает вместо него прыгающий прямоугольник. С поверхностью то же самое: простая линия вместо дороги с перспективой и песком в случайных местах. Единственное, что пока можно в игре — прыгать прямоугольником на месте:

ИИ научился играть в динозаврика из Chrome Google Chrome, Динозавры, Компьютерные игры, Нейронные сети, Машинное обучение, Код, Искусственный интеллект, Видео, Длиннопост

Кстати, если вы обратите внимание на игру в Chrome, то заметите, что хотя динозаврик (по ощущениям) бежит по земле, на самом деле его координата X на экране не меняется. Можно представить, что это не динозаврик бежит, а кактусы летят на него со всё более высокой скоростью. Иллюзия!


Движение и препятствия. На следующем шаге Эван делает так, чтобы на динозаврика двигались кактусы. Но кактусы тоже рисовать долго, поэтому снова берём прямоугольники. Сначала делаем их маленькими и смотрим, что происходит:

ИИ научился играть в динозаврика из Chrome Google Chrome, Динозавры, Компьютерные игры, Нейронные сети, Машинное обучение, Код, Искусственный интеллект, Видео, Длиннопост

Пока всё хорошо: персонаж прыгает, прямоугольники двигаются. Можно сделать следующий шаг — добавить кактусы разной высоты и ширины, как в оригинальной игре. И снова это всё ещё прямоугольники:

ИИ научился играть в динозаврика из Chrome Google Chrome, Динозавры, Компьютерные игры, Нейронные сети, Машинное обучение, Код, Искусственный интеллект, Видео, Длиннопост

Смерть от кактусов. Последнее, что делает Эван — добавляет в игру условие, что как только персонаж коснулся кактуса, то умирает. Это делается просто проверкой пересечения границ одного и второго объекта. Коснулся кактуса — всё исчезло:

ИИ научился играть в динозаврика из Chrome Google Chrome, Динозавры, Компьютерные игры, Нейронные сети, Машинное обучение, Код, Искусственный интеллект, Видео, Длиннопост

Теперь всё готово для первой версии, можно поиграть и проверить, всё ли там происходит как надо.


Эван не начал программировать сразу всю игру с динозаврами, графикой и красивыми кактусами. Вместо этого он сделал макет игры и физику; потом убедился, что всё работает; и только после этого заменил прямоугольники на динозавра и кактусы, а линию на полу — на дорогу с песком. Всё это он просто вырезал из игры и вставил в свой проект:

ИИ научился играть в динозаврика из Chrome Google Chrome, Динозавры, Компьютерные игры, Нейронные сети, Машинное обучение, Код, Искусственный интеллект, Видео, Длиннопост
Красные прямоугольники — разметка границ объектов для определения столкновений. Позже они пропадут.


За кадром осталось то, как Эван делал птиц: они могут летать низко, повыше или совсем высоко. Но мы уже понимаем, что сначала это был прямоугольник выше линии, а потом его заменили на картинку с птицей.


Динозаврику тоже пришлось научиться пригибаться — прямоугольник, который уменьшал свою высоту, превратился в пригибающегося динозаврика:

ИИ научился играть в динозаврика из Chrome Google Chrome, Динозавры, Компьютерные игры, Нейронные сети, Машинное обучение, Код, Искусственный интеллект, Видео, Длиннопост

Нейросеть

Когда игра готова, можно к ней прикручивать искусственный интеллект. Для этого Эван пишет простую самообучающуюся нейросеть, которая работает по принципу обучения с подкреплением. Это значит, что ИИ сначала ничего не знает о мире, в который его поместили, и его задача — определить для себя правила, которые помогут играть в игру как можно дольше.


Если очень коротко, то это работает так:


- делают первое поколение сети;


- запускают её в игру и смотрят результат;


- те версии первого поколения, которые показали наилучшие результаты или дольше всех играли, остаются, а остальные убираются;


- эти удачные версии снова запускают в игру и тоже смотрят, какие из них покажут наилучший результат;


- новых везунчиков оставляют, остальных убирают, и всё повторяется до тех пор, пока ИИ не научится полностью проходить игру.


Первая версия ИИ, которую сделал Эван, просто прыгала случайным образом, и, если повезёт, то перепрыгивала кактусы:

ИИ научился играть в динозаврика из Chrome Google Chrome, Динозавры, Компьютерные игры, Нейронные сети, Машинное обучение, Код, Искусственный интеллект, Видео, Длиннопост

Синяя линия — связь между параметрами игры и действием динозаврика. Пока всё примитивно.


У первых нескольких поколений ИИ была примитивная тактика: просто прыгаешь и надеешься, что интервал прыжков совпадёт с расстояниями между кактусами. Это не сработало, поэтому к седьмому поколению нейросеть нашла взаимосвязь между расстоянием до препятствия, расстоянием между препятствием и моментом, когда надо подпрыгивать:

ИИ научился играть в динозаврика из Chrome Google Chrome, Динозавры, Компьютерные игры, Нейронные сети, Машинное обучение, Код, Искусственный интеллект, Видео, Длиннопост

Цветные линии вверху — это связи внутри нейросети в упрощённом виде. Видно, как одни параметры начинают влиять на другие.


Теперь ИИ умеет дожидаться, пока кактусы не окажутся достаточно близко для прыжка, вместо того чтобы перепрыгивать их случайным образом.


Интересный момент: так как Эван использует самообучающуюся нейросеть, то мы можем заметить, как в некоторых моментах динозаврик раздваивается или распадается на множество частей.

ИИ научился играть в динозаврика из Chrome Google Chrome, Динозавры, Компьютерные игры, Нейронные сети, Машинное обучение, Код, Искусственный интеллект, Видео, Длиннопост

Это связано с тем, что ИИ постоянно проверяет, что лучше: прыгнуть чуть раньше или чуть позже. И если какая-то стратегия даёт результат лучше, чем у остальных вариантов — ИИ делает эту стратегию базовой и в следующем поколении опирается уже на неё.

ИИ научился играть в динозаврика из Chrome Google Chrome, Динозавры, Компьютерные игры, Нейронные сети, Машинное обучение, Код, Искусственный интеллект, Видео, Длиннопост

25-е поколение — здесь появилась реакция на низко летящего птеродактиля (в авторском тексте значится утка): нужно пригнуться.

ИИ научился играть в динозаврика из Chrome Google Chrome, Динозавры, Компьютерные игры, Нейронные сети, Машинное обучение, Код, Искусственный интеллект, Видео, Длиннопост

40-е поколение — связи поменялись, чтобы приспособиться к высокой скорости игры, когда кактусы за секунду пролетают от одного края до другого.

ИИ научился играть в динозаврика из Chrome Google Chrome, Динозавры, Компьютерные игры, Нейронные сети, Машинное обучение, Код, Искусственный интеллект, Видео, Длиннопост

43-е поколение — визуально отличие не сильно заметно, но некоторые линии в связях стали толще. Это значит, что одни коэффициенты и параметры стали сильнее влиять на другие.


Финал

К сорок третьему поколению нейросеть Эвана научилась играть в динозаврика с такой скоростью, которая выходит за пределы человеческих возможностей. Именно для этого и используют ИИ — чтобы помочь человеку справляться с задачами ещё лучше, чем он это делает сейчас.


Есть и другие

На Ютубе много примеров, как нейросети учатся играть в эту игру. Подходы существуют разные, но чаще всего вы увидите какие-то эволюционные или генетические алгоритмы, смысл которых в одном: случайным образом мутируешь много исходных персонажей, проверяешь их, отбираешь лучшего, потом делаешь ему копии и случайным образом мутируешь их. И так шаг за шагом, поколение за поколением удачные мутации укрепляются, а ненужные пропадают.


Так как машины могут прогонять поколения очень быстро, буквально за секунды, за несколько часов можно обучить нейронку какой-нибудь несложной игре, даже если она не знает её правил. А за дни, недели и месяцы можно обучить и более сложным играм.


Источник

Показать полностью 12 1
145

Распознавание цифр различными моделями нейросетей

1. Dense Neural Network

2. Convolutional Neural Network

3. K Nearest Neighbors Classifier


Источник и дополнительная информация.

3026

Компьютерных человечков обучили игре в прятки. Соревнование привело к тому, что все поумнели

Некоммерческая лаборатория OpenAI, созданная в 2015 году при участии Илона Маска, продолжает экспериментировать с искусственным интеллектом. В этот раз ее сотрудники обучили компьютер игре в прятки. Для этого они разместили на небольшой виртуальной площадке синих и красных человечков. Синие прятались, а красные — искали своих противников.

Правила игры со временем усложняли: синей команде давали фору, менялось количество участников, на карту добавляли дополнительные объекты — например, ящики и трамплины. Со временем синие человечки поняли, что могут укрываться за ящиками. С их помощью они даже отгораживались от своих соперников. В свою очередь красные научились обходить препятствия и перебираться через виртуальные стены, используя все те же ящики.


При этом сотрудники OpenAI не программировали подобное поведение. Искусственный интеллект дошел до всего сам — на это понадобилось более миллиона игр. Его действия основывались на алгоритмах, схожих с алгоритмами человеческого поведения.

484

Мошенники подделали голос директора компании с помощью ИИ и заставили подчинённого перевести им 243 тысячи долларов

Эксперты назвали инцидент первым киберпреступлением, совершённым с помощью имитации голоса.

Мошенники подделали голос директора компании с помощью ИИ и заставили подчинённого перевести им 243 тысячи долларов Tjournal, Мошенничество, Киберпреступность, Машинное обучение, Искусственный интеллект, Имитация, Голос, Работа, Длиннопост

В марте 2019 года мошенники обманом заставили подчинённого британской компании перевести им 243 тысячи долларов (более 15 миллионов рублей), используя сымитированный с помощью искусственного интеллекта голос его руководителя. Об этом сообщил The Wall Street Journal со ссылкой на страховую компанию Euler Hermes Group, которая возместила убытки пострадавшим и отказалась указывать названия компаний.


Генеральный директор британской энергетической фирмы думал, что разговаривал по телефону со своим начальником, исполнительным директором немецкой головной компании. Босс попросил его срочно, в течение часа, перевести 243 тысячи долларов венгерскому поставщику.


Директор британской фирмы узнал лёгкий немецкий акцент и тембр голоса начальника, поэтому выполнил просьбу. Но мошенники позвонили ещё дважды. После перевода денег хакеры сказали, что немецкая компания отправила британской сумму на возмещение убытков. В третий раз они запросили второй платёж. Однако обещанный перевод ещё не пришёл, а звонок поступил с австрийского номера. Тогда британец заподозрил неладное и не стал платить ещё раз.


Деньги ушли на счёт венгерского банка, затем были переведены в Мексику и дальше разошлись по разным местам. Детективам не удалось обнаружить ни одного подозреваемого. Неизвестно, использовали ли преступники роботов, чтобы сгенерированный голос мог самостоятельно реагировать на вопросы жертвы.


Полиция и эксперты по кибербезопасности ещё в 2018 году предсказывали, что преступники начнут использовать ИИ для автоматизации кибератак. Рюдигер Кирш (Rüdiger Kirsch), эксперт по мошенничеству в Euler Hermes, отметил, что никогда не сталкивался с мошенниками, которые использовали бы ИИ.


Инцидент стал первым подобным зарегистрированным преступлением в Европе, отметил Филипп Аманн (Philipp Amann), глава безопасности в Европейском центре киберпреступности. Он подчеркнул, что хакеры, скорее всего, начнут чаще использовать технологию, если она позволяет успешно совершать преступления.


Кирш полагает, что мошенники использовали коммерческую программу для генерации голоса. С помощью подобного сервиса он записал собственный голос и отметил, что имитация звучала как настоящая. Существует несколько компаний, продающих программы, позволяющие быстро имитировать голос, отметил Бобби Филар (Bobby Filar), директор компании Endgame, занимающейся анализом данных: «Вам не нужна докторская степень по математике, чтобы её использовать».


Хакеры также могли склеить отрывки аудиозаписей для имитации голоса, но на это потребовались бы часы аудиозаписей. Мошенники могли получить доступ к публичным выступлениям директора немецкой компании. Филар считает, что все попадают в такие ситуации, когда случайно выдают информацию, которую потом мошенники могут использовать против них.


Технологии машинного обучения, с помощью которых можно имитировать голоса, позволяют намного проще совершать киберперступления, считает глава исследовательского центра ИИ и роботов в институте ООН по вопросам преступности и правосудия Иракли Беридзе (Irakli Beridze). Он изучает способы, позволяющие распознавать фейковые видео. Беридзе считает, что DeepFake-ролики станут ещё более удобным инструментом для хакеров: «Представьте видео-звонок с голосом и выражением лица вашего начальника. У вас не возникло бы никаких сомнений».


Источник

Показать полностью
2714

Билайн Россия первым в России совместно с «Лиза Алерт» разработал нейросеть для поиска пропавших людей

Состоялось то, чего мы очень ждали и о чём мечтали: Билайн представил решение «Beeline AI - Поиск людей» на базе нейросети для обработки фотографий, полученных с беспилотных летательных аппаратов (БПЛА) в местах поиска пропавших людей. Эта технология, разработанная совместно с нами, позволит сократить время на просмотр и сортировку полученных с БПЛА снимков в 2,5 раза. В дальнейшем технология будет адаптироваться к специфике поиска и совершенствоваться.

Билайн Россия первым в России совместно с «Лиза Алерт» разработал нейросеть для поиска пропавших людей Лиза Алерт, Билайн, Искусственный интеллект, Квадрокоптер, Дрон, Беспилотник, Поиск людей, Добровольцы, Длиннопост

Мы начали активно использовать беспилотники в прошлом году, наращивая интенсивность, и успешно находить пропавших с помощью нашей группы просмотра снимков. Но если в 2018 году за весь год мы нашли три человека благодаря снимкам с дронов, то на сегодняшний день нам удаётся каждую неделю спасти как минимум одного потерявшегося с помощью дрона.


Анализ снимков - процесс трудоемкий: на это нужно не только много времени, но и достаточное количество людей, готовых отсматривать фотографии. Для привлечения к этой работе большого количества добровольцев отряд создал специальный ресурс watcher.lizaalert.ru, где люди, физически не принимающие участие в поиске, могут помогать отряду онлайн – находясь дома или в офисе у компьютера. Но люди устают, и отсматривать снимки в течение нескольких часов, не снижая эффективности, – задача почти невыполнимая, а цена ошибки, как вы понимаете, очень высока.

Билайн Россия первым в России совместно с «Лиза Алерт» разработал нейросеть для поиска пропавших людей Лиза Алерт, Билайн, Искусственный интеллект, Квадрокоптер, Дрон, Беспилотник, Поиск людей, Добровольцы, Длиннопост

С одного дня поисков с помощью дронов отряд получает порядка 2500 фотографий, на проверку которых группа из 30 человек тратит в среднем 5-7 часов. Благодаря «Beeline AI - Поиск людей» время на анализ 1 фотоизображения занимает 2-3 секунды, что позволяет сократить процесс сортировки всего контента до 1-2,5 часов в зависимости от количества фотографий. По мере обучения нейросети скорость и точность ее работы будет расти. Важная особенность нейросети – это её способность обучаться распознавать объекты на снимках, сделанных с высоты от 40 до 100 метров, с высоким уровнем визуального «шума» - деревья, природный ландшафт, сумерки и т.д.


Первоочередная задача «Beeline AI - Поиск людей» - убрать «пустые» и неинформативные фотографии, на которых точно нет человека или атрибутов, указывающих, что в этом месте был человек. Это позволяет группе анализа сразу сосредоточиться на потенциально результативных снимках.


Первичные тесты совместно с отрядом «Лиза Алерт» показали, что точность модели на тестовых изображениях приближается к 98%. Потенциально нейронная сеть способна находить людей и предметы во всех местах поиска, таких как лес, болота, поля, города, независимо от времени года и одежды человека, так как алгоритм настраивается на работу в любое время года и сможет распознавать нестандартное положение тела в пространстве, например, сидящего, лежащего или частично прикрытого листвой.


Мы очень рады, что у нас снова есть повод сказать огромное спасибо нашему замечательному и давнему другу – Билайну, при поддержке которого у нас функционирует бесплатная горячая линия, осуществляется смс-рассылка с информацией о поисках и действуют островки безопасности для потерявшихся детей! Мы видели, как сотрудники Билайна, разрабатывающие для нас эти решения, болеют душой за результат, понимая, что они создают инструменты для спасения человеческих жизней. Мы хотели бы поблагодарить всю команду, участвовавшую в разработке этого крайне важного для нас проекта, и лично Евгению Чистову, руководителя по корпоративной социальной ответственности ПАО «Вымпелком» (Билайн), которая давно стала настолько близким другом «Лиза Алерт», что мы считаем её таким же, как мы, представителем отряда.

Билайн Россия первым в России совместно с «Лиза Алерт» разработал нейросеть для поиска пропавших людей Лиза Алерт, Билайн, Искусственный интеллект, Квадрокоптер, Дрон, Беспилотник, Поиск людей, Добровольцы, Длиннопост
Показать полностью 2
33

Российские учёные научились читать мысли

Учёные Г. К. «Нейроботикс» («Нейроассистивные технологии») и Лаборатории нейроробототехники Московского физико-технического института (МФТИ) научились использовать электрическую активность мозга для воссоздания изображений, которые видит человек.

«Энцефалограмма — следовой сигнал от работы нервных клеток, снимаемый с поверхности головы. Раньше считалось, что исследовать процессы в мозге по ЭЭГ — это все равно, что пытаться узнать устройство двигателя паровоза по его дыму. Мы не предполагали, что в ней содержится достаточно информации, чтобы хотя бы частично реконструировать изображение, которое видит человек. Однако оказалось, что такая реконструкция возможна и демонстрирует хорошие результаты. Более того, на ее основе даже можно создать работающий в реальном времени интерфейс «мозг — компьютер». Это очень обнадеживает. Сейчас создание инвазивных нейроинтерфейсов, о которых говорит Илон Маск, упирается в сложность хирургической операции и то, что через несколько месяцев из-за окисления и естественных процессов они выходят из строя. Мы надеемся, что в будущем сможем сделать более доступные нейроинтерфейсы, не требующие имплантации», — подчеркнул один из авторов работы, младший научный сотрудник МФТИ и программист-математик компании «Нейроботикс» Григорий Рашков.

Российские учёные научились читать мысли Нейронные сети, Россия, ЭЭГ, Видео, Длиннопост, МФТИ

Существующие решения по распознаванию изображений с помощью сигналов мозга используют функциональную магнитно-резонансную томографию (фМРТ) или анализ получаемого непосредственно с нейронов сигнала. А разработка учёных из МФТИ и «Нейроботикс» использует электроэнцефалограмму (ЭЭГ), снимаемую с поверхности головы, и нейросети, которые в реальном времени реконструируют просматриваемое человеком видео.


В рамках первой части эксперимента испытуемым показали 10-секундные видеоролики с YouTube («абстракции», «водопады», «лица людей», «скорость» — видеосъемку от первого лица гонок на снегоходах, водных мотоциклах, ралли — и «движущиеся механизмы»), снимая при этом показатели ЭЭГ общей продолжительностью 20 минут. Собранные данные позволили доказать, что частотные характеристики волновой активности (спектры) ЭЭГ для разных категорий видеороликов достоверно различаются и позволяют в реальном времени анализировать реакцию мозга на видео.

Российские учёные научились читать мысли Нейронные сети, Россия, ЭЭГ, Видео, Длиннопост, МФТИ

Во второй части эксперимента на основе трёх произвольно выбранных роликов были созданы две нейросети: первая генерировала произвольные изображения этих же категорий из «шума», вторая — создавала похожий «шум» из ЭЭГ. После того учёным удалось работать нейросети совместно, что позволило по записанному сигналу ЭЭГ воспроизводить кадры, похожие на те, которые видели люди в момент записи. В итоге в 90% случаев удалось получить кадры, которые совпадали с изначальным видеороликом.

Показать полностью 2
Мои подписки
Подписывайтесь на интересные вам теги, сообщества,
пользователей — и читайте персональное «Горячее».
Чтобы добавить подписку, нужно авторизоваться.
Отличная работа, все прочитано!