Нейронные сети рвут суперкомпьютер в шахматы. Что дальше?

AlphaZero на сегодняшний день играет в шахматы сильнее всех в мире. Самообучающейся шахматной машине AlphaZero удалось обыграть прежнего компьютерного чемпиона, даже укомплектованного дебютными базами...

Нейронные сети рвут суперкомпьютер в шахматы. Что дальше? Наука, Искусственный интеллект, Шахматы, Будущее, Длиннопост

Поразительные результаты тестирования обновленной версии искусственной нейронной сети AlphaZero опубликовала компания по разработке искусственного интеллекта DeepMind 7 декабря 2018 года, напомнив всем о том информационном взрыве, причиной которого стал шахматный матч с одной из сильнейших компьютерных программ Stockfish, сыгранный в декабре прошлого года.


Результаты не оставляют сомнения в том, что AlphaZero на сегодняшний день играет в шахматы сильнее всех в мире. Обновленная версия AlphaZero вновь разгромила прежнего компьютерного чемпиона — программу Stockfish (версия 8) — в новом 1000-партиевом матче. При этом AlphaZero удалось выиграть 155 партий, 839 раз — сыграть вничью и проиграть всего 6 партий.


AlphaZero также превзошел Stockfish в серии матчей c неравным временным контролем, уверенно побив программу с классическим алгоритмом принятия решений, даже в условиях предоставления ей 10-кратной форы по времени на обдумывание ходов.


Как сообщили в компании DeepMind, с практически идентичным результатом AlphaZero превзошел и девятую версию Stockfish — новейшую по состоянию на 13 января 2018 года.


По данным DeepMind, самообучающейся шахматной машине AlphaZero удалось обыграть прежнего компьютерного чемпиона, даже укомплектованного дебютными базами, хотя наличие баз всё же помогло Stockfish, позволив программе выиграть белым цветом несколько игр. Тем не менее, этого оказалось недостаточно для общего выигрыша матча.

Нейронные сети рвут суперкомпьютер в шахматы. Что дальше? Наука, Искусственный интеллект, Шахматы, Будущее, Длиннопост

Результаты AlphaZero против последней версии программы Stockfish, а также против программы Stockfish, укомплектованной дебютными базами (победы – зеленый; поражения – красный, ничьи – серый)

Из презентации компании DeepMind для журнала Science

Все это перечеркнуло главные аргументы о необъективности выводов, сделанных по результатам матча, сыгранного в конце 2017 года. Тогда, как считали многие, контроль времени по одной минуте на ход явно ущемлял возможности программы Stockfish.


С контролем три часа на партию плюс 15 секунд на каждый ход подобного аргумента приведено быть не может, так как предоставленное время является огромным для любого компьютера.


В партиях с неравным контролем времени программа Stockfish начала обыгрывать AlphaZero только тогда, когда ее преимущество перед соперником составило 30 к 1. В матче с 10 кратным преимуществом по времени в пользу Stockfish, самообучающаяся шахматная машина AlphaZero вновь одержала уверенную победу.

Нейронные сети рвут суперкомпьютер в шахматы. Что дальше? Наука, Искусственный интеллект, Шахматы, Будущее, Длиннопост

Результаты, показанные AlphaZero в матчах с неравным контролем времени, свидетельствуют не только о том, что данная программа является намного более сильной, чем любой традиционный «шахматный движок», но и о том, что она использует намного более эффективный алгоритм расчета. По данным DeepMind, AlphaZero использует дерево поиска Монте-Карло, просчитывая приблизительно 60 тысяч ходов в секунду, что в тысячу раз уступает (!) возможностям Stockfish (60 миллионов ходов в секунду).

Нейронные сети рвут суперкомпьютер в шахматы. Что дальше? Наука, Искусственный интеллект, Шахматы, Будущее, Длиннопост

Иллюстрация расчета вариантов со стороны AlphaZero

Из презентации компании DeepMind для журнала Science

Что же поклонники компьютерных шахмат могут почерпнуть, познакомившись с этими результатами? Во-первых, AlphaZero утвердился в статусе сильнейшего шахматного игрока в мире. Но это еще не всё. Если Вы следите за развитием искусственного интеллекта, то продемонстрированные результаты окажутся для Вас еще более интригующими. Алгоритм расчета AlphaZero является одинаковым как для шахмат, так и для популярных в азиатских странах настольных игр «го» и «сёги».


AlphaZero смогла побить лучшие компьютерные программы во всех трех играх, имея в своем распоряжении только правила игры и несколько часов на самообучение. Обновленные результаты самообучающейся машины AlphaZero компания DeepMind предоставила ровно через год после первой победы, одержанной над Stockfish.


Комментируя партии AlphaZero, сыгранные в первом матче против Stockfish в декабре 2017 года, многие ведущие шахматные гроссмейстеры не скрывали своего изумления от увиденного. В числе аргументов, вносивших во всеобщую оценку некий элемент сдержанности, было то, что в 2017 году программа Stockfish была лишена электронных дебютных баз (того огромного опыта, который человечеству удалось накопить за сто с лишним лет развития шахматной теории), а также была существенно ограничена во времени. Тем не менее, сегодняшние результаты, предоставленные компанией DeepMind, показывают, что учет пожеланий критиков существенным образом не меняет картины.


Тогда экспертов шахматного мира поразила не столько филигранность техники AlphaZero, сколько способность машины принимать за доской совершенно, казалось бы, некомпьютерные «творческие» решения. Так, например, комментируя одну из партий матча, международный гроссмейстер Сергей Шипов обратил внимание на отказ AlphaZero от немедленного следования сильнейшему варианту и возвращение к нему через промежуточное повторение ходов, как если бы машиной руководило желание проверить реакцию соперника.


«Меня потрясли „человеческие“ рефлексы AlphaZero при выборе хода и удивительное для „новичка шахмат“ понимание позиции с нестандартным (нарушенным) материальным равновесием. Это, честно говоря, удивительно», — констатировал Шипов.


В свою очередь, другой российский гроссмейстер Петр Свидлер в 2017 году в беседе с Сергеем Шиповым, давая оценку игре AlphaZero, отметил факт выигрыша машиной нескольких «совершенно сногсшибательных партий в новоиндийской защите». Как заявил Свидлер, то, что продемонстрировала машина, лишенная дебютных баз и имеющая несколько часов на самообучение, — «это центральная теория, которую, я помню, Боря Гельфанд сотоварищи, Лёва Аронян (международные гроссмейстеры Борис Гельфанд и Левон Аронян — прим. ИА Красная Весна) поднимали с нуля лет десять назад».


«Железяка сама начинает так ходить?», — задается вопросом Свидлер. «Нам говорят, что книги у нее нет, — подчеркивает Свидлер, — что она в такую бесову силу играет, что, несколько часов поучившись, в состоянии повторять то, что люди годами искали в новоиндийской защите».


«Кроме восторга от того, что машина делает, у меня глаза полезли на лоб, когда я увидел эти дебюты. Потому что, ну, елки-палки, если на самом деле она в состоянии с нуля воспроизвести дебютные находки и еще усилить их — это, конечно, на меня сногсшибательное впечатление произвело», — добавил Свидлер, заключив при этом, что не верит в какую-либо фальсификацию со стороны компании DeepMind.


И, конечно, обратили внимание гроссмейстеры, в этой связи нельзя не задать вопрос о применении AlphaZero далеко за пределами мира шахмат.


«Они потратили четыре часа на шахматы, — рассуждает международный гроссмейстер Сергей Шипов, — потом за два часа они разбомбили сёги. Соответственно, ясно, что теперь они будут решать совершенно другие задачи. Для них шахматы — просто мелочь какая-то».


Соглашаясь с мнением своего коллеги, аналогичную точку зрения высказывает и Пётр Свидлер: «Совершенно понятно, что они занимаются созданием искусственного интеллекта не для того, чтобы играть в настольные игры».


«А чем же будет этот монстр заниматься на самом деле, не военной ли отраслью?», — спрашивает Сергей Шипов, обращая при этом внимание на то, что на фоне всех этих достижений в области создания искусственного интеллекта «человек становится каким-то уж совсем жалким и ничтожным».


Свидлер оставляет данный вопрос без ответа, согласившись, что проблема неконтролируемого развития в данной сфере действительно является поводом для беспокойства.


...


Источник

Вы смотрите срез комментариев. Показать все
163
Автор поста оценил этот комментарий
Учебники по физике загрузили бы в её. Может быть уже телепортацию придумала.
раскрыть ветку (68)
288
DELETED
Автор поста оценил этот комментарий
Комментарий удален. Причина: данный аккаунт был удалён
раскрыть ветку (2)
79
Автор поста оценил этот комментарий

Они и так потихоньку на марс съебывают

5
Автор поста оценил этот комментарий

И правильно сделает.

47
Автор поста оценил этот комментарий

Я надеюсь что доживу до того времени, когда ИИ будет активно использоваться в медицине, и желательно с онлайн-интерфейсом.

Красота же: загрузил все свои жалобы и результаты анализов в формочку на сайте, и тебе выдалась пачка рекомендаций и лечение. Никаких тебе очередей в поликлинику и неправильно поставленных диагнозов потому что доктор был с похмелья.

раскрыть ветку (23)
60
Автор поста оценил этот комментарий

Нахер медицину. Пусть судьёй назначат.

раскрыть ветку (5)
56
DELETED
Автор поста оценил этот комментарий
"Убить всех человеков, это паразиты на теле Земли"
ещё комментарии
26
Автор поста оценил этот комментарий
Ну нахер. Ибо - в результате драки с Ивановым И. И. вы разбили его смартфон с новейшим андроидом и самым мощным процессором, моего дальнего, но такого любимого родственника. Расстрелять -с!!
раскрыть ветку (1)
12
Автор поста оценил этот комментарий
На самом деле будет всё без эмоций. Проблема в другом. Для обучения нужны примеры. А если за примеры брать текущую судеьную систему, результат может быть очень неожиданным
2
Автор поста оценил этот комментарий

Не назначат. Либо ограничат использование решений в судебной практике. Вы же не можете всерьез говорить что наши политики и чиновники согласятся чтобы их ЧЕСТНО судили?

12
Автор поста оценил этот комментарий

Таааак... Загрузил жалобы в формочку и получил ответ? Где-то я такое уже видел... Где же? А вот!

Иллюстрация к комментарию
раскрыть ветку (3)
1
DELETED
Автор поста оценил этот комментарий
Откуда кадр?))
раскрыть ветку (1)
3
Автор поста оценил этот комментарий
"Идиократия"
Автор поста оценил этот комментарий
Но там всё равно был врач. Укуреный, но врач
4
Автор поста оценил этот комментарий
Автор поста оценил этот комментарий
А как же человеческий фактор, это назначить изначально не то лечение и смотреть, как человек мучается.
Автор поста оценил этот комментарий

Лет 10 назад в нашем универе что-то подобное пытались запилить. Свалились на сложности оцифровки данных, их недостаточном количестве и, конечно, на дикой бюрократии.

Автор поста оценил этот комментарий

Вопрос в том, сможет ли человек объективно оценить свои симптомы, и какие из них он посчитает существенными, а какие забудет упомянуть. Не говоря уже о том, что "формочка на сайте" не сможет провести визуальный и физический осмотр.


Если человек сможет правильно оценить свое состояние, то ничто не мешает ему и сегодня воспользоваться интернетом и найти заболевание под свои болячки.

Автор поста оценил этот комментарий

Такие проекты уже есть, индивидуальная медицина называются. Через пару тройку лет будут коммерческие решения думаю (в ии там нет смысла, и нейронная сеть справится)

Автор поста оценил этот комментарий

Не проканает: "все лгут" (с) д-р Хаус.

1
Автор поста оценил этот комментарий
Так уже есть. Куча сайтов, задаёшь симптомы, тебе выдаёт вероятные заболевания, с процентом вероятности по каждому. Я так изжогу себе вылечил. Сначала продиагностировался на трёх разных сайтах, потом почитал, как лечиться и какие лекарства покупать. Теперь не мучаюсь, изжога прошла.
раскрыть ветку (5)
Автор поста оценил этот комментарий
Подскажи, как лечился 10 лет мучаюсь
раскрыть ветку (2)
Автор поста оценил этот комментарий
Перестал жрать майонез и сладкий чай в товарных количествах.
Автор поста оценил этот комментарий
Потом разговорился с другом, у него ещё хуже проблема была - дикие боли в желудке. Но ему попался хороший гастроэнторолог, посоветовавший год не есть мяса. Потом за 15 лет болей не проявлялось.
Автор поста оценил этот комментарий

Сайты подскажи?

раскрыть ветку (1)
Автор поста оценил этот комментарий
Сейчас уж и не вспомню, но нашёл за пять минут.
Автор поста оценил этот комментарий
Без физического осмотра врачём многое может упустить такая система, какой бы хорошей она не была.
8
Автор поста оценил этот комментарий

Или по истории и экономике - может быть уже идеальный строй и законы были бы..

раскрыть ветку (14)
4
Автор поста оценил этот комментарий

Ага.

Или в в "Мстители. Эра Альтрона". Там то же самое сделали, в итоге робот посчитал что человечество должно умереть.

раскрыть ветку (3)
2
Автор поста оценил этот комментарий
По американски да.
раскрыть ветку (2)
Автор поста оценил этот комментарий
Какая-то подспудная мысль о суициде общества.
раскрыть ветку (1)
Автор поста оценил этот комментарий
Нет понятия справедливости, есть понятие сильного.
3
Автор поста оценил этот комментарий
Плюс настольных игр - можно учиться методом проб и ошибок (а на этот ИИ пока и работают). Допустим, можно загрузить предварительно в ИИ весь человеческий опыт по истории и экономике, но это не значит, что ИИ создаст из этого опыта (возможно далеко от идеального) хороший строй. Единственный выход для тренировки ИИ - создать государство с парой миллионов кожаных рабов и ИИ во главе. Каждую неделю ИИ будет экспериментировать с строем. В силу неопытности ИИ, эти рабы могут погибнуть в ближайшие года полностью, но главное не сдаваться. Возможно 100 лет экспериментов хватит, чтобы более менее поддерживать жизнь кожаных ублюдков. Но это все еще далеко от идеала, еще лет 1000 нужно, чтобы ИИ в плюс начал выходить
раскрыть ветку (9)
7
Автор поста оценил этот комментарий
Так в ИИ, кроме как правил игры, ничего другого не загружали, оно 'самообучилось'. Это в StockFish закачали овердохуллиард баз с партиями.
раскрыть ветку (2)
4
Автор поста оценил этот комментарий
Ну так самообучалось то ИИ не перечитыванием правил, а тысячами игр (=пробы и ошибки)
раскрыть ветку (1)
Автор поста оценил этот комментарий
Смысл не учить на том, что уже есть.
Смысл - рассказать правила, и дать волю с ними поработать.
Проблкма с алгоритмами правил, т.к. люди себя довольно отвратительно ведут в этом мире... ))
Автор поста оценил этот комментарий

Да, давай дадим ии расходный материал еще, чтобы было чем нас ебашить)

Автор поста оценил этот комментарий
Симуляции
раскрыть ветку (2)
5
Автор поста оценил этот комментарий
Нельзя симулировать человеческое поведение. Экономика и история не дают закономерностей, только наблюдения
раскрыть ветку (1)
1
Автор поста оценил этот комментарий

Мне кажется, какие-то общие правила есть. Все же, по сути, хотят одного и того же.

Автор поста оценил этот комментарий

Ну он же в шахматы сам с собой играл - он не может в каких нибудь Симс просимулировать всю историю за несколько секунд?

раскрыть ветку (1)
4
Автор поста оценил этот комментарий
при симуляции в симс или любой другой подобной программе даже мельчайшее отличие от реального человеческого поведения может развернуть курс обучения на 180 градусов
4
Автор поста оценил этот комментарий
Лучше в покер научили
раскрыть ветку (19)
5
Автор поста оценил этот комментарий
Я так в шашки играл. Скачал приложение на смартфон. Запустил игру против компьютера, поставил сложность на максимум. На компе запустил онлайн шашки. Делал на смартфоне ходы как мой оппонент в сетевой игре, а сам ходил так как ходил ИИ на смартфоне. Само собой, результат был стопроцентный выигрыш в любой игре. Забавно, но ИИ начинал игру странными ходами, иногда нарочно отдавая свои шашки противнику, но всегда выигрывал...
11
Автор поста оценил этот комментарий
А если серьезно, этот ии сможет управлять войсками (не российскими) лучше тысячи генералов. Это страшнее атомной бомбы. Эффективная армия. Сократят всё руководство армии. Генеральские зарплаты пойдут на разработку новых вооружений. И оставят только программистов и несколько профессиональных военных. Не удивлюсь если эта ии проходит обкатку в каком нибудь конфликте сейчас.
раскрыть ветку (14)
8
Автор поста оценил этот комментарий

пока что это ИИ для полностью известными состояниями позиций. В войне про противника все не знаешь.

раскрыть ветку (3)
3
Автор поста оценил этот комментарий

ИИ для полномасштабной разведывательной деятельности - объединение спутников, стационарных и мобильных средств разведки, анализ донесений агентуры и, конечно, массивная армия ботов для сбора сведений в Интернете. Классификация и категоризация всего и вся - от персонала до авианосца. Расчет баллистических ракет и стратегического вооружения. Расчет событий и потерь.

раскрыть ветку (1)
Автор поста оценил этот комментарий
Все перечисленное логично для человека. Машина сама должны придумать, должны быть задача и правила.
2
Автор поста оценил этот комментарий
На современном уровне разведки? сомневаюсь в вашем утверждении.
5
Автор поста оценил этот комментарий
Загружаем ИИ в Цивилизацию. Ждём от 2х до 4х часов...
2
Автор поста оценил этот комментарий
Один вирус и армии капец
Автор поста оценил этот комментарий

Несколько сократят штабы - их роль возьмут на себя "железяки". А ВСЁ руководство армии не сократят, потому как машина может выдать оптимальное решение на войну, операцию, бой, но не может обеспечить его исполнение. В самом грубом виде,пример обеспечения: "приказываю взять высоту к 12:00, а не то пойдешь под трибунал". Это грубо, на самом деле у умных командиров всё тоньше, просто для примера.

А боевая подготовка в мирное время - как без командования?

1
Автор поста оценил этот комментарий

А почему не российскими?

раскрыть ветку (6)
5
Автор поста оценил этот комментарий
А вы слышали об аналогичных российских разработках?
раскрыть ветку (5)
1
Автор поста оценил этот комментарий
Если они и есть то такие вещи должны быть особо секретными. И утечка подобных данных должна быть = гос.измене.
раскрыть ветку (2)
1
Автор поста оценил этот комментарий
Все как всегда услышали то, что захотели. Я спрашивал про отечественные аналоги ии из статьи.
раскрыть ветку (1)
Автор поста оценил этот комментарий
Штирлиц ещё никогда не был так близок к провалу))
4
Автор поста оценил этот комментарий

Да я и достоверных иностранных разработках не слышал.

Автор поста оценил этот комментарий
Единая система управления полем боя, как-то так звучала.
Автор поста оценил этот комментарий

Покер не прокатывает изза неполноты информации

Автор поста оценил этот комментарий

так научили уже в общем)

Автор поста оценил этот комментарий
Стриппокер
1
Автор поста оценил этот комментарий

Чет мне уже и так очково... давайте не будем!

1
Автор поста оценил этот комментарий
Лучше по биологии, пусть изобретет лекарство от всех болезней и бессмертие.
раскрыть ветку (3)
2
Автор поста оценил этот комментарий
Все поверят, скушают лекарство и умрут. Так роботы убьют всех человеков, осуществитмя мечта Бендера)
Автор поста оценил этот комментарий

и как мы будем жить если никто не будет умирать? тогда нужно будет запрещать рождение новых людей

раскрыть ветку (1)
Автор поста оценил этот комментарий
Вселенная бесконечна?
2
Автор поста оценил этот комментарий
В её. *фейспалм. Де ж вы беретесь
Вы смотрите срез комментариев. Чтобы написать комментарий, перейдите к общему списку