Нейронные сети рвут суперкомпьютер в шахматы. Что дальше?⁠⁠

AlphaZero на сегодняшний день играет в шахматы сильнее всех в мире. Самообучающейся шахматной машине AlphaZero удалось обыграть прежнего компьютерного чемпиона, даже укомплектованного дебютными базами...

Поразительные результаты тестирования обновленной версии искусственной нейронной сети AlphaZero опубликовала компания по разработке искусственного интеллекта DeepMind 7 декабря 2018 года, напомнив всем о том информационном взрыве, причиной которого стал шахматный матч с одной из сильнейших компьютерных программ Stockfish, сыгранный в декабре прошлого года.

Результаты не оставляют сомнения в том, что AlphaZero на сегодняшний день играет в шахматы сильнее всех в мире. Обновленная версия AlphaZero вновь разгромила прежнего компьютерного чемпиона — программу Stockfish (версия 8) — в новом 1000-партиевом матче. При этом AlphaZero удалось выиграть 155 партий, 839 раз — сыграть вничью и проиграть всего 6 партий.

AlphaZero также превзошел Stockfish в серии матчей c неравным временным контролем, уверенно побив программу с классическим алгоритмом принятия решений, даже в условиях предоставления ей 10-кратной форы по времени на обдумывание ходов.

Как сообщили в компании DeepMind, с практически идентичным результатом AlphaZero превзошел и девятую версию Stockfish — новейшую по состоянию на 13 января 2018 года.

По данным DeepMind, самообучающейся шахматной машине AlphaZero удалось обыграть прежнего компьютерного чемпиона, даже укомплектованного дебютными базами, хотя наличие баз всё же помогло Stockfish, позволив программе выиграть белым цветом несколько игр. Тем не менее, этого оказалось недостаточно для общего выигрыша матча.

Результаты AlphaZero против последней версии программы Stockfish, а также против программы Stockfish, укомплектованной дебютными базами (победы – зеленый; поражения – красный, ничьи – серый)

Из презентации компании DeepMind для журнала Science

Все это перечеркнуло главные аргументы о необъективности выводов, сделанных по результатам матча, сыгранного в конце 2017 года. Тогда, как считали многие, контроль времени по одной минуте на ход явно ущемлял возможности программы Stockfish.

С контролем три часа на партию плюс 15 секунд на каждый ход подобного аргумента приведено быть не может, так как предоставленное время является огромным для любого компьютера.

В партиях с неравным контролем времени программа Stockfish начала обыгрывать AlphaZero только тогда, когда ее преимущество перед соперником составило 30 к 1. В матче с 10 кратным преимуществом по времени в пользу Stockfish, самообучающаяся шахматная машина AlphaZero вновь одержала уверенную победу.

Результаты, показанные AlphaZero в матчах с неравным контролем времени, свидетельствуют не только о том, что данная программа является намного более сильной, чем любой традиционный «шахматный движок», но и о том, что она использует намного более эффективный алгоритм расчета. По данным DeepMind, AlphaZero использует дерево поиска Монте-Карло, просчитывая приблизительно 60 тысяч ходов в секунду, что в тысячу раз уступает (!) возможностям Stockfish (60 миллионов ходов в секунду).

Иллюстрация расчета вариантов со стороны AlphaZero

Из презентации компании DeepMind для журнала Science

Что же поклонники компьютерных шахмат могут почерпнуть, познакомившись с этими результатами? Во-первых, AlphaZero утвердился в статусе сильнейшего шахматного игрока в мире. Но это еще не всё. Если Вы следите за развитием искусственного интеллекта, то продемонстрированные результаты окажутся для Вас еще более интригующими. Алгоритм расчета AlphaZero является одинаковым как для шахмат, так и для популярных в азиатских странах настольных игр «го» и «сёги».

AlphaZero смогла побить лучшие компьютерные программы во всех трех играх, имея в своем распоряжении только правила игры и несколько часов на самообучение. Обновленные результаты самообучающейся машины AlphaZero компания DeepMind предоставила ровно через год после первой победы, одержанной над Stockfish.

Комментируя партии AlphaZero, сыгранные в первом матче против Stockfish в декабре 2017 года, многие ведущие шахматные гроссмейстеры не скрывали своего изумления от увиденного. В числе аргументов, вносивших во всеобщую оценку некий элемент сдержанности, было то, что в 2017 году программа Stockfish была лишена электронных дебютных баз (того огромного опыта, который человечеству удалось накопить за сто с лишним лет развития шахматной теории), а также была существенно ограничена во времени. Тем не менее, сегодняшние результаты, предоставленные компанией DeepMind, показывают, что учет пожеланий критиков существенным образом не меняет картины.

Тогда экспертов шахматного мира поразила не столько филигранность техники AlphaZero, сколько способность машины принимать за доской совершенно, казалось бы, некомпьютерные «творческие» решения. Так, например, комментируя одну из партий матча, международный гроссмейстер Сергей Шипов обратил внимание на отказ AlphaZero от немедленного следования сильнейшему варианту и возвращение к нему через промежуточное повторение ходов, как если бы машиной руководило желание проверить реакцию соперника.

«Меня потрясли „человеческие“ рефлексы AlphaZero при выборе хода и удивительное для „новичка шахмат“ понимание позиции с нестандартным (нарушенным) материальным равновесием. Это, честно говоря, удивительно», — констатировал Шипов.

В свою очередь, другой российский гроссмейстер Петр Свидлер в 2017 году в беседе с Сергеем Шиповым, давая оценку игре AlphaZero, отметил факт выигрыша машиной нескольких «совершенно сногсшибательных партий в новоиндийской защите». Как заявил Свидлер, то, что продемонстрировала машина, лишенная дебютных баз и имеющая несколько часов на самообучение, — «это центральная теория, которую, я помню, Боря Гельфанд сотоварищи, Лёва Аронян (международные гроссмейстеры Борис Гельфанд и Левон Аронян — прим. ИА Красная Весна) поднимали с нуля лет десять назад».

«Железяка сама начинает так ходить?», — задается вопросом Свидлер. «Нам говорят, что книги у нее нет, — подчеркивает Свидлер, — что она в такую бесову силу играет, что, несколько часов поучившись, в состоянии повторять то, что люди годами искали в новоиндийской защите».

«Кроме восторга от того, что машина делает, у меня глаза полезли на лоб, когда я увидел эти дебюты. Потому что, ну, елки-палки, если на самом деле она в состоянии с нуля воспроизвести дебютные находки и еще усилить их — это, конечно, на меня сногсшибательное впечатление произвело», — добавил Свидлер, заключив при этом, что не верит в какую-либо фальсификацию со стороны компании DeepMind.

И, конечно, обратили внимание гроссмейстеры, в этой связи нельзя не задать вопрос о применении AlphaZero далеко за пределами мира шахмат.

«Они потратили четыре часа на шахматы, — рассуждает международный гроссмейстер Сергей Шипов, — потом за два часа они разбомбили сёги. Соответственно, ясно, что теперь они будут решать совершенно другие задачи. Для них шахматы — просто мелочь какая-то».

Соглашаясь с мнением своего коллеги, аналогичную точку зрения высказывает и Пётр Свидлер: «Совершенно понятно, что они занимаются созданием искусственного интеллекта не для того, чтобы играть в настольные игры».

«А чем же будет этот монстр заниматься на самом деле, не военной ли отраслью?», — спрашивает Сергей Шипов, обращая при этом внимание на то, что на фоне всех этих достижений в области создания искусственного интеллекта «человек становится каким-то уж совсем жалким и ничтожным».

Свидлер оставляет данный вопрос без ответа, согласившись, что проблема неконтролируемого развития в данной сфере действительно является поводом для беспокойства.

...

Источник

294

Вы смотрите срез комментариев. Показать все

163

sobelman74

5 лет назад

Учебники по физике загрузили бы в её. Может быть уже телепортацию придумала.

раскрыть ветку (68)

288

DELETED

5 лет назад

Комментарий удален. Причина: данный аккаунт был удалён

раскрыть ветку (2)

porewo

5 лет назад

Они и так потихоньку на марс съебывают

SonderSchule

5 лет назад

И правильно сделает.

svcpp

5 лет назад

Я надеюсь что доживу до того времени, когда ИИ будет активно использоваться в медицине, и желательно с онлайн-интерфейсом.

Красота же: загрузил все свои жалобы и результаты анализов в формочку на сайте, и тебе выдалась пачка рекомендаций и лечение. Никаких тебе очередей в поликлинику и неправильно поставленных диагнозов потому что доктор был с похмелья.

раскрыть ветку (23)

MODRATORY.G0VN0

5 лет назад

Нахер медицину. Пусть судьёй назначат.

раскрыть ветку (5)

DELETED

5 лет назад

"Убить всех человеков, это паразиты на теле Земли"

ещё комментарии

grimmerio

5 лет назад

Ну нахер. Ибо - в результате драки с Ивановым И. И. вы разбили его смартфон с новейшим андроидом и самым мощным процессором, моего дальнего, но такого любимого родственника. Расстрелять -с!!

раскрыть ветку (1)

iii0123

5 лет назад

На самом деле будет всё без эмоций. Проблема в другом. Для обучения нужны примеры. А если за примеры брать текущую судеьную систему, результат может быть очень неожиданным

PopovPS

5 лет назад

Не назначат. Либо ограничат использование решений в судебной практике. Вы же не можете всерьез говорить что наши политики и чиновники согласятся чтобы их ЧЕСТНО судили?

Voler

5 лет назад

Таааак... Загрузил жалобы в формочку и получил ответ? Где-то я такое уже видел... Где же? А вот!

раскрыть ветку (3)

DELETED

5 лет назад

Откуда кадр?))

раскрыть ветку (1)

Keinan

5 лет назад

"Идиократия"

Nik.bo

5 лет назад

Но там всё равно был врач. Укуреный, но врач

TTTriforce

5 лет назад

Так уже пилят такое.

https://yandex.ru/search/?lr=2&text=%D0%BD%D0%B5%D0%B9%D...

Dimax07

5 лет назад

А как же человеческий фактор, это назначить изначально не то лечение и смотреть, как человек мучается.

Geengulo

5 лет назад

Лет 10 назад в нашем универе что-то подобное пытались запилить. Свалились на сложности оцифровки данных, их недостаточном количестве и, конечно, на дикой бюрократии.

shpungout

5 лет назад

Вопрос в том, сможет ли человек объективно оценить свои симптомы, и какие из них он посчитает существенными, а какие забудет упомянуть. Не говоря уже о том, что "формочка на сайте" не сможет провести визуальный и физический осмотр.

Если человек сможет правильно оценить свое состояние, то ничто не мешает ему и сегодня воспользоваться интернетом и найти заболевание под свои болячки.

pupsichekk

5 лет назад

Такие проекты уже есть, индивидуальная медицина называются. Через пару тройку лет будут коммерческие решения думаю (в ии там нет смысла, и нейронная сеть справится)

Metafizik

5 лет назад

Не проканает: "все лгут" (с) д-р Хаус.

hal99

5 лет назад

Так уже есть. Куча сайтов, задаёшь симптомы, тебе выдаёт вероятные заболевания, с процентом вероятности по каждому. Я так изжогу себе вылечил. Сначала продиагностировался на трёх разных сайтах, потом почитал, как лечиться и какие лекарства покупать. Теперь не мучаюсь, изжога прошла.

раскрыть ветку (5)

Dimax07

5 лет назад

Подскажи, как лечился 10 лет мучаюсь

раскрыть ветку (2)

hal99

5 лет назад

Перестал жрать майонез и сладкий чай в товарных количествах.

hal99

5 лет назад

Потом разговорился с другом, у него ещё хуже проблема была - дикие боли в желудке. Но ему попался хороший гастроэнторолог, посоветовавший год не есть мяса. Потом за 15 лет болей не проявлялось.

Kwasya

5 лет назад

Сайты подскажи?

раскрыть ветку (1)

hal99

5 лет назад

Сейчас уж и не вспомню, но нашёл за пять минут.

isohdfs27

5 лет назад

Без физического осмотра врачём многое может упустить такая система, какой бы хорошей она не была.

liberalistka

5 лет назад

Или по истории и экономике - может быть уже идеальный строй и законы были бы..

раскрыть ветку (14)

AlexKS

5 лет назад

Ага.

Или в в "Мстители. Эра Альтрона". Там то же самое сделали, в итоге робот посчитал что человечество должно умереть.

раскрыть ветку (3)

D1mitriy

5 лет назад

По американски да.

раскрыть ветку (2)

Rypudaaa

5 лет назад

Какая-то подспудная мысль о суициде общества.

раскрыть ветку (1)

D1mitriy

5 лет назад

Нет понятия справедливости, есть понятие сильного.

Laralex

5 лет назад

Плюс настольных игр - можно учиться методом проб и ошибок (а на этот ИИ пока и работают). Допустим, можно загрузить предварительно в ИИ весь человеческий опыт по истории и экономике, но это не значит, что ИИ создаст из этого опыта (возможно далеко от идеального) хороший строй. Единственный выход для тренировки ИИ - создать государство с парой миллионов кожаных рабов и ИИ во главе. Каждую неделю ИИ будет экспериментировать с строем. В силу неопытности ИИ, эти рабы могут погибнуть в ближайшие года полностью, но главное не сдаваться. Возможно 100 лет экспериментов хватит, чтобы более менее поддерживать жизнь кожаных ублюдков. Но это все еще далеко от идеала, еще лет 1000 нужно, чтобы ИИ в плюс начал выходить

раскрыть ветку (9)

zoomer543

5 лет назад

Так в ИИ, кроме как правил игры, ничего другого не загружали, оно 'самообучилось'. Это в StockFish закачали овердохуллиард баз с партиями.

раскрыть ветку (2)

Laralex

5 лет назад

Ну так самообучалось то ИИ не перечитыванием правил, а тысячами игр (=пробы и ошибки)

раскрыть ветку (1)

Terravetus

5 лет назад

Смысл не учить на том, что уже есть.
Смысл - рассказать правила, и дать волю с ними поработать.
Проблкма с алгоритмами правил, т.к. люди себя довольно отвратительно ведут в этом мире... ))

pupsichekk

5 лет назад

Да, давай дадим ии расходный материал еще, чтобы было чем нас ебашить)

Libr0air

5 лет назад

Симуляции

раскрыть ветку (2)

Laralex

5 лет назад

Нельзя симулировать человеческое поведение. Экономика и история не дают закономерностей, только наблюдения

раскрыть ветку (1)

OlgaBush

5 лет назад

Мне кажется, какие-то общие правила есть. Все же, по сути, хотят одного и того же.

liberalistka

5 лет назад

Ну он же в шахматы сам с собой играл - он не может в каких нибудь Симс просимулировать всю историю за несколько секунд?

раскрыть ветку (1)

rod98

5 лет назад

при симуляции в симс или любой другой подобной программе даже мельчайшее отличие от реального человеческого поведения может развернуть курс обучения на 180 градусов

cloquet

5 лет назад

Лучше в покер научили

раскрыть ветку (19)

Yanesmog

5 лет назад

Я так в шашки играл. Скачал приложение на смартфон. Запустил игру против компьютера, поставил сложность на максимум. На компе запустил онлайн шашки. Делал на смартфоне ходы как мой оппонент в сетевой игре, а сам ходил так как ходил ИИ на смартфоне. Само собой, результат был стопроцентный выигрыш в любой игре. Забавно, но ИИ начинал игру странными ходами, иногда нарочно отдавая свои шашки противнику, но всегда выигрывал...

Galefax

5 лет назад

А если серьезно, этот ии сможет управлять войсками (не российскими) лучше тысячи генералов. Это страшнее атомной бомбы. Эффективная армия. Сократят всё руководство армии. Генеральские зарплаты пойдут на разработку новых вооружений. И оставят только программистов и несколько профессиональных военных. Не удивлюсь если эта ии проходит обкатку в каком нибудь конфликте сейчас.

раскрыть ветку (14)

Mikalkis

5 лет назад

пока что это ИИ для полностью известными состояниями позиций. В войне про противника все не знаешь.

раскрыть ветку (3)

borodin.devel

5 лет назад

ИИ для полномасштабной разведывательной деятельности - объединение спутников, стационарных и мобильных средств разведки, анализ донесений агентуры и, конечно, массивная армия ботов для сбора сведений в Интернете. Классификация и категоризация всего и вся - от персонала до авианосца. Расчет баллистических ракет и стратегического вооружения. Расчет событий и потерь.

раскрыть ветку (1)

Terravetus

5 лет назад

Все перечисленное логично для человека. Машина сама должны придумать, должны быть задача и правила.

Galefax

5 лет назад

На современном уровне разведки? сомневаюсь в вашем утверждении.

kotomoore

5 лет назад

Загружаем ИИ в Цивилизацию. Ждём от 2х до 4х часов...

kitilan

5 лет назад

Один вирус и армии капец

vladvladlen

3 года назад

Несколько сократят штабы - их роль возьмут на себя "железяки". А ВСЁ руководство армии не сократят, потому как машина может выдать оптимальное решение на войну, операцию, бой, но не может обеспечить его исполнение. В самом грубом виде,пример обеспечения: "приказываю взять высоту к 12:00, а не то пойдешь под трибунал". Это грубо, на самом деле у умных командиров всё тоньше, просто для примера.

А боевая подготовка в мирное время - как без командования?