Ли Седоль против Альфаго - что же там произошло?

Думаю многие уже слышали о том, что марте 2016-го прошёл матч по игре в го между новой программой AlphaGo (назовём её просто Альфой, для краткости) и одним из сильнейших игроков планеты Ли Седолем, в котором он проиграл.

Сам я довольно слабый любитель (и очевидно слоупок), но попытаюсь вспомнить и разобраться в этой ситуации - благо анализа этого события в интернете немерено. Например разборы партий от Александра Динерштейна.


Что из себя представляет AlphaGo?

Это хитро устроенная многоуровневая нейросеть, которая при работе использует старый добрый метод Монте-Карло, так что принцип игры альфы здорово напоминает Mogo. Например, когда когда Альфа уверена в победе - она делает слабые ходы, которые не дают много очков. Её вполне устроит победить с преимуществом и в пол очка - так что излишне прессовать противника она не будет. На мой взгляд это надёжный, но скучноватый подход.

Ну а поскольку это нейросеть - никто, даже сами разработчики, не знают как она думает и почему она сделала этот ход, а не тот.

Ли Седоль против Альфаго - что же там произошло? GO, Игры, Длиннопост

Пожалуй история началась с того, что в октябре Альфа выиграла у трёхкратного чемпиона Европы Фань Хуэя. Причём с разгромным счётом 5:0! Flawless victory!

Непосвящённым сложно понять насколько невероятной и шокирующей для всех любителей го была эта новость.

Только что сильнейшие компьютеры играли на уровне сильных любителей (профессионалы их легко уделывали даже давая им огромную фору) - и вдруг такое.

Считалось что компьютеры смогут играть на уровне мастера разве что через десятки лет. Да, даже мобильники нынче играют в шахматы сильнее чемпиона мира, но аналогия тут слабая - го на сотни порядков сложнее шахмат - эта не та игра которую можно просчитать.

Хотя паники ещё не было и надежда оставалась. Всё таки европейский чемпион это совсем не чемпион мира. Может он играл несерьёзно или противника недооценил. Тем более что на разборах этих игр многие увидели кучу ошибок и с той и с другой стороны. Были даже подозрения что чемпиону приплатили чтобы он беспалевно слил матч. Поэтому надвигающийся матч между топовым профессиональным игроком Ли Седолем и новым суперкомпьютером все ждали с нетерпением.


Тут важно понять кто такой Ли Седоль.

В Корее - стране двинутой на играх - самые двинутые становятся профессиональными игроками и зарабатывают после этого безумные деньги играя в игры.

Например: профессиональный игрок в Старкрафт. Да, бредовато звучит, но такая уж она, Корея.

Так вот Ли Седоль стал профессиональным игроком в го в 13 лет! А стать профессионалом очень непросто (и это мягко сказано) - отбор там суровый.

Мало обладать огромным талантом - надо с раннего детства, всю жизнь вкалывать с утра до вечера - не видя белого света только изучать эту игру. Как результат - корейский пацан может впух и впрах разнести какого нибудь нашего чемпиона.

Сейчас Ли входит в пятёрку сильнейших игроков мира и выиграл более 800 турниров! Не верилось что этот чудо игрок, боец, профессионал, не способный ошибаться, умудрится слить. Все были уверены в его победе.

Ли Седоль против Альфаго - что же там произошло? GO, Игры, Длиннопост

Сам Седоль охотно принял вызов: почему бы и нет - одолеть не доработанную программу, играющую пока довольно слабо, и получить миллион баксов - кто бы отказался. Он рассчитывал на лёгкий выигрыш. “Через два-три года Google захочет взять реванш - и вот тогда играть будет интересней” сказал он.


И вот началась первая партия (Альфа играет за белых): http://gokifu.com/s/2ipk-gokifu-20160309-Lee_Sedol%289p%29-A...

Ли Седоль против Альфаго - что же там произошло? GO, Игры, Длиннопост

Уже в самом начале игры Ли сходу сломал шаблон нарисовав седьмым ходом китайское фусеки, у которого центральный камень сдвинут на один пункт - то есть изменил стандартный розыгрыш начала игры. Он выбрал антикомпьютерную стратегию, хотел чтобы компьютер отошёл от известных шаблонов и начал думать сам.

Есть мнение - что это и было одной из причин его поражения.


Девятым ходом Ли сыграл никкентакабасами (что приятно). То есть атаковал камень белых, взяв его в окружение. Комп не стал выпрыгивать из клещей, как это обычно делается, а сыграл прилипание. В книжках, кстати, этот ход считается ошибочным (комментатор тоже про это упомянул).

Пятнадцатым ходом Ли усилил угол и продолжил атаку на камни белых. Мог бы и мирно построить базу наверху, но это было бы не в его стиле.

Альфа же нарастила белую стенку и сама атаковала атакующий его камень. Так что с агрессивностью у неё всё в порядке.

23 ход - цуке был необычным и привёл к жутко сложной борьбе. При этом много белых и чёрных групп пытались задушить и разрезать друг друга.

Смотреть на подобную борьбу довольно интересно - начинаешь думать как бы ты сам сыграл - и тут тебе показывают сильный неожиданный ход, который атакует во все стороны и имеет продолжения. В этом сила го - её ходы могут понять даже начинающие.


К 77 ходу борьба вроде стабилизировалась и позиция чёрных выглядит неплохо - они сделали большой мешок в центре. Ли должно быть расслабился и захавал этим ходом 2 белых камня.

Ход 86 сделанный альфой снова необычен - совсем не из книжек.

Ли вскоре закрывает свой мешок, получив очки. Должно быть он был доволен исходом и ещё немного расслабился.

И вот на 102 ходу Альфа вторглась на позиции черных. Очень сильный и неожиданный ход (может даже божественный) - его никто не предвидел!

Ли Седоль против Альфаго - что же там произошло? GO, Игры, Длиннопост

И тем обиднее, что его вполне можно было предотвратить, вовремя сделав угрозу разрезания в O9 (гарантированное сенте). Ли такого уровня игры должно быть не ожидал, а белую стенку Альфы рассматривал скорее как жертву, а не как угрозу.

После этого хода возникает множество сложных вариантов, часто неприятных для чёрных. И закончилось это вторжение катастрофично для Ли - потеря очков, потеря инициативы да ещё и слабые позиции, которые можно порезать.

В общем, к 186-му ходу Ли признал своё поражение.

По итогам: Ли в шоке, профессиональные игроки в шоке, остальные просто в офигевании.


Сам глава DeepMind сказал что причина того, что программа, которая вроде как обучалась просматривая человеческие партии, стала делать такие нечеловечески сильные ходы благодаря тому что пять месяцев Альфа тренировалась играя со своими по разному модифицированными копиями. То есть всё это время компьютер исследовал игру, тренировался. А 5 месяцев для компьютера - всё равно что эпоха для человека.


продолжение следует

Вы смотрите срез комментариев. Показать все
ещё комментарии
Вы смотрите срез комментариев. Чтобы написать комментарий, перейдите к общему списку