256

Ли Седоль против Альфаго - что же там произошло?

Думаю многие уже слышали о том, что марте 2016-го прошёл матч по игре в го между новой программой AlphaGo (назовём её просто Альфой, для краткости) и одним из сильнейших игроков планеты Ли Седолем, в котором он проиграл.

Сам я довольно слабый любитель (и очевидно слоупок), но попытаюсь вспомнить и разобраться в этой ситуации - благо анализа этого события в интернете немерено. Например разборы партий от Александра Динерштейна.


Что из себя представляет AlphaGo?

Это хитро устроенная многоуровневая нейросеть, которая при работе использует старый добрый метод Монте-Карло, так что принцип игры альфы здорово напоминает Mogo. Например, когда когда Альфа уверена в победе - она делает слабые ходы, которые не дают много очков. Её вполне устроит победить с преимуществом и в пол очка - так что излишне прессовать противника она не будет. На мой взгляд это надёжный, но скучноватый подход.

Ну а поскольку это нейросеть - никто, даже сами разработчики, не знают как она думает и почему она сделала этот ход, а не тот.

Ли Седоль против Альфаго - что же там произошло? GO, Игры, Длиннопост

Пожалуй история началась с того, что в октябре Альфа выиграла у трёхкратного чемпиона Европы Фань Хуэя. Причём с разгромным счётом 5:0! Flawless victory!

Непосвящённым сложно понять насколько невероятной и шокирующей для всех любителей го была эта новость.

Только что сильнейшие компьютеры играли на уровне сильных любителей (профессионалы их легко уделывали даже давая им огромную фору) - и вдруг такое.

Считалось что компьютеры смогут играть на уровне мастера разве что через десятки лет. Да, даже мобильники нынче играют в шахматы сильнее чемпиона мира, но аналогия тут слабая - го на сотни порядков сложнее шахмат - эта не та игра которую можно просчитать.

Хотя паники ещё не было и надежда оставалась. Всё таки европейский чемпион это совсем не чемпион мира. Может он играл несерьёзно или противника недооценил. Тем более что на разборах этих игр многие увидели кучу ошибок и с той и с другой стороны. Были даже подозрения что чемпиону приплатили чтобы он беспалевно слил матч. Поэтому надвигающийся матч между топовым профессиональным игроком Ли Седолем и новым суперкомпьютером все ждали с нетерпением.


Тут важно понять кто такой Ли Седоль.

В Корее - стране двинутой на играх - самые двинутые становятся профессиональными игроками и зарабатывают после этого безумные деньги играя в игры.

Например: профессиональный игрок в Старкрафт. Да, бредовато звучит, но такая уж она, Корея.

Так вот Ли Седоль стал профессиональным игроком в го в 13 лет! А стать профессионалом очень непросто (и это мягко сказано) - отбор там суровый.

Мало обладать огромным талантом - надо с раннего детства, всю жизнь вкалывать с утра до вечера - не видя белого света только изучать эту игру. Как результат - корейский пацан может впух и впрах разнести какого нибудь нашего чемпиона.

Сейчас Ли входит в пятёрку сильнейших игроков мира и выиграл более 800 турниров! Не верилось что этот чудо игрок, боец, профессионал, не способный ошибаться, умудрится слить. Все были уверены в его победе.

Ли Седоль против Альфаго - что же там произошло? GO, Игры, Длиннопост

Сам Седоль охотно принял вызов: почему бы и нет - одолеть не доработанную программу, играющую пока довольно слабо, и получить миллион баксов - кто бы отказался. Он рассчитывал на лёгкий выигрыш. “Через два-три года Google захочет взять реванш - и вот тогда играть будет интересней” сказал он.


И вот началась первая партия (Альфа играет за белых): http://gokifu.com/s/2ipk-gokifu-20160309-Lee_Sedol%289p%29-A...

Ли Седоль против Альфаго - что же там произошло? GO, Игры, Длиннопост

Уже в самом начале игры Ли сходу сломал шаблон нарисовав седьмым ходом китайское фусеки, у которого центральный камень сдвинут на один пункт - то есть изменил стандартный розыгрыш начала игры. Он выбрал антикомпьютерную стратегию, хотел чтобы компьютер отошёл от известных шаблонов и начал думать сам.

Есть мнение - что это и было одной из причин его поражения.


Девятым ходом Ли сыграл никкентакабасами (что приятно). То есть атаковал камень белых, взяв его в окружение. Комп не стал выпрыгивать из клещей, как это обычно делается, а сыграл прилипание. В книжках, кстати, этот ход считается ошибочным (комментатор тоже про это упомянул).

Пятнадцатым ходом Ли усилил угол и продолжил атаку на камни белых. Мог бы и мирно построить базу наверху, но это было бы не в его стиле.

Альфа же нарастила белую стенку и сама атаковала атакующий его камень. Так что с агрессивностью у неё всё в порядке.

23 ход - цуке был необычным и привёл к жутко сложной борьбе. При этом много белых и чёрных групп пытались задушить и разрезать друг друга.

Смотреть на подобную борьбу довольно интересно - начинаешь думать как бы ты сам сыграл - и тут тебе показывают сильный неожиданный ход, который атакует во все стороны и имеет продолжения. В этом сила го - её ходы могут понять даже начинающие.


К 77 ходу борьба вроде стабилизировалась и позиция чёрных выглядит неплохо - они сделали большой мешок в центре. Ли должно быть расслабился и захавал этим ходом 2 белых камня.

Ход 86 сделанный альфой снова необычен - совсем не из книжек.

Ли вскоре закрывает свой мешок, получив очки. Должно быть он был доволен исходом и ещё немного расслабился.

И вот на 102 ходу Альфа вторглась на позиции черных. Очень сильный и неожиданный ход (может даже божественный) - его никто не предвидел!

Ли Седоль против Альфаго - что же там произошло? GO, Игры, Длиннопост

И тем обиднее, что его вполне можно было предотвратить, вовремя сделав угрозу разрезания в O9 (гарантированное сенте). Ли такого уровня игры должно быть не ожидал, а белую стенку Альфы рассматривал скорее как жертву, а не как угрозу.

После этого хода возникает множество сложных вариантов, часто неприятных для чёрных. И закончилось это вторжение катастрофично для Ли - потеря очков, потеря инициативы да ещё и слабые позиции, которые можно порезать.

В общем, к 186-му ходу Ли признал своё поражение.

По итогам: Ли в шоке, профессиональные игроки в шоке, остальные просто в офигевании.


Сам глава DeepMind сказал что причина того, что программа, которая вроде как обучалась просматривая человеческие партии, стала делать такие нечеловечески сильные ходы благодаря тому что пять месяцев Альфа тренировалась играя со своими по разному модифицированными копиями. То есть всё это время компьютер исследовал игру, тренировался. А 5 месяцев для компьютера - всё равно что эпоха для человека.


продолжение следует

Найдены дубликаты

+20

Сразу вспоминаю старого доброго Айзека Азимова. По моему, пора уже и в калькуляторы зашивать три закона робототехники. На всякий случай.

раскрыть ветку 2
+14

Поздно. У них уже и свои шахиды появились в лице Galaxy Note 7.

+2
А нах это компьютерам(роботам)? Они не стареют, они могут планировать на десятилетия вперед. Им не нужна еда и одежда, т.е. ради роскоши или от голода они не начнут убивать. Самая большая опастность от роботов была описана в мультфильме "Валли". Люди просто станут не жизнеспособным стадом.
+11
Для всяких шахмат и го они могут сильного искусственного противника создать, а как до видеоигр доходит, то все пиздец приплыли, а жаль.
раскрыть ветку 4
+6

Вообще-то могут, но не хотят. В видеограх цель чтобы побольше народу их купило, и слишком сильный ИИ этому только помешает.

Я читал выступление разработчика ИИ для Civilization 4. Так вот, он рассказывал, что цель не была создать наиболее сильный ИИ, его цель была создать ИИ, которого людям будет интересно обыгрывать. Т.е. он должен быть с одной стороны не идиотом, но с другой стороны предсказуем и легко эксплуатируем, чтобы игроки постоянно ощущали "о, какой я умный, как я красиво его развел". Поэтому ему пришлось внедрять разнообразные слабые места в ИИ - есть часовая презентация в которой он рассказывает как это делал.

+1

Сейчас Google делает искусственный интеллект, который будет в StarCraft 2 играть.

+1

  Вот уж действительно. Сейчас поигрываю в Стелларис. Всем хороша игрушка, но ИИ запредельно тупой.

Например в моём секторе денег и минералов хоть жопой жуй, но на планетах безработица, а этот идиот вместо того чтобы клепать заводы и лабы - лениво клепает ненужные улучшения для космопортов. И так везде - у алиенов тоже. Идиократия блин...

  Малость вручную поправил скрипты на Lua - стал чуть менее тупым, но всё равно идиёт

0
Так AlphaGo это самостоятельная ОС на собственном железе, созданная с одной целью - играть в го. А у тебя есть всего лишь комп с ОС созданной для тысячи целей и простое железо, на которое если навесишь что-то серьёзнее скрипта на Lua, то производительность упадет в ноль. Но это не отменяет факта, что некоторые геймдевы даже не заморачиваются над ИИ
+3

Всё так расписано, будто там баталии уровня "Цивилизации" или любой другой пошаговой стратегии.
Очень даже интересно было почитать.

+2

разница между человеком и компутером в том, что компутер не совершает ошибок. научите компутер делать что-то правильно, и он всегда будет делать это правильно.

раскрыть ветку 4
-2
ЭВМ сможет выполнить безошибочно только тот алгоритм, в котором ему изначально известны входные данные и изначально известен результат, который должен получится при обработке  этих данных. Если что-то пойдет не так, а в реальной жизни всегда что-то идет не так, то возможны ошибки, вот и будь готов к непредвиденным последствиям.
раскрыть ветку 3
0
поэтому, когда машины победят, они не станут уничтожать людей. а загонят их в резервации и будут наблюдать :D
раскрыть ветку 2
0
Херовый он игрок, откровенно говоря. Тактик отличный, но настолько недооценивать противника и быть заочно уверенным в своей победе, так себя вести недостойно ни звания профессионала, ни звания адекватного игрока. Я доволен тем, что он проиграл, возможно, это собьет с него спесь.
0

Скажите, а вы на онлайн-го есть? Сам просто тоже заинтересовался, играть еще толком не умею, интересно было бы попробовать

раскрыть ветку 1
0

Играю иногда на https://www.gokgs.com/  

Клёвый сайт, там сидят все - и начинающие и профессионалы.

Зайти сначала под гостем, зарегистрироваться, а после этого играть. В чате можно попросить в русской комнате обучающую игру - наверняка кто нибудь поможет, объяснит.

  Правда после перерывов мои учётки там всё время стираются - так что регулярно завожу новые.

0

Вангую всплеск просмотров Хикару но Го

0

Очень интересно!Представляю как было сложно все это написать

-2

В части в которой служит по контракту мой брат поставили вот такую штуку.

https://rg.ru/2016/11/10/reg-cfo/v-kaluzhskoj-oblasti-proshl...

https://www.youtube.com/watch?v=iiw1LHJGLeE

Брат говорит, что они поссыкивают ставить комплекс в полностью автоматический режим и между собой называют Скайнет.

раскрыть ветку 7
+2

Мне интересно, как в автоматическом режиме будет работать система свой-чужой? Отличать по форме, знакам различия?

раскрыть ветку 6
+2

А не надо систему распознавания. Просто сделать возможность удалённого отключения. например, модуль радиоприёмника, "слушающий" определённый набор частот и, в случае передачи кодовых сигналов по разным частотам в заданной последовательности - система отключается. А всё остальное время тупо мониторит возможных вторженцев и ликвидирует их. Своих же просто предупредить, что за определённой чертой жизни нет. В таком случае кто сунется - сам виноват. Просто и надёжно

раскрыть ветку 5
-3

А 5 месяцев для компьютера - всё равно что эпоха для человека.

Эпоху от эпохи отделяют события а не время, т.е эпоха может длится 1 день.

Например эпоху динозавров закончилась падением метеорита, началась новая эпоха.

автор лс.

раскрыть ветку 5
+3

  Хотел написать геологическая эпоха ))

При обучении через АльфаГо прогнали чуть ли не миллионы партий

раскрыть ветку 4
+1

@nikkentakabasami, очень интересный пост, читал с удовольствием! Буду ждать продолжения (подписался на Вас). Следил за всем играми AlphaGo и сначала тоже сомневался в силе нейросети, но потом...все увидели, что случилось.


Кстати, как считаете, чемпион мира по шахматам Магнус Карлсен смог бы потягаться с тем же Deep Blue? Или компьютер в любом случае выиграет шахматную партию, независимо от силы человеческого разума?

раскрыть ветку 2
0

Не, прост комп все равно не чувствует времени, так что для него это и не эпоха, и не секунда)

-4
Иллюстрация к комментарию
-6

Лет 15 назад читал в "Компьютерре", что то, что компьютер обыграл человека в шахматы - ничего не значит, это тупой перебор вариантов, там, конечно используются какие-то эвристики, но никак Deep Blue не подходит под понятие ИИ. А вот го - имеет столько вариантов, что просчитать их невозможно, что когда комп обыграет человека в го - вот тогда можно будет говорить об искусственном интеллекте, там даже сомневались, что это вообще возможно. А в результате - банальные (ну, может не совсем) нейросети, в которых многие уже давно разочаровались. Да и в других сферах, если посмотреть, тоже интересная движуха пошла (автопилоты, Watson...). Как-то неожиданно - не понадобилось никаких революций и прорывов вроде квантового компьютера, просто медленная, планомерная эволюция традиционного харда и софта. Кажется, философы изучающие сознание и мышление, строящие множество гипотез, скоро останутся без работы.

раскрыть ветку 1
+8
Ну нейросеть совершенно не банальная, за последние N лет появилось несколько прорывных идей, вдохновлённых изучением мозга. Те же свёрточные сети. Так что мини-революции, которые двигают эволюцию, скорее.
-7

"го на сотни порядков сложнее шахмат" - любитель го хотел унизить шахматы,но все что у него вышло - показать что с математикой у него туго.

раскрыть ветку 15
+3

Да ладно тебе, не бомби. Го реально сложнее шахмат, с этим глупо спорить.

раскрыть ветку 12
0

И поэтому первая же нормальная ( не у любителей на коленке ) попытка создать программу для игры в Го увенчалась успехом и обыграла человека в одну калитку.

В то время как в шахматы, крупные корпорациями ( в т.ч. IBM ) по десять лет вкладывали деньги, но никак не могли обыграть человека до определенного момента.

раскрыть ветку 3
-4

Сложнее на 1-2 порядка максимум.НО НЕ СОТЕН.Разница космических масштабов.

раскрыть ветку 7
+1

Да ладно, сглючил немного. В geektimes как то писали что го в гугол раз сложнее шахмат - оттуда подцепил.

  Сам я даже не представляю как можно подсчитать общее число ходов в го.

В первую очередь в голову приходит число 360!, однако нужно учитывать ко борьбу, зеркальную идентичность начальных позиций и то, что после снятия камней с доски на пустом месте снова можно играть. В теории число возможных ходов - бесконечно (игроки могут затянуть игру до бесконечсоти, если хотят)

раскрыть ветку 1
-1

Как и в шахватах, если хотят. А хотение бесконечности учитывать не нужно, нужно предполагать, что противники будут играть до победы или ничьи.

-8

вот бы нейросеть в игры современные аля дотка что бы 10к ммр взял, или кс го, ну wow там.

Бота заиметь нейросетевого что бы он качал меня в WoW пока я работаю

раскрыть ветку 4
0

Изи сделать бота, который будет поднимать ммр в дотке, просто потому что у него реакция и движение мышки занимает 0 времени, в отличие от человека

0

в вов могут играть и обычные боты

какой смысл в боте для доты? Ты в доту играешь, что бы удовольствие получать или ммр? Если ммр, то у меня для тебя плохие новости

раскрыть ветку 2
+4

Есть школьники, готовые отдавать свой полугодовой запас наличности, сэкономленной с завтраков, за акк с овер9000 ммр. Поэтому я бы и от бота не отказался бы.

0
обычные боты в вове не могут искать группу для подземелья , или лучше самому создать ее с тим спиокм и всем вытекающим , что бы тактику рассказывал и  т д.
ещё комментарии
Похожие посты
Похожие посты не найдены. Возможно, вас заинтересуют другие посты по тегам: