Теория игр за 10 минут

Друзья, привет!

Джон Нейман совсем недавно пропионерил одну интересную теорию. Срезанировало так, что появилось новое ответвление математики - теория игр. Собрал для вас немного материала по этой теме. Есть видео или текст :)

Среднестатический человек принимает решение каждые две секунды, т.е. за день у нас набегает порядка 35 000! Некоторые из этих решений, например, что съесть на обед или какой фильм сегодня посмотреть, принимаются в таком условном вакууме: т.е., результат зависит исключительно от вашего выбора. Однако результат множества других решений, например, куда пойти с друзьями или как вам с супругой воспитывать своих детей, зависит уже от предпочтений и целей по крайней мере еще одного человека.

И вот этот тип решений, которые принимаются при взаимодействии с другими людьми – называется стратегическим, а отраслевая наука, которая их изучает, называется “теория игр”.

И этот текст, основанный на трудах экономистов Авинаша К. Диксита и Барри Дж. Налебаффа - это введение в теорию игр и ускоренный курс по «перехитрению» вашего соперника, чтобы может быть немного помочь вам улучшить стратегическое мышление.

Теория игр: некоторые термины и понятия

Итак, давайте начнем с того, что вбросим пару терминов.

Что такое стратегическое мышление. Это у нас “искусство превзойти противника, зная, что противник пытается сделать то же самое с вами”. И как мы говорили, наука, которая изучает стратегическое мышление и это теория игр.

Впервые она была разработана Джоном фон Нейманом в середине Второй мировой войны. Ее цель - поиск оптимальных игровых стратегий. Т.е. стратегий, которые обеспечат наилучший результат в любой игре, где подразумевается конфликт, сотрудничество или все вот это вместе.

И под играми здесь понимается не столько компьютерные игры, как многие могут подумать, а, в общем-то любая ситуация, где присутствует процесс принятие решений. И это может включать в себя шахматы, воспитание детей, теннис, поглощение одной компанией другую, маркетинговые компании и прочее, прочее. Фактически, любое взаимодействие между двумя людьми можно считать игрой, достойной математического анализа. Главное условие – чтобы оно включало в себя набор участников, принимающих решения, набор вариантов, доступный этим участникам, и понимание последствий каждого решения, хотя бы примерное.

С этим определились, поехали дальше по терминологии.

В теории игр участники, принимающие решения называются “игроками”, а их выбор называется “ходами”. Соответственно, комбинация ходов называется “стратегией”.

Ходы в игре могут быть последовательными или одновременными. В игре с последовательными ходами игроки делают их по очереди и, прежде чем сделать свой следующий ход, они видят, что сделал их оппонент, поэтому могут скорректировать свою стратегию. Например, по таком принципу работают шахматы.

В игре с одновременными ходами игроки должны действовать одновременно, то есть они должны выбирать свои действия без какого-либо знания о том, что выбрал их оппонент.

Если интересы игроков находятся в конфликте – то есть, если выигрыш одного человека всегда означает проигрыш другого, – тогда мы говорим об играх с нулевой суммой. Это, например, большинство спортивных соревнований: да, т.е. если одна команда выиграла, это означает, что другая команда проиграла.

Но на практике большинство игр, в которые мы в реальной жизни играем, включают комбинации взаимовыгодных (беспроигрышных) или взаимновредных (проигрышных) стратегий. И эти игры называются играми с ненулевой суммой.

Все, с терминологией закончили, давайте посмотрим что-нибудь поинтереснее.

Последовательные игры: предвосхищение реакции вашего соперника

Для начала поговорим о последовательных играх. Как мы знаем, это игры, в которых игроки ходят по очереди. Т.е. шахматы, крестики-нолики: один игрок делает первый ход, а затем другой пытается найти наилучших ответ. Соответственно, в последовательных играх преобладает линейная цепочка мышления: “Если я сделаю это, мой соперник может сделать вот это, и я, в свою очередь, могу ответить вот так и т. д.”

Фактически рисуется дерево решений. И чем сложнее игра, тем больше это дерево разветвляется. Например, игровое дерево для крестиков-ноликов рисуется очень легко, потому что там ограниченное количество комбинаций, а вот полное игровое дерево для шахмат будет насколько большим, что до сих пор фактически еще не нарисовано. Просто потому что там просто сумасшедшее количество комбинаций. Т.е. представим партию, у первого игрока 20 возможных ходов, он делает какой-то ход, там Е2Е4, затем второй игрок делает свой ход и у него также был выбор из 20 вариантов. Т.е. только после первого хода, количество возможных комбинаций уже 400. А ещё через один круг это число возрастает до 20 тысяч.

Понимаете, да, масштабы? Американский математик Клод Шеннон даже подсчитал точное количество всех возможных комбинаций и выяснил, что таких будет 10 в 120-ой степени. Чтобы вы понимали насколько это много, число атомов во Вселенной, всего 10 в 80-ой степени. Это меньше в 10 в 40 степени раз, чем шахматных комбинаций.

Но возвращаясь к нашей теме. Наилучшую цепочку ходов в последовательной игре можно найти, применив одно очень простое правило: “ смотри вперед, рассуждай назад” (Look Forward, Reason Backward). Т.е. смотрите на 2-3 шага вперед и потом возвращаетесь к тому, что вам нужно сделать сейчас. Другими словами, постарайтесь предвидеть к чему в итоге приведут ваши решения. Что делают шахматисты: они спрашивают себя, приведет ли эта комбинация в четыре хода к хорошей позиции. Если да, то они ее используют; если нет, то пытаются придумать что-то еще. Либо они рассуждают, что вот мне нужна такая позиция, как я могу ее достичь. Т.е. они строят свою стратегию, рассуждая в обратном направлении от предполагаемого результата. Также такое часто используется в целеполагании. Т.е. мы знаем к чему хотим прийти, берем это как отправную точку и дальше идем постепенно назад уже к той точке, где мы сейчас находимся.

Есть интересный пример, который мы сейчас разберем, но для начала мне необходимо дать вам небольшой контекст и познакомить вас с действующими персонажами одного мультика, который называется - Peanuts. На русский его даже не переводили, потому чисто американский мультик, снятый по комиксам. С чисто американскими идеями. Нам здесь интересны только несколько персонажей и контекст ситуации.

Первый – Чарли Браун

https://peanuts.fandom.com/wiki/Charlie_Brown

Тихий, спокойный парень, немного неуверенный в себе, но достаточно умный и обладающий определенной решимостью. Часто терпит неудачу, опять-таки, из-за своей неуверенности, либо просто невезения, но идет к своим целям.

Второй - Люси ван Пелт

https://peanuts.fandom.com/wiki/Lucy_van_Pelt

Девочка, с достаточно плохим характером, которая постоянно задирает и в какой-то степени жестоко общается со всеми вокруг.

И наша повторяющая ситуация, где она держит мячик для регби и уговаривает Чарли подбежать и ударить по нему. Чарли обычно отказывается пинать его, не доверяя Люси. Затем Люси говорит что-то, чтобы убедить Чарли доверять ей, тот соглашается, подбегает, но в самую последнюю секунду, прежде чем он сможет его ударить, Люси убирает мяч, и Чарли падает на спину.

Одновременные игры: понимание стратегии вашего соперника

И будь то шахматы или крестики-нолики, общий принцип последовательных игр заключается в том, что “каждый игрок должен узнать решения других игроков и использовать их при расчете своего текущего хода”. Но этот принцип вообще не работает для одновременных игр. Как, например, камень-ножницы-бумага, в которой все игроки должны принимать решения в один и тот же момент.

Поэтому, в одновременных играх мы руководствуемся логикой “Я думаю, что он думает, что я думаю и т.д.” Т.е. если у нас последовательные игры могут быть представлены в виде древа решений, то лучший способ решить игру с одновременными ходами - это составить таблицу, в которой будут отображены все возможные комбинации вариантов, либо наиболее вероятные из них.

Просто хрестоматийным примером того, как работает одновременная игра, является дилемма заключенного. Здесь у нас за преступление арестованы два человека и помещены в одиночные камеры без возможности общения друг с другом.

Соответственно, доказательств на них недостаточно, поэтому прокурор предлагает каждому из них возможность сделать признание, где главным будет выступать их “соучастник”. И если оба заключенных сделают это и предадут друг друга, они оба получат стандартное наказание в 10 лет. Если только один из них подпишет признание, то он отделается одним годом тюрьмы за сотрудничество с властями, в то время как другой получит суровый приговор в 25 лет. Наконец, если ни один из преступников не решит сотрудничать с полицией, каждый из них будет приговорен всего к 3 годам тюремного заключения.

Очевидно, что лучшая, именно совместная стратегия, состоит в том, чтобы оба заключенных твердо стояли на своем и не сдавали друг друга. Однако это не оптимальная стратегия на индивидуальном уровне. По отдельности лучшая стратегия для каждого из заключенных - сдать другого человека, потому что таким образом, в лучшем случае, он может получить срок в один год, а в худшем - 10 лет. С другой стороны, твердая позиция не сотрудничать может привести с одной стороны всего к трехлетнему тюремному заключению, но также и к 25 годам. А оставлять свою судьбу в руках другого игрока просто неразумно, потому что вся цель теории игр – это максимально контролировать ситуацию, тогда, когда это возможно.

Одновременные игры: понимание стратегии вашего соперника

И будь то шахматы или крестики-нолики, общий принцип последовательных игр заключается в том, что “каждый игрок должен узнать решения других игроков и использовать их при расчете своего текущего хода”. Но этот принцип вообще не работает для одновременных игр. Как, например, камень-ножницы-бумага, в которой все игроки должны принимать решения в один и тот же момент.

Поэтому, в одновременных играх мы руководствуемся логикой “Я думаю, что он думает, что я думаю, что...” Т.е. если у нас последовательные игры могут быть представлены в виде древа решений, то лучший способ решить игру с одновременными ходами - это составить таблицу, в которой будут отображены все возможные комбинации вариантов, либо наиболее вероятные из них.

Просто хрестоматийным примером того, как работает одновременная игра, является дилемма заключенного. Здесь у нас за преступление арестованы два человека и помещены в одиночные камеры без возможности общения друг с другом.

Соответственно, доказательств на них недостаточно, поэтому прокурор предлагает каждому из них возможность сделать признание, где главным будет выступать их “соучастник”. И если оба заключенных сделают это и предадут друг друга, они оба получат стандартное наказание в 10 лет. Если только один из них подпишет признание, то он отделается одним годом тюрьмы за сотрудничество с властями, в то время как другой получит суровый приговор в 25 лет. Наконец, если ни один из преступников не решит сотрудничать с полицией, каждый из них будет приговорен всего к 3 годам тюремного заключения.

Очевидно, что лучшая, именно совместная стратегия, состоит в том, чтобы оба заключенных твердо стояли на своем и не сдавали друг друга. Однако это не оптимальная стратегия на индивидуальном уровне. По отдельности лучшая стратегия для каждого из заключенных - сдать другого человека, потому что таким образом, в лучшем случае, он может получить срок в один год, а в худшем - 10 лет. С другой стороны, твердая позиция не сотрудничать может привести с одной стороны всего к трехлетнему тюремному заключению, но также и к 25 годам. А оставлять свою судьбу в руках другого игрока просто неразумно, потому что вся цель теории игр – это максимально контролировать ситуацию, тогда, когда это возможно.

Доминирующие стратегии и равновесие Нэша

Давайте еще немного остановимся на дилемме заключенного и, в определенной степени, упростим ситуацию. Это позволит сейчас объяснить несколько основных правил, которые могут помочь разработать наилучшую стратегию для победы в играх с одновременными ходами. И эти правила основаны на двух очень простых идеях: доминирующие стратегии и равновесие.

Доминирующая стратегия – это стратегия, которая обеспечивает нам наилучший результат, вне зависимости от выбора другого игрока. И большой плюс доминирующих стратегий в том, что они в некоторых случаях лучше, а в других - не хуже. Поэтому если вы находите доминирующую стратегию в одновременной игре, то вы всегда должны выбирать ее и не беспокоиться о ходах соперника.

В дилемме заключенного доминирующей стратегией для любого отдельного игрока является сотрудничество с полицией, потому что таким образом он никогда не рискнет быть обманутым своим соперником. А если оба игрока сделают один и тот же выбор – то есть, если оба игрока выберут доминирующую стратегию, тогда их игра достигнет так называемого “равновесия доминирующей стратегии”. Или равновесие Нэша, в честь математика Джона Нэша, который прославился в 2001 году благодаря фильму “ Игры разума”.

В равновесии Нэша ни один игрок не может ничего выиграть, изменив только свою стратегию. Другими словами, если один из заключенных решит пойти на сделку, лучшее, что может сделать другой — это последовать его примеру; в противном случае он окажется проигравшим.

Когда все плохо – создай хаус

Т.е. как мы поняли, в дилемме заключенного доминирующей стратегией для отдельных игроков является сотрудничество. А вот твердая позиция, т.е. молчание, будет являться стратегий со слабым доминированием, потому что в трех из четырех случаев мы оказываемся в более худшем положении по сравнению с нашим соперником.

Если доминирующей стратегии нет, либо мы не можем ее найти, то тогда начинаем рассматривать доминируемые стратегии с наибольшим количеством положительных для нас исходов. Если и таких нет, то у нас остается два варианта – первый – реагирование, т.е. отвечать наилучшим образом на каждый конкретный ход игрока и второй – это создать хаус.

Знаете, в шахматах, когда вы проигрываете и у вас очень понятное положение фигур на поле, то если вы не сделаете ничего радикального, то вы точно проиграете. В играх гроссмейстеров, например, иногда можно видеть, что если один из них потерял всего одну минорную фигуру, например – ладью, то они просто сдаются, потому что знают, что их оппонент точно доведет игру до конца и они все равно проиграют.

Поэтому здесь стратегией может стать создать хаус на поле, где ни ты, ни твой оппонент в моменте не понимаете до конца что происходит, но есть вероятность перевернуть ход игры. Потому что, когда «пыль уляжется» неизвестно в какой позиции вы окажитесь. Но она будет как минимум не хуже, потому что вы и так проигрывали.

И в подобных ситуациях, где игроки используют системное поведение, лучшими будут те, у кого в распоряжении наибольшее количество разных ходов и комбинаций.

Давайте напоследок какой-нибудь пример из футбола. Т.е. вратарю будет гораздо легче отбить пенальти от игрока, который постоянно бьет в левый верхний угол, чем от того может одинаково хороша ударить в любую часть ворот. Поэтому старайтесь иметь в арсенале разные стратегии.

Спасибо, что дочитали :)

Теория игр за 10 минут⁠⁠

Правила сообщества