Горячее
Лучшее
Свежее
Подписки
Сообщества
Блоги
Эксперты
Войти
Забыли пароль?
или продолжите с
Создать аккаунт
Регистрируясь, я даю согласие на обработку данных и условия почтовых рассылок.
или
Восстановление пароля
Восстановление пароля
Получить код в Telegram
Войти с Яндекс ID Войти через VK ID
ПромокодыРаботаКурсыРекламаИгрыПополнение Steam
Пикабу Игры +1000 бесплатных онлайн игр Собирайте цепочки из трех и более одинаковых фишек, чтобы восстановить величие школы волшебников! Волшебство и захватывающие приключения ждут вас уже с первых шагов!

Волшебный особняк

Казуальные, Три в ряд, Головоломки

Играть

Топ прошлой недели

  • AlexKud AlexKud 35 постов
  • Animalrescueed Animalrescueed 52 поста
  • Webstrannik1 Webstrannik1 50 постов
Посмотреть весь топ

Лучшие посты недели

Рассылка Пикабу: отправляем самые рейтинговые материалы за 7 дней 🔥

Нажимая «Подписаться», я даю согласие на обработку данных и условия почтовых рассылок.

Спасибо, что подписались!
Пожалуйста, проверьте почту 😊

Помощь Кодекс Пикабу Команда Пикабу Моб. приложение
Правила соцсети О рекомендациях О компании
Промокоды Биг Гик Промокоды Lamoda Промокоды МВидео Промокоды Яндекс Маркет Промокоды Пятерочка Промокоды Aroma Butik Промокоды Яндекс Путешествия Постила Футбол сегодня
0 просмотренных постов скрыто
81
SlyVolunteer
SlyVolunteer
10 месяцев назад
Наука | Научпоп
Серия Происхождение экономических систем

Равновесие Нэша и дилемма заключенного: как математика связана с развитием человеческой цивилизации?⁠⁠3

Равновесие Нэша [1] - это концепция из теории игр, которая объясняет, как в ситуациях с несколькими участниками каждый игрок может принимать решения, не желая менять свою стратегию, если остальные тоже остаются при своих. В равновесии Нэша все участники действуют оптимально относительно друг друга, даже если их действия не приводят к наилучшему личному результату [2].

Пример из фильма «Игры разума» помогает визуализировать эту идею. В одной из сцен Джон Нэш с друзьями сидит в баре, когда в помещение заходят несколько девушек, включая одну очень привлекательную блондинку. Друзья решают, что все должны попробовать привлечь внимание блондинки, ведь она самая красивая. Однако Нэш замечает, что если каждый будет пытаться ухаживать за блондинкой, они будут мешать друг другу, и в итоге никто не добьётся успеха — блондинка отвергнет всех, а остальные девушки почувствуют себя второстепенными и тоже откажут.

Тогда Нэш предлагает иную стратегию: никто из них не обращается к блондинке. Вместо этого каждый выбирает одну из её подруг. Это минимизирует конкуренцию и увеличивает шансы на успех, так как остальные девушки почувствуют себя ценными.

Вот этот отрывок из фильма, смотрите с 14 секунды, чтобы пропустить заставку канала:

Реальная математика за этой концепцией сложнее, но её можно представить как «баланс интересов», где каждый действует, учитывая действия других, и никому невыгодно действовать иначе. Хотя на самом деле принцип равновесия Нэша был известен человечеству уже более 19 столетий.

Равновесие Нэша и библейский принцип «возлюби ближнего своего, как самого себя» могут быть неожиданно связаны через идею гармоничного взаимодействия людей в обществе, где индивидуальные и коллективные интересы сбалансированы.

В равновесии Нэша каждый участник выбирает стратегию, которая оптимальна для него, учитывая действия других. Это не означает альтруизм, но предполагает, что участник осознаёт влияние своих действий на других. Если никто не может улучшить своё положение, не ухудшив положение остальных, достигается баланс. Принцип «возлюби ближнего своего, как самого себя» также олицетворяет баланс. Он призывает относиться к другим с такой же заботой, как к самому себе, не ставя свои интересы выше, но и не игнорируя их. Это создаёт основу для гармоничного сосуществования, где личные и общие блага взаимосвязаны.

В обоих случаях ключевой идеей является необходимость учитывать не только свои интересы, но и интересы окружающих. В равновесии Нэша это делается рационально, чтобы достичь устойчивого результата, а в библейском принципе - морально, чтобы построить справедливое общество. Если каждый будет действовать, думая и о себе, и о других (равновесие Нэша), либо любить ближнего, как себя (библейский принцип), то создаётся система, где меньше конфликтов и больше взаимной выгоды.

Представьте ситуацию, где несколько человек делят ограниченный ресурс, например, воду или еду. Принцип Нэша подскажет им найти баланс: никто не возьмёт больше, чем ему нужно, чтобы остальные не начали нарушать договорённости. Принцип любви к ближнему добавляет моральное измерение: люди добровольно ограничивают себя из заботы о других, возможно, даже жертвуя чем-то ради общего блага.

Фильм «Платформа» (2019) — это мощная метафора социального неравенства, идеально иллюстрирующая ситуации, где равновесие Нэша нарушается, а библейский принцип «возлюби ближнего своего, как самого себя» игнорируется. Башня представляет собой вертикальную тюрьму с множеством этажей. Ежедневно через башню движется платформа с едой, начиная с верхних этажей. Количество еды достаточно для всех, если бы её делили равномерно. Но на практике верхние уровни берут больше, чем им нужно, не оставляя ничего для нижних. Те, кто живут ниже, страдают от голода, злости и отчаяния.

Нижние этажи страдают от голода, злости и отчаяния

Нижние этажи страдают от голода, злости и отчаяния

В таком обществе каждый действует исходя из своих интересов, игнорируя последствия для других. На верхних этажах рационально предположить, что если ты не возьмёшь еду сейчас, то, оказавшись на нижних уровнях, можешь остаться без неё. Это приводит к тому, что каждый игрок берёт как можно больше еды, не думая о тех, кто ниже. Это стратегия индивидуального выживания, но она разрушает возможность устойчивого равновесия.

В результате система становится нестабильной: нижние этажи страдают, а высшие боятся, что в любой момент могут оказаться среди обделённых. Если бы узники следовали принципу «возлюби ближнего своего, как самого себя», они могли бы организовать равномерное распределение еды. Например, каждый мог бы взять ровно столько, сколько ему нужно. Это обеспечило бы выживание всех обитателей башни, стабилизировало систему и уменьшило бы насилие.

Почему система не достигает равновесия Нэша?

1) Недостаток доверия

Люди не верят, что другие придерживаются договорённостей, и предпочитают действовать эгоистично.

2) Отсутствие коммуникации

Узники изолированы и не могут договориться, что увеличивает хаос.

3) Принудительная система

Башня сама по себе стимулирует конкуренцию, а не сотрудничество.

«Платформа» показывает, как эгоистичное поведение разрушает общее благо. Чтобы выйти из замкнутого круга неравенства, необходимо больше, чем просто рациональный расчёт — нужна эмпатия, доверие и готовность делиться ресурсами. Это напоминает, что для устойчивости общества важно сочетать рациональность (равновесие Нэша) и моральные принципы.

Дилемма заключенного

Дилемма заключённого [3] - это классический пример из теории игр, который прекрасно иллюстрирует проблему недостатка доверия и его влияние на принятие решений. Она показывает, как рациональное поведение в условиях недоверия может привести к худшему исходу для всех участников.

Два подозреваемых арестованы и изолированы друг от друга. Им предложены варианты:

1) Если один сдаёт другого (предательство), а второй молчит, предатель освобождается, а молчащий получает максимальный срок (например, пожизненное заключение).

2) Если оба молчат, они получают минимальный срок (например, 1 год).

3) Если оба предают, они оба получают средний срок (например, 5 лет).

Поскольку игроки не могут доверять друг другу, логично предположить, что другой выберет предательство, чтобы минимизировать свой срок. Поэтому оба обычно выбирают предательство, что приводит к среднему сроку для каждого, хотя если бы они доверяли друг другу и молчали, их срок был бы минимальным.

В дилемме заключенного участники не могут договориться или гарантировать выполнение соглашения, поэтому действуют из страха быть обманутыми. Каждый участник пытается защитить себя от максимального наказания, что приводит к взаимному предательству. В условиях недоверия участники ориентируются только на свои интересы, не принимая во внимание возможные преимущества совместных действий.

Пример фильма «Платформа» показывает, что еда распределяется аналогично дилемме заключённого:

1) Если верхние этажи «молчат» (берут только свою долю), еды хватит всем.

2) Если они «предают» (берут больше, чем нужно), нижние этажи страдают.

Из-за недостатка доверия (верхние этажи предполагают, что если они не возьмут больше, кто-то другой с их этажа это сделает) система разваливается. Взаимное недоверие ведёт к хаосу, где каждый действует эгоистично.

Как преодолеть недостаток доверия?

1) Коммуникация

Если участники смогут договориться, шансы на кооперацию возрастут.

2) Внешние правила

Вмешательство третьей стороны (например, строгие законы или контроль) может стабилизировать систему.

3) Долгосрочные отношения

В повторяющихся играх участники склонны сотрудничать, так как понимают, что их действия влияют на будущее взаимодействие.

Дилемма заключённого и её связь с недоверием - это универсальная модель, применимая в реальной жизни: от социальных конфликтов до экономических систем. Она учит, что для достижения наилучшего коллективного результата необходимы не только рациональность, но и готовность к доверию и сотрудничеству.

Общественный строй и математика

Сравнение капитализма и коммунизма через призму равновесия Нэша и дилеммы заключённого позволяет выявить их сильные и слабые стороны в контексте кооперации, доверия и эффективности решения социальных проблем.

Капитализм поощряет каждого участника системы (предприятия, работников, потребителей) действовать в своих собственных интересах. Это часто приводит к ситуации, где каждый принимает оптимальное решение для себя, но не всегда для общества. Конкуренция стимулирует инновации и развитие, но приводит к неравномерному распределению ресурсов (например, богатство концентрируется у элит).

Капитализм создаёт множество ситуаций, где компании или люди принимают решения, основанные на недоверии. Например, загрязнение окружающей среды выгодно для отдельных корпораций, даже если оно наносит ущерб обществу. Недостаток кооперации и ориентация на краткосрочную выгоду затрудняют решение глобальных проблем, таких как изменение климата или социальное неравенство.

Коммунизм стремится к тому, чтобы участники действовали в интересах всего общества. В идеальной коммунистической системе люди выбирают стратегии, которые максимизируют общественное благо. Таким образом, коммунизм приводит к равновесию, где ресурсы распределяются справедливо, что снижает социальное напряжение.

Коммунизм предполагает высокую степень доверия между участниками системы. Если кто-то начинает действовать эгоистично (например, злоупотреблять ресурсами), система становится нестабильной. Исторически попытки реализации коммунизма сталкивались с проблемой морального риска: когда люди считают, что могут получать выгоды, не внося вклад, доверие разрушается.

Какой строй более выгоден для цивилизации?

Идеальный ответ может лежать в синтезе лучших черт обеих систем:

1) Кооперативный капитализм - модель, в которой рыночная конкуренция сочетается с сильными социальными гарантиями и глобальным сотрудничеством для решения общих проблем.

2) Технологический коммунизм - система, где технологии (например, искусственный интеллект и автоматизация) устраняют необходимость жёсткой иерархии, позволяя справедливо распределять ресурсы.

Капитализм быстрее продвигает технологии из-за конкуренции. Коммунизм эффективнее в устранении социальных неравенств, что ускоряет развитие человеческого потенциала в долгосрочной перспективе. Капитализм решает проблемы выборочно, ориентируясь на прибыль. Коммунизм направлен на системное решение проблем, но часто сталкивается с трудностями в реализации. Для устойчивого развития цивилизации в долгосрочной перспективе потребуется гибридная модель, объединяющая технологический прогресс капитализма с кооперативными и справедливыми принципами коммунизма. Это позволит эффективно решать социальные проблемы и одновременно сохранять высокий темп инноваций.

Литература

[1] Nash, John F. (1950) Equilibrium points in n-person games // PNAS. 36 (1): 48–49. doi:10.1073/pnas.36.1.48

[2] Мазалов В. В. Математическая теория игр и приложения. — Изд-во Лань, 2010, 446 с.

[3] Poundstone, William (1992) Prisoner’s Dilemma: John von Neumann, Game Theory, and the Puzzle of the Bomb. — Doubleday. ISBN 0-385-41567-2.

Показать полностью 1 1
[моё] Развитие Будущее Теория игр Равновесие Джон Нэш Дилемма заключенного Капитализм Коммунизм Социализм Цивилизация Критическое мышление Видео Длиннопост RUTUBE
132
5
Eriright
Eriright
2 года назад
Серия Теория игр для начинающих

Олени и буйволы⁠⁠

Робинзон Крузо и Пятница — охотники на зайчиков каменного века. Однажды вечером, когда они вместе выпивали, между ними завязался разговор о делах. Обменявшись мнениями, они поняли, что, объединив свои усилия, они могут замахнуться на гораздо более крупное животное, например, на оленя или буйвола. Тот, кто охотится в одиночку, не может рассчитывать на то, что сможет убить такого гиганта. Но если бы охотники объединились, каждый день охоты на оленя или буйвола давал бы в шесть раз больше мяса, чем день охоты только на зайчиков. Такое сотрудничество имеет большие преимущества: каждый охотник будет получать в три раза больше мяса от охоты на крупную дичь, чем от охоты на зайца.

Робинзон Крузо и Пятница договорились на следующий день поохотиться на крупную дичь, и каждый вернулся в свою пещеру. К сожалению, накануне они слишком много выпили и оба забыли, на какое животное они должны были охотиться, на оленя или буйвола. Охотничьи угодья для этих животных находятся в противоположных направлениях. Тогда не было сотовых телефонов, и все это было до того, как Робинзон Крузо и Пятница стали соседями. Поэтому они не могли просто вначале встретиться, а потом пойти охотиться. На следующее утро каждый должен был принять собственное решение.


Для того, чтобы решить, куда идти, обоим охотникам придется сыграть в игру с одновременными выбором их стратегий. Если обозначить количество мяса, которое каждый получает в день при охоте на зайчиков (выбранная единица), то доля каждого в случае удачной координации усилий по охоте на оленя или буйвола составит три единицы. Таким образом, платёжная матрица для этой игры выглядит следующим образом:

Олени и буйволы


Эта игра сильно отличается от рассмотренной ранее дилеммы заключенного. Разберем самое главное отличие.

Лучший выбор для Робинзона Крузо зависит от того, что делает Пятница, и наоборот. Не существует оптимальной стратегии ни для одного из игроков, независимо от действий другого. В отличие от дилеммы заключенных, в этой игре нет доминирующей стратегии. Поэтому каждый игрок должен анализировать возможный выбор другого и с учетом этого искать свою оптимальную стратегию.

Робинзон Крузо размышляет подобным образом: «Если Пятница пойдет туда, где пасутся олени, то я получу большую долю добычи, если пойду туда, с другой стороны, я ничего не получу, если пойду на пастбище буйволов. Если Пятница отправится на землю бизонов, должно быть наоборот. Вместо того, чтобы пойти на риск и отправиться в одну из этих областей и обнаружить, что Пятница ушёл в другую, не лучше ли мне самому пойти и поохотиться на зайчиков, как я делал всегда, даже если это приносит мне меньше мяса? Другими словами, не должен ли я взять единицу лута наверняка, вместо того, чтобы рисковать получить три единицы или ничего? Это зависит от того, что, по моему мнению, собирается сделать Пятница, поэтому я должен поставить себя на его место и подумать о том, что он думает. Но он также задается вопросом, что я собираюсь делать, и пытается поставить себя на мое место! » Есть ли конец этим повторяющимся размышлениям о размышлениях?

Показать полностью 1
[моё] Математика Книги Популяризация Научпоп Теория игр Джон Нэш
1
10
Eriright
Eriright
3 года назад
Серия Теория игр для начинающих

Парето-оптимальность⁠⁠

Всем привет! Я продолжаю свою серию постов по популяризации науки :) Пока я выкладываю материалы по теории игр.


Парето-оптимальность


Из двух возможных видов игр мы до сих пор рассматривали только некооперативные, то есть те, в которых каждый игрок является эгоистом и желает максимизировать только свой собственный выигрыш или минимизировать свой проигрыш. Возникает вопрос: почему, например, в дилемме заключённого игроки не могут договориться между собой о том, какие стратегии применять?


Критики игрового анализа дилеммы заключённого считают, что рациональное поведение, приводящее к более выгодным для всех ситуациям, возникает не для отдельных лиц, а для групп. Поэтому они считают, что для отдельно взятого игрока его оптимальная стратегия будет заключаться в достижении оптимальной цели для всей группы в целом. Теория рабочего класса Карла Маркса является проявлением такого мышления.


Вильфредо Парето (1848–1923), итальянский социолог и экономист, внес свой вклад в изучение распределения доходов и анализ индивидуального выбора. Он вводит понятие эффективности и помогает развивать область микроэкономики с помощью таких идей, как кривая безразличия. Возможно, вы уже слышали о «принципе Парето». Также называемый законом Парето, принципом 80-20 или даже законом 80-20, это эмпирическое явление, наблюдаемое в определенных областях: примерно 80% следствий являются продуктом 20% причин. Хотя работы Парето не обязательно подразумевает распределение 80-20, Джозеф Джуран в 1954 году использовал выражение «принцип Парето» для его обозначения.


Другой термин, носящий его имя, связан с теорией игр. Пусть имеется система с несколькими частными показателями. Тогда система достигла оптимальности по Парето (стала эффективной по Парето), если при улучшении любого из показателей достигается ухудшение других.


Сам Парето высказывался так:


«Всякое изменение, которое никому не приносит убытков, а некоторым людям приносит пользу (по их собственной оценке), является улучшением»


Относительно исходной ситуации, улучшение по Парето — это новая ситуация, в которой некоторые агенты выиграют, а ни один агент не проиграет.


Ситуация называется доминируемой по Парето, если возможно улучшение по Парето.

Таким образом, система допускает локальные улучшения до тех пор, пока они не приносят никому вреда.


В своем «Руководстве по политической экономии»  Парето рассматривает максимальную полезность для общества как свойство общего экономического равновесия и определяет ее как положение, при котором всякая малая вариация увеличивает полезность одних и уменьшает полезность других.


Полезность относится к полезности товара или услуги, ощущаемой данным экономическим агентом в данное время, в отличие от объективной полезности того же товара или услуги. Например, для путешественника в пустыне стакан воды субъективно будет стоить намного дороже, чем для человека в бассейне.


Таким образом, система допускает локальные улучшения, если они никому не вредят. Общее благо общества по Парето максимально в том состоянии, когда никакое изменение полученного оптимального распределения не наносит вреда благосостоянию хотя бы одного объекта системы. Например, в дилемме заключённых состояние «оба молчат» является Парето-оптимальным.


Но опять же возникает проблема. Философы, которые считают, что этот факт показывает противоречие между некооперативной и кооперативной теорией игр упускают из виду важность предположения в кооперативной теории игр о том, что могут быть сделаны жесткие договоренности. Не имеет значения, что Франкенштейн и Дракула обещали соблюдать соглашение. Они, например, могут договориться, но не сдержать обещания. Или же они могут затратить ресурсы на обеспечение нерушимости договора.


Фонтан с водой и оптимум Парето


Мы обсудим здесь ситуацию, описанную в статье одного французского исследователя.

В административном ресторане есть довольно классический для франции питьевой фонтан, оборудованный двумя кранами, с одной особенностью, которая кажется весьма распространенной: общий поток воды одинаков при работе одного или обоих кранов. Когда два человека приходят наполнить свои графины, они обычно делают это одновременно, используя оба крана. Это действительно хорошая идея?

Парето-оптимальность

Представьте себе, что первый человек, Гензель, подходит к фонтану, чтобы наполнить свой графин. Как раз в тот момент, когда он собирается начать налить себе водички, в свою очередь появляется второй человек, Гретель. У последней есть выбор между двумя стратегиями: активировать второй кран, чтобы наполнить ее графин одновременно с Гензелем, или подождать, пока тот не закончит, прежде чем начать делать это.


Когда работает только один из кранов, он наполняет графин примерно за 20 секунд. Когда оба крана открыты, каждый из них наполняет графин за 40 секунд. Если Гретель решит использовать второй кран, она и Гензель проведут у фонтана 40 секунд. Если же она решит подождать, Гензель проведет там только 20 секунд, а она 40 (20, чтобы подождать и 20, чтобы наполнить свой графин).


Таким образом, Гретель абсолютно ничего не выигрывает, если откроет второй кран, а Гензель в таком случае потеряет 20 секунд. Поэтому лучшим общим решением будет подождать и никогда не использовать оба крана одновременно.


В случае, который нас здесь интересует, есть две ситуации: одна, когда Гретель использует второй кран, и другая, когда она ждет, прежде чем наполнить свой графин. Вторая ситуация – оптимум Парето, но не первая, поскольку можно улучшить результат Гензеля (сократить его время у фонтана с 40 до 20 секунд), не ухудшив результат Гретель (у которой и так и так будет 40 секунд ожидания).


На самом деле, единственный плюс двух краников у таких фонтанов – это возможность поболтать с коллегой, пока наполняются графины, поэтому, несмотря на всю их нелогичность, во Франции они всюду =)


Попробуйте вспомнить, с какими примерами подобных ситуаций вы уже сталкивались в своей жизни?

Показать полностью 1
[моё] Математика Теория игр Джон Нэш Парето Популяризация Дилемма заключенного Длиннопост
0
10
Eriright
Eriright
3 года назад
Серия Теория игр для начинающих

Равновесие по Нэшу⁠⁠

Всем привет! Я продолжаю свою серию постов по популяризации науки :) Пока я выкладываю материалы по теории игр.


Прошлые посты тут:


Игра с природой, или что такое математическое ожидание? : Часть 1, Часть 2

Дилемма заключённого : Часть 1, Часть 2, Часть 3,

Частные и общественные блага: Часть 1, Часть 2



Немного классификации и терминов


Мы с вами уже построили платёжные матрицы в двух играх, проведём немного классификации.

В 1944 году за авторством Оскара Моргенштерна и Джона фон Неймана была опубликована книга «Теория игр и экономическое поведение» («Game Theory and Economic Behavior»), в которой:


- Было сформулировано определение «игры», как деятельности двух и более участников (игроков) имеющей условия некоего «выигрыша» и «проигрыша», в рамках которой все участники могут распоряжаться какими-то ресурсами и взаимодействуют между собой, преследуя цель «выиграть» и принимая решения, основанные на поведении других игроков;

- Был математически описан способ поиска оптимальных стратегий в такой игре (ведущих к «выигрышу» с какой-то определенной вероятностью).


Джон фон Нейман (1903—1957) – американский математик и физик венгерского происхождения. Он внес важный вклад во многие области. Тема упомянутой выше книги скорее связана с экономикой. На самом деле до 1930-х годов экономическая наука (по крайней мере, ее основные направления того времени) использовала большое количество числовых данных, но без какой-либо настоящей научной строгости. Это напоминало физику 17-го века, ожидающую языка и научного метода для выражения и решения своих проблем. В то время как классическая физика нашла решение в исчислении бесконечно малых, фон Нейман предлагает для экономики в характерном для нее аксиоматическом подходе теорию игр и теорию общего равновесия.


Суммой игры называется общий итог выигрышей и проигрышей.


В игре с нулевой суммой выигрыш одной стороны равен проигрышу другой. Некоторые карточные игры – преферанс, покер, бридж – есть игры с нулевой суммой. Игры с отрицательной суммой тоже имеются − например, лотереи (если считать сумму участников и не учитывать организаторов).


Команда, выступающая как единое целое, тоже может считаться игроком.


Антагонистической игрой называется игра двух игроков с нулевой суммой – выигрыш одного игрока оборачивается проигрышем другого.


Первым значительным вкладом фон Неймана в 1928 году стала минимаксная теорема, которая утверждает, что в игре с нулевой суммой при полной информации (каждый игрок знает возможные стратегии своего противника и их последствия) у каждого есть набор предпочтительных («оптимальные») стратегии. В игре между двумя рациональными игроками нет ничего лучше для каждого из них, чем выбрать одну из этих оптимальных стратегий и придерживаться её.


Существуют игры с количеством участников, большим двух. Эти игры можно разделить на два класса – кооперативные, когда разрешено нескольким участникам вступать в коалицию (например, в преферансе при розыгрыше мизера обычно два игрока играют против одного в пределах одной партии). В некооперативных играх каждый участник играет только за себя.

В спортивных играх – командных (футбол, хоккей) или личных (шахматы) каждый матч или партия есть игра с нулевой суммой по результатам (ничья, или же один выигрывает, а другой проигрывает). Хотя в турнирных таблицах фигурируют общие набранные очки, в шахматах, например, считают именно «плюсы» – разницу между выигранными и проигранными партиями. В футболе, в связи с борьбой с ничьими, ничейный результат невыгоден обоим. Но если брать именно набранные очки, то турнир – игра с положительной суммой.


Равновесие по Нэшу


Джон Нэш (John Forbes Nash) (1928-2015) в теории игр был признан второй звездой после фон Неймана. Родился в 1928 г., изучал математику в Принстоне и скоро проявил интерес к теории игр. В своей диссертации (1950) двадцатидвухлетний Нэш сформулировал понятие, которому суждено было изменить теорию игр. Кстати, по мотивам его жизни был снят фильм «Игры разума», весьма советую к просмотру.


Термин «равновесие по Нэшу» настолько популярен, что сам Нэш стал бы миллионером, если бы ему платили по доллару за каждое упоминание о нём. Во всяком случае, профессором MIT он стал. А также Нэш – единственный математик и экономист, удостоенный Нобелевской премии по экономике в 1994 году и Абелевской премии по математике в 2015 году.


Вначале Нэш исследовал игру двух игроков с ненулевой суммой, затем объектом его исследований стали некооперативные игры с тремя и более участниками. Нэш вначале выдвинул понятие о равновесии в таких играх, затем доказал, что оно существует для любых конечных игр с любым числом игроков. До него фон Нейманом было доказано только равновесие в играх двух лиц с нулевой суммой.


Исследования Джона Нэша принесли ему Нобелевскую премию по экономике в 1994 году совместно с Джоном Харсаньи и Райнхардом Селтеном. Нобелевский комитет пояснил, что Харсаньи премирован за «распространение равновесия по Нэшу на класс игр с неполной информацией», а Селтен – за обогащение этого равновесия.


Мы видим, что равновесие по Нэшу привело троих учёных к Нобелевской премии (хотя это была математика, премию дали за экономику, математикам Нобелевские премии не положены). Так что же это такое, равновесие по Нэшу?


Равновесие по Нэшу – ситуация в игре, в которой ни один из игроков не может улучшить свое положение, односторонне изменив свою стратегию, если другие игроки свои стратегии не меняли.


Каждый из игроков в равновесии по Нэшу осведомлён о стратегиях других игроков и в связи с этим выбирает для себя лучшую из доступных ему стратегий. В равновесии по Нэшу действует принцип «оглашения» – если все игроки огласят свои стратегии, ни один из них не захочет изменить свою. Это приводит к выводу, что каждому из игроков невыгодно в одностороннем порядке менять свою стратегию – система находится равновесии. Для его поддержания не требуется внешних сил, каждый из игроков старается реализовать в создавшихся условиях именно свою стратегию, и равновесие нарушать невыгодно каждому из игроков. Именно здесь кроется различие между кооперативными и некооперативными играми – для устойчивости первых могут потребоваться внешние силы (например, обращение в суд), устойчивость вторых же внешних сил не требует.


К сожалению, встречаются такие ситуации, когда такое устойчивое состояние возникает в невыгодной для всех ситуации. Если бы все изменили свои стратегии, система пришла бы к более выгодному состоянию для всех, но для этого необходимо сотрудничество всех, которое невозможно в некооперативных играх, а попытка любого из игроков изменить для себя стратегию приводит к ещё более худшим результатам. Упомянутая ранее дилемма заключённого – один из случаев стабильно плохой по Нэшу ситуации для всех.

Показать полностью
[моё] Математика Теория игр Дилемма заключенного Джон Нэш Популяризация Длиннопост Текст
0
195
prostoecon
prostoecon
3 года назад
Лига образования

Почему нам достаточно синицы в руках? | Равновесие Нэша⁠⁠

Начнем с детской игры


В 2005 году крупный японский производитель электроники (Maspro Denkoh Corporation) не мог определить, какому аукционному дому передать право продажи коллекции картин со стартовой ценой в 20 миллионов долларов.

Конкурентам (Sotheby“s и Christie”s) было предложено сыграть в камень-ножницы-бумагу. Соперники написали выбранный ими объект на листочке и отдали организатору. Подумайте, если бы от победы в этой игре зависел ваш карьерный успех и премия в сотни тысяч долларов , что бы вы выбрали – камень, ножницы или бумагу?

Подскажу вам, что чаще всего люди выбирают камень (37,8%), бумагу ставят 32,6% игроков, а ножницы — 29,6%

Тогда кажется, что надо ставить бумагу, ведь большинство выбирает камень. Но если соперник знает об этой тактике, надо ставить ножницы, ведь он поставит бумагу.

Christie”s полагали, что соперники в курсе этой статистики, и действовали по плану. Sotheby's, с другой стороны, решили, что игра будет зависеть от случая. В результате ножницы кристис разрезали бумагу сотбис. Почему же Сотбис в такой важной игре решили не заморачиваться?

Ответ дает теория игр. В «камень ножницы бумага» вам неизвестна компетенция соперника, так что лучшим выбором будет случайный предмет, т.е. использование смешанной стратегии.


Более серьезные игры


Нежелание следовать смешанной стратегии привело футбольный клуб Челси к поражению в финале лиги чемпионов в 2008 году. Вот как это вышло. Профессор Лондонской школы экономики Игнасио Паласиос-Уэрта просмотрел тысячи записей пенальти, и дал рекомендации тренеру Челси по поводу поведения вратаря соперника – Эдвина Ван дер Сара. По статистике тот чаще прыгал в естественный от бьющего угол, т.е. в левый для правши и в правый для левши.


В финальной серии футболисты Челси, следуя указаниям тренера, забили 4 из 5 пенальти в неестественный для себя угол. И вот кульминация - 6:5 по голам в пользу Манчестера, и Челси надо сравнивать счет, чтобы остаться в игре. К мячу подходит Николя Анелька, он правша и по рекомендации должен бить в правый от себя угол. Вероятно, к этому времени Ван дер Сар уже разгадал тактику соперников и перед ударом показал рукой именно правый для пенальтиста угол. Это не могло не смутить Анелька, и он принял решение бить в другой. В итоге Ван дер Сар своим сейвом принес победу Манчестеру.


Дилемма заключенного


Очевидно, что в спорте почти не бывает вариантов, когда оба участника довольны – всегда есть победитель и проигравший, какую бы стратегию они не применяли. Но в жизни ситуации, такие ситуации встречаются сплошь и рядом.

Ход рассуждений сообщника аналогичный. В итоге каждый заключенный гарантированно получает 5 лет тюрьмы вместо 1 года. Такой исход называется равновесием Нэша по имени известного американского математика. Кстати, у него довольно занятная биография, о которой был снят фильм «Игры разума», получивший 4 Оскара. Как-нибудь посмотрите.

Итак, равновесие Нэша – это комбинация стратегий, при которой никто не может улучшить свое положение, если другие участники не меняют свое поведение.


Пример 1

Такое равновесие хорошо иллюстрируют доктрина взаимного уничтожения, когда ни одна из стран не может безнаказанно применить ядерное оружие, но и разоружаться тоже никто не спешит. В итоге, государства тратят миллиарды долларов на военные разработки, которые, надеюсь, никогда не будут применены. А ведь эти деньги могли пойти на образование, строительство жилья и прочие важные цели.


Пример 2

В повседневной жизни с равновесием Нэша сталкивается каждый из нас. Вот вы с утра думаете, поехать на работу-учебу на машине или на автобусе. Ход рассуждений такой – хорошо, чтобы все поехали на автобусе, тогда пробок не будет, но ведь все рассядутся по машинам, а я буду толкаться в пробке в душном автобусе. Так уж лучше провести время в пробке с комфортом – сидя в машине. В итоге, так думает каждый и едет на машине, действительно создавая затор

Пример 3

Еще один яркий пример – выборы. Вы можете изучить программу всех кандидатов, послушать дебаты и после проголосовать за самого достойного. Или поступить, как делают многие - прийти на участок и проголосовать за того, кто у вас на слуху. Вы, конечно, хотите, чтобы были выбраны лучшие кандидаты, но также знаете, что кроме вас никто больше не будет изучать их программы. Поэтому даже не тратите время и поступаете как обычно.

https://img4.teletype.in/files/7b/66/7b661af5-8f71-4259-ba21...

Что делать?

Довольно примеров, расскажу, как выйти из этого равновесия. Ведь очевидно, что есть лучший вариант во всех перечисленных ситуациях. Раз люди сами договориться не могут, давайте наймем арбитра, как китайские доставщики в 19 веке. Тогда большинство грузов доставлялось ручным трудом – люди тащили тележку и получали деньги за своевременную доставку. Понятно, что если все будут стараться, то груз доедет вовремя. Да и даже если кто-то сфилонит, можно успеть. И что думает каждый: «Если все остальные тянут, то можно расслабиться, а если они еле работают, то от меня одного толку нет». В итоге грузы сильно задерживались, и доставщики, чтобы не терять деньги, сами нашли выход

https://img3.teletype.in/files/ea/f3/eaf3cac4-dc7d-4bb7-9a49...

Они нанимали еще одного человека в команду, чтобы он подгонял лентяев. Перспектива получить плетью по спине сразу сместила равновесие, и все начали усердно работать.

В современном мире роль арбитра выполняет государство, конечно, не стегая никого плетью, а используя более мягкую политику. Так, достаточно ограничить въезд в центр города, сделать платными многие парковки и повысить налоги, и вот многие водители спешат с утра на остановку, а не за руль.

Правда, есть случаи, когда даже государство не может повлиять на это равновесие. Наверняка вы знаете, что раскладка QWERTY была создана, чтобы исключить сцепление рычагов пищущей машинки друг с другом и повысить скорость печати. Сегодня эта проблема ушла, а вот неэффективная qwerty осталась. И несмотря на то что уже изобретены раскладки, которые позволяют набирать текст быстрее и проще (Dvorak, Colemak), мало кто готов переучиваться, потому что qwerty используется повсеместно

https://img1.teletype.in/files/43/90/43902358-7d97-4a23-a4a9...

Но если бы люди могли договориться друг с другом и одновременно перейти на другую раскладку, то всем стало бы лучше и равновесие Нэша сместилось в более эффективную точку.

Также и сообщники в задачке про кражу телевизора могли бы договориться вдвоём хранить молчание, и получить всего по 1 году. Есть конечно, еще один способ выхода из этого равновесия – непредвиденные ситуации, когда форс-мажор вмешивается в игру, но это уже совсем другая история.

Этот, а также мой материал по другим темам в видеоформате можно посмотреть в Telegram, YouTube, VK

Показать полностью 6 1
[моё] Экономика Игры разума Джон Нэш Теория игр Математика Образование YouTube Видео Длиннопост
55
1079
Chakaron
Chakaron
3 года назад

Фильмы о гениях⁠⁠

Источник

Показать полностью 8
Фильмы Гений Подборка Стивен Хокинг Джон Нэш Моцарт Ван Гог Чарли Чаплин Марк Цукерберг Стив Джобс Алан Тьюринг Актеры и актрисы Интересное Длиннопост
93
11
merchandrey
merchandrey
4 года назад
Пикабушники Казахстана

Теория МИИгР⁠⁠

Теория МИИгР

В теории игр, есть такое понятие как равновесие Нэша – это когда отдельно взятому участнику игры невыгодно менять стратегию, т.к. сразу все участники либо выигрывают, либо проигрывают. Правда есть нюанс, это справедливо для игр, где участники не могут вступать в сговор.


В апреле чиновники казахстанского МИИР разорвали отношения с компанией Азия Авто. Причиной такого шага министра должно быть стала «неэффективная» работа компании по локализации. Сварки и окраски нет, локализация низкая. Оценку, видимо, как-то произвели. Чек-лист был, наверняка. Однако, отчаянные попытки Азии Авто привлечь внимание общественности и руководства страны заставили меня задуматься.


Потратив 2,5 часа в сети, я выяснил для себя, любопытную деталь: похоже, что локализации нет и у других заводов. Но они при этом продолжают пользоваться льготами.


Аллюр – на государственные деньги Банка Развития Казахстана купил 3 сварочных линии: SsangYoung, JAC и Toyota. Сотрудничество с Toyota закончилось, не успев начаться, а SsangYong и JAC мягко говоря не впечатляют объемами. SY, кажется, даже в самой Корее уже не делают. Линии купили и бросили, по факту локализация не выше, чем у Азии Авто. Что произошло с громким проектом первого казахстанского автомобиля Nomad, теперь уже даже Гугл с трудом вспоминает.


3000 машин по данным с пресс-конференции азиатов было всего сварено. Хотелось бы использовать данные с официального сайта МИИР или самого Аллюр, но такой информации там нет.


Умножим 3000 шт. на примерную маржу с одной машины. Для этого очень грубо возьмем 10% от средней цены где-то 15000 долларов – это 1500 долларов с машины. В лучшем случае получается 4,5 млн. Об окупаемости таких линий Аллюр и выделивший деньги Банк Развития Казахстана могут только мечтать. Ну и понятно, что локализация здесь нисколько не выше, чем у Азии Авто.


По Астане Моторс трудно что-то сказать, т.к. они несколько лет собирали свои автомобили у Аллюра. А свою сборку наладили только в 2020 и тоже льготы теперь получают. На той же пресс-конференции было сказано, что площадь завода в Алматы не позволяет организовать полноценную сварку и окраску, звучит правдоподобно. Через Гугл карты посмотрел заводы в других странах, как бы другие мощности совсем.


Вот и получается, что есть МИИР и три завода с низкой фактической локализацией. Было бы интересно послушать пресс-конференцию, где чиновники МИИР рассказывают сколько и куда было вложено государственных средств и чего достигли. Ну или хотя бы глянуть официальную статистику сборка/сварка по заводам.


Получается, что теоретически теперь министерству надо будет лишить льгот и остальных участников игры. Однако, Джон Нэш писал о некооперативных играх. Здесь же возможно есть какой-то сговор, раз этого до сих пор не случилось.

Показать полностью 1
[моё] Казахстан Бизнес Производство Чиновники Игры Джон Нэш Журналисты Автомобилисты Автозавод Пикабушники Евразийский экономический союз Длиннопост
9
338
Kittymeowmeowme
Kittymeowmeowme
6 лет назад

Джон Нэш и его теория игр⁠⁠

Личность Джона Нэша стала известна многим людям, далеким от мира науки, после выхода на большой экран фильма «Игры разума» с Расселом Кроу в главной роли. В определенной степени голливудское кино идеализирует математика, о чем упоминал и сам Джон после просмотра киноленты. Между тем есть более правдивый и почти никому не известный документальный фильм под названием «Игры разума».


В детстве Нэш ненавидел математику, и оценки в школе у него были соответствующие. Сам он в автобиографии говорит, что все изменилось после книги «Творцы математики». Она была написана так захватывающе и понятно, что по прочтении ему удалось самостоятельно доказать одну небольшую теорему.


Разумеется, Нэш поступил на математический факультет, а перед этим успел получить знания в области химической инженерии и международной экономики. За выдающиеся достижения по окончании учебы Джону дали не только степень бакалавра, но и магистра, и он отправился покорять Принстонский университет. В кармане у Нэша была рекомендация от бывшего преподавателя, в которой кратко значилось: «Он гений математики».


Бывшие сокурсники утверждают, что Джон был одержим деньгами и неимоверно скуп. Однажды дошло до того, что он по шуточному совету пошел искать банк, который бесплатно выдавал бы конверты и марки при обслуживании расчетного счета. Найти такое учреждение ему не удалось.


В годы учебы завязался его первый серьезный роман, который не особенно известен широкой общественности. Романтическая связь окончилась болезненным разрывом. В результате этих отношений у Джона родился сын, с которым он никогда не общался.


Несмотря на любовные перипетии, Нэш ни на йоту не отклонился от заданного курса. Ему был 21 год, когда в Принстоне он написал диссертацию по теории игр. Через 45 лет именно за нее он получит Нобелевскую премию по экономике.


После окончания аспирантуры Джон остался преподавать в Принстоне и по совместительству трудился в частных компаниях. Ему было 26 лет, когда полиция задержала его за непристойное поведение. Мы не знаем подробностей той истории, но, возможно, этот случай был первым звоночком, предвещающим проблемы с психикой Джона. Тем более что за эту оплошность он лишился привилегий на работе: у него отозвали допуск к секретной информации.


Чуть позже Джон женился на своей студентке Алисии Лард, которая была всего на 4 года его младше. Еще через год журнал Fortune назвал Нэша «восходящей звездой математики», а молодая супруга забеременела. В это же время у него начали проявляться первые признаки шизофрении.


Болезнь развивалась стремительно, и скрывать ее от общественности было все труднее. Последней каплей стало то, как Нэш отверг предложение университета быть деканом математического факультета. Он заявил, что не намерен тратить время на всякие глупости и хочет быть императором Антарктиды.


Джон потерял работу и принудительно был помещен в психиатрическую лечебницу. Ему поставили диагноз «параноидная шизофрения» и два месяца заставляли пить лекарства. После выписки он внезапно решил уехать в Европу. Алисия оставила новорожденного сына родителям и отправилась вслед за мужем. Нэш пытался найти политическое убежище, но не смог. Вскоре он был арестован и депортирован в США.


Отдельно нужно упомянуть визуальные галлюцинации, которые играют большую роль в фильме «Игры разума». Настоящий Нэш никогда их не видел, он только слышал голоса. К тому же у математика была масса необоснованных страхов, которые также не отражены в киноленте. Например, при виде красных галстуков он неизбежно начинал думать, что перед ним стоит участник коммунистического заговора.


Вопреки расхожему мнению, Джон никогда не работал на Пентагон и не искал зашифрованные послания русских или японских шпионов. Правда, он считал, что мир строит заговор против Америки, и поэтому писал правительству США личные письма. Если не вдаваться в детали, Джон убеждал государство, что нужно использовать принципиально иной метод шифровки информации, и даже предложил один. Изумительность идеи заключается в том, что именно этот метод применяется сейчас, в наши дни. Тогда, конечно, никто на письма Джона не отвечал.


Болезнь развивалась. Агрессивное лечение в психбольницах не давало никаких результатов. Джон говорил о себе в третьем лице, постоянно звонил бывшим коллегам, чтобы рассказать об очередной безумной теории заговора, и чего-то боялся.


Когда ситуация окончательно вышла из-под контроля, обезумевшего Нэша снова поместили в клинику. Там он прошел курс инсулинокоматозной терапии — это искусственное введение человека в кому с помощью инсулина. После выписки бывшие коллеги Джона из жалости предложили ему работу, но Нэш отказался и снова уехал в Европу.


Эта поездка стала последней каплей для Алисии. Она развелась с Джоном и вырастила их сына сама. К сожалению, уже в подростковом возрасте стало ясно, что у мальчика тоже шизофрения. По его собственному признанию, он считал, что голоса, которые он слышит, принадлежат Богу. Галлюцинации были не только слуховыми, как у отца, но и визуальными.


Вернувшись из «путешествия», Нэш не без помощи бывших коллег устроился в Принстонский университет и повстречался с новым психиатром, который выписал ему щадящие лекарства, не те, которые приходилось принимать в психлечебницах. Таблетки подавляли проявления шизофрении, и Нэш начал снова общаться с бывшей женой и сыном. Идиллия длилась недолго: Джон боялся, что лекарства влияют на мозг и способность мыслить, и перестал их принимать — симптомы вернулись с новой силой.


В Принстоне Нэш часто бродил по университету как призрак и записывал на меловых досках непонятные формулы. Из-за этого студенты прозвали его Фантомом.


Несмотря на усилившуюся вновь болезнь, Алисия разрешила Нэшу переехать к ним. Она считала, что совершила предательство, когда развелась с Джоном. Возможно, именно этот шаг спас гениального математика от бродяжничества, поскольку, будучи в разводе, он не имел собственного жилья и часто ночевал в отелях или у знакомых.


Болезнь отступила только в 1980-х. Врачи удивленно разводили руками, а весь секрет состоял в том, что Джон усилием ума заставил себя не обращать внимания на симптомы и снова занялся математикой. Препараты он больше не принимал.


Однако есть и ложка дегтя в этой истории: известно, что у шизофреников симптомы ближе к старости становятся все менее явными. Возможно, это был естественный процесс и никакого излечения не произошло.


В 1994 году Нэш получил Нобелевскую премию по экономике за диссертацию, которую написал в 21 год. Традиционную для таких случаев лекцию Джону прочитать не дали, потому что боялись за его психическое состояние. Вместо этого был организован семинар с участием ученых, на котором они обсуждали вклад Джона в теорию игр.


Еще через несколько лет Нэш и Алисия вторично поженились. С момента развода тем временем прошло 38 лет. А незадолго до гибели Нэш получил высшую награду по математике — Абелевскую премию — и стал первым и пока единственным человеком в мире, который удостоился двух премий сразу — Нобелевской и Абелевской.


Джон и Алисия умерли в один день и даже один миг. В 2015 году они попали в автокатастрофу. Ему было 86, Алисии — 82. Интересно, что всему виной была случайность: супруги были не пристегнуты, а водитель автомобиля (был пристегнут) отделался легкой травмой. Как видите, жизнь даже признанного гения может разрушить одна маленькая оплошность.

Источник: adme. ru


Теперь подробнее рассмотрим теорию игр Джона.


В 1930-е годы Джон фон Нейман и Оскар Моргенштерн стали основателями нового интересного направления математики, которое получило название "теория игр". В 1950-е годы этим направлением заинтересовался молодой математик Джон Нэш. Теория равновесия стала темой его диссертации, которую он написал, будучи в возрасте 21 год. Так родилась новая стратегия игр под названием «Равновесие по Нэшу», заслужившая Нобелевскую премию спустя много лет - в 1994 году.


Долгий разрыв между написанием диссертации и всеобщим признанием стал испытанием для математика. Гениальность без признания вылилась в серьезные ментальные нарушения, но и эту задачу Джон Нэш смог решить благодаря прекрасному логическуму разуму. Его теория "равновесие по Нэшу" удостоилась премии Нобеля, а его жизнь экранизации в фильме «Beautiful mind» («Игры разума»).


Поскольку теория равновесия Нэша объясняет поведение людей в условиях взаимодействия, поэтому стоит рассмотреть основные понятия теории игр.


Теория игр изучает поведение участников (агентов) в условиях взаимодействия друг с другом по типу игры, когда исход зависит от решения и поведения нескольких людей. Участник принимает решения, руководствуясь своими прогнозами относительно поведения остальных, что и называется игровой стратегией.


Существует также доминирующая стратегия, при которой участник получает оптимальный результат при любом поведении других участников. Это наилучшая безпроигрышная стратегия игрока.


Дилемма заключенного и научный прорыв

Дилемма заключенного - это случай с игрой, когда участники вынуждены принимать рациональные решения, достигая общей цели в условии конфликта альтернатив. Вопрос заключается в том, какой из этих вариантов он выберет, осознавая личный и общий интерес, а также невозможность получить и то, и другое. Игроки словно заключены в жесткие игровые условия, что порой заставляет их мыслить очень продуктивно.


Эту дилемму исследовал американский математик Джон Нэш. Равновесие, которое он вывел, стало революционным в своем роде. Особенно ярко эта новая мысль повлияла на мнение экономистов о том, как делают выбор игроки рынка, учитывая интересы других, при плотном взаимодействии и пересечении интересов.


Лучше всего изучать теорию игр на конкретных примерах, поскольку сама эта математическая дисциплина не является сухо-теоретической.


Пример дилеммы заключенного

Пример, два человека совершили грабеж, попали в руки полиции и проходят допрос в отдельных камерах. При этом служители полиции предлагают каждому участнику выгодные условия, при которых он выйдет на свободу в случае дачи показаний против своего напарника. У каждого из преступников существует следующий набор стратегий, которые он будет рассматривать:


*Оба одновременно дают показания и получают по 2,5 года в тюрьме.

*Оба одновременно молчат и получают по 1 году, поскольку в таком случае доказательная база их вины будет мала.

*Один дает показания и получает свободу, а другой молчит и получает 5 лет тюрьмы.

Очевидно, что исход дела зависит от решения обоих участников, но сговориться они не могут, поскольку сидят в разных камерах. Также ярко виден конфликт их личных интересов в борьбе за общий интерес. У каждого из заключенных есть два варианта действий и 4 варианта исходов.


Цепь логических умозаключений

Итак, преступник А рассматривает следующие варианты:


*Я молчу и молчит мой напарник — мы оба получим по 1 году тюрьмы.

*Я сдаю напарника и он сдает меня — мы оба получим по 2,5 года тюрьмы.

*Я молчу, а напарник меня сдает — я получу 5 лет тюрьмы, а он свободу.

*Я сдаю напарника, а он молчит – я получаю свободу, а он 5 лет тюрьмы.

Приведем матрицу возможных решений и исходов для наглядности.

Вопрос состоит в том, что выберет каждый участник?

«Молчать, нельзя говорить» или «молчать нельзя, говорить»

Чтобы понять выбор участника, нужно пройти по цепочке его размышлений. Следуя рассуждениям преступника А: если я промолчу и промолчит мой напарник, мы получим минимум срока (1 год), но я не могу узнать, как он себя поведет. Если он даст показания против меня, то мне также лучше дать показания, иначе я могу сесть на 5 лет. Лучше мне сесть на 2,5 года, чем на 5 лет. Если он промолчит, то мне тем более нужно дать показания, поскольку так я получу свободу. Точно так же рассуждает и участник B.


Нетрудно понять, что доминирующая стратегия для каждого из преступников - это дача показаний. Оптимальная точка этой игры наступает тогда, когда оба преступника дают показания и получают свой «приз» — 2,5 года тюрьмы. Теория игр Нэша называет это равновесием.


Неоптимальное оптимальное решение по Нэшу

Революционность нэшевского взгляда в том, что такое равновесие не является оптимальным, если рассмотреть отдельного участника и его личный интерес. Ведь наилучший вариант - это промолчать и выйти на свободу.


Равновесие по Нэшу – это точка соприкосновения интересов, где каждый участник выбирает такой вариант, который для него оптимальный только при условии, что другие участники выбирают определенную стратегию.


Рассматривая вариант, когда оба преступника молчат и получают всего по 1 году, можно назвать него Парето-оптимальным вариантом. Однако он возможен, только если преступники смогли бы сговориться заранее. Но даже это не гарантировало бы этого исхода, поскольку соблазн отступить от уговора и избежать наказания велик. Отсутствие полного доверия друг к другу и опасность получить 5 лет вынуждает выбрать вариант с признанием. Размышлять о том, что участники будут придерживаться варианта с молчанием, действуя согласованно, просто нерационально. Такой вывод можно сделать, если изучать равновесие Нэша. Примеры только доказывают правоту.


Эгоистично или рационально

Теория равновесия Нэша дала потрясающие выводы, опровергнувшие существующие до этого принципы. Например, Адам Смит рассматривал поведение каждого из участников как абсолютно эгоистичное, что и приводило систему в равновесие. Эта теория носила название «невидимая рука рынка».


Джон Нэш увидел, что если все участники будут действовать, преследуя только свои интересы, то это никогда не приведет к оптимальному групповому результату. Учитывая, что рациональное мышление присуще каждому участнику, более вероятен выбор, который предлагает стратегия равновесия Нэша.


Чисто мужской эксперимент

Ярким примером может служить игра «парадокс блондинки», которая хотя и кажется неуместной, но является яркой иллюстрацией, показывающей, как работает теория игр Нэша.


В этой игре нужно представить, что компания свободных парней пришла в бар. Рядом оказывается компания девушек, одна из которых предпочтительнее других, скажем блондинка. Как парням повести себя, чтобы получить наилучшую подругу для себя?


Итак, рассуждения парней: если все начнут знакомиться с блондинкой, то, скорее всего, она никому не достанется, тогда и ее подруги не захотят знакомства. Никто не хочет быть вторым запасным вариантом. Но если парни выберут избегать блондинку, то вероятность каждому из парней найти среди девушек хорошую подругу высока.


Ситуация равновесия по Нэшу неоптимальна для парней, поскольку, преследуя лишь свои эгоистические интересы, каждый выбрал бы именно блондинку. Видно, что преследование только эгоистичных интересов будет равнозначно краху групповых интересов. Равновесие по Нэшу будет значить то, что каждый парень действует в своих личных интересах, которые соприкасаются с интересами всей группы. Это неоптимальный вариант для каждого лично, но оптимальный для каждого, исходя из общей стратегии успеха.


Вся наша жизнь игра

Принятие решений в реальных условиях очень напоминает игру, когда вы ожидаете определенного рационального поведения и от других участников. В бизнесе, в работе, в коллективе, в компании и даже в отношениях с противоположным полом. От больших сделок и до обычных жизненных ситуаций все подчиняется тому или иному закону.


Конечно, рассмотренные игровые ситуации с преступниками и баром - это всего лишь отличные иллюстрации, демонстрирующие равновесие Нэша. Примеры таких дилемм очень часто возникают на реальном рынке, а особенно это работает в случаях с двумя монополистами, контролирующими рынок.


Смешанные стратегии

Часто мы вовлекаемы не в одну, а сразу в несколько игр. Выбирая один из вариантов одной игре, руководствуясь рациональной стратегией, но попадаете в другую игру. После нескольких рациональных решений вы можете обнаружить, что ваш результат вас не устраивает. Что же предпринимать?


Рассмотрим два вида стратегии:


Чистая стратегия – это поведение участника, которое исходит из размышления над возможным поведением других участников.

Смешанная стратегия или случайная стратегия – это чередование чистых стратегий случайным образом или выбор чистой стратегии с определенной вероятностью. Такую стратегию еще называют рэндомизированной.

Рассматривая такое поведение, мы получаем новый взгляд на равновесие по Нешу. Если ранее говорилось о том, что игрок выбирает стратегию один раз, то можно представить и другое поведение. Можно допустить тот вариант, что игроки выбирают стратегию случайно с определенной вероятностью. Игры, в которых нельзя найти равновесия Нэша в чистых стратегиях, всегда имеют их в смешанных.


Равновесие Нэша в смешанных стратегиях называется смешанным равновесием. Это такое равновесие, где каждый участник выбирает оптимальную частоту выбора своих стратегий при условии, что другие участники выбирают свои стратегии с заданной частотой.


Пенальти и смешанная стратегия

Пример смешанной стратегии можно привести в игре в футбол. Лучшая иллюстрация смешанной стратегии - это, пожалуй, серия пенальти. Так, у нас есть вратарь, который может прыгнуть только в один угол, и игрок, который будет бить пенальти.


Итак, если в первый раз игрок выберет стратегию сделать удар в левый угол, а вратарь также упадет в этот угол и словит мяч, то как могут развиваться события во второй раз? Если игрок будет бить в противоположный угол, это, скорее всего, слишком очевидно, но и удар в тот же угол не менее очевиден. Поэтому и вратарю, и бьющему ничего не остается, как положиться на случайный выбор.


Так, чередуя случайный выбор с определенной чистой стратегией, игрок и вратарь пытаються получить максимальный результат.

Источник: fb. ru

Показать полностью 13
Джон Нэш Математика Наука Открытие Теория Экономика Биография Длиннопост Теория игр
24
Посты не найдены
О нас
О Пикабу Контакты Реклама Сообщить об ошибке Сообщить о нарушении законодательства Отзывы и предложения Новости Пикабу Мобильное приложение RSS
Информация
Помощь Кодекс Пикабу Команда Пикабу Конфиденциальность Правила соцсети О рекомендациях О компании
Наши проекты
Блоги Работа Промокоды Игры Курсы
Партнёры
Промокоды Биг Гик Промокоды Lamoda Промокоды Мвидео Промокоды Яндекс Маркет Промокоды Пятерочка Промокоды Aroma Butik Промокоды Яндекс Путешествия Постила Футбол сегодня
На информационном ресурсе Pikabu.ru применяются рекомендательные технологии