Парето-оптимальность

Всем привет! Я продолжаю свою серию постов по популяризации науки :) Пока я выкладываю материалы по теории игр.


Парето-оптимальность


Из двух возможных видов игр мы до сих пор рассматривали только некооперативные, то есть те, в которых каждый игрок является эгоистом и желает максимизировать только свой собственный выигрыш или минимизировать свой проигрыш. Возникает вопрос: почему, например, в дилемме заключённого игроки не могут договориться между собой о том, какие стратегии применять?


Критики игрового анализа дилеммы заключённого считают, что рациональное поведение, приводящее к более выгодным для всех ситуациям, возникает не для отдельных лиц, а для групп. Поэтому они считают, что для отдельно взятого игрока его оптимальная стратегия будет заключаться в достижении оптимальной цели для всей группы в целом. Теория рабочего класса Карла Маркса является проявлением такого мышления.


Вильфредо Парето (1848–1923), итальянский социолог и экономист, внес свой вклад в изучение распределения доходов и анализ индивидуального выбора. Он вводит понятие эффективности и помогает развивать область микроэкономики с помощью таких идей, как кривая безразличия. Возможно, вы уже слышали о «принципе Парето». Также называемый законом Парето, принципом 80-20 или даже законом 80-20, это эмпирическое явление, наблюдаемое в определенных областях: примерно 80% следствий являются продуктом 20% причин. Хотя работы Парето не обязательно подразумевает распределение 80-20, Джозеф Джуран в 1954 году использовал выражение «принцип Парето» для его обозначения.


Другой термин, носящий его имя, связан с теорией игр. Пусть имеется система с несколькими частными показателями. Тогда система достигла оптимальности по Парето (стала эффективной по Парето), если при улучшении любого из показателей достигается ухудшение других.


Сам Парето высказывался так:


«Всякое изменение, которое никому не приносит убытков, а некоторым людям приносит пользу (по их собственной оценке), является улучшением»


Относительно исходной ситуации, улучшение по Парето — это новая ситуация, в которой некоторые агенты выиграют, а ни один агент не проиграет.


Ситуация называется доминируемой по Парето, если возможно улучшение по Парето.

Таким образом, система допускает локальные улучшения до тех пор, пока они не приносят никому вреда.


В своем «Руководстве по политической экономии»  Парето рассматривает максимальную полезность для общества как свойство общего экономического равновесия и определяет ее как положение, при котором всякая малая вариация увеличивает полезность одних и уменьшает полезность других.


Полезность относится к полезности товара или услуги, ощущаемой данным экономическим агентом в данное время, в отличие от объективной полезности того же товара или услуги. Например, для путешественника в пустыне стакан воды субъективно будет стоить намного дороже, чем для человека в бассейне.


Таким образом, система допускает локальные улучшения, если они никому не вредят. Общее благо общества по Парето максимально в том состоянии, когда никакое изменение полученного оптимального распределения не наносит вреда благосостоянию хотя бы одного объекта системы. Например, в дилемме заключённых состояние «оба молчат» является Парето-оптимальным.


Но опять же возникает проблема. Философы, которые считают, что этот факт показывает противоречие между некооперативной и кооперативной теорией игр упускают из виду важность предположения в кооперативной теории игр о том, что могут быть сделаны жесткие договоренности. Не имеет значения, что Франкенштейн и Дракула обещали соблюдать соглашение. Они, например, могут договориться, но не сдержать обещания. Или же они могут затратить ресурсы на обеспечение нерушимости договора.


Фонтан с водой и оптимум Парето


Мы обсудим здесь ситуацию, описанную в статье одного французского исследователя.

В административном ресторане есть довольно классический для франции питьевой фонтан, оборудованный двумя кранами, с одной особенностью, которая кажется весьма распространенной: общий поток воды одинаков при работе одного или обоих кранов. Когда два человека приходят наполнить свои графины, они обычно делают это одновременно, используя оба крана. Это действительно хорошая идея?

Парето-оптимальность Математика, Теория игр, Джон Нэш, Парето, Популяризация, Дилемма заключенного, Длиннопост

Представьте себе, что первый человек, Гензель, подходит к фонтану, чтобы наполнить свой графин. Как раз в тот момент, когда он собирается начать налить себе водички, в свою очередь появляется второй человек, Гретель. У последней есть выбор между двумя стратегиями: активировать второй кран, чтобы наполнить ее графин одновременно с Гензелем, или подождать, пока тот не закончит, прежде чем начать делать это.


Когда работает только один из кранов, он наполняет графин примерно за 20 секунд. Когда оба крана открыты, каждый из них наполняет графин за 40 секунд. Если Гретель решит использовать второй кран, она и Гензель проведут у фонтана 40 секунд. Если же она решит подождать, Гензель проведет там только 20 секунд, а она 40 (20, чтобы подождать и 20, чтобы наполнить свой графин).


Таким образом, Гретель абсолютно ничего не выигрывает, если откроет второй кран, а Гензель в таком случае потеряет 20 секунд. Поэтому лучшим общим решением будет подождать и никогда не использовать оба крана одновременно.


В случае, который нас здесь интересует, есть две ситуации: одна, когда Гретель использует второй кран, и другая, когда она ждет, прежде чем наполнить свой графин. Вторая ситуация – оптимум Парето, но не первая, поскольку можно улучшить результат Гензеля (сократить его время у фонтана с 40 до 20 секунд), не ухудшив результат Гретель (у которой и так и так будет 40 секунд ожидания).


На самом деле, единственный плюс двух краников у таких фонтанов – это возможность поболтать с коллегой, пока наполняются графины, поэтому, несмотря на всю их нелогичность, во Франции они всюду =)


Попробуйте вспомнить, с какими примерами подобных ситуаций вы уже сталкивались в своей жизни?