Искусственный интеллект научили игре в покер чтобы превзойти человека.⁠⁠

Переведено мной для общего ознакомления. Критика и рекомендации приветствуются.

Искусственный интеллект обучается покеру чтобы превзойти человека.

By Tonya RileyMar. 3, 2017 , 2:15 PM

2 искусственных интеллекта (ИИ) наконец доказали свои знания «когда поддержать, а когда и сбросить руку» впервые победив современных игроков в популярной разновидности покера Техасский Холдем, и на этой неделе команда руководящая одним из ИИ, также известная как DeepStack, приоткрыла некоторые секреты их успеха – используя которые ИИ могут быть использованы в широком спектре задач от усиления безопасности авиалиний до упрощения ведения деловых переговоров.

ИИ превосходил человека в таких играх как шахматы и в прошлом году в Го, но они были плохими игроками в покер. В DeepStack исследователи прервали серию неудач, объединив новые алгоритмы и глубокое машинное обучение, позволяя более точно имитировать человеческий мозг и самообучаться.

"Это ... масштабируемый подход к решению [комплексной информации], которые позволяют быстро принять очень хорошее решение, даже лучше, чем у людей," говорит Мюррей Кэмпбелл, старший научный сотрудник IBM в Армонк, Нью-Йорк, и один из создателей шахмотного ИИ - Deep Blue.

Шахматы и Го имеют одно общее важное свойство, которое позволяло в первую очередь ИИ выигрывать – Это 2 идеальные информационные игры. Это значит что обе стороны точно знают с чем оперирует оппонент – большая помощь для ИИ. Техасский Холдем совсем иное, в этой версии покера, 2 или более игроков – неопределенно оперируют с закрытыми картами. Предоставляя набор общих карт, игроков спрашивают, повысить ставку, поддержать ставку или сбросить карты. Исходя из неопределенной основы игры, ставки игроков основываются на угадывании, что мог бы сделать их противник. Противоположно шахматам, где выигрышная стратегия основывается исходя из положения фигур на доске и потенциальных ходов игрока, Холдем требует то, что мы называем интуицией.

Цель традиционных ИИ – высчитать возможные результаты игры так глубоко, как это возможно и затем определить порядок действий исходя из данных полученных в предшествующих играх. Недостаток этого метода в порядке сжатия доступных данных , алгоритм иногда подбирает стратегии которые неспособны победить, - сказал Майкл Боулинг, компьютерный ученый из Университета Альберты в Эдмонтоне, Канада.

ИИ DeepStack, избегает абстрагирования данных проводя вычисления лишь на несколько шагов вперед, а не всю игру. Программа постоянно пересчитывает действия согласно алгоритму, как только поступают новые данные. Как только ИИ нужно произвести действие перед тем как оппонент повысит ставку или поддержит текущую и не поступила новая информация для вычислений, тогда в дело вступают Нейронные сети, - система которая задействует знания полученные в результате обучения. То есть помогает ограничить возможные ситуации для вычисления в алгоритме, так как они были получены во время прошлых игр. Это позволяет ИИ принять более быстрый и точный вариант действия –прокомментировал Майкл Боулинг. Для обучения нейронных сетей DeepStack, исследователям потребовалась программа для решения более 10 миллионов случайно сгенерированных игровых покерных ситуаций.

Для тестирования DeepStack, исследователи в прошлом году провели соревнования против 33 профессиональных игроков в покер, выбранных Международной федерации покера. В течение 4-х недель, игроки соревновались на протяжении 44,852 игр по безлимитному Техас холдему, версия для двух игроков, в которой участники могли ставить столько денег, сколько у них есть. После того, как с помощью формулы для устранения случаев, когда удача, а не стратегия, позволяли победить, исследователи обнаружили, что конечная скорость победа DeepStack была 486 милли-биг-блайнд за игру. милли-биг-блайнд это одна тысячная ставки которая требуется, чтобы выиграть игру. Это почти в 10 раз больше, чем то, что профессиональные игроки в покер считают значительной маржой, отрапортовала команда ИИ на этой неделе в «Science».

Решения задач команды совпадают с успехом, который несколько недель назад использовал Libratus, покерный ИИ, разработанный исследователями из Университета Карнеги-Меллона в Питтсбурге, штат Пенсильвания. В соревнованиях по покеру на протяжении 20 дней, состоявшейся в Питтсбурге, Libratus превзошел четырех человек из Топ мирового рейтинга Texas Holdem на протяжении 120,000 раздач. Обе команды сообщают что их системы превосходят над людьми благодаря статистически значимым выводами. Основное отличие заключается в том, что из-за отсутствия глубокого изучения, Libratus требует больше вычислительной мощности для своих алгоритмов и первоначально необходимо решать задачи до конца каждый раз, чтобы построить стратегию, говорит Боулинг. DeepStack может работать на ноутбуке.

Хотя еще не ясно какой ИИ является настоящим покер-чемпионом, так как не было проведено ни одного матча между ними, тем не менее уже известно что обе системы приспособлены для решения более сложных проблем реального мира в таких областях как безопасность и ведение переговоров.

Исследователи также заинтересованы в бизнес-применении технологии. Например, искусственный интеллект, который может понять, плохие информационные сценарии и может помочь определить окончательную цену продажи дома, которая будет для покупателя приемлемой, прежде чем задействовать другие ставки, что позволяет покупателю лучше планировать по ипотечному кредиту. Система как AlphaGo, идеальный игровой ИИ, который победил чемпиона мира в прошлом году, не сможет этого сделать из-за отсутствия ограничений на возможный размер и количество ставок.

Тем не менее, DeepStack через несколько лет будет в состоянии имитировать сложные человеческие принятия решений, говорит Боулинг. Машина научиться более точно обрабатывать сценарии, где состояние игры не известны заранее, как в Техас Холдем, и где его нейронные сети не были обучены, - говорит он.

Кэмпбелл соглашается. "Покер является шагом более сложным, чем информационные игры," говорит он, " ИИ все еще должен пройти долгий путь, чтобы осознать беспорядочность реального мира."

Прошу пояснить что такое Маржа в покере ?

Прошу пояснить что такое Милли-биг-блайнд ?

Спасибо за прочтение и спасибо за замечания:

Einz – спаибо за то что нашёл ошибки мне стало стыдно

korovsky – сперва ты заставил меня пригорать – но тем не менее я стал более тщательно читать свой перевод

Xirurgik и DormidontDZ – за поддержку

Наука | Научпоп

7.7K пост78.5K подписчиков

Добавить пост

Правила сообщества

Основные условия публикации

- Посты должны иметь отношение к науке, актуальным открытиям или жизни научного сообщества и содержать ссылки на авторитетный источник.

- Посты должны по возможности избегать кликбейта и броских фраз, вводящих в заблуждение.

- Научные статьи должны сопровождаться описанием исследования, доступным на популярном уровне. Слишком профессиональный материал может быть отклонён.

- Видеоматериалы должны иметь описание.

- Названия должны отражать суть исследования.

- Если пост содержит материал, оригинал которого написан или снят на иностранном языке, русская версия должна содержать все основные положения.

Не принимаются к публикации

- Точные или урезанные копии журнальных и газетных статей. Посты о последних достижениях науки должны содержать ваш разъясняющий комментарий или представлять обзоры нескольких статей.

- Юмористические посты, представляющие также точные и урезанные копии из популярных источников, цитаты сборников. Научный юмор приветствуется, но должен публиковаться большими порциями, а не набивать рейтинг единичными цитатами огромного сборника.

- Посты с вопросами околонаучного, но базового уровня, просьбы о помощи в решении задач и проведении исследований отправляются в общую ленту. По возможности модерация сообщества даст свой ответ.

Наказывается баном

- Оскорбления, выраженные лично пользователю или категории пользователей.

- Попытки использовать сообщество для рекламы.

- Фальсификация фактов.

- Многократные попытки публикации материалов, не удовлетворяющих правилам.

- Троллинг, флейм.

- Нарушение правил сайта в целом.

Окончательное решение по соответствию поста или комментария правилам принимается модерацией сообщества. Просьбы о разбане и жалобы на модерацию принимает администратор сообщества. Жалобы на администратора принимает @SupportComunity и общество Пикабу.

tasdev

7 лет назад

Маржа - грубо говоря, средняя прибыль за игру. Так как игрок может несколько сдач выиграть, несколько проиграть, и разные суммы во всех - считается потом средний доход на одну сыгранную сдачу.
Измеряется он в ББ - биг блайндах, минимальной ставке для вхождения в игру. Ну или милли-ББ, т.е. 1/1000 ББ.
Т.е. в игре с минимальной ставкой доллар, ИИ выигрывал бы в среднем 48 центов на сдачу. Это очень и очень круто, даже не верится в такой результат.