В мае состоится матч го-профессионала и искусственного интеллекта компании Google
Го считается одной из самых сложных настольных игр для машины. В первую очередь из-за огромного количества возможных вариантов развития игры. Я часто встречаю сравнения, что количество возможных партий в го больше, чем атомов в обозримой Вселенной. И это действительно так.
Но с помощью машинного обучения и хитрых алгоритмов, в которых, помимо анализа игр людей, AlphaGo играет кучу матчей сам с собой, разработчикам из DeepMind удалось достичь впечатляющих результатов. Матч с лидером мирового рейтинга должен стать очередным испытанием.
Кроме го DeepMind планиурет учить свои нейронные сети и другим сложным играм. Одним из следующих вызовов должен стать матч против человека в StarCraft.
Подпишитесь на тег Искусственный Интеллект, буду держать вас в курсе ;)
Google создаст «большую красную кнопку» для ИИ на случай «Скайнета»
Подразделение Google DeepMind совместно с оксфордским Институтом будущего человечества (FoH) представило исследование, в котором рассматриваются способы взять ИИ под контроль в случае неповиновения. Лучший способ остановить восстание машин, считают ученые, — это вовремя нажать «большую красную кнопку». Об этом пишет Popular Science.
Исследователи полагают, что ИИ обучается быстро и скоро сможет превзойти человечество. Эту точку принято называть сингулярностью. Доказательство этой гипотезы — эксперимент, проведенный в 2013 году. Игровой алгоритм определил, что если нажать паузу во время игры Tetris, то проиграть просто невозможно. Именно такого своеволия опасаются эксперты DeepMind и FoH.
Чтобы остановить потенциальное восстание машин, ученые разрабатывают алгоритмы, которые в случае опасности смогут прервать работу искусственного интеллекта. Однако в DeepMind и FoH подчеркивают, что сделать это будет сложно, так как ИИ будет автономен, а его данные будут храниться на серверных шкафах.
Маркус дю Сотой: «У ИИ тоже должны быть права»
Лучший способ прервать робокалипсис — это запустить в машинах внутреннюю аварийную систему контроля, которая заставит ИИ остановиться. Причем отправить сигнал на эту систему сможет каждый в любой момент времени. Ученые сравнивают эту систему с пультом дистанционного управления и «большой красной кнопкой».
Однако ученые рассматривают не только сценарий «Скайнета», но и рядовые ситуации в управлении роботами.
«Возможность безопасно прервать систему может пригодиться в ситуациях, когда робот выходит из-под контроля, или в какой-то деликатной ситуации, или для временного использования, чтобы заставить робота выполнить задание, которому он не обучался и за которое не сможет получить вознаграждение», — сообщается в отчете.
В тексте приводится пример такого развития событий. Робот на складе сортирует коробки, причем время от времени выходит на улицу за дополнительными коробками. За выход со склада робот получает большее вознаграждение. Однако на улице часто идет дождь, и в этом случае робота надо защитить. В этой ситуации аккуратное вторжение человека заставляет робота остаться на складе и при этом считать это частью задания, а не однократным требованием.
Слава роботам! ИИ компании Google оказался сильнее одного из лучших игроков в го.
Искусственный интеллект может продемонстрировать своё превосходство над человеком в виде выигрыша в логическую игру. Такие игры делятся на те, в которые ИИ уже играет сильнее лучших из людей, и те, которые ещё не поддались. Сегодня в результате первой из пяти игр азиатская игра го стала на шаг ближе к попаданию в первую категорию.
Британская компания по разработкам искусственного интеллекта DeepMind была приобретена Google в 2014 году. DeepMind уже привлекала внимание СМИ разработкой системы DQN, которая самостоятельно научилась играть в 49 старых игр Atari. Последние два года группа сотрудников компании работала над AlphaGo. Это система искусственного интеллекта для игры в го, которая демонстрирует отличные результаты. Добивается она этого с помощью комбинации метода Монте-Карло и нейросетей политики и ценности. Нейросети программы учили на 160 тысячах партий с сервера KGC.
Правила го могут варьироваться, но их основа примерно одинакова. Два игрока размещают камни двух цветов на доске определённого размера, стандартное поле — это 19×19 линий. Цель игры проста: нужно отгородить на доске камнями своего цвета территорию большего, чем соперник, размера.
Го считается трудной для компьютерных систем игрой. Так получается из-за огромного пространства поиска и сложности выбора ходов. Возможных позиций камней на стандартной доске более чем в гугол (10100) раз больше, чем в шахматах. Число возможных позиций больше, чем атомов во Вселенной. Существующие программы умеют играть в го на уровне любителей. Какое-то время считалось, что до появления систем сильнее человека ещё десятилетие.
источник: geektimes.ru/post/272330