Искусственный интеллект Карнеги-Меллона побеждает лучших покерных профессионалов

Libratus, искусственный интеллект, разработанный Университетом Карнеги-Меллона, вошел в историю, победив четырех лучших в мире профессиональных игроков в покер в марафонском 20-дневном покерном конкурсе под названием «Brains Vs

Libratus, искусственный интеллект, разработанный Университетом Карнеги-Меллона, вошел в историю, победив четырех лучших в мире профессиональных игроков в покер в марафонском 20-дневном покерном конкурсе под названием «Brains Vs. Искусственный интеллект: поднять ставку »в казино Rivers в Питтсбурге.

После того, как 30 января были разыграны последние 120 000 раздач в хедз-апе, в безлимитном техасском холдеме, Libratus выиграл у коллектива $ 1 766 250 фишек. Разработчики Libratus - Туомас Сандхольм, профессор компьютерных наук, и Ноам Браун, доктор философии. студент в области компьютерных наук - сказал, что значительная победа является статистически значимой, а не просто вопросом удачи.

«Способность ИИ к стратегическим рассуждениям с несовершенной информацией превзошла способность лучших людей», - сказал Сандхольм.

Этот новый этап в искусственном интеллекте имеет значение для любой области, в которой информация является неполной, а противники сеют дезинформацию, сказал Фрэнк Пфеннинг, руководитель отдела компьютерных наук в Школе компьютерных наук КМУ. Деловые переговоры, военная стратегия, кибербезопасность и планирование медицинского лечения могут выиграть от автоматизированного принятия решений с использованием подобного Libratus AI.

«Компьютер не может выиграть в покер, если он не может блефовать», - сказал Пфеннинг. «Разработка ИИ, способного сделать это успешно, является огромным научным шагом вперед и имеет множество применений. Представьте, что ваш смартфон когда-нибудь сможет договориться о лучшей цене на новый автомобиль для вас. Это только начало.

Профессионалы - Донг Ким, Джимми Чоу, Даниэль Маулай и Джейсон Лес - поделят призовой кошелек на 200 000 долларов на основе их соответствующих результатов во время мероприятия.

Маколей из Шотландии сказал, что Либратус был более жестким противником, чем он ожидал, но было противно играть против него.

«Всякий раз, когда ты играешь в покер с лучшим игроком, ты учишься у него», - говорит Маколэй.

Лес из Коста Меса, Калифорния, согласился, что превосходящие противники помогают игрокам в покер улучшаться.

«Обычно вам приходится много терять и платить много денег за опыт», - сказал он. «Здесь, по крайней мере, я не теряю деньги».

«Этот эксперимент потребовал, чтобы мы собрали нескольких лучших в мире профессиональных игроков в покер, которые специализируются на хедз-апе по безлимитному техасскому холдему, и что они будут играть в меру своих способностей на протяжении всего длительного соревнования», - сказал Браун. «Эти игроки больше чем встречался, что описание и оказался живучей команда противников для Libratus, изучение и разработку стратегии вместе на протяжении всего мероприятия.»

Победа Libratus стала возможной благодаря компьютеру Bridges Питтсбургского суперкомпьютерного центра, на котором ИИ вычислил свою стратегию до и во время события, и казино Rivers, которое провело это событие.

«Rivers Casino гордится тем, что сотрудничает с Университетом Карнеги-Меллона и Питтсбургским суперкомпьютерным центром для размещения Brains Vs. Искусственный интеллект: рост конкуренции Ante », - сказал Крейг Кларк, генеральный директор Rivers Casino. «Подобные исторические события очень важны, поскольку они повышают осведомленность о том, как компании в Питтсбурге влияют на мир».

Событие было окружено спекуляциями о том, как Libratus мог улучшаться изо дня в день во время соревнований. Оказывается, именно профи научили Либрата о его слабостях.

«После того, как игра заканчивалась каждый день, мета-алгоритм анализировал, какие дыры выявили и использовали профессионалы в стратегии Libratus», - сказал Сандхольм. «Затем он расставил приоритеты в отверстиях и алгоритмически исправил тройку лидеров, используя суперкомпьютер каждую ночь. Это сильно отличается от того, как обучение использовалось в прошлом в покере. Обычно исследователи разрабатывают алгоритмы, которые пытаются использовать слабости противника. Напротив, здесь ежедневное улучшение заключается в алгоритмическом исправлении дыр в нашей собственной стратегии ».

Сандхольм также сказал, что стратегия конечной игры Libratus, которая рассчитывалась в прямом эфире с компьютером Bridges для каждой раздачи, была крупным достижением.

«У решателя конечной игры есть отличный анализ карт», - сказал он.

Он мог обновлять свою стратегию для каждой руки таким образом, чтобы любые поздние изменения только улучшали стратегию. В ходе соревнования профессионалы ответили более агрессивными ходами в начале раздачи, без сомнения, чтобы избежать игры в глубоких водах эндшпиля, где ИИ имел преимущество, добавил он.

Сандхольм поделится всеми секретами Libratus теперь, когда конкурс окончен, начиная с приглашенных докладов на собрании Ассоциации по развитию искусственного интеллекта 4-9 февраля в Сан-Франциско и представленных рецензируемым научным конференциям и журналам.

На протяжении всего конкурса Libratus набирал мощность примерно 600 из 846 вычислительных узлов Bridges. Общая скорость мостов составляет 1,35 петафлопс, примерно в 7250 раз быстрее, чем у высококлассного ноутбука, а его память составляет 274 терабайта, что примерно на 17 500 больше, чем вы бы получили на этом ноутбуке. Эта вычислительная мощь дала Libratus возможность сыграть сразу с четырьмя лучшими игроками в Техасский Холдем и победить их.

Разработчик Туомас Сандхольм и компьютер Bridges из Питтсбургского суперкомпьютерного центра, на котором ИИ рассчитал свою стратегию
Разработчик Туомас Сандхольм и компьютер Bridges из Питтсбургского суперкомпьютерного центра, на котором ИИ рассчитал свою стратегию.

«Мы разработали Bridges для объединения высокопроизводительных вычислений и искусственного интеллекта», - сказал Ник Нистром, старший директор PSC по исследованиям и главный исследователь для системы Bridges, финансируемой Национальным научным фондом. «Победа Libratus - важная веха в развитии ИИ для решения сложных реальных проблем. В то же время, Мосты приводят к новым открытиям в области физических наук, биологии, социальных наук, бизнеса и даже гуманитарных наук. Новые проекты с уникальным акцентом на удобство использования всегда приветствуются ».

Сандхольм сказал, что он продолжит свое исследование основных технологий, связанных с решением несовершенных информационных игр и применением этих технологий для решения реальных проблем. Это включает его работу с Optimized Markets, компанией, которую он основал, чтобы автоматизировать переговоры.

«CMU сыграл ключевую роль в развитии как компьютерных шахмат, которые в конечном итоге победили чемпиона мира среди людей, так и Ватсона, ИИ, который победил лучшую человеческую опасность! конкуренты », сказал Пфеннинг. «Было очень интересно наблюдать за прогрессом программ игры в покер, которые наконец превзошли лучших игроков. Каждое из этих достижений является важной вехой в нашем понимании интеллекта ».

Мозги против AI был спонсирован GreatPoint Ventures, Avenue4Analytics, TNG Technology Consulting GmbH , Журнал Искусственный интеллект , Intel а также Оптимизированные рынки, Inc , Карнеги Меллона Школа компьютерных наук в партнерстве с Rivers Casino, Питтсбургский суперкомпьютерный центр (PSC) через рецензируемый XSEDE распределение и Сандхольм Лаборатория электронных торговых площадок для мероприятия.

Техасский Холдем Head-Up No-Limit - чрезвычайно сложная игра, с 10160 (номер 1, за которым следуют 160 нулей) информационных наборов - каждый набор характеризуется своим ходом игры в руке, который воспринимает игрок, чей ход является. Это гораздо больше информации, чем количество атомов во вселенной.

ИИ должен принимать решения, не зная всех карт в игре, и в то же время пытаться выявлять блеф своим противником. Как предполагает «безлимитный», игроки могут делать ставки или повышать любую сумму до всех своих фишек.

Карта