После марафонского матча по безлимитному техасскому холдему против четырех лучших профессиональных игроков в покер Libratus, искусственный интеллект, разработанный в Карнеги-Меллон, на решающие 1,77 миллиона долларов фишек.
Во время нашего предыдущего отчета о конкурсе, который состоялся в казино Rivers в Питтсбурге, начиная с 11 января, казалось вероятным, что Libratus выйдет победителем, несмотря на шаткое начало, давшее надежду его противникам. Однако степень улучшения игрового процесса за 20-дневный матч была впечатляющей и стала неожиданностью для игроков-людей, которые изначально сомневались в ее способности блефовать.
В этом видео Карнеги-Меллона, снятом чуть более чем на полпути к событию, мы слышим реакцию покерных профессионалов, Джейсона Леса и Джимми Чоу, на то, как проходил матч, и его создатель, профессор Туомас Сандхольм, объясняет способности, необходимые для покера. такие же, как и в других сложных многоагентных ситуациях, таких как деловые переговоры:
Теперь игра завершилась, когда Libratutus опережает профи с общим счетом в 1 766 250 долларов в фишках, хотя никто не получает эти выигрыши. Четыре профессионала поделятся 200000 долларов в зависимости от своих результатов, в то время как команда Libratus планирует опубликовать свои алгоритмы искусственного интеллекта в рецензируемом журнале.
До сих пор сдерживаясь в отношении того, как действует Libratus, опасаясь дать какое-либо преимущество игрокам-людям, Сандхольм уже поделился некоторыми из его общих черт.
Libratus состоит из трех основных частей, первая из которых не сильно отличается от Claudico, его предшественника, который одержал безрезультатную победу над человеческими противниками в 2015 году. Эта часть концентрируется на стратегиях, которые следует использовать в начале игры и, как и раньше Сообщается, что перед матчем было потрачено 15 миллионов основных часов вычислений на компьютере Bridges в Питтсбургском суперкомпьютерном центре (PSC).
Вторая часть ИИ, «решатель эндшпиля», была полностью переработана Сандхольмом и его аспирантом Ноамом Брауном для Libratus, и хотя из статистического анализа невозможно было сказать, улучшило ли оно в более ранней версии манеру игры Клаудико. В общем, обновленная версия была охарактеризована Сандхольмом как «потрясающая».
В третьей части Libratus ИИ искал свои собственные стратегические слабости, чтобы он мог изменить свою игру перед следующей сессией, и для этого команда Карнеги-Меллона полагалась на возможность уделить ей время на мостах, финансируемых Национальным научным фондом. компьютер в ночное время на протяжении всего конкурса. Он использовал примерно 600 из 846 вычислительных узлов Bridges. Общая скорость мостов составляет 1,35 петафлопса, что примерно в 7250 раз быстрее, чем у высокопроизводительного ноутбука, а его память составляет 274 терабайта, что примерно на 17 500 больше, чем у этого ноутбука.
Объясняя это, Сандхольм сказал:
«Каждый день после завершения игры мета-алгоритм анализировал, какие дыры профессионалы выявили и использовали в стратегии Libratus. Затем он расставил приоритеты в дырах и алгоритмически исправлял тройку лучших с помощью суперкомпьютера каждую ночь ».
Другими словами, Libratus научился определять вещи, которые эксплуатируют его противники, например, раздача «телеграмм», которые заметил другой игрок. Именно из-за этого играть каждый день становилось все труднее, что отмечали игроки-люди.
Ник Нистром, старший директор по исследованиям PSC и главный исследователь системы Bridges, прокомментировал, что успех Libratus не ограничивается покером:
«Победа Libratus — важная веха на пути к разработке искусственного интеллекта для решения сложных реальных проблем. В то же время Bridges делает новые открытия в физических науках, биологии, социальных науках, бизнесе и даже в гуманитарных науках ».
После завершения конкурса «Мозги против ИИ» Сандхольм намерен продолжить свои исследования основных технологий, используемых для решения игр с несовершенной информацией и применения этих технологий для решения реальных проблем.