Авторизация
 
  • 06:29 – Натуральное путешествие 
  • 10:14 – 30 мая 2020 года в ущелье Чункурчак пройдёт плоггинг 
  • 11:00 – Грибы Кыргызстана. Тихая охота 
  • 10:53 – Фотоконкурс "Природа в кадре" 

Компьютер впервые победил профессиональных игроков в покер, выиграв более $1,7 млн

Компьютер впервые победил профессиональных игроков в покер, выиграв более $1,7 млн

Программа Libratus, разработанная в Университете Карнеги — Меллона, победила в 20-дневном покерном турнире «Brains Vs. Artificial Intelligence: Upping the Ante». Компьютер обыграл людей и выиграл фишек на более 1,7 миллиона долларов, сообщает New Scientist, передает Joinfo.ua.


В последнее время наработки в области машинного обучения позволили компьютерам значительно продвинуться вперед и обыграть людей в играх, в которых это традиционно считалось невозможным. Однако, вплоть до недавнего времени люди по-прежнему побеждали в играх с неполной информацией. В 2015 году программа Claudico (предшественник Libratus) играла с четырьмя профессиональными игроками и заняла третье место. На протяжении двух недель было сыграно 80000 раздач и из четырех живых игроков только один набрал меньше фишек, чем компьютер.


В турнире, который проходил в питтсбургском казино Rivers было сыграно 120 тысяч раздач в безлимитный техасский холдем один на один (Хедз-Ап), против Libratus играли Даниэль МакОлэй, Джимми Чу, Донг Ким и Джейсон Лес. В результате 20-дневного турнира программа победила людей, заработав более 1,7 миллиона долларов в фишках. Несмотря на это, разработчик не получат никаких денег, а призовой фонд в 200 тысяч долларов будет поделен между четырьмя живыми игроками в зависимости от занятого места.


На данный момент, согласно информации, которую подготовила для ДжоИнфоМедиа журналист Мария Громко, точно не известно, как именно работает Libratus, авторы описали лишь общую структуру программы и планируют в ближайшем будущем опубликовать статью в рецензируемом журнале. По словам разработчиков, Libratus состоит из трех частей. Основное «ядро» Libratus было подготовлено заранее, вычисления заняли 15 миллионов ядро-часов, в то время как на Claudico ушло два-три миллиона. Вторая часть программы следила за возможными ошибками, которые могли допустить соперники, и учитывала в процессе игры эту информацию. Третья часть Libratus отслеживала собственные слабые стороны, которые могли использовать противники, и корректировала общую стратегию с учетом этих данных. Такой подход позволил программе как блефовать самостоятельно, так и распознавать дезинформацию со стороны соперников.


По мнению авторов программы у систем, подобных Libratus, большое будущее в самых разных сферах, где приходиться иметь дело с неполной информацией. В качестве возможных сфер применения программы исследователи называют информационную безопасность, военное дело, аукционы, переговоры и даже бережливое распределение медикаментов.



Напомним, в ЕС готовятся к революции роботов.


КОММЕНТАРИИ: