继人工智能攻陷围棋,德州扑克也沦陷了

  1. 云栖社区>
  2. 镁客网>
  3. 博客>
  4. 正文

继人工智能攻陷围棋,德州扑克也沦陷了

行者武松 2018-03-14 15:19:00 浏览903
展开阅读全文

相对于围棋,德州扑克的非完美信息给了人工智能更大的压力。

继AlphaGo披着“Master”在中韩围棋界大获全胜后,德州扑克也不幸沦陷,只不过这次的主角并不是AlphaGo。

继人工智能攻陷围棋,德州扑克也沦陷了

近日,来自加拿大Alberta大学、捷克Charles大学、布拉格捷克理工大学的10位研究员在arXiv网站(一个收集物理学、数学、计算机科学与生物学论文预印本的网站)上传了一篇题为《DeepStack:无限注德扑的专业级人工智能玩家》的论文,介绍了一种能在一对一无限注德州扑克中击败人类玩家的新算法“DeepStack”。

在围棋等棋类游戏中,玩家能够获得的确定性信息是对称的,而德州扑克不同,这是一种包含了欺骗、推测的非完美信息游戏。在德州扑克的游戏中,玩家只能掌握自己手上的牌,通过推理非对称的信息,从而与对手进行博弈。而这里就是该论文的意义所在,论文中提到“DeepStack是一种通用算法,可用于一大类非完整信息的序列博弈 ”。

不同于过去研究人员所采用的一种压缩型的策略,这个加拿大和捷克的合作团队在开发新算法“DeepStack”过程中更注重培养人工智能出牌时的“直觉”。在运用深度学习,反复自我博弈之后,“DeepStack”学会了在每一个具体情境出现时进行推理,这种做法非常接近于人类玩家的习惯。

去年年末,该团队邀请了33名专业扑克选手与“DeepStack”进行了44852次博弈。在最后的结果中,DeepStack成为了首个在一对一无限注德扑中战胜人类玩家的人工智能,并且平均胜率达到了492mbb/g(milli-big-blinds per game,用于衡量扑克玩家表现的指数,一般职业玩家认为50mbb/g是个门槛,750mbb/g就是对手每局都弃牌的赢率)。


原文发布时间:2017-01-11 10:55
本文作者:韩璐
本文来自云栖社区合作伙伴镁客网,了解相关信息可以关注镁客网。

网友评论

登录后评论
0/500
评论
行者武松
+ 关注
所属团队号: 镁客网