新华社华盛顿7月11日电(记者周舟)美国卡内基-梅隆大学11日宣布◈★,该校和脸书公司合作开发的人工智能Pluribus在六人桌德州扑克比赛中击败多名世界顶尖选手◈★,成为机器在多人游戏中战胜人类的一个里程碑◈★。
美国《科学》杂志11日在线发表的相关论文显示被C的走不了路智能电器◈★。◈★,Pluribus与13名德州扑克高手进行了1万手不限注对局的六人桌比赛◈★,每次比赛中由机器对5名人类选手◈★,结果机器取得胜利wework官网◈★。
在另外一种形式的六人桌比赛中wework官网◈★,由5个Pluribus与1名人类选手对局◈★,结果机器分别在5000手对局中先后击败了德州扑克世界冠军达伦·伊莱亚斯和克里斯·弗格森wepoker◈★!◈★。
在比赛中◈★,Pluribus会让自己变得难以预测被C的走不了路◈★。例如常规打法是在牌最好的时候押注wework官网◈★,但这很快会被对手识破◈★,因此它会“耍点心眼”◈★,不按常理出牌wepoker官网中文版◈★,◈★。分析显示被C的走不了路wework官网◈★,它会做出一些多数人类玩家都认为不好的决策◈★,这在客观上也迷惑了对手◈★。
研究人员指出◈★,与让机器下国际象棋和围棋相比◈★,德州扑克的挑战更大◈★。德州扑克比赛中每方都不知道对手的牌◈★,对手还可能在押注时虚张声势◈★,因此决策只能基于不完全信息◈★,这与真实世界中的问题更接近◈★。
卡内基-梅隆大学教授图奥马斯·桑德霍尔姆说◈★,此前人工智能在“战略性推理”方面取得的成就仅限于二人游戏◈★,此次在复杂游戏中战胜5名人类选手◈★,将为人工智能解决真实世界问题提供新的可能性◈★。
据介绍wework官网◈★,在二人游戏中被C的走不了路◈★,机器的策略是实现博弈论中的“纳什均衡”被C的走不了路◈★,即确保结果至少是平局◈★,而只要对手犯错打破均衡◈★,机器就能获胜◈★。但这一策略不适用于多人游戏◈★,因此机器不能保平◈★,必须不断争取先手才能最终获胜◈★。研究人员为此设计了一种新的“有限前瞻搜索”算法◈★,让机器能做出一个平衡的整体决策◈★。
2017年被C的走不了路被C的走不了路◈★,卡内基-梅隆大学开发的人工智能Libratus曾在12万手一对一不限注德州扑克比赛中分别战胜4名人类选手◈★。