你听闻过,可晓得它于德州扑克范畴的“表亲”阿尔法Q吗?德州扑克乃是典型的不完美信息博弈,玩家无法瞧见对手底牌,需应对欺骗、心理战以及概率计算,这给人工智能带来了全然各异的挑战。近些年来,以阿尔法Q作为代表的德州扑克AI,正以全新之方式再度界定这项智力游戏。
阿尔法Q不是单一AI的正式称呼,是专门对付德州扑克的人工智能系统的统称,卡内基梅隆大学开发的和很具代表性。和下围棋的不一样,阿尔法Q不用预测“完美信息”,要在隐藏信息的状况下,算出最均衡的策略组合。它依据博弈论里的纳什均衡理论,借助反事实遗憾最小化(CFR)算法,在无数回自我对弈里找寻不会被对手利用的稳定打法。

2017年,有一款名为的阿尔法Q类AI,在一场12万手牌的挑战当中,凭借绝对优势击败了四名顶级职业选手。它的核心能力是持续计算,以及优化下注尺寸与频率,在每一个决策点上,都能逼近数学上的最优解。人类选手难以应对的是,阿尔法Q没有情绪,不会疲劳,并且能精确执行混合策略,同一手牌在不同情况下,以特定比例进行跟注、加注或弃牌,致使对手完全无法捕捉规律。
对于传统扑克教学而言,阿尔法 Q 的现身带来了颠覆性的改变,以往凭借经验以及直觉的“标准打法”被证实存在着漏洞,AI 察觉到了众多人类从来没有经过系统运用的下注尺度,就像超池下注的频率要远比人类习惯高很多,当下,顶级职业选手开始借助 AI 来辅助复盘,在学习那些违背直觉然而在数学层面上正确的决策。更为关键的是,阿尔法 Q 的技术已经扩散到了现实应用领域,其博弈算法正被应用于商业谈判、网络安全以及拍卖策略设计上。
如果人类禁止在正式比赛里使用AI辅助,你认为开发者是应当公开阿尔法Q的全部策略呢,还是要将其保密呢?欢迎在评论区抒发出你的观点,也千万别忘了点赞以及分享本文,从而让更多人知晓AI怎样重新阐述德州扑克。