• 项目
首页>>文章列表 >>文化教育 >>李开复点评德扑人机战:AI会向人隐瞒信息?不用担心

李开复点评德扑人机战:AI会向人隐瞒信息?不用担心

新浪科技讯 4月8日凌晨消息,“冷扑大师”VS中国龙之队德州扑克人机大战表演赛在海南生态软件园传奇智力运动馆结束了第二天的比赛。全天共8400手牌,龙之队一共输了347565分,与冷扑大师之间的积分差距相当明显。


4月7日下午,创新工场创始人、董事长李开复做客新浪直播间,为大家讲述了他眼中的德扑人机大战以及未来人工智能技术的应用前景。


以下为新浪科技根据李开复博士所讲内容整理:


就像AlphaGo打败了世界冠军,德扑AI程序Libratus也是打败了美国最顶尖的选手。


人类第一次输了1万多分,第二次输了5万多分,第三次输了12万多分。我们可以看到,第一次几乎是不相上下的情况,代表中国派出的选手真的很强。但是“冷扑大师”在打完每一场(section)比赛之后,他就会进行机器学习,针对每一位牌手的弱点调整自己的参数。所以在第一天下午的比赛,他就化身为6个“冷扑大师”,针对每一位牌手的弱点调整参数,借此把差距拉到5万;第三场比赛再学习,便领先了12万。


我们可以看到机器的自我调整是非常厉害,非常可怕的。


“冷扑大师”如何学会打德扑


其实“冷扑大师”和AlphaGo的差别还是很大的。


“冷扑大师”从来没有学过人类的牌谱,而AlphaGo先从人类的牌谱开始学起,之后再自我提升。“冷扑大师”几乎是从博弈论的理论加上德州扑克的规则,自己再不断地推进算法,所以他每一次下注与否或者每一个决策都是针对人类所有的可能性做出一个最有利于他自己的判断。这个判断做出来以后,无论人类怎样回应,对于“冷扑大师”来说都是接近最优的。而且“冷扑大师”还会不断优化自己的打法,让对手无法猜测,但他却可以猜测人类的应对方式。


如果你把“冷扑大师”的盖子掀开来,你会发现里面其实是一个特别巨大的数据库,它储存了所有牌的排列与组合,还有在当即的排列与组合之下如何去寻找一个平衡点,好让对手无法猜测出你有什么牌。

其他分类