• 项目
首页>>文章列表 >>文化教育 >>【2017年度星际争霸AI竞赛结果出炉】中科院自动化所第4,Facebook第6

【2017年度星际争霸AI竞赛结果出炉】中科院自动化所第4,Facebook第6

Facebook悄悄地派出一款叫做CherryPi的AI bot参加了2017年度AI星际争霸赛AIIDE,然后……输了。


CherryPi在28场比赛里排名第6;这次比赛的冠军ZZZKBot由澳大利亚的程序员Chris Coxe独立开发,不仅如此,排名前三的bot都是由独立参赛的业余兴趣爱好者开发而成。国外科技网站Engadget以“Facebook星际争霸AI被业余玩家狂虐”(Facebook's 'StarCraft' AI was defeated by hobbyists)为题做了报道。


上周日的比赛结果说明Facebook确实还有很长的路要走,但情况并非像Engadget标题那样简单。


星际争霸AI竞赛:业余爱好者与大公司同台

年度星际争霸AI竞赛由AIIDE大会主办,AIIDE是“互动数字娱乐AI(AI for Interactive Digital Entertainment)的缩写。这个竞赛也得到了暴雪、DeepMind和FAIR等机构的赞助。(DeepMind并没有参与这次竞赛。)


AIIDE表示,举办星际争霸竞赛的目的是促进和评估用于实时战略(RTS)游戏的人工智能研究进展。有鉴于其隐藏信息,庞大的状态和动作空间以及快速采取行动的要求,RTS游戏对于AI研究而言是比国际象棋更大的挑战,而AI玩星际争霸更是比下围棋的难度更高。目前,顶级的人类职业玩家仍然在RTS游戏中占据主导地位,但AI游戏研究人员的目标便是在不久的将来改变这一现状。


AIIDE已经举办多年,一直使用星际争霸I,2017年的竞赛也一样。虽然整体而言,星际II对人类玩家的要求(尤其是创造力)更高一点,但对于软件/机器而言,实际上星际I和星际II要做的事情都一样,资源采集优化,地图对战优化,决定建造基地和使用什么技术……因此,使用星际I也一样检测能最先进的AI bot。


根据竞赛组织负责人、加拿大纽芬兰大学David Churchill和他的同事Richard Kelly的报告,共有28支队伍参加了本次竞赛。要说星际争霸AI竞赛与其他竞赛最大的不同,或许就下图可见,超过一半都是以个人名义参赛(Independent)。


比赛中,参赛程序使用BWAPI(一种可将程序连接到星际争霸游戏引擎的软件库),在Starcraft Broodwar: Fog of War Enabled这款游戏中对战,最终根据胜率进行排名。


前十名如下:


Facebook的AI CherryPi排名第6,排名第一的ZZZKBot就是上文所说的独立开发者Chris Coxe开发的bot。


在公布结果前一天,Coxe谦虚地表示,“ZZZKBot的设计初衷仅仅是证明一个概念。源代码并不完美。”


爱好者与巨头的不同玩法:一个是硬编码,一个是机器学习


不过,值得注意,ZZZKBot——以及大多数排名靠前的个人参赛bot——的大多数决策都是由手工编码(hard-code)实现的,基于过往游戏结果和具体游戏场景的规则等因素,考虑了各种情况和优先级。


目前领先的星际争霸bot都基于其设计者制定的规则和策略。Coxe说,他的bot最大特征就是一个简单的学习功能,每个bot都有一个预编程的策略,关注哪种策略奏效,就让bot在下一场比赛中做好准备。具体到ZZZKBot,就是单基地rush战术,4农民造狗池,然后出提速狗,刺蛇,飞龙,后期升级飞龙及守护者的科技。这种方法相当于一个“N-trick pony”,系统做的全部事情就是单基地速攻战术(1-base rush build)。很多现有bot对于这样简单粗暴的策略很弱,因此它能够胜出。


ZZZKBot的对战观几乎不存在,仅有的对战逻辑就是等待(个别情况)、攻击(几乎所有场景)和防御(极少发生)。


此外,手工编码系统最致命的一个弱点,就是无法扩展。


Facebook和谷歌等技术巨头以不同的方式进入星际争霸,他们的策略是机器学习,通过检查过去游戏中的大量数据,从头制定自己的策略。不同于手工编码,采用机器学习(或者说让机器自己学习)的方法能够扩展,也是Facebook AI这次挑战的主要看点所在。


Facebook的研究科学家Gabriel Synnaeve表示,CherryPi是未来研究星级争霸的基础。“我们想看看它与现有bot的区别,尤其是测试它是否存在需要纠正的缺陷。”


根据HackerNews的讨论,参与开发CherryPi的Facebook研究人员“尽量避免使用硬编码”。


这次Facebook的AI虽然没有夺得桂冠,但亚军bot PurpleWave的开发者Dan Gant预见到了其发展前景。Dan Gant在接受Wired采访时说,大多数机器人根据敌人军队的数量选择攻击或者撤退,但从比赛视频中可以看到,CherryPi似乎知道什么时候应该快速移动,潜入敌军发动攻击


资深AI专家袁泉也关注了2017年度AI星际争霸赛,他告诉新智元,Facebook这次参赛的AI CherryPi,我们推测采用的是机器学习与手工编码相结合的方式——毕竟现阶段还没有办法全部用机器学习去做。目前,AI玩星际的难点还是集中在:


  • 环境更加开放,有更大的决策和活动空间;

  • 更强调AI长期规划和推理能力;

  • 星际(尤其是星际II)更要求创造力和想象力,包括出奇兵和隐身策略


虽然Facebook AI这次只取得第6名的成绩,但组织者David Churchill透露,系统内有一些bug,调试后还会再跑一次,成绩应该有所提升。



星际争霸AI bot,轻松实现数亿美元潜在收入

这次参赛表明,Facebook很重视与谷歌等巨头在人工智能领域的竞争。谷歌DeepMind的AlphaGo去年击败了顶尖人类棋手,风头一时无两。今年8月,DeepMind宣布下个目标将是星际争霸II。Facebook的人工智能研究小组FAIR发表了很多研究论文,但并没有像DeepMind一样取得举世瞩目的突破性成就。目前,Facebook发表了3篇关于星际争霸的论文,但似乎并没有在这方面特别下功夫。


制造星际争霸AI给科技巨头带来的不仅仅是满足感。谷歌表示DeepMind的机器学习有助于减少数据中心的制冷费用。微软今年的机器学习研究报告称,哪怕只有0.1%的预测用户点击广告提升,都会带来数亿美元的收入。一个能够击败人类玩家的AI bot将会很快赚回其研发费用。


但别期待独立参赛玩家一夜间消失,或者轻易征服星际争霸。


Churchill说,“几年内,业余玩家,大多数以规则为基础的bot,仍会做得很好。”他猜测,bot击败人类玩家大概需要五年,不过也许这会来的更快。


其他分类