围棋之后是游戏 谷歌AI把星际职业选手打懵了
曾心怡发表于2019年01月25日 09:5037506人阅读
摘要: 去年12月的比赛录像显示,DeepMind旗下人工智能AlphaStar分别以5-0战胜两位《星际争霸2》职业选手TLO和MaNa。但在凌晨的现场比赛中,MaNa为人类扳回一城,打败视野受限的进阶版AI。

继AlphaGo在围棋界战无不胜之后,人工智能又向游戏与电竞行业进军了。

北京时间1月25日凌晨2点起,谷歌旗下人工智能公司DeepMind公布的录像显示,去年12月,他们开发的全新游戏类AI——AlphaStar分别以5-0战胜《星际争霸2》两位职业选手TLO和MaNa,成为第一个打败电竞职业选手的人工智能。

但在之后的现场比赛中,MaNa成功为人类扳回一局,以1-0的成绩战胜AlphaStar。这同样也创造了历史——AlphaStar首次成为职业选手的手下败将。

观众在DeepMind英国总部观看直播

赛后,DeepMind研究联席负责人David Silver表示:

尽管后续还有很多工作要做,但我希望未来的人们在回顾今日时,可以将这一比赛结果视为AI能力又向前迈了一步的表现。

DeepMind官网资料显示,作为最具挑战性的即时战略(RTS)游戏之一,也是电竞历史最为悠久的游戏之一,暴雪出品的《星际争霸2》近年来已被公认为AI研究的“大挑战(grand challenge)”。

对于AI而言,这类游戏比国际象棋、围棋等棋盘类游戏来得更难,不仅因为没有最佳策略,也是因为人工智能无法通过观察前一块棋子的移动来计算下一步棋,而必须实时作出反应。

时至今日,AI仍在挣扎应对《星际争霸2》的复杂性,鲜有系统能与职业选手的技术相媲美。

不过,AlphaStar与普通AI不太一样,它所使用的深度神经网络是通过监督学习(supervised learning)和强化学习(reinforcement learning)直接从原始游戏数据当中训练出来的。也就是说,它成长的每一步都是一场完整的比赛。

AlphaStar所遇到的第一个对手是《星际争霸2》Liquid战队的虫族选手TLO。在比赛前,DeepMind对AI进行了为期一周的训练,相当于让它玩了200年的《星际争霸2》。

尽管TLO曾自信表示有能力打败人工智能,但AlphaStar仍旧赢得了全部五场比赛,每一次还都使用了完全不同的独特策略。

但值得注意的是,在这场对抗中,AlphaStar确实更有优势——首先是因为比赛使用神族,而非TLO最擅长的虫族;二是因为尽管AI选手的视野也受到战争迷雾的限制,但它看到的地图已经被缩小了。

这也就意味着它无需像人类选手一样分配时间去关注地图的不同部分,而可以直接处理敌军和自家基地的信息。

不过,DeepMind研究人员指出,在同一时间内,AlphaStar仍然只会关注地图的单一部分,因此这也不能称之为优势。

话虽如此,人们还是能从比赛录像上看出,AlphaStar能够做到人类做不到的事——同时熟练控制三个不同区域中的作战单位。

AlphaStar对战星际职业选手TLO

在人类“绝世高手”与刚出道的新人AI首次交锋过后,DeepMind又将AlphaStar扔回了训练室,再次花了两周时间让它吸取经验。

此后,AlphaStar在与TLO的同队战友MaNa进行比赛时,已不再是当初稚拙的“菜鸟”,没有再犯前一次比赛中的明显战术错误。在脱胎换骨的AI面前,使用擅长种族神族的MaNa最终也是铩羽而归。

眼看着AI接连战胜两位人类高阶选手,DeepMind又开始对AlphaStar进行了全新的训练——削去它纵览全图的能力,要求它像人类玩家一样必须不断切换地图视野。

又是一周的训练过去,AlphaStar的游戏水平迅速提升。不过,视野受限显然限制了AI选手采取此前惊人策略的能力,并最终在MaNa的猛烈攻势下举起白旗。

但从DeepMind给出的图表可以看出,第二版AlphaStar在受训七天后的水平已经很接近原始版本

目前,全部11场比赛的录像均已在DeepMind官网上释出,供观众下载。针对部分观众的质疑,TLO也给出了回应:

我想对那些说MaNa没打好比赛的人说,相信我,与AlphaStar这样的对手打比赛真的很难,因为它的打法与人类完全不同,我们之前也完全没有经验。

AlphaStar给人留下了极其深刻的印象。在我看来,它还是前所未有的游戏AI。

*本文来自华尔街见闻(微信ID:wallstreetcn)。开通华尔街见闻金卡会员,马上领取2019全球市场机会。

收藏分享
50条评论