我的位置: 财经 > 创客驿站 > 文章详情
王者荣耀界的“阿尔法狗”完胜人类,训练师却说:让AI“内卷”才有意义
分享至:
 (50)
 (1)
 收藏
来源:上观新闻 作者:李晔 俱鹤飞 2021-07-09 06:27
摘要:不同AI间的对决,才体现人类智慧。

7月8日,2021世界人工智能大会腾讯展区,著名的多人竞技游戏王者荣耀,上演了一场人类与AI的较量——王者荣耀电竞职业选手和AI战队“王者绝悟”正面对决。

一边是全国排名前十的5名专业选手,一边是空无一人的五张椅子。看不见的敌人,更让人感到可怕。五局三胜的赛事,AI最终以3:1提前结束赛事。这一幕,像极了2017年“阿尔法狗”战胜柯洁。

王者荣耀展区上的AI席位

“下次,干翻AI!”

比赛展区挤满了人,有女粉丝疯狂喊叫:“辰鬼(一位职业选手),我挺你!”

14时30分,第一局比赛正式开打,“王者绝悟”选择的比赛阵营中规中矩,而职业选手却出其不意,选择了两名“法师”角色(常规比赛中多只有一名“法师”)。不过“王者绝悟”似早已见怪不怪,以摧枯拉朽的态势赢下第一局。人,还是低估了AI。

第二局,职业选手们更谨慎了些,避免与“王者觉悟”正面冲突,选择的阵容更加保守。“王者绝悟”却仿佛打出了气势,开局伊始就攻下一城,且势不可挡。在AI面前,职业选手仿佛成了刚接触游戏的新人。第二局,AI又赢了。

只要再赢一局,“王者绝悟”就将拿下整场比赛。到第三局,职业选手再次改变阵容,选择了能“隐身+瞬间移动”的角色,这一尝试非常管用,AI一时懵了。事实证明,当难以预判对手轨迹时,AI强大的算力便没了用武之地。人类战队终于扳回一局。

在即将进入第四局的休息时段,观众开始悄声议论,“看来AI并不是无法战胜的。”由于游戏阵容不允许与上局相同,人类战队的取胜战略无法沿用,因此第四局比赛进行得极其艰难,成为一场拉锯战。人的状态逐渐疲惫,但AI依旧精神抖擞,比赛进行愈久,对职业选手就愈不利。果不其然,当第四局比赛进行到16分钟时,“王者绝悟”赢了。

职业选手赛后接受采访

在赛后采访环节,职业选手表示,“AI确实太猛了,总能做出异于常人的反应,让我们招架不住。”已是第二次对战“王者绝悟”的选手辰鬼也觉得,AI的配合较上一次更为默契。

那么,“如果还有下次,你们愿意复仇吗?”解说员问。职业选手虽败仍嘴硬:“下次,干翻AI!”

用虚拟反哺现实

 “王者绝悟”技术负责人杨光,是这支AI“梦之队”的总教练。眼看自己训练出的团队获胜,他不忘给人类战队一个台阶,“他们今天中午刚刚组队,还来不及磨合就匆忙上阵了。”

这支临时拼凑起来的战队,其人员搭配也有不合理处——两名选手在游戏中擅长打同一位置,都爱扮演“战士”角色,而为战队保驾护航的“辅助”位却无人问津。结果商量之后,选手们只能以“一人打一把辅助”来妥协。可见,个人英雄主义是人性的弱点。

不过,在杨光看来,即便经历以击败AI为导向的专业训练,且彼此间懂得协同、配合,人类胜算的可能性依旧不大,“最多六四开,AI是六,人类是四。”

杨光告诉记者,AI的学习能力于人类而言是碾压级的,AI一天的训练量就相当于人类440年的训练量。

观众体验“王者绝悟”

对于“王者绝悟”的训练始于2017年。起先采用的是“模仿学习”模式,即让AI模仿人类的打法,但局限在于,人类的最高水平成了AI的“天花板”。2019年之后,AI训练师改变策略,采用强化学习模式,让AI之间“互斗”,技艺得以突飞猛进。

从实践来看,无论是操作的强度还是准度,AI较人类更胜一筹,也呈现出太多出乎意料的打法。“比如人类打法中,多讲究兵分多路,各司其职,但AI会一口气布局4名‘射手’,事实证明,这种人类极少采用的打法居然胜率最高。再如,人类玩家会尽量避免蹭兵线,但AI却经常一哄而上狂蹭兵线,这种打法其实也是AI算出来的全盘收益最大化的打法。”

唯有当AI与人类多次交锋后形成“套路”,才偶尔会出现漏洞。此时,人类趁虚而入,方有胜利可能。“以前出现过一次,5名人类玩家全部选择‘射手’角色,且清一色不与AI交锋,只一路‘推塔’。面对这种正常比赛中绝不可能出现的打法,AI一时无措,结果人类赢了。”但训练师会迅速给AI“打补丁”,也就是说,AI经此一役,长了记性,以后再出现类似少见战局,它再不会乱了阵脚。

据介绍,“王者绝悟”背后,是天文数字级的计算量——以阿尔法狗为例,其在一局中的空间选择,多达10的80次方。而在王者荣耀中,游戏元素并不完全透明,涉及“草丛机制”,也要考虑目标和路径选择、技能释放、团队协作等,复杂环境下的动作决策可能性多达10的两万次方,对算法的挑战性极大。

正是基于此,“王者绝悟”的能力一旦开放、泛化出来,其意义也极大。据透露,腾讯已经开发出“开悟”平台,将玩家经脱敏的游戏数据和算力开放给高校和科研团体,并从去年开始专门举办AI高校挑战赛,即鼓励各高校和科研团体利用王者荣耀共享的数据和算力平台,结合各自不同算法,训练出AI,再彼此抗衡。

所以,今后人跟AI打没有意义,因为胜负已经注定。更大的意义在于,让不同算法之下训练出的不同AI选手的对决,它们的胜负,才真正体现人类智慧。

据悉,目前已有包括中科大在内的16所高校的人工智能学院参与了“王者绝悟”AI高校挑战赛。此举帮助高校解决了空有算法但缺乏数据的难题,可以通过大量游戏数据的喂给,来测试不同算法的有效性。而“王者绝悟”所代表的“通用多智能体研究”一旦泛化到游戏以外的领域,如足球、篮球等体育赛事,乃至一些不适合人类亲自实战的高难度任务,虚拟世界的游戏智慧反哺现实世界才有了更多可能。

栏目主编:李晔 文字编辑:俱鹤飞 题图来源:李晔 摄
上一篇: 没有了
下一篇: 没有了
  相关文章
评论(1)
我也说两句
×
发表
最新评论
快来抢沙发吧~ 加载更多… 已显示全部内容
上海辟谣平台
上海2021年第46届世界技能大赛
上海市政府服务企业官方平台
上海对口援疆20年
举报中心
网上有害信息举报专区
关注我们
客户端下载