来源 | HyperAI超神经(ID: HyperAI)
在 5 月 1 日~ 5 月 4 日期间,玩家通过《王者荣耀》最新版本客户端进入游戏,即可与绝悟 AI 对战。一时间哀鸿遍野,普通玩家、游戏主播、职业选手,纷纷表示被绝悟 AI 虐到体无完肤。
《王者荣耀》的游戏主播们最近有些自闭了,因为被最新上线的游戏 AI 绝悟虐得太狠。
挑战 AI:主播连跪,职业选手也谨慎
「绝悟 AI」诞生自腾讯 AI Lab 和《王者荣耀》职业联赛团队的合作项目,在 2018 年的 KPL 秋季总决赛上,绝悟 AI 的 1v1 版本首次露面。
后来在 ChinaJoy 2019 上,绝悟 AI 首次向顶级业余玩家开放了四天的内测,在首日 504 场对战中,绝悟 AI 的胜率高达 99.8 %。
4 月 27-29 日,《王者荣耀》在虎牙、斗鱼、触手、企鹅、快手五个直播平台,用绝悟 AI 对战十支人类战队。
人类战队的结果,基本是以「被 AI 吊打」、「偷塔艰难取胜」、「无情屠杀」这类关键词为主。
主播和职业玩家都面对了一个强大的对手
在 5 月 1 日~ 5 月 4 日期间,玩家通过最新版本客户端进入游戏,即可与绝悟 AI 对战。
挑战绝悟 AI 的模式目前有六关,前五关没有门槛,最后一关要求玩家达到荣耀王者称号,或者巅峰赛积分 1400 才能进入。
上线半天即修复,为玩家降低难度
在绝悟 AI 上线前,官网称「第六关的绝悟 AI ,代表着 2019 年 KPL 冠军队伍的战斗力水平。」
更新《王者荣耀》即可与绝悟 AI 比试一番
所以绝悟 AI 上线后,受到了广大玩家的欢迎,但是面对强大的 AI ,人类玩家几乎全军覆没,全网哀嚎连续团灭,被绝悟 AI 狠狠教育。
一时间,网络上也出现各种玩家分享的「针对 AI 阵型」、「偷塔流」游戏经验,来面对强大的绝悟 AI。
5 月1 日 11:00 左右,专用服务器就面临满载,很多玩家就出现了无法进入游戏的问题。
《王者荣耀官网》发出不停机修复通告
在进行了游戏不停机修复后,有不少玩家表示,修复后第六关的人机难度降低了非常多,正常阵容都能打赢。
很多玩家认为绝悟 AI 的及时放水,也为他们找回了一点儿游戏自尊心。
5 月 4 日活动结束后,绝悟 AI 也将暂别王者峡谷,继续履行他的使命——将其在峡谷继续磨练智能决策与协作技能,以应用于现实,为服务人类zuozh。
围读论文:知己知彼,方能战胜绝悟
《王者荣耀》作为 MOBA(Multiplayer Online Battle Arena Games 多人在线战术竞技类游戏)的代表。游戏不同于其他游戏,MOBA 类游戏对于玩家的操作要求更高,游戏环境也会更加复杂。
基于这些特点,MOBA 游戏已经成为检验前沿 AI 的动作决策、预测能力的重要平台。
以《王者荣耀》为例,一局对战会产生 10 ^ 600 种游戏可能性,也会产生 10 ^ 18000 种可能的游戏操作。同时AI还需要在游戏当中进行偷袭、防御、兵线运营、技能成长等复杂操作。
截止目前,绝悟 AI 有两篇主要论文,分别在 2018 年和 2020 年发布。
论文一:5V5 分层宏观策略模型
2018 年,论文《MOBA 游戏 AI 的分层宏观策略模型(Hierarchical Macro Strategy Model for MOBA Game AI )》(论文地址:https://arxiv.org/pdf/1812.07887v1.pdf)
这篇文章中,团队提出了一种新的分层宏观策略模型(HMS),以在统一的神经网络中考虑阶段层和注意层, 该模型模拟了 MOBA 游戏的宏观策略操作,通过宏观战略决策,进一步指导微观战略决策。
论文中介绍和标注游戏区域与阵营
HMS 明确地模拟了 AI 玩家对游戏地图的关注,并考虑了游戏不同阶段进行建模。还提出了一种新颖的模仿跨 AI 玩家之间的通信机制,使得游戏 AI 之间能够交流和合作。
论文最后提到,使用《王者荣耀》作为 MOBA 游戏代表,来实施和评估 HMS,在 AI 与顶级1%人类玩家团队之间进行了比赛,AI 实现了 48% 的胜率。
论文二:1V1 复杂控制决策问题
2020 年的 AAAI 上,论文《利用深度强化学习掌握MOBA游戏中的复杂控制能力(Mastering Complex Control in MOBA Games with Deep Reinforcement Learning)》(论文地址:https://arxiv.org/pdf/1912.09729.pdf)被收录。
这篇论文的主要场景则是《王者荣耀》中的 1V1 模式,介绍了绝悟 AI 在 1v1 的游戏模式中的表现,即单个智能体的复杂动作决策问题。
在 MOBA 游戏中,1 v 1 场景下涉及的状态和动作空间,要远比传统的 1 v 1 游戏复杂得多。
所以,这也导致在这个问题中很难搜索到达到人类水平的控制策略。因此,在这篇论文中腾讯 AI Lab分别在系统设计和算法方面都做了大量的优化。
系统设计方面:设计的强化学习系统具有低耦合且扩展性较高的优点,这样他就可以实现在大规模问题上进行高效探索的可能性。
算法方面:在算法方面,加入了控制解耦、动作掩膜、目标注意力机制,同时对经典PPO算法进行了改进。
通过这些方面的改进,在王者荣耀 1 v 1 测试场景下,人工智能智能体能够击败顶尖的职业玩家。这篇论文中的 1V1 绝悟 AI 与大量顶级业余玩家进行了 2100 场对战。绝悟 AI 的胜率达到 99.81%。
在貂蝉(法师)、狄仁杰(射手)、花木兰(上单/战士)、露娜(打野/刺客)、鲁班(射手)等英雄上,绝悟 AI 对战顶级业余玩家的胜率都是 100 %。
等等,什么。。。胜率 100%?
打扰了。
360金融首席科学家张家兴:别指望AI Lab做成中台
我们想研发一个机器学习框架,6 个月后失败了
“应付”大学作业,我花3小时写了一个“文本转手写”神器
几十秒构建端到端 AI,NeurIPS 2020 AutoDL 竞赛夺冠“黑马”原来靠的是这门技术
区块链重大技术分析:IBM、微软、苹果、Google 都做了什么?
还没有评论,来说两句吧...