本篇文章2613字,读完约7分钟
据雷锋说。在国际比赛中,openai的dota 2游戏人工智能击败了人类玩家,就像当时的alphogo一样,这个消息再次席卷了整个屏幕。我们似乎又看到艾骄傲地笑了。
在这场比赛中重要的是,moba多人在线战术竞技游戏像dota和rts实时战略游戏像星际争霸一直被认为是超越了当前人工智能技术的能力,远非人工智能能够掌握和击败人类。这些游戏在竞争中需要长期的战略决策和多玩家合作,其状态和动作比象棋和围棋等复杂。/きだよよ0/房间。在过去的几十年里,人工智能技术一个接一个地引入了后几款棋盘游戏。
雷锋报道说deepmind研究星际争霸2已经有一段时间了,最近发布了一些研究成果。阿里巴巴在中国也与伦敦大学合作研究人工智能和星际。但是到目前为止,研究人员还没有取得重大突破,人们普遍认为,在星际争霸2中,我们至少还有1-2年的时间让人工智能打败人类。
这就是为什么openai的消息如此令人震惊。
但是如果我们更多地了解dota 2的ai,它是如何训练的,它使用什么样的游戏环境,我们会发现它已经取得了许多令人印象深刻的研究成果,但它并不是想象中的突破性ai技术。前谷歌大脑团队成员丹尼·布里兹(Denny britz)发起了一场关于黑客新闻的讨论,从他的分析和其他讨论中可以看出许多线索。
Openai将很快公布具体的研究细节。但首先,让我们看看dota 2 ai解决的问题在现实中有多难,以及它与alphago相比有多难。
1v1的难度是5v5无法比拟的
一般来说,玩dota 2游戏是一个5v5游戏。这种游戏需要先进的策略制定、团队沟通和协调技巧,通常需要45分钟。1v1游戏有很多限制。两个玩家基本上沿着一条线移动并试图杀死对方。比赛时间通常在几分钟之内。1v1竞争需要机械技能和短期战术,但不需要长期规划或协调,而后者是当前人工智能技术中最具挑战性的。事实上,在1v1中可以采取的有用动作的数量少于Go。有效状态空,也就是玩家对游戏中正在发生的事情的想法,应该比围棋小,如果用更有效的方式来描述的话。
人工智能可以获得更多的信息
openai的人工智能可能是在游戏ai的api上开发的,因此它可以访问人类无法访问的各种信息。此外,即使openai的研究人员限制获取某些类型的信息,ai仍然可以获得比人类更准确的信息。例如,一项技能只能击中一定范围内的对手,而人类玩家必须看着屏幕来估计与对手的距离。这需要练习,但人工智能知道准确的距离信息,并立即决定使用技能。获取各种准确的数据信息将会带来巨大的优势。例如,在这个游戏中,人工智能已经几次在最远的距离启动它的技能。
反应时间的优势
人工智能可以立即做出反应,但人类不能。如果反应优势与上述数据优势相结合,就会形成另一个巨大优势。例如,一旦一个对手逃离了某个特定技能的使用范围,ai可以立即被取消,以避免无效的技能施放并且不会延迟回复时间。
只使用特定的游戏角色
dota有100多个中介角色,每个角色都有不同的能力和优势。在这场比赛中,openai的人工智能学习和扮演的唯一角色是影子魔鬼。当然,影子魔鬼也是一个普通的独唱英雄。它的技能通常是直接攻击,而不是更复杂,这使得它更容易受益于人工智能擅长的距离数据和快速响应时间的优势。
有些规则是被写死的
这个游戏ai不是从零开始训练的,它对游戏有一些“了解”。装备的选择是生死攸关的,部队的技术也是如此,这对比赛也很重要。根据当前新闻,人工智能学会与对手互动。
一般来说,由于1v1比赛主要是机械技能的比赛,所以人类选手被击败并不奇怪。此外,由于有限的竞争环境,对一系列可能的行动的人为限制,以及几乎不需要长期规划或协调,结论是显而易见的,那就是,在这次1v1 dota比赛中,人工智能要解决的击败人类冠军的问题实际上比Go要简单。
本质上,人工智能技术没有突然的突破,它的成功是算法和研究者的成功。研究人员明智地设置了问题,以正确的方式避免了当前技术的限制,并取得了预期的结果。
据说,openai的人工智能训练时间约为2周。当时,alphago需要在谷歌的gpu集群上进行几个月的高度分布式大规模培训。自那时以来,已经取得了一些技术进步,但不足以将计算要求降低一个数量级。
也许不知道真相的新闻讨论有点过分,但事实上,在这项研究中有相当多令人惊讶的结果。
完全通过自我对抗来训练
这一次,人工智能不需要任何训练数据,也不需要从人类演示中学习。相反,它是随机开始的,并不断地与自己对抗。虽然这项技术并不新,但令人惊讶的是,人工智能已经学会了一些人类玩家已经使用过的技术,这些技术已经非常强大了。也许人工智能将会学习其他人类从未使用过的技术。正如我们在阿尔法戈和人类之间的游戏中看到的,人类玩家已经开始从人工智能不那么容易理解的技术中学习。
艾加电子竞技取得了很大的进步
在像dota和星际这样具有挑战性的环境中测试人工智能技术是非常重要的。如果电子体育社区和游戏开发商也对应用于游戏的人工智能技术的价值感兴趣,那么人工智能技术很可能会在他们的支持下取得更大的进步。
部分可观察的环境
虽然openai游戏api开发的细节还不清楚,但是从人类玩家的角度来看,只有屏幕上显示的内容可以在游戏中看到,而且玩家的视角是有限的。例如,在上坡地形上,不能清楚地看到斜坡上的情况。这意味着,不同于围棋或象棋,战斗游戏是在一个部分可观察的环境中,不可能知道关于当前游戏状态的全部信息。这些问题是人工智能难以解决的,属于需要积极研究的领域。目前,还不清楚环境的可观测性在1v1 dota竞赛中有多重要。
事实上,对于许多乍看起来耸人听闻的技术,我们需要有一个清晰的理解。出人意料的是,雷(公开号:雷)发现马斯克也在推特上对此事发表了评论。
他说:“openai第一次在电子竞技中打败了顶尖的人类玩家,这比象棋和围棋难多了”,然后开始谈论ai的危害。“没有人喜欢被监督,但所有东西(汽车、飞机、食物、药品等)都喜欢。)那可能会给公众带来伤害的已经被监督了,而ai应该是一样的。”。
这种大肆宣传肯定不是openai研究人员的错,他们一直对自己的成就的局限性有着非常清楚和明确的理解。过度解读人工智能的进步会带来一些伤害。我们希望openai公布他们研究的技术细节,避免错误的猜测。
雷锋文章版权所有。严禁擅自转载。详情请参考转载说明。
标题:AI别笑,1v1的DotA比赛其实比围棋简单
地址:http://www.hcsbodzyz.com/hcxw/5495.html