本篇文章1540字,读完约4分钟
7月9日,由ccf主办、雷(公开号:雷)和香港中文大学联合主办的第二届ccf-GAIR全球人工智能与机器人峰会进入第三天。在机器学习的第一次特别会议上,facebook人工智能研究所的研究员田元东博士为会议带来了一个名为“AIIngames:成就与挑战”的分享。
他分享了人工智能目前在游戏领域的应用,他们的研究进展以及基于他们平台的许多测试结果。具体演变内容如下:
他从去年alphago战胜李世石和今年master战胜柯杰开始,介绍了ai目前在游戏中的优势和劣势。
好处:
作为一个虚拟平台,游戏平台是一个非常好的数据源。
游戏环境提供了大量的数据,非常丰富和准确
作为一个虚拟环境,游戏可以获得比现实生活中高得多的数据
这是一个非常科学的平台,为重复的科学研究提供了环境。
我们可以得到一个非常有趣的游戏过程,并提取许多概念。现实生活中有太多的规则。
缺点:
算法不太好,会有很多无效数据。
游戏的研究需要大量的资源。
需要考虑的可以延伸到现实生活中。
它仍处于初级阶段,许多算法无法量化它。
从游戏的发展过程来看,自20世纪90年代以来,它已经非常接近现实生活。作为一名研究人员,目标是开发更优化的算法和系统,并在更好的环境中评估算法的结果。然后他向我们解释了人工智能在游戏中是如何工作的。
人工智能在游戏中如何工作:
1.从当前情况出发,进行有限搜索,评估结果并获得分数。每一步都会有更好的算法。该算法是根据不同的游戏来确定的,例如象棋和围棋,它们需要不同的算法。
2.评估桌面得分。不同的游戏有不同的评价方法,这对围棋和象棋来说是不同的。有时写了太多的规则,可能会发生冲突。现在让计算机通过深度学习学习一个非常强大的策略网络,这会有很好的效果。
之后,他展示了alphago的设计理念,如硬件和资源的配置、政策网络的选择、如何培养价值网络以及如何收集数据。
接下来,他向我们介绍了黑森林引擎。
卷积神经网络被用作策略网络的一部分,它可以预测接下来的三个步骤而不是一个。光是神经网络就可以克服当时很多开源软件,而且搜索效果会变得更好,而且这个代码已经是开源的了。我们的算法还可以评估阿尔法戈竞赛。
最后两份工作
1、fps游戏
选择的平台被称为末日,使用的神经网络相对简单。当前的四个框架被放在神经网络中,演员-关键模型被用于训练。此外,还有课程培训,可以使人工智能的能力越来越强,让机器一点一点地学习更多的基础程序,然后适应更复杂的环境。
现在的缺点是电脑更擅长局部战斗,而且他们的总体把握实际上是空·怀特,所以他们没有像人一样的大策略和思维。
2.elf(高度可扩展且灵活)平台
平台的优势:1 .自动帮助您处理多线程或多进程问题;2.处理速度更快,资源占用更少;3.它是灵活的,可以改变具体的结构,选择不同的游戏参数和强化学习算法。
目前,这个平台已经是开源的,它的使用非常简单,没有复杂的步骤。
最后,他提到了游戏引擎是如何继续扩展的:
例如,现在游戏是一对一的。有两个人,一个在左下角,另一个在右下角。他们正在建造坦克来互相战斗。是在这里建立大量的士兵来互相补给,还是去探索,此时人工智能训练仍然是个问题。
1.有一些好的技能可以改变整个局面。如何在这个时候训练他们。
2.假设我们不希望计算机做出重大决策,我们不希望计算机只使用9个动作空,这样计算机就可以控制每个单元的决策。这个时候我们怎么控制他们?
3.如果我们使用基于模型的强化学习来做到这一点,我们将继续探索和探索如何玩这个游戏。对于复杂的游戏来说,这一块基于模型的是困难的,所以如何探索这一块。
更详细的发言请参考雷锋的后续深度报道。雷锋原创。
雷锋原创文章。严禁擅自转载。详情请参考转载说明。
标题:Facebook 人工智能研究院研究员田渊栋:将人工智能运用于游戏,最新进展到了哪
地址:http://www.hcsbodzyz.com/hcxw/9997.html