导言
作为一种模拟战略战术模拟演习战场环境的学习范式,战争棋推演提供了在非真实战场环境中研究作战策略、发现战术漏洞和总结作战经验的能力。其中,使用了大量的策略推演规则,如何将机器学习技术与知识地图相结合,实现战争棋推演环境下的智能体辅助操作将是本文的重点。
目录
首先,深度学习和知识图谱的缺陷
第二,认知中间站在策略演绎领域的应用
第三,什么是战争棋推演
四。阿尔法战争:一个军事象棋推演/战斗指挥平台,具有常识、指挥艺术和实时智能
V .阿尔法瓦案例演示:光影沐浴者
首先,深度学习和知识图谱的缺陷
人工智能经历了几次大起大落,迎来了第三次发展浪潮。以知识地图为代表的知识工程和以深度学习为代表的机器学习的发展突出了当前的进展。
1。深度学习
深度学习是统计机器学习和人工神经网络相结合的一种新的学习方法,它不同于传统的模式识别方法,它可以利用深度神经网络从海量数据中自动学习有效的层次特征表示。由于大规模的标注数据,深度学习在语音识别、图像识别等领域取得了优异的效果,但仍然存在一些局限性,主要表现在:
01对数据的强依赖性:—深度学习需要大量的标注数据进行训练以获得更好的泛化能力,数据量直接影响深度学习模型的推理效果。然而,在许多实际应用场景中,很难找到足够高质量的训练数据。另一方面,收集和标注用于训练深度学习模型的数据需要大量的人力,而人工标注的信息有一定的局限性。
02缺乏学习常识:—人工智能的知识表示包括专业知识和常识知识。常识是指人类在生活中总结的科学知识。当人类遇到新情况时,他们可以通过现有的常识进行猜测和判断。然而,神经网络学习的本质是相关性的挖掘和记忆,缺乏推理能力和抽象能力。这种缺陷使得它在面对新情况时无法像人类一样从他人身上做出推论。
03缺乏可解释性:-深度学习模型是一种端到端的学习,输入原始数据(开始)和输出最终目标(结束),中间学习和预测过程未知。类似于黑盒系统,它的推理效果很好,但不知道为什么,这也极大地制约了深度学习的应用和普及。例如,在投资领域,无法解释的投资相当于投机。
2。知识地图
知识地图本质上是一个语义网络,表达各种实体、概念及其语义关系。与传统知识表示相比,知识地图具有高实体/概念覆盖率、多样语义关系、友好结构和高质量等优点,日益成为人工智能时代最重要的知识表示。但是,目前知识地图的应用还处于初级阶段,其登陆困难主要包括以下几个方面:
01构建高质量地图的难点:—知识地图的构建是整个应用链的第一步,地图构建的质量直接决定了上层应用的效果。由于各种原因,大多数数据以非结构化形式存储,非结构化数据的知识提取在准确性和完整性方面面临技术挑战。
02依靠专家经验:—知识地图本质上是知识的一种组织形式,它没有学习的能力。地图的构建涉及大量的手工设计和劳动,尤其是行业知识地图,依赖于行业从业者对业务逻辑的准确梳理。因此,知识的爆炸性增长要求知识地图构建具有更高的可移植性和可扩展性。
03覆盖限制的应用性能:—构建知识地图的目的不仅是为了可视化数据,还为了在实际应用场景中赋予业务信息可计算性。然而,目前的知识地图普遍存在覆盖率低、数据稀疏、更新慢等问题,限制了知识地图分析和挖掘的优势。总的来说,深度学习和知识映射在技术本身和应用方面都存在一些缺陷,结合它们的优点出现了许多新方法。
第二,认知中间站在策略演绎领域的应用
中国台湾的核心价值是资源整合效率最大化。建设一个支持业务融合的中间站,不仅可以帮助实现人工智能技术的落地方案,还可以实现功能的重用,达到规模效应。
在策略演绎领域,基于分布式图形存储,融合图形计算的认知平台和可视化分析引擎,有助于挖掘、发现和演绎相关隐藏知识或新的跨领域知识,提升决策推荐的准确性和及时性,提高策略演绎过程和结果的可解释性。它在金融营销与风险控制、金融定量投资、军事战争棋推演等领域有着广阔的应用前景。
1。金融营销和风险控制
众所周知,金融业的两个核心业务是:营销和风险控制,这两个业务的核心都是根据数据分析客户行为和预测未来场景变化。传统的数据分析技术是基于关系数据库的,很难发现数据之间多层次的“隐藏关系”。通过使用知识地图,所有实体(包括公司、人员、地名、产品、信息、研究报告、事件等。)和关系(股权关系、竞争关系、外国投资等))可以以图形的形式表现出来,形成“金融多关系图”,从而帮助金融从业者从事件中,/”其次,图形数据库、图形挖掘、图形计算模型等技术特别适用于复杂关系网络下的账户关联挖掘和资金交易流跟踪,有助于发现复杂多变的欺诈风险行为,如信用卡套期保值、团伙贷款欺诈、跨境洗钱等传统风险控制场景下无法发现的行为。
2。金融量化投资
近年来,以追求绝对回报为目标的量化对冲投资策略因其低风险和稳定回报而成为机构投资者的主要投资策略之一。简而言之,定量投资意味着用机器构建一个框架,并在这个框架下进行交易。利用机器学习技术可以有效地发现数据之间的关系,并利用它对新数据进行预测或分类,这已经成为构建量化投资框架的一种新的有效策略。其次,使用知识地图从影响投资的事件中提取实体和关系,例如与公司相关的股票信息和其他实体,例如可能影响股票交易价格行为的事件(管理变更、新产品发布等)。),构建金融量化投资知识地图,然后通过大量的表征学习方法将知识地图中的实体和关系转化为个高维连续向量。
3。军棋推演
随着信息技术在现代战争中的应用,随着战场要素的增加和战场范围的全球化趋势,一体化联合作战已经成为现代战争的主要作战方式。在这种背景下,兵棋推演系统面临着推演要素增多、推演范围扩大的挑战。人机协同环境下,战争棋推演的核心是不完全信息下的动态博弈和实时对抗。鉴于战争棋推演中规则和计算的复杂性,利用人工智能系统可以更快、更准确地进行态势分析和战略决策,最大限度地减少错误的发生。在推演过程中,战棋推演系统自动收集战场态势数据,记录每个作战单元的属性,如作战半径、攻击威力、前进速度、掩护使用、隶属关系等。通过采集战场态势信息,在模拟对抗中学习战术规则,获取作战经验,优化策略,进而进行战前态势分析,科学制定作战计划,提高作战过程中的实时决策能力和应急响应能力。
第三,什么是战争棋推演
如果你知道你的问题,你不需要战争棋推演;当你不知道如何处理不确定和复杂的情况时,你可能需要下棋。
-"海湾罢工"国际象棋设计师,马克·赫尔曼
军队没有移动,但战争棋继续前进。用战争模拟系统演绎战争就是演绎战争棋。从军事游戏到沙盘模拟,再到复杂的计算机程序,军棋推演在模拟真实战争、辅助指挥决策方面发挥着越来越突出的作用,已经发展成为现代战争中的一个关键环节。
据报道,美军在伊拉克战争中的战斗经历与战前的战争棋推演结果极为相似;击中我并杀死本·拉登的过程也在五角大楼的战争棋推演系统上被练习过无数次;日本被蓝色军团利用了数百次,这也为美国军方扭转珍珠港事件后的不利局面奠定了基础。
随着现代战争规模的逐渐扩大,陆地、海洋、空、天空、电磁等不同战场混杂交织,各种军种的协调日益复杂,推演战棋的重要性也越来越受到重视。美国陆军司令部总参谋学院、勒梅中心、美国国防大学、美国研究生院和美国海军军事学院的章程或多或少地明确了这种战争棋推演的目的。
另一方面,随着计算机技术的兴起,沙盘上传统的军事棋推演进一步转化为严格的二进制计算,并直观地呈现在屏幕上。结合科学技术的大规模战争棋推演系统将在信息战的模拟对抗中发挥更大的作用。
四。阿尔法战争:一个军事象棋演绎/战斗指挥平台,具有常识、指挥艺术和实时智能)
作战指挥是一项多学科、多任务的综合战略活动,包括装备体系、作战环境、指挥艺术和智能判断。战争棋推演是一个模拟、模拟和推演整个战争过程的微型作战指挥过程。
许多大型实时战略游戏都有类似的特点。以暴雪的星际争霸2为例,它的复杂性在于战争棋推演和战场实战指挥之间。具体比较如下:
虽然在复杂性上有所不同,但战争棋推演、实际战场和星际争霸2的核心本质是即时战略推演类型,它是先验知识和即时情报的综合应用。袁婷科技多年来一直致力于知识地图和自主学习系统平台的研究和应用,尤其是近年来,在国防、金融和安全等领域的许多大规模实际项目中抽象出了大量的通用认知智能引擎和组件。
战略推演平台是袁婷科技对常识、行业先验地图、态势感知和即时判断等综合智能应用自动化的探索和思考。应用场景包括国防作战指挥、反恐、经济犯罪调查、投资交易等。
以中等复杂度的星际争霸2为研究对象,我们设计了一个自动化平台——AlphaWar,它可以利用知识地图和强化学习技术设计出击败对手的人工智能。
今天,我们将揭开袁婷科技的神秘产品。
Alphawar基于行业优先图,以策略编辑器为主体,以多代理策略网络为核心思想,包括以下核心组件:
1。决策控制:-包括一些跨领域的通用决策控制组件,如最佳路径搜索和目标识别。
2。战术系统:-可以是人类经验验证的战术(类似于指挥艺术),也可以是人工智能训练得到的模型(例如,世界顶级I星选手的战斗训练结果)。战术系统是一个完整的操作序列,它涉及到游戏中的所有单位及其行为,并且只向外界公开战术核心参数。
3。Agent: 在这个系统中,Agent的定义是:某个单位(可以是战斗单位、建筑等)的最佳解。)到特定场景(也可以是所有场景)下的特定目标。例如,圣灵中机械哨兵力场的时间和位置。这是一个可以广泛应用强化学习和培训的地方。
4。超越地图:超越地图是站在巨人肩膀上的关键。由于当前深度学习相关技术的局限性,不可能比较完全零超越图。对于星际争霸2或军事实战指挥,先验地图包括战场环境(基本信息)、双方装备系统(不完全信息)、战术系统等。
凤凰的武器,战术系统,设备拆卸和设备参数
当然,除了这些核心组件外,还有各种组件,如态势感知和作战控制(单兵、小组合作等)。),所有这些都可以通过知识表示、专家系统和人工智能模型的方式生成。组件都是手和脚,需要大脑来指挥和控制。
在alphawar中,索引控制中心有两种实现方式,第一种是策略编辑器。例如,如果我们的一方(虫族)发现另一方(精灵)已经打开了两个裸露的地雷,它可以得到一个可以被快速压制的策略来感知情况。此时,只有一个态势分类器和一个快速压制器就足以完成整个指挥和控制过程。第二种情况比较复杂,也是实际战争中的常规情况,形势变化很快。此时,需要一个基于lstm的深度指控网络。(这是一个大话题,后续有机会单独推出)
以上是阿尔法战争的基本构成。接下来,我们将使用一个例子来说明它是如何工作的。不需要写一行代码就能实现一个在整个比赛中最困难的阶段击败星际争霸2的战术机器人!
V.案例演示:光影沐浴者
光影沐浴者,俗称快藏刀战术。使用星际争霸2的反隐藏单位或建筑通常需要先进的建筑技术来制造。在早期,圣灵以最快的速度制造黑暗圣堂武士(并欺骗对手),这通常在输赢中起着决定性的作用。
以下是系统中光影沐浴器的结构:
如图所示,大多数组件都是战略性实现,可以理解为指挥和控制中的常规启动操作。它与知识地图和深度学习有关,需要四个组成部分的训练模型或知识推理:
1。偷水晶+机械平台:-偷水晶和机械平台的主要目的是为了加快攻击时间,攻击越晚,对手拿出反隐藏装置的可能性就越高。由于水晶和机械平台的需要,应该使用重放来训练最佳隐藏位置,避开其他农民的道路探索路线和虫族房屋的可能路线。
2。首先删除反隐藏:-这是一个典型的知识地图+人工智能代理。首先,要从知识地图中找出对手种族反隐蔽的实施手段,并采取相应的反战术。在这个过程中有很多可能性,所以我们需要使用人工智能来获得最佳解决方案。例如,另一方是人族,此时通常会有探测扫描。如果所有的黑暗圣堂武士一起扔空,他们可能会被海浪吃掉。必须分批消耗彼此的扫描时间(每批一次)。在对方的扫描时间(知识地图获取)用完之后,黑暗圣堂武士将会变成一个大的。这种训练只用几十个样本就能完美实现。
3。折叠部队:-这是一种将态势感知网络与武器和服务地图相结合的策略。例如,当对手(虫族)开始变成眼虫时,此时有必要跳离猎人以清除障碍。
4。密室操作:-微操作是输赢的关键因素。著名的阿尔法星拥有大量的微操作代理,在同等条件下可以以最小的损失歼灭对方的主力。(关于如何训练战术和特工,有机会单独深入地解释)
直接上面的结果:击败另一方(蓝色的一方),当它在经济和军队方面有优势!
未来战争的胜利将取决于认知速度,也就是说,让机器正确地了解战斗情况并做出决策。认知的速度在很大程度上取决于智能技术的应用。因此,代理辅助是升级战棋系统的关键。
标题:AlphaWar兵棋推演:虚拟硝烟中的AI指挥艺术与决胜智慧
地址:http://www.hcsbodzyz.com/hcxw/888.html