本篇文章2568字,读完约6分钟

最近,国内开源领域发生了许多重大事件。清华开启了测绘框架,却忽略了天元框架。随后,华为开发了自己的深度学习框架mindspore。

目前,其代码已经推出。首先,0.1.0-alpha版本被发布,然后它将被逐渐改进。

mind孢子作为华为整体人工智能解决方案的一部分,支持端缘云整体场景的深度学习和训练推理框架,主要用于计算机视觉、自然语言处理等人工智能领域,为数据科学家和算法工程师提供设计友好、高效的开发体验。

从华为MindSpore看框架开源之势

与此同时,and孢子不仅为新兴的人工智能处理器提供了本地支持,还支持通用cpu和gpu。

心孢子框架解读

目前,人工智能的研究和生产之间存在着巨大的差距。

一方面,学术界与人工智能相关的研究持续升温,各种模型算法和需求层出不穷;另一方面,人工智能模型在工业中的应用也在不断被引入。不同的场景,如安全城市、交通指挥和医学生物学,都需要庞大的数据集和完整的功能来满足特定的需求。

从华为MindSpore看框架开源之势

现有框架大多开发门槛高,同时整体场景能力不足,异构性不强。Mindspore可以实现统一的架构、一次培训和多次部署。Mindspore通过实现ai算法,即代码,可以显著减少模型的开发时间。

从华为MindSpore看框架开源之势

从整体架构来看,mindspore具有基于源代码转换的通用自动区分、自动分布式并行训练、数据处理和图形执行引擎的特点。

1.自动差动系统

头脑孢子的第一个特征是它的自动微分系统。在深度学习中,自动微分通常是指网络模型的自动推导,网络权重的优化是在梯度的指导下进行的。

在当前主流的深度学习框架中,有三种自动区分技术:

第一种是基于以张量流为代表的静态数据流图的转换,通过静态编译技术优化网络性能。然而,这种方法受到数据流图表达形式的限制,不能灵活地表达控制流。

从华为MindSpore看框架开源之势

二是基于pytorch表示的动态图的变换。这种方法虽然可以使用户灵活地使用控制流,但也存在运行时资源开销大的缺点,不能利用静态编译技术来优化计算图的性能。

从华为MindSpore看框架开源之势

最后一种是mindspore采用的技术,这是一种基于源代码转换的通用自动区分技术。

这种方法的优点是源代码基于函数式编程框架,并以即时编译的方式在中间表达式中进行自动差异更改,支持复杂的控制流场景、高阶函数和闭包。

因为它支持控制流的自动区分,所以它可以具有前两种区分技术的优点,不仅支持本地控制流的灵活表达,而且在执行前对网络进行静态编译和优化,生成高效的计算图,从而提高执行性能。

从华为MindSpore看框架开源之势

2.自动并行化

第二个特点是mindspore具有自动实现分布式并行训练的能力。在模型开发过程中,除了设计模型本身的逻辑外,还需要设计分布式并行训练的逻辑。

开发人员不仅要分析数据量、参数量、集群网络拓扑等因素来确定模型分割策略,还要考虑分割后的子模型设备绑定,从而达到良好的并行训练性能。

对于具有复杂逻辑和大参数的模型,手动找到的并行策略与业务目标的实现没有直接关系,但是需要耗费大量的精力。Mindspore提出了一种新的分布式并行训练模式来解决这个问题,它结合了数据并行、模型并行和混合并行模式。

从华为MindSpore看框架开源之势

Mindspore通过构建基于数据量、模型参数量、网络簇拓扑带宽等信息的成本模型,自动选择成本最低的模型进行分割,并将模型绑定到设备上执行,实现了自动分布式并行训练。整个过程几乎不需要开发人员的参与,这可以使开发人员更加关注模型逻辑的开发。

从华为MindSpore看框架开源之势

3.数据处理功能

mindspore中的数据处理功能称为minddata,用于在训练过程中完成数据的流水线处理。它具有数据加载、数据增强、训练导入等功能。它还提供了一个易于使用的编程接口和丰富的数据处理能力,涵盖了cv/nlp和其他场景。

从华为MindSpore看框架开源之势

此外,mindspore还支持分布式培训。在分布式数据并行模式下,每批完成后,计算和模型信息将被分配给工作对象,并提供了两种调整迭代和划分数据的方法,即“切片和重采样”。

从华为MindSpore看框架开源之势

4.图形引擎模块

图形引擎模块负责MindSports前端和底层硬件之间的交互任务,是MindSports内部的图形处理模块。它负责对从管理引擎传输的图形执行一系列图形操作,最后将其转换为可直接在底层硬件上运行的图形,并分发和管理图形中使用的所有操作符。

从华为MindSpore看框架开源之势

在图形处理过程中,图形引擎将统一定义每个插件模块需要提供的接口。具体的插件由不同的功能模块根据自己的能力提供,它将根据不同插件提供的能力实现执行选择,以保证性能。

从华为MindSpore看框架开源之势

关于框架开源的争论

心灵孢子的开源并不出人意料。当华为在2019年8月的华为全连接会议上正式发布瑞星910芯片时,它发布了一个全场景人工智能计算框架mind孢子,并透露mind孢子将在2020年第一季度开放源代码。

从华为MindSpore看框架开源之势

华为轮值主席徐志军在新闻发布会上表示,mindspore标志着华为全场景、全堆栈人工智能解决方案的组成,也标志着华为的人工智能战略进入了一个新阶段。

从华为MindSpore看框架开源之势

除了mindspore,市场上还有许多开源框架,各种框架共存并发展:

国际开源框架:

& # 9642;谷歌张量流

& # 9642;加利福尼亚,伯克利,卡夫

& # 9642;facebook的Pytorch

& # 9642;Microsoft cntk

& # 9642;Google keras

& # 9642;亚马逊mxnet

国内开源框架:

& # 9642;百度百科

& # 9642;鄙视天元大脑++版

& # 9642;华为精神孢子

& # 9642;清华的计划

& # 9642;腾讯youtu ncnn

& # 9642;阿里x-深度学习

随着人工智能技术的发展,神经网络的层次不断加深,模型越来越大、越来越精确,其应用也逐渐丰富。它的底层框架已经成为技术巨头的布局焦点。

目前,市场上有很多人工智能框架。原因是开源框架是推动人工智能技术发展的重要推动力。开源项目允许开发人员查看、使用、复制和修改自己的源代码,具有更新快、二次开发和可扩展性强的特点,对减少企业开发人工智能应用的投资有很好的效果。

从华为MindSpore看框架开源之势

因此,目前,开源框架被广泛应用于人工智能发展的浪潮中,以快速构建人工智能开发环境,促进企业加快技术产品化的进程。

最近,许多框架相继被打开,这证明国内的技术制造商和大学增加了他们的基础研究;另一方面,这也表明国内制造商在人工智能的开发和应用过程中更加关注底层基础设施。

从华为MindSpore看框架开源之势

许多框架都是一个接一个的开源,这将为开发者提供更多的选择,对人工无线城市和生态都有好处。

放眼世界,更多的人工智能开源框架将不可避免地带来各种框架和标准之间的竞争,而这些基础设施之间的竞争也将增强人工智能的基础性能,从而为人工智能上层应用的创新带来更多的可能性。

标题:从华为MindSpore看框架开源之势

地址:http://www.hcsbodzyz.com/hcxw/929.html