本篇文章1172字,读完约3分钟

2017年7月7日至9日,全球人工智能和机器人峰会ccf-gair会议在深圳喜来登大中华区酒店举行。会议由中国计算机联合会主办,雷锋同志主持。(公开号码:雷锋。com)和香港科技大学(深圳)汇聚了全球30多名顶尖院士和近300家ai star ai企业。参加人数为3000人,这是中国的最高阵容。雷锋。会议期间,com记者第一时间进行了现场报道。

旷视科技孙剑:计算视觉的革命与挑战 | CCF-GAIR 2017

首先,孙健自然会抱怨天气造成的延误。但与此同时,他自然开始认为,如果人工智能能帮助飞机计划起飞和着陆,那绝对会比无人驾驶飞行器容易,而且它显然能有所帮助。

旷视科技孙剑:计算视觉的革命与挑战 | CCF-GAIR 2017

谈正事,孙健说,人工智能的分析与大数据、计算能力和算法改进有关,但他认为最重要的是计算方法的改变。虽然神经网络是由人类在计算机上建立和发展起来的,但神经网络中激活函数、非线性单元和权矩阵的应用可以形成一个非常高维的非线性函数,从而完成与以往不同的任务。除此之外,gpu还使得神经网络的发展更加强大。

旷视科技孙剑:计算视觉的革命与挑战 | CCF-GAIR 2017

Face++很早就意识到这种操作非常重要,所以他们搭建了一个完整的操作平台,自主开发了深度学习框架和深度学习训练引擎brain++并花了大量时间对其进行了润色。这一方向的认可和深入投资使face++取得了优异的成绩。

旷视科技孙剑:计算视觉的革命与挑战 | CCF-GAIR 2017

孙健解释说,过去人们不相信可以训练深层学习网络。自从2012年alexnet在8楼之后,一切都变了。然而,在这种模式下,网络在大约20层表现最好。

但是,face++的深度剩余网络resnet已经达到了152层,效果有了很大的提高;2016年,它甚至达到了1000层,实现网络不再困难。

随着网络研究的发展,不同的设备开始根据计算资源的数量表现出网络的差异化效应。与1000层相比,face++的新shufflenet适合非常小的计算,但它比alexnet好得多。网络架构不断改进,速度越来越快,越来越好。fgpa能以30fps的速度实现1080p图像识别。

旷视科技孙剑:计算视觉的革命与挑战 | CCF-GAIR 2017

在人脸识别方面,在超过人类识别准确率后,人们继续创造新的记录。

凭借face++自主开发的网络和智能城市眼系统,他们在今年的麻省理工学院科技评论中位列最聪明公司的第11位。

计算机视觉有几个挑战:感知很容易解决,认知和概念很难解决,甚至我都不知道如何教机器。然而,计算机视觉实际上有很大一部分认知和概念,比如什么样的东西是椅子。有两个非常有力的例子,人们无法准确描述椅子是什么。

旷视科技孙剑:计算视觉的革命与挑战 | CCF-GAIR 2017

还有弱线索、遮挡、模糊、目标跟踪等。人类在识别时会根据常识增加丰富的想象力和推理能力,但是很难把这些能力教给计算机,而且在这种条件下计算机的识别能力比人类差得多。

旷视科技孙剑:计算视觉的革命与挑战 | CCF-GAIR 2017

最后,还有精度要求很高的场景,如自动驾驶和医学图像诊断;和基于背景知识的图像内容描述。但这也意味着有很多潜力可以挖掘

更多的演讲报道和演讲图片全文,请继续关注雷锋。

雷锋原创文章。严禁擅自转载。详情请参考转载说明。

标题:旷视科技孙剑:计算视觉的革命与挑战 | CCF-GAIR 2017

地址:http://www.hcsbodzyz.com/hcxw/6112.html