本篇文章581字,读完约1分钟
5月8日上午,Xi交通大学人工智能研究所所长、首席科学家孙健博士作了由“信息技术新工程产学研联盟”主办的人工智能教育网上公开课“可视化计算前沿进展”的报告。
在他的报告中,孙健博士从两个方面探索了当前使用卷积神经网络的计算机视觉:
1.卷积神经网络的核心可以概括为:网络深度、网络卷积运算、网络宽度和网络规模。
2.计算机视觉的核心问题可以概括为:分类、检测、分割和序列。
孙健说,研究人员为解决这些问题做了很多努力,取得了很多进展,但计算机视觉中的关键问题,如长尾分布、自监督学习和遮挡等,还没有解决。
下面我们将介绍孙健博士报告的一些内容。
卷积神经网络
计算机视觉涉及许多任务,其中之一是如何理解图片,即图像的表示。从1978年的2.5dsketch到今天的中深卷积神经网络的点特征和局部特征,图像表示问题已经研究了几十年。
目前最流行的方法是深度卷积神经网络,即通过中间函数的作用输入一幅图像并输出一个类别。但是卷积神经网络学到了什么?孙健提到,所学的东西可以分为两个维度:低层次的表征,如线段、边缘和纹理,以及高层次的特征,如狗和耳朵。
卷积神经网络的思想由来已久。早在20世纪80年代,日本科学家就提出了神经认知机的概念,这可以看作是卷积网络的最初原型。Yannlecun在20世纪90年代发展了这种方法,学术界开始研究卷积神经网络。
计算机视觉
标题:旷视首席孙剑:视觉计算前沿进展
地址:http://www.hcsbodzyz.com/hcxw/376.html