本篇文章2394字,读完约6分钟
计算机视觉和模式识别国际会议(Cvpr)是由ieee组织的一年一度的学术会议,主要讨论计算机视觉和模式识别的技术内容。在各种学术会议统计中,cvpr具有很强的影响力和很高的排名。在刚刚结束的美国夏威夷cvpr 2017大会上,学术界和产业界都给予了极大的关注,论文数量和参会人数都创下了cvpr的新纪录。
对于这样一个顶级的学术会议,除了阅读相关的文章之外,没有机会参加的同学们如何能够对2017 cvpr的学术成果有更深的理解?
8月12日下午,由雷锋主持的“上海交通大学盖尔讲堂专题讲座”。网站将在上海交通大学正式开放。作为雷锋旗下的高端学术分享品牌。gair演讲厅将举办高频率的线下校园学术分享活动,实现学术专家、人工智能运营商和在校学生之间的深度交流。本次活动中,雷锋特别邀请了2017年cvpr的五位前沿论文讲演者,请他们讲解论文,分享自己的cvpr经历。我相信五位学院派青年的原创分享会带给你一个更生动的cvpr介绍。
活动
主办单位:雷(公开号码:雷)
合作社:上海交通大学、人工智能研究所、人工智能实验室、人工智能学院
讲师:中国计算机联合会
合作媒体:人工智能技术评论
时间:8月12日下午2: 00-6: 30
地点:上海交通大学电信3号楼200号报告厅
活动流程2:00-2:05组织者介绍本次活动
学校领导讲话
2: 15-2: 55吴佳俊,麻省理工学院电子工程系三年级博士生
共享主题:用于从单个图像重建三维对象的点云生成网络
用于从单个图像重建3d对象的点集生成网络
算法工程师汪洋,阿里巴巴人工智能实验室高级
共享主题:基于情境注意的场景标注记忆网络
3:35-4:15雷尼,上海交通大学研究生
共享主题:通过多粒度分析进行视频分割
从4: 15到4: 30现场休息
上海交通大学研究生林天威
分享主题:单镜头临时动作检测
5:10-5:50上海交通大学王敏思博士
共享主题:集体活动识别交互环境的循环建模
5:50-6:20现场统一问答
活动在6:20结束
客人介绍
比尔·弗里曼教授和乔希·特南鲍姆教授,吴佳俊,麻省理工学院电子工程系三年级博士。他的研究兴趣在于计算机视觉、机器学习和计算认知科学的交叉领域。此前,他于2014年在清华大学跨学科研究所获得学士学位。他曾在微软、facebook和百度的研究实验室实习。
共享主题:用于从单个图像重建3D对象的点集生成网络(用于从单个图像重建3D对象的点云生成网络)
深层神经网络生成的三维数据越来越受到学术界的关注。大多数现有方法采用传统的三位数据表示,如三位体素或图像集。在这篇cvpr文章中,作者试图从一幅图像中直接生成3D点云坐标,并对其进行重建。作者设计了相应的神经网络结构、损失函数和学习范式。实验结果也证明了该方法的良好性能。
汪洋,阿里巴巴人工智能实验室高级算法工程师。2014年毕业于中国电子科技大学电子工程学院,研究方向为信号与信息处理。同年,他加入阿里巴巴,从事数据挖掘、机器学习、计算机视觉等工作。目前,他的主要研究兴趣是目标检测和跟踪、语义分割、深度网络压缩和加速等。
主题:基于情境注意的场景标注记忆网络
共享内容:场景标注要解决的问题是预测图像中每个像素所属的类别。事实上,它可以被视为一个序列到序列的预测任务。因此,如何充分利用相关的上下文信息是提高标注效果的关键。在本文中,我们提出了一种情景camn方法,并定义了一个由完全连接的神经网络(fcn)和基于注意的具有反馈连接的记忆网络组成的统一框架来实现上下文信息的选择和调整。我们对pascal context、sift flow和pascal voc 2011进行了一系列评估,取得了良好的效果。
雷尼是上海交通大学的研究生。
共享主题:通过多粒度分析进行视频分割(基于多粒度分析的视频分割)
视频目标分割是指视频中的目标对象沿着每一帧的轮廓进行分割。使用多粒度框架可以从粗到细精确地分割视频。视频分割可以理解为时间序列中的超像素标记过程。借助精确视频跟踪技术,基于时间空的多实例学习算法可以对超像素进行分类,然后通过图形切割在像素级对其进行细化,最终实现精确分割。
林天威,上海交通大学自动化系计算机视觉实验室一年级学生,由赵旭先生指导。主要集中在计算机视觉、深度学习、视频分析等方向,主要研究视频运动分析领域中的时间运动检测。
主题:单镜头时间动作检测
共享内容:时序行为检测是确定动作的时间间隔(包括开始时间和结束时间)和视频序列中的动作类别。与之密切相关的一个领域是基于图像的对象检测,它检测图像中对象的位置,包括两个维度:长度和宽度,而时间行为检测只需要确定动作在时间维度中的位置。本文已提交给2017年acm多媒体展
王敏思,上海交通大学博士生。
共享主题:用于集体活动识别的交互上下文的递归建模(通过交互信息的递归建模来识别群体行为)
分享内容:群体行为识别旨在判断整个人群在场景中的行为。群体行为通常包括多层次的交互情境,包括单个人的运动信息、局部群体中人与人之间的交互信息以及局部群体之间的交互信息。针对这一现象,提出了一种基于多级递归神经网络的群体行为识别算法。在每一层的交互信息建模中,算法使用lstm节点,低层信息作为高层信息节点的输入进行汇聚,高层信息节点主要分为三个不同的lstm层:人层、组层和场景层。最后,通过多级lstm结构,实现跨级群体行为识别。该方法在集体活动数据库中取得了良好的识别准确率。
以上是本次活动的简要介绍。如果你想近距离了解论文提交的更多细节,请报名参加会议。此外,整个活动是免费的,并有一个现场的图书交付活动。奖品是深度学习,最近已经脱销了。你还在等什么?扫描下面活动海报的二维码进行注册,或单击活动链接进行注册。
雷锋原创文章。严禁擅自转载。详情请参考转载说明。
标题:错过CVPR 2017?绝对不能错过GAIR大讲堂——上海交大专场开启报名
地址:http://www.hcsbodzyz.com/hcxw/11356.html