本篇文章3332字,读完约8分钟
演讲结束时,掌声响起。
赵恒匆匆离开了他在《浪潮》中的座位,希望在人群散去之前离开2017年美国公民自由联盟的主会场,这样他就可以找到一个地方来看下一个议程——但为时已晚。尽管大门试图将会场与会场紧密隔开,但当赵恒推开大门时,会场外熙熙攘攘甚至嘈杂的谈话声涌入大厅,吸引了许多观众回头看。
赵恒提着他的包,跌跌撞撞地跟着人群向下一个会场走去。他只是暗暗后悔没有早点离开。
赵恒半是无奈半是欣慰地说:“我想主办方没想到会有这么多人,而且今年的场地太小了。”作为中国五所顶尖大学的博士生,他觉得自己已经迎来了acl的“春天”和深度学习的“黄金时代”。
据雷锋的《ai科技评论》不完全统计,第55届acl主会场规模约为1500人,每个分会场安排300多个座位。据估计,该acl的参与者人数将超过1,000人。
十年前,美国公民自由联盟不是这样的。北京大学计算机科学研究所的万晓军教授回忆说,他第一次参加acl是在2007年,当时他刚在学校教书,“会议在捷克的布拉格举行,同时举行的还有两个学术会议,即2007年欧洲计算机学会年会和2007年国际计算机学会年会。”根据当时的数据,这三次会议吸引了创纪录的1095人参加会议,美国公民自由联盟2007年收到了588份提交的论文,包括131篇论文。
十年后,美国公民自由联盟2017年只收集了299篇论文,发表了1318篇论文。必须说,这与深度学习的迅速发展有关。
在中国计算机联合会推荐的2011年版国际学术会议和期刊目录中,acl也是ccf推荐的国际学术会议(人工智能和模式识别)的B类;2015年,中国计算机联合会(ccf)在第四版更新中将其“升级”为人工智能领域的甲级会议,与aaai和cvpr并驾齐驱。这次修订和升级的A级会议数量激增,包括最初的B级会议,如nips和acl,这也引起了一些争议。
尽管学术界对ccf的推荐标准仍有许多分歧和讨论,但不可否认的是,深度学习的发展正在影响甚至引领着学术界的研究和行业趋势。至少ccf的自上而下的政策可以让我们看到学习对人工智能甚至深度学习的高度重视和重要性。
在这份出色的报纸开播前十分钟,会场已经满了
从2017年美国公民自由联盟的议程来看,深度学习的趋势越来越明显:在2017年美国公民自由联盟中,第一天的六个教程中只有四个与深度学习相关,而且大多数都分析了它在计算语言学各个领域的应用。
张凯是一家国内知名企业的首席科学家,在过去两年里,他是美国公民自由联盟的忠实参与者。他今年也来到现场,告诉了雷锋。com ai Technology Review指出,如果研究人员在2015年仍处于深度学习的初步研究阶段,那么2016年的acl将是一次深度学习将在自然语言处理领域开花结果的会议。他说,2017年美国公民自由联盟整体上延续了前一年的风格,几乎所有的论文都采用了深度学习的方法来建立模型和提高效果。此外,研究中使用的数据集基本上没有太大的更新,这并没有给他带来很大的惊喜。也就是说,研究者采用了新的方法来检验原始内容,注重效果和表现,没有更多的理论创新。
组委会自然意识到深度学习的巨大影响。在去年的2016年美国公民自由联盟大会上,加州大学伯克利分校的e. dario gutierrez发表了一篇讨论符号语义学的文章,题为《寻找非仲裁形式——利用字符串度量学习进行核回归的系统化》。去年,当深度学习开始被广泛使用时,这个决定模糊地揭示了一个想法,即组委会鼓励做更多的创新论文,避免在深度学习中越来越深。
在今年的优秀论文展示场景中,大部分论文都未能跳出深度学习的“大坑”,而“常规感觉”是满满的:我们如何处理数据,我们如何训练,我们的方法比以前提高了多少个百分点...人们似乎对美学感到有点厌倦。
与其他优秀论文相比,约翰·霍普金斯大学的瑞安·科特雷尔和杰森·艾斯纳今年获奖的最佳长篇论文《概率类型学:元音发明的深层生成模型》属于深层学习方法的范畴。然而,它提供了一种解决问题的新思路,因此它在一些基于数据的论文中显得尤为突出:本文通过神经网络学习方法构建了一种可训练的元音空概率分布方法,从而研究了语言类型学中元音的分散性和集中性,最后一句陈述是“使用nlp工具做科学,而不仅仅是工程!”于是一个问题出现了:深度学习应该如何与传统的自然语言处理研究相结合?
清华大学教师朱晓燕认为,自然语言处理研究水平的突破不仅仅是由深度学习驱动的。“深度学习的普及很大一部分是由简历领域带来的,但自然语言处理的情况不同。在深入学习变得流行之前,已经有许多好的应用程序解决方案。此外,工业中的一些应用,例如特定情况下的服务机器人,不一定需要深度学习方案。ゥ
另一位工业技术人员持有类似观点。她认为,从学术角度来看,过去两年来深度学习的综合应用属于应用工具的升级,其普及只是一种暂时现象,将来可能会被更好的方法所取代。
也许,对于追求理论创新和突破的学术界来说,深度学习的“泛滥”并不是什么令人兴奋的事情,但对于工业界来说,这是一个机会。
企业“蜂拥而至”今年,38家企业/机构成为2017年acl的赞助商,还有许多来自中国的新面孔,包括腾讯、阿里巴巴、今日头条、cvte等公司。在现场,包括英美烟草公司在内的18家制造商搭建了展台,这也有助于激发会场的激情。
但是在去年的美国公民自由联盟中,只有16个赞助商。
Acl 2016赞助商名单
雷锋。(公开号码:雷锋。《艾科技评论》实地走访了多家参展商,发现包括谷歌、facebook、百度、腾讯等公司。今年所有的报纸都被美国公民自由联盟雇佣了。看着展台上行业推广的内容,雷科技评论发现,对自然语言处理的应用需求不外乎对话问答、推荐系统、机器翻译等领域。
三星电子(Samsung Electronics)研究员Je hun jeon表示,该公司的研究成果主要使用机器学习,机器学习已应用于移动设备、智能家居产品和物联网产品。日本工业技术研究所的研究员Takushi说,该研究所主要关注三个领域。一种是使用机器学习和模拟机制来解决缺少数据的领域的问题;二是用强化学习解决化工问题,同时也注意人工智能控制系统的建设。
张凯告诉雷锋。《com ai技术评论》认为,他在acl中主要关注的是两个领域的深度学习的发展,一是根据语义理解文本情感;另一个是生成更智能的文本内容。他还认为,深度学习将成为未来重要的研究工具,并给行业带来更多惊喜。
艾伦,一个不想透露他的组织的nlp研究员,告诉雷锋。com ai Technology Review指出,深度学习的不可预测性使得许多研究处于“知道为什么”的状态,并且主要工作集中在调试好的结果上,而不是探究潜在的原理。然而,他也指出,这为工业界提供了一个与学术界站在同一起跑线上的机会。“如果我们从句法的角度来理解,我们可能需要涉及很多专业知识,但是在采用深度学习的方法之后,我们可以直接用大量的数据来馈入(模型),并且我们也可以成功地得到结果。工业以产品化为导向,所以它更关心结果和产出,而不是中间研究过程。ゥ
艾伦还认为,许多大学的研究可以在现有数据集上调试出好的结果,但同样的模型不能应用于工业。“高校使用的数据集因其规模小而不适合工业”,而工业上可以很容易地获得深入学习所需的大量数据,这也是为什么工业在某些研究领域甚至可以在学术界领先的原因。
其中,一些企业将在学术会议上发表的论文数量作为另一种招聘手段来反映其研究实力;然而,一些制造商持有另一种观点:对于行业来说,是否在顶级会议上发表论文不再是研究人员的首要要求,甚至不再是他们的主要关键绩效指标。这是做好产品的正确方法,发表论文的动机自然要弱得多。
然而,俗话说,“行业有专业”,工业界和学术界对不同的方向给予不同的关注。对于行业来说,深度学习的确是实现工业化的巨大机遇。它只能专注于流行技术和快速产出,并增强公司的影响力;然而,学术研究应该以追求真理为原则,而不是盲目追求热点,这样才能在追求真理的过程中带来创新和真正的改变。
(应被告的请求,文中的赵恒和张凯是假名)
雷锋原创文章。严禁擅自转载。详情请参考转载说明。
标题:ACL的「深度学习热」:论文纷纷「入坑」,企业蜂拥「入局」|ACL 2017
地址:http://www.hcsbodzyz.com/hcxw/11163.html