本篇文章4415字,读完约11分钟
"你认为小熊健离开普林斯顿大学去创业怎么样?"答案是不言而喻的,在计算机视觉圈(或泛人工智能圈)里,“学得更好就是做生意”。
因此,有人总结了学术牛市的三种选择:一是教授被行业挖走,领导各大公司的研究所;第二,技术背景强的学生在毕业后或短暂的职业生涯后加入几个志同道合的学生(或朋友)一起创业;第三,教授离开学院和大学去建立自己的公司。
毫无疑问,萧属于第三条道路。
X教授创立了autox。肖是麻省理工学院人工智能实验室的博士。在创业之前,他是学术界的明星人物,他周围的朋友和同事都喜欢叫他x教授
学生时代,肖获得了包括eccv(欧洲计算机视觉会议)和谷歌研究在内的最佳论文奖。2013年从麻省理工学院毕业后,他在普林斯顿大学计算机系担任助理教授,后来创建了普林斯顿大学计算机视觉和机器人实验室。
在个人网站上,肖介绍了自己的情况:他在计算机视觉、自动驾驶和机器人技术方面有十多年的研究和工程经验,也是三维深度学习、rgb-d识别与地图、大数据和机器人深度学习领域的先驱。
有了这样的背景,他也是一个中国企业家,这使他成为中国资本在硅谷追逐的对象。
去年6月,当他离开普林斯顿大学并决定创业时,外界好奇的是:X教授会创建什么样的公司?“教授创业必须牢牢扎根于自己的学术成就。因此,我认为熊健先生公司的关键词也与深度学习和视觉(尤其是三维视觉)密切相关。”有人曾经猜测过。
最终,由肖创立的autox向外界揭示了这个谜题——一家为自动驾驶汽车提供软件(包括感知、决策和控制)解决方案的技术公司。
凭借其在学术界的声誉,肖已经为Auto X招聘了20多名员工。他们大多来自美国顶尖大学:麻省理工学院、斯坦福大学和伯克利分校,并在微软、facebook、苹果、magicleap和本田工作过。
“自动驾驶仪不是奢侈品”
“为什么(选择)自动驾驶?今年5月,在2017年铁饼大会上,肖在讲话中回答了这个问题。
他说自动驾驶是一个“令人兴奋的领域”。回顾过去几十年科技领域的变化,从个人电脑、互联网到智能手机,几乎每个人的生活都发生了变化。在未来30年里,将改变每个人生活的将是自动驾驶汽车。
让他“超级兴奋”的是,自主驾驶是他擅长的领域(计算机视觉和机器人)的大规模应用。
在自主驾驶生态系统中,参与者包括汽车制造商、tier1、芯片公司、旅游服务公司等。肖指出,要开放自主驾驶生态系统,需要一个非常好的人工智能软件平台,这是autox可以发挥其优势的地方。
在自动驾驶领域,特斯拉是少数几家使用基于摄像头的方法实现全自动驾驶的公司之一。在特斯拉的第二代自动驾驶仪硬件上,特斯拉希望通过八个摄像头、前向雷达、超声波雷达和gps数据实现全自动驾驶。没有激光雷达,这是特斯拉和主流自动驾驶公司的最大区别。
但autox选择了比特斯拉更激进的方法。
今年3月,autox获得了加州车管所颁发的驾驶考试执照,随后公司发布了不同天气条件下的驾驶考试视频。
值得注意的是,这辆由林肯mkz改装而成的原型车并未配备激光雷达、毫米波雷达、超声波雷达、差分gps等传感器。取而代之的是7台相机,总成本不到500美元,相当于一部智能手机的价格。
肖想要解决的问题是触及自主驾驶领域的痛点——昂贵的传感器无法迅速将科研成果商业化。例如,在由谷歌拆分的自动驾驶公司waymo 10年的研究中,最大的进展是将传感器价格从最初的75000美元降至7500美元。
在tiecon 2017上,肖说:“autox的使命是使自主驾驶技术民用化。”自动驾驶不是奢侈品,而是人人都能享受的技术。ゥ
“让人工智能变得更强大,让软件变得更好”相机的优势在于,即使是非常低端的相机也能保持高分辨率。摄像机对物体的识别,包括交通灯,是非常清晰的。当然,该方案最大的优点是硬件成本非常低,易于集成。
但问题是,目前仅仅依靠纯视觉可靠吗?小熊健回答:“让人工智能更强,让软件更好。”(让人工智能更强大,让软件更好。(
在听了他在tiecon的演讲后,一位观众评论道:Autox肖健对基于摄像头的驾驶比基于传感器的自主驾驶更有信心。(
作为一家新公司,autox没有收集足够的数据来使其系统做出更好的决策。在未来,autox希望建立一个自动驾驶车队来收集更多的数据并不断改进这个解决方案。
今年7月,在cvpr(计算机视觉与模式识别国际会议)上,雷锋与肖博士谈了autox的新趋势和他对自动驾驶的思考。以下是对话记录(删除):
雷锋。介绍autox的最新情况,比如团队规模和最近的计划。
肖:最近已经发展到20人左右,可能没有其他公司发展得快。我们喜欢招募最优秀的人。我们仍然采用两个标准:红色和专业,即强大的专业技能和特别重视团队合作。
目前有一些计划,但不方便透露。我们可以说的是,我们将在两年内把我们的产品推向市场,这样用户就可以使用它们。
雷锋。autox的计划是放弃激光雷达和差分gps,在车前使用七个摄像头,所以成本也很低。但是从安全的角度来看,你是怎么想的呢?如果只使用摄像机,可以达到什么程度的自动驾驶?如何应对恶劣天气和背光等极端情况?
小熊健:我们从来没有说过要放弃安全,但是很多人把安全作为不做视觉的借口。
安全性并不意味着物理世界中没有足够的信息,而是软件应该足够好。我认为从理论上讲,依靠照相机是绝对安全的。只要你在这个领域投入和花费更多的精力,结果不会是坏的。
恶劣天气和背光主要取决于提高算法的鲁棒性和提高数据水平。当然,相机不应该太差。基于这个前提,另一个是拼写软件。
雷锋。你认为视觉能解决自动驾驶的所有问题吗?
肖:我认为从长远来看,我们完全可以解决自动驾驶的所有问题。问题是我们此时是否有耐心等待,例如,实现完全无人驾驶需要10年或20年。
我们从不拒绝其他传感器或其他技术,只关注相机。我们的论点是,人们看不起相机太少,这导致没有努力改善其功能。它仍然有大量的油和水要“挤压”,但每个人都没有努力“挤压”。
雷锋。你在之前的演讲中说你想建立一个“自动驾驶大脑”。这是什么“大脑”?
肖:自动驾驶的大脑有点像操作系统,它很大,比如说窗口;;到小说,比如linux内核的核心代码。
我们现在正在做的是核心内核,它包括两个模块:感知和决策。我们构建内核,然后向其中添加其他传感器和其他服务层。
雷锋。(公开号码:雷锋。目前,许多公司的目标是做四级自动驾驶技术。这个目标非常雄心勃勃,但远未实现工业化。你对这种自动驾驶仪的商业化有什么看法?
肖熊健:我认为像谷歌这样的大公司可以这样玩,因为它有足够的钱,但大多数初创公司做不到。初创企业每一到两年就需要融资,然后他们一分钱也赚不到。我认为这是一种不健康的方式。
为什么我一开始就选择了相机,因为激光雷达在未来10年可能会很便宜,但在2到3年内会便宜吗?绝对不便宜,不会这么快。
雷锋:你认为企业家或后来者在无人驾驶领域能找到什么机会?
肖:我认为我们应该使它与众不同,比如把重点放在利基市场。如果没有特色,大而全,它将是第五级,它将需要十多年的时间来赚钱。我认为基本上没有生存的机会和方式。
这与滴滴或优步等普通初创企业不同。你可以从构建一个应用和一个服务器开始,然后你可以集中精力工作六个月,你可以在短时间内占领市场并取得好成绩。
但是自动驾驶不是这样。即使我们集中火力六个月,我们仍然不能实现全自动驾驶。这不是金钱可以解决的问题,而是需要更多的技术积累。
因此,我更看好渐进式道路,先辅助驾驶,然后升级。我认为这是合理的。大多数汽车工厂也是如此。他们不会立即实现自动驾驶,消费者可以购买这样的汽车。
雷锋。在自动驾驶领域,从2009年到2017年,你印象最深刻的是什么?
肖:我认为最令人印象深刻的是人们观念的改变。在过去,自动驾驶是不可能的,它不是工作,而是纯粹的科学研究。每个人都对这个领域过于悲观。
如今,许多人认为自主驾驶有可能实现,这太乐观了。许多人,包括埃隆·马斯克和黄仁勋,认为无人驾驶的问题已经解决了。我认为他们想得太简单了。
无论是过于悲观还是过于乐观,这两种方法都是不正确的。最好理性地看待它:你必须看到它确实有希望,但这是一个渐进的过程。
雷锋。欧特克希望与哪种公司合作?
肖:我们对整个交通和手机旅游很感兴趣。有四个主要合作伙伴:
首先是汽车制造商。这是我们最想合作的伙伴。主流原始设备制造商可以让我们的产品进入主流模式。起初,它可能不是完全无人驾驶,而是辅助驾驶,它可能是l2、l2.5、l3和不同级别的辅助驾驶。这就是我们和其他自动驾驶公司的区别。我们更喜欢渐进模式——一个软件逐渐升级,数据逐渐积累。
第二是与原始设备制造商相关的第一层。通过与他们合作,我们共同开发并向原始设备制造商销售软件和硬件,并将它们安装到主流机型中。
第三个是优步和滴滴这样的旅游公司。然而,这种模式的问题在于,只有真正无人驾驶,它才能商业化。这个门槛会更高,周期会更长,而且可能需要很多年才能普及。
第四,物流公司,包括快递、卡车等。,如果无人驾驶是有人驾驶,要求可能会更高,但对货物的要求会更低。
雷锋。谈谈你对加入cvpr的感受。
肖:现在这个领域确实吸引了大家的注意力。当我以前从事简历研究时,它被认为是一个不受欢迎的行业,很少有人关注它。当时,会议规模很小。现在有四五千人,这太夸张了。
cvpr在我们这个领域的优势在于它可以从社会上吸引最优秀的人才,这对整个领域的快速发展非常重要。
*在cvpr研讨会上,从左到右:余飞雪、彭军、肖熊健、倪凯、吴甘沙、侯小弟来自时宇的照片
雷锋。今年,许多与cvpr中自动驾驶相关的中国公司,如滴滴、图森、Horizon、momenta和autox,都在积极参与,这些公司或多或少都在做与深度学习相关的事情。你认为深度学习会给自主驾驶带来什么变化?
肖:深度学习对自主驾驶和人工智能领域的影响是巨大的,不可低估。
如今,自主驾驶公司使用深度学习已成为常识。例如,我以前在普林斯顿教书,我教了两周深度学习。学生学完之后,他们都明白了,然后他们开始做自己的项目。
我认为深度学习有点像“你会使用电脑和办公室吗?”。因此,在不久的将来,我们不应该说“我是一个基于深度学习的公司”,这就像说“我们是一个基于使用计算机的it公司。”
深度学习的进展仍然很快。同时,我觉得有些进展可能并不实际。
例如,生成性对抗网络在与生活无关的领域非常有用,但我对自主驾驶有所保留。因为外界无法区分这是纯粹的学术研究还是一项真正可以使用的技术。
目前,许多技术并不完美,这可能只是一个非常基本的想法,需要更多的时间才能进化得更好。例如,计算机视觉在20或30年前就有了一个初步的想法,直到现在它已经发展到了一个合适的水平。
雷锋原创文章。严禁擅自转载。详情请参考转载说明。
标题:“AI好青年”肖健雄:榨干摄像头性能,渐进式实现自动驾驶
地址:http://www.hcsbodzyz.com/hcxw/11014.html