本篇文章3118字,读完约8分钟
雷锋。作者胡佳琪和雷锋。(公开号码:雷锋。com)开始了这篇文章。
人脸识别技术,作为计算机视觉领域的龙头华丹,最近已经成为中国人工智能领域的一颗闪亮之星。
早在去年年底,阿里的迪法恩斯技术(face++)就获得了1亿美元的融资,而本月专注于计算机视觉技术的上唐技术(Shangtang Technology)获得了4.1亿美元的B系列融资,开创了全球人工智能领域。单轮融资的最高纪录;像从云科技、易图科技和沈星科技这样的人脸识别公司最近都获得了数千万美元的融资。这是一个奇怪的现象,这些统一的轻资产算法公司可以在资本市场获得如此巨大的融资。难怪连对人脸识别领域持乐观态度的李开复也惊叹这个行业能“养活四只独角兽”。
除了这些上游算法提供商,Hikvision、大华等传统安全行业巨头也在人脸识别技术研发上投入了大量资金。例如,根据Hikvision的年度报告,Hikvision在R&D的投资在2016年达到了24.33亿元。
面孔识别的投资逻辑:有吸引力的市场空
众所周知,中国已经成为人脸识别技术发展的最佳沃土。2016年,中国平安的竞价总额为660亿元,中国整个安防行业的规模为1000亿元。根据中安的资料。中国安防行业的市场规模从2012年的3240亿元增长到2016年的5400亿元,年均复合增长率达到15%,2016年视频监控产品的产值达到约962亿元。
经过近十年的高清和网格升级,中国视频监控行业已经形成了总投资近万亿元的硬件基础设施。在视频监控领域完成了“看”和“看得清楚”两个步骤后,人脸识别技术就像“理解”一样。这是实现ai+安全最重要的一步。如果人脸识别技术真的能为不断扩大的安全性增加最后一笔,那将是一个十亿美元的蛋糕,
除了安全性,人脸识别技术还将广泛应用于交通、金融、教育、房地产、移动支付等领域,如远程开户、支付、认证等。人脸识别在许多行业都有大规模推广的潜力。除了这些B和G终端,人脸识别还有一个C终端还没有打开。这张诱人的大蛋糕组合是人脸识别技术背后的投资逻辑。
人脸识别技术的成熟曲线:你在微笑吗?
从马云的《为脸付费》开始,随着人脸识别技术逐渐成为热点,出现了很多类似“新的人脸识别技术准确率超过99%,比肉眼更准确”的报道,极具误导性,但事实并非完全如此。
在学术界,人脸识别算法的准确率确实可以达到99%以上。例如,在国际人脸识别领域的两个经典列表lfw和fddb中,几乎主流玩家都能达到99.5%以上的识别准确率,尤其是国内团队,其分数远远超过谷歌。然而,lfw和fddb只是两个拥有少量数据的学术数据库。例如,lfw只有10,000多张人脸图像。通过不断调整主流的人脸识别算法,识别结果可以很容易地刷到很高的水平。熟悉机器学习的人都知道“过度适应”的概念。然而,由于各种各样的原因,像lfw和fddb这样的学术列表已经成为人脸识别算法供应商用于营销的噱头,就像安卓手机供应商生产的每一款新机型一样。人脸识别技术也是如此。工业中真正的识别场景与学术数据库完全不同。在真实场景应用中,由于摄像机位置、拍摄角度、光线和障碍物的影响,识别率会大大降低。
人脸识别技术中的核心人脸比较可以分为3种比较场景:1: 1、1: N和N: N。目前,1: 1(快速比较当前人脸和人像数据库的对应人脸数据)是使用最广泛的场景,如候选人的身份确认、牌照比较以及招商银行较早的刷脸和取款。由于摄像头位置和光线可控,需要用户配合,1: 1。1: N比较是从大量的肖像数据库中检索当前用户的面部数据并进行匹配。典型的应用场景是检查犯罪嫌疑人,也就是说,在监控摄像头捕捉到一张人脸后,它会从海量的嫌疑人人脸数据中检索出该人脸是否被列出。目前,1: n比较的核心应用问题是,当n较大时,需要大量的计算资源,比如腾讯的云(Tencent Cloud)成千上万的产品,比如Youtu 2.0,它将n的最大值限制在10,000,当n太小时,它极大地限制了应用场景。最后,N: N相当于在人像数据库中同时搜索多个人脸,这需要更严格的计算资源,并且往往会产生较高的错误率,从而影响识别结果,因此目前难以大规模应用。
通过以上介绍,我们可以看出,人脸识别技术是一个场景性很强的领域。在不同的场景中,如执照比对、嫌疑人调查、1:1合作识别、1:1不合作识别(即物体不能很好地站在摄像机前,摄像机从隐藏的地方捕捉人脸),其应用难度与技术路线有很大不同,甚至其核心技术能力不在于算法本身,而在于对场景的深入研究。
所谓场景深度培育,就是密切关注场景的需求,根据场景的特点,以商业上可以接受的价格(价格、计算延迟、可维护性等)收集大量的场景数据。),不断调试方法或使用多种方法的组合,经过一轮又一轮的alpha、beta到zeta版本,最终实现产品化。这个过程并不像一个征服世界的算法那么简单。
然而,人脸识别技术提供商面临的一个难题是,人脸识别技术本身很难构成一个独立的应用,必须与其他服务或产品相结合。例如,technology+camera可以成为智能视频监控设备,或者与传统支付产品相结合,在密码/手机验证码上增加一层人脸识别验证,在atm机上增加人脸识别功能,可以在特定场景下形成具有商业价值的应用。
在上述背景下,人脸识别技术提供商与应用场景之间存在一定的距离,他们不得不站在其他产品或商业模式的后面,导致对场景缺乏深入的控制,甚至难以获得升级后的技术赖以生存的场景数据。然而,缺乏对场景的控制将使技术本身难以通过有效的场景培养获得质的变化。最终的结果,可能是通过出售许可证或出售服务的方式,提供了一种通用的算法技术。
人脸识别独角兽公园:谁在短跑,谁在假装跑步?
目前,我们已经看到了人脸识别技术的供应商,并与在安全等领域有着深厚背景的企业进行了深入的合作。例如,上塘科技与老牌证券上市公司东方网通成立了合资公司,利用双方的优势推动人脸识别技术在证券行业的落地。此外,在一些案例中,从云科技将智能城市的上市公司杜佳科技与传统身份识别领域的解决方案易图科技+神思电子捆绑在一起。当然,忽视技术本身的阿里背景是不可或缺的。毕竟,如果没有通过技术算法对场景的深度培养,很难有所作为。
从场景+技术两个角度来看,观察人脸识别独角兽公园中奇怪动物趋势的逻辑是清晰的:首先,你是否有深度培育人脸识别应用场景的禀赋,或者你能否与场景中的伙伴深深地联系在一起?第二,商业突破能否在特定的场景中实现,并在特定的销售收入数据中得到反映?第三,除了cnn和其他传统的计算机视觉技术,Return能否实现技术突破,如引入人脸三维信息,多特征融合,或更好的1: N/N: N搜索策略?最后,这一点可以反映在不同公司发表的论文的主题和质量上。
最后,我们可以对本文的题目做出一个初步的结论:通过深度学习技术的引入,人脸识别领域近年来确实在算法上取得了突破。过去,人脸识别初创企业往往可以仅仅依靠费奇的算法获得不错的投资,但事实是人脸识别的工业应用还远未成熟,更令人尴尬的是人脸识别技术本身难以作为独立产品使用,需要结合场景进行深度培育,才能在识别效果和商业化方面取得突破。在通往奇点的道路上,人脸识别可能还有很长的路要走。如果把这场奇点竞赛视为接力赛,那么人脸识别团队的接力棒刚刚从学术界移交到工业界,而这群获得了大量融资的中国本土人脸识别公司真诚地希望他们能够全力以赴,全力以赴。
当然,仍然有假装的跑步者,他们仍然持有学术思想,并为在这次比赛中刷名单的算法感到自豪。也许留给他们的时间不多了。
雷锋的特别贡献。严禁擅自转载。详情请参考转载说明。
标题:人脸识别,是否将成为AI+时代首个临近的奇点?
地址:http://www.hcsbodzyz.com/hcxw/11321.html