本篇文章3575字,读完约9分钟

“老婆,开门。”

如果隔壁的老王居心叵测,故意练习你的口音,我相信你会觉得“北京有很多人很擅长口语。”客人们将举行一场盛大的宴会,大厅的东北角将设置一个8英尺的障碍物。腹语者将坐在栅栏里,有一张桌子、一把椅子、一把扇子和一把尺子。

“老婆,开门”,如果隔壁老王对你的声音模仿到出神入化

▲隔壁的王叔叔

然而,如果你的家装有带声纹识别的智能门锁,即使隔壁的老王把你的声音模仿得惟妙惟肖,这门也打不开。

虽然雷锋的编辑早就听说声纹识别技术可以应用到智能门锁上,但他不能在没有亲眼目睹的情况下感受到它的威力。

几天前,雷锋。参加了在清华大学大楼举行的人工智能与信息安全论坛和德银堂信息技术研究所成立大会。演讲进行到一半时,德银堂董事长方正突然要求员工在讲台上放一扇门和相关设备。

“老婆,开门”,如果隔壁老王对你的声音模仿到出神入化

这是为了让事情发生!

然后,两个漂亮的小姐妹走上舞台,一个扮演主人,另一个扮演小偷。

店主在手机应用程序中输入自己的声音,并将其与门绑定后,他开始了第一轮:

姐姐小姐的主人购物回家,打开应用程序,根据弹出的数字密码直接读取密码(现实生活中的随机密码,演示时密码简化为12345678),顺利开门。

第二轮:手机丢了,被“小偷”找到了。小偷用自己的声音读出了密码。嗯,门没有像预期的那样回应。

第三回合:小偷没有放弃。在偷手机之前,他悄悄地跟着主人,录下了她的声音。然后把它放在门上“听”——即使此时使用了固定的密码,小偷还是会多次播放主人的声音,但门还是打不开。

“老婆,开门”,如果隔壁老王对你的声音模仿到出神入化

然而,首先,如上所述,声音门锁也已经着陆之前;其次,观众的接受度还有待检验,毕竟指纹识别和人脸识别是更方便的识别方法。

然而,接下来由方正和德银堂副总经理兼总建筑师肖永明介绍的一幕,却让雷锋黯然失色。com编辑期待着它:

“像‘转张三到1000元’,你可以做语音识别,意图理解,得到指示,确认你的身份,最后进行银行转账。一句话就可以很方便的转账或者银行购物。”

肖永明也告诉了雷锋。他们正与汽车制造商合作开发汽车声波纹锁和声波纹防盗装置。

有一个背景需要解释:

德意通和清华大学共同负责制定国家颁布的所有与声纹识别相关的行业标准,涉及公安、金融等不同行业。手机银行唯一设定的生物识别标准是声波纹标准,主要由手机银行起草。

“老婆,开门”,如果隔壁老王对你的声音模仿到出神入化

事实上,声纹识别作为密码验证的一种手段,早已出现在银行服务中。2015年,语音识别制造商和银行联合发布了“声纹+人脸”p2p转账产品。

2016年,建行手机银行推出声纹验证服务。

2015年,蚂蚁金服技术团队相关负责人表示,人脸登陆有望在今年内启动,蚂蚁金服开发的声纹技术也有可能应用于人脸识别后的登陆、转移等场景。

后来,大家都知道,支付宝今年真的推出了“刷脸”服务。当然,声纹服务还没有推出。

总的来说,这意味着方正关于一个词在未来可以被转移的想法是可靠的,肖永明提到的汽车声纹锁也在2015年被报道,但这也是未来应用的一个预期领域。然而,雷锋。com了解到Provoc确实在与相关汽车制造商合作开发声波纹锁。

“老婆,开门”,如果隔壁老王对你的声音模仿到出神入化

然而,回到问题的开始,虽然看起来很酷的黑色技术,我能相信声纹的安全性吗?为什么上面的智能门能认出老王是老王,你是你?为什么即使是你的声音也不能开门?

“老婆,开门”,如果隔壁老王对你的声音模仿到出神入化

-下面是技术展示-在雷锋努力工作的开放班。一些专家给出了以下不同声音的声纹。可以看出,不同的声音呈现不同的画面:

▲1个月大婴儿的哭喊声

▲男式口哨声纹

▲雨雷声纹

▲声音和枪击声纹

我真的很抱歉。专家还给出了接吻声的声纹,说接吻时不应该吮嘴。看这张小照片,它特别像日出时的大海吗?

此外,被视为军事机密的核潜艇声纹:

不同的物体有不同的声纹,不同人声音的声纹相当神秘。科学家的目的是在各种声音中找出一个人的声音特征,从而判断“你就是你”。

然后问题来了。首先,我们如何判断“你就是你”?

告诉雷(公开号:雷),声纹识别是一个典型的模式识别问题。完成声纹特征提取后,有必要选择合理的声纹建模和识别方法。

以上是声纹识别技术的发展概况。

自1930年以来,科学家们已经比较了最简单的声音波形,以了解谁“波动”不同。

主流方法有高斯混合模型-通用背景模型(gmm-ubm)、基于gmm-ubm的I-向量和深度神经网络。

所谓的高斯混合模型(gmm),是一种基于高斯概率密度函数(正态分布曲线)的模型,能够精确地量化事物。

哦,你还是不明白你在学什么。你怎么能打破它?

借用网友的一个生动解释是:

陶孕育了一个生命、两个生命、三个生命和万物。

Gmm是人们知道自然界万物相互平等的规律,是大脑认识自然后的长期归纳和沉淀。

gmm的核心思想是任何形式的函数(无论是可见光还是图像,或者抽象的多维变量模型,如经济和金融危机模型)都可以通过多个高斯函数进行加权和混合。

什么是gmm-ubm?它是对传统gmm模型的改进,因为在实际应用中不可能收集到足够的语音来覆盖所有的声学现象,所以新说话人的gmm模型是通过基于ubm的映射自适应得到的。

“老婆,开门”,如果隔壁老王对你的声音模仿到出神入化

如果它看起来有点复杂,你可以简单地将其理解为几种不同的算法...

声纹识别门锁看起来太简单了,实际上是“复杂的”。

方正说,上面演示的智能门锁结合了声纹识别和语音识别,实现了对“谁说了什么”的识别和判断,也就是说,“门”不仅知道你是谁,还知道你说了什么。

“老婆,开门”,如果隔壁老王对你的声音模仿到出神入化

它们还采用了新旧技术的结合,如gmm-ubm和i-vector方法相结合,动态时间序列信息用于文本提示声纹识别,基于深度学习的声纹特征提取方法与传统的动态时间规整算法相结合来识别文本的相关声纹。

“老婆,开门”,如果隔壁老王对你的声音模仿到出神入化

第二,如果我感冒了该怎么办?当孩子们的声音改变时,他们多大了?当你开门时,你心情不好。如果你哭着想要开门呢?或者,我最终决定去泰国。如果我回家后想开门呢?

“老婆,开门”,如果隔壁老王对你的声音模仿到出神入化

“门”能认出谁是生物主人吗?

(年度最佳戏剧,想开门吗)

人的声音也是多变的,容易受到身体状况、年龄、情感等的影响。在嘈杂的环境和混合的说话人中,提取和建模声纹特征也很困难。

方正说,他们一直在努力克服这些问题,从各个方面提高声纹识别系统的鲁棒性。

什么是稳健性?你和鲁班有关系吗?

不,不

Robust是robust的音译,意思是robust和strong。这是系统在异常和危险条件下生存的关键。例如,计算机软件的健壮性是在输入错误、磁盘故障、网络过载或蓄意攻击的情况下,它是否不会崩溃或崩溃。所谓“鲁棒性”是指控制系统在一定的参数扰动下保持某些其他性能的特性。

“老婆,开门”,如果隔壁老王对你的声音模仿到出神入化

方正解释说,科学家通常从技术和工程的角度并行处理这个问题。

例如,对于时变声纹问题(人的声纹随时间变化),一方面从人的发音机制和听觉感知出发,寻找语音信号中的时变鲁棒信息,并从中提取时变鲁棒声纹特征;另一方面,根据用户的使用情况,设计了多种声纹模型的自动重建和更新框架,以保证声纹识别系统始终保持稳定和准确。

“老婆,开门”,如果隔壁老王对你的声音模仿到出神入化

针对情感和噪声问题,也进行了相关的研究,如利用特征映射和补偿、降噪自动编码器等方法,在一定程度上解决了其困扰。

还有,你为什么认为在密码设置过程中,应该使用数字动态验证码,而不是随便叫“老婆”?

因为动态数字密码术和其他专利技术(如声纹的时变鲁棒性、联合因子分析等。)用于声纹认证应用时,身体状况、年龄和情绪的影响可以被有效地抵消。

想哭就哭,只要记住正确读数字。

这还不够。为了确保不会有蛾子因为上述变化而无法认出它们的生物主人,方正和他的研究小组想出了这些方法:

1.研究了十多种典型语音变化对声纹的影响,其中“你在我的搜索中落了雁”可能也在分析之列;

2.记录了世界上规模最大、时间跨度最长的研究年龄对声纹影响的语音数据库,用于研究和解决年龄对声纹的影响;

3.情感语音的声纹识别技术研究。情感语音的声纹识别技术研究。例如,如果一个姐姐说你“烦人”,她必须根据上下文和语气来分析:她是想让你开始还是过来。

“老婆,开门”,如果隔壁老王对你的声音模仿到出神入化

4.环境噪声、混合语音等对一般声纹识别有很大影响,因此有必要通过多次测试来保证识别的稳定性。

虽然已经做了很多研究,但是“门”要认出你是你并不容易。

方正说,未来声纹识别有三个有趣的研究方向。

第一,如何解决声纹黑客问题,虽然我们已经有了录音回放的检测技术,但是黑客的手段会不断增加,水平也会不断提高,因此有必要更全面地研究黑客对声纹识别系统的攻击手段,并提前研究有效的反攻击措施。

“老婆,开门”,如果隔壁老王对你的声音模仿到出神入化

第二,如何在复杂的互联网环境下构建统一的声纹平台。目前,整个互联网充满了各种编码格式、通道和噪声的声音,如何在如此复杂的环境中准确高效地完成声纹识别和身份认证也是一个巨大的挑战。

“老婆,开门”,如果隔壁老王对你的声音模仿到出神入化

第三,如何解决“鸡尾酒会”的问题。在实际应用中,语音信号通常同时与多个说话人混合,因此如何在多说话人场景中实现实时说话人检测也将是一个主要的研究难点。如果这一问题得到解决,它将在许多领域得到应用,如警察刑事侦查中的快速目标说话人检测。

“老婆,开门”,如果隔壁老王对你的声音模仿到出神入化

雷锋原创文章。严禁擅自转载。详情请参考转载说明。

标题:“老婆,开门”,如果隔壁老王对你的声音模仿到出神入化

地址:http://www.hcsbodzyz.com/hcxw/11300.html