丁香五月天婷婷久久婷婷色综合91|国产传媒自偷自拍|久久影院亚洲精品|国产欧美VA天堂国产美女自慰视屏|免费黄色av网站|婷婷丁香五月激情四射|日韩AV一区二区中文字幕在线观看|亚洲欧美日本性爱|日日噜噜噜夜夜噜噜噜|中文Av日韩一区二区

您正在使用IE低版瀏覽器,為了您的雷峰網(wǎng)賬號(hào)安全和更好的產(chǎn)品體驗(yàn),強(qiáng)烈建議使用更快更安全的瀏覽器
此為臨時(shí)鏈接,僅用于文章預(yù)覽,將在時(shí)失效
政企安全 正文
發(fā)私信給李勤
發(fā)送

0

“老婆,開(kāi)門(mén)”,如果隔壁老王對(duì)你的聲音模仿到出神入化

本文作者: 李勤 2017-08-07 16:11
導(dǎo)語(yǔ):“老婆,開(kāi)門(mén)?!比绻舯诶贤醪粦押靡猓桃饩毩?xí)你的口音……

“老婆,開(kāi)門(mén)。”

如果隔壁老王不懷好意,刻意練習(xí)你的口音,相信你能感受到“京中有善口技者。會(huì)賓客大宴,于廳事之東北角施八尺屏障,口技人坐屏障中,一桌、一椅、一扇、一撫尺而已”的同等效果。

“老婆,開(kāi)門(mén)”,如果隔壁老王對(duì)你的聲音模仿到出神入化

▲隔壁王叔叔

不過(guò),如果你家安裝的是擁有聲紋識(shí)別的智能門(mén)鎖,就算隔壁老王將你的聲音模仿到出神入化,這扇門(mén)也是開(kāi)不了的。

雖然,雷鋒網(wǎng)編輯早就聽(tīng)說(shuō)過(guò)聲紋識(shí)別技術(shù)可以應(yīng)用于智能門(mén)鎖,但是不親見(jiàn),還真不能感受到它的威力。

幾天前,雷鋒網(wǎng)在清華大學(xué)的一棟大樓內(nèi),參加人工智能與信息安全論壇暨得意音通信息技術(shù)研究院成立大會(huì)時(shí),演講聽(tīng)到一半,得意音通董事長(zhǎng)鄭方突然讓工作人員把一張門(mén)和相關(guān)設(shè)備搬上了演講臺(tái)。

“老婆,開(kāi)門(mén)”,如果隔壁老王對(duì)你的聲音模仿到出神入化

這是要搞事??!

然后,兩個(gè)漂亮的小姐姐走上臺(tái),一個(gè)扮演主人,一個(gè)扮演盜竊者。

“老婆,開(kāi)門(mén)”,如果隔壁老王對(duì)你的聲音模仿到出神入化

主人在手機(jī) App 中錄入了自己的聲音與門(mén)進(jìn)行綁定后,開(kāi)始了第一個(gè)回合:

小姐姐主人逛街回到家,打開(kāi) App,按照彈出來(lái)的數(shù)字密碼(實(shí)際生活中是隨機(jī)密碼,在演示過(guò)程中密碼簡(jiǎn)化成了 12345678),直接念了密碼,順利開(kāi)門(mén)了。

第二回合:手機(jī)丟了,被“小偷”撿到了。盜竊者用自己的聲音念密碼,嗯,門(mén)在意料之中地沒(méi)有反應(yīng)。

第三回合:盜竊者不死心,在偷手機(jī)之前,就悄悄尾隨過(guò)主人,并錄下了她的聲音。然后播放給門(mén)“聽(tīng)”——就算此時(shí)采用的是固定密碼,盜竊者播放了好幾次主人的聲音,門(mén)依然沒(méi)有開(kāi)。

不過(guò),第一,前文也提到過(guò),聲音門(mén)鎖此前也有落地;第二,受眾接受度還有待考驗(yàn),畢竟還有指紋識(shí)別和人臉識(shí)別這種更方便的識(shí)別手段。

但是,鄭方和得意音通副總經(jīng)理兼首席架構(gòu)師肖永明介紹的以下這個(gè)場(chǎng)景,就讓雷鋒網(wǎng)編輯十分期待了:

“像‘給張三轉(zhuǎn)1000元’一句話(huà),馬上可以做語(yǔ)音識(shí)別、意圖理解,得出指令,進(jìn)行身份確認(rèn),最后進(jìn)行銀行轉(zhuǎn)帳。一句話(huà)就可以銀行轉(zhuǎn)帳或購(gòu)物等,非常方便。”

肖永明還告訴雷鋒網(wǎng),目前他們正與汽車(chē)廠(chǎng)商合作,研制用于汽車(chē)的聲紋鎖和聲紋防盜。

“老婆,開(kāi)門(mén)”,如果隔壁老王對(duì)你的聲音模仿到出神入化

這里有一個(gè)背景需要交待:

得意音通和清華大學(xué)共同負(fù)責(zé)國(guó)家頒布所有聲紋識(shí)別相關(guān)行業(yè)標(biāo)準(zhǔn)的制定,涉及行業(yè)包括公安、金融等不同行業(yè)。手機(jī)銀行現(xiàn)在設(shè)定唯一一個(gè)生物特征識(shí)別的標(biāo)準(zhǔn)就是聲紋的標(biāo)準(zhǔn),也主要由他們起草。

其實(shí),聲紋識(shí)別作為密碼驗(yàn)證手段之一,早就在銀行服務(wù)中出現(xiàn)過(guò)。2015年,已有語(yǔ)音識(shí)別廠(chǎng)商與銀行聯(lián)合發(fā)布“聲紋+人臉”p2p轉(zhuǎn)賬產(chǎn)品。

2016年,建行手機(jī)銀行推出了聲紋驗(yàn)證服務(wù)。

2015年,螞蟻金服技術(shù)團(tuán)隊(duì)相關(guān)負(fù)責(zé)人稱(chēng),人臉登陸有希望在年內(nèi)上線(xiàn),同時(shí),螞蟻金服研發(fā)的聲紋技術(shù)也很有可能繼人臉識(shí)別之后應(yīng)用于登陸、轉(zhuǎn)賬等場(chǎng)景中。

后來(lái),大家都知道,今年支付寶果真推出了“刷臉”服務(wù)。當(dāng)然,還沒(méi)推出聲紋服務(wù)。

綜合來(lái)看,這意味著,鄭方提出的未來(lái)一句話(huà)可以轉(zhuǎn)賬這種事情還是靠譜的,而肖永明提到的汽車(chē)聲紋鎖,也在 2015 年時(shí)見(jiàn)諸報(bào)道,只是也是作為未來(lái)應(yīng)用的展望領(lǐng)域之一。

但是,回到問(wèn)題最初,雖然看上去都是酷炫的黑科技,我能相信聲紋識(shí)的安全性嗎?為什么上面這種智能門(mén)能認(rèn)出老王是老王,你是你?為什么就算是你的聲音,錄音播放也無(wú)法開(kāi)門(mén)?

--下面才是技術(shù)秀--

在雷鋒網(wǎng)的的一次硬創(chuàng)公開(kāi)課中,曾有專(zhuān)家給出了以下不同聲音的聲紋圖,可以看到,不同的聲音,呈現(xiàn)出的畫(huà)面是迥異的:

“老婆,開(kāi)門(mén)”,如果隔壁老王對(duì)你的聲音模仿到出神入化

▲1個(gè)月大嬰兒的哭聲聲紋

“老婆,開(kāi)門(mén)”,如果隔壁老王對(duì)你的聲音模仿到出神入化

▲男人的口哨聲聲紋

“老婆,開(kāi)門(mén)”,如果隔壁老王對(duì)你的聲音模仿到出神入化

▲下雨打雷聲聲紋

“老婆,開(kāi)門(mén)”,如果隔壁老王對(duì)你的聲音模仿到出神入化

▲人聲和槍聲聲紋

真是不好意思,專(zhuān)家還給出了一張接吻聲的聲紋圖,就說(shuō)你們接吻時(shí)不要咂巴嘴,你看這小畫(huà)面,是不是特別像日出時(shí)的海面:

  “老婆,開(kāi)門(mén)”,如果隔壁老王對(duì)你的聲音模仿到出神入化

“老婆,開(kāi)門(mén)”,如果隔壁老王對(duì)你的聲音模仿到出神入化

還有,被視為軍事機(jī)密的核潛艇聲紋:

“老婆,開(kāi)門(mén)”,如果隔壁老王對(duì)你的聲音模仿到出神入化

不同的物體發(fā)出的聲音有不同的聲紋,不同的人聲音的聲紋更是頗具奧秘,科學(xué)家的目的,就是在各種人聲中找出一個(gè)人的聲音特性,從而判定“你是你”。

接下來(lái)問(wèn)題來(lái)了,第一,用什么方法可以判定“你是你”?

鄭方告訴雷鋒網(wǎng),聲紋識(shí)別是一類(lèi)典型的模式識(shí)別問(wèn)題。完成聲紋特征提取后,接下來(lái)就需要選擇合理的聲紋建模和識(shí)別方法。

“老婆,開(kāi)門(mén)”,如果隔壁老王對(duì)你的聲音模仿到出神入化

上述是一張聲紋識(shí)別技術(shù)發(fā)展簡(jiǎn)圖。

從1930年開(kāi)始,科學(xué)家用最樸素的語(yǔ)音波形進(jìn)行比對(duì),看誰(shuí)“浪”得不一樣。

現(xiàn)在的主流方法是高斯混合模型-通用背景模型(GMM-UBM)、基于GMM-UBM發(fā)展起來(lái)的i-vector,以及深度神經(jīng)網(wǎng)絡(luò)等。

所謂高斯混合模型(GMM),就是用高斯概率密度函數(shù)(正態(tài)分布曲線(xiàn))精確地量化事物,它是一個(gè)將事物分解為若干的基于高斯概率密度函數(shù)(正態(tài)分布曲線(xiàn))形成的模型。

哎呀,學(xué)渣聽(tīng)上去還是不懂,怎么破?

借用某網(wǎng)友的一個(gè)生動(dòng)解釋是:

GMM——道生一一生二二生三三生萬(wàn)物。

GMM是人們認(rèn)識(shí)自然萬(wàn)物相生相克的規(guī)律,是大腦對(duì)自然認(rèn)識(shí)后的長(zhǎng)時(shí)間歸納與沉淀。

GMM的核心思想就是任意形態(tài)的函數(shù)形式(不管是可見(jiàn)的光,圖像,還是抽象的多維度變量模型,比如經(jīng)濟(jì)金融危機(jī)模型),都可以用多個(gè)高斯函數(shù)加權(quán)混合得到。

那么什么是GMM-UBM?它是對(duì)傳統(tǒng)GMM模型的改進(jìn),因?yàn)樵趯?shí)際應(yīng)用中不可能采集到足夠的語(yǔ)音以覆蓋所有的聲學(xué)現(xiàn)象,因此在背景模型(UBM)的基礎(chǔ)上通過(guò)MAP自適應(yīng)得到新說(shuō)話(huà)人的GMM模型。

如果看上去實(shí)在有點(diǎn)復(fù)雜,你就簡(jiǎn)單地把它理解為幾種不同的算法吧……

看上去簡(jiǎn)單得不能更簡(jiǎn)單的聲紋識(shí)別門(mén)鎖其實(shí)很“復(fù)雜”。

鄭方說(shuō),上述演示的智能門(mén)鎖將聲紋識(shí)別和語(yǔ)音識(shí)別結(jié)合起來(lái),實(shí)現(xiàn)了對(duì)“Who Spoke What”的識(shí)別判斷,也就是說(shuō),“門(mén)”不但知道你是誰(shuí),還知道你說(shuō)了什么。

他們還利用了新老技術(shù)的結(jié)合,比如,將GMM-UBM與i-vector方法結(jié)合起來(lái),利用動(dòng)態(tài)時(shí)序信息在文本提示聲紋識(shí)別中得以應(yīng)用,基于深度學(xué)習(xí)的聲紋特征提取方法與傳統(tǒng)動(dòng)態(tài)時(shí)間規(guī)整算法結(jié)合起來(lái),對(duì)文本進(jìn)行相關(guān)聲紋識(shí)別。

第二,不小心感冒了怎么辦?家里的小朋友長(zhǎng)大了幾歲,聲音發(fā)生了變化怎么辦?開(kāi)門(mén)的時(shí)候心情不好,哭著想開(kāi)門(mén)怎么辦?再或者,好不容易下定決心去了趟泰國(guó),回家想開(kāi)門(mén)怎么辦?

“門(mén)”還能認(rèn)出誰(shuí)是親生主人嗎?

(年度最佳戲精,花式來(lái)開(kāi)門(mén))

人的聲音還具有易變性,易受身體狀況、年齡、情緒等的影響。若在環(huán)境噪音較大和混合說(shuō)話(huà)人的環(huán)境下,聲紋特征也是很難提取和建模的。

鄭方說(shuō),他們一直以來(lái)都在努力地克服這些難題,全方位地提升聲紋識(shí)別系統(tǒng)的魯棒性。

“老婆,開(kāi)門(mén)”,如果隔壁老王對(duì)你的聲音模仿到出神入化

魯棒性是什么?和魯班是親戚嗎?

NONONO

魯棒是Robust的音譯,也就是健壯和強(qiáng)壯的意思。它是在異常和危險(xiǎn)情況下系統(tǒng)生存的關(guān)鍵。比如說(shuō),計(jì)算機(jī)軟件在輸入錯(cuò)誤、磁盤(pán)故障、網(wǎng)絡(luò)過(guò)載或有意攻擊情況下,能否不死機(jī)、不崩潰,就是該軟件的魯棒性。所謂“魯棒性”,是指控制系統(tǒng)在一定(結(jié)構(gòu),大?。┑膮?shù)攝動(dòng)下,維持其它某些性能的特性。

鄭方解釋?zhuān)茖W(xué)家通常從技術(shù)和工程兩個(gè)角度并行處理。

例如,對(duì)于聲紋時(shí)變問(wèn)題(人的聲紋隨時(shí)間變化),一方面從人類(lèi)發(fā)音機(jī)理和人耳聽(tīng)覺(jué)感知出發(fā),尋找語(yǔ)音信號(hào)中對(duì)時(shí)間魯棒的信息,從中提取時(shí)變魯棒的聲紋特征;另一方面根據(jù)用戶(hù)使用情況,設(shè)計(jì)了多種聲紋模型自動(dòng)重建與更新的框架,時(shí)刻保證聲紋識(shí)別系統(tǒng)的穩(wěn)定性與準(zhǔn)確性。

針對(duì)情感和噪音問(wèn)題,其也進(jìn)行了相關(guān)研究,例如,采用特征映射與補(bǔ)償、降噪自動(dòng)編碼器等方法在一定程度上解決了其所帶來(lái)的困擾。

還有,你以為為什么在密碼設(shè)定過(guò)程中,要用數(shù)字的動(dòng)態(tài)驗(yàn)證碼形式而不是隨便叫一聲“老婆”?

因?yàn)樵诼暭y認(rèn)證應(yīng)用中使用動(dòng)態(tài)數(shù)字密碼形式,以及其他一些專(zhuān)利技術(shù)(如聲紋時(shí)變魯棒性、聯(lián)合因子分析等),可以有效抵消身體狀況、年齡、情緒等的影響。

你哭就哭吧“老婆,開(kāi)門(mén)”,如果隔壁老王對(duì)你的聲音模仿到出神入化,記得念準(zhǔn)數(shù)字就好。

這樣還不夠,為了確保不會(huì)因?yàn)樯鲜鲎児拾l(fā)生認(rèn)不出親生主人的幺蛾子,鄭方和他的科研團(tuán)隊(duì)想出了這些辦法:

1.研究了十余種典型發(fā)音方式變化對(duì)聲紋的影響,“你滴鵝幾在我搜上”“老婆,開(kāi)門(mén)”,如果隔壁老王對(duì)你的聲音模仿到出神入化也許也在分析行列中;

2.錄制了全世界規(guī)模最大、時(shí)間跨度最長(zhǎng)的用于研究年齡變化對(duì)聲紋影響的語(yǔ)音數(shù)據(jù)庫(kù),用于研究解決年齡對(duì)聲紋的影響;

3.開(kāi)展情感語(yǔ)音的聲紋識(shí)別技術(shù)研究。比如,一個(gè)妹子說(shuō)你“討厭”,一定要根據(jù)語(yǔ)境和語(yǔ)氣來(lái)分析:她到底是叫你起開(kāi),還是叫你過(guò)來(lái)。“老婆,開(kāi)門(mén)”,如果隔壁老王對(duì)你的聲音模仿到出神入化

4.環(huán)境噪聲、混合說(shuō)話(huà)等對(duì)一般性的聲紋識(shí)別影響較大,所以要通過(guò)多次測(cè)試保證識(shí)別的穩(wěn)定性。

雖然已經(jīng)進(jìn)行了這么多研究工作,讓“門(mén)”能認(rèn)出你是你,隔壁老王是隔壁老王也并非易事。

鄭方稱(chēng),未來(lái)聲紋識(shí)別有三個(gè)有意思的研究方向。

第一,如何解決聲紋黑客攻擊問(wèn)題,我們雖然已經(jīng)有了針對(duì)錄音重放的檢測(cè)技術(shù),但是黑客的手段也會(huì)不斷增多、水平不斷提高,需要更全方位的研究黑客對(duì)聲紋識(shí)別系統(tǒng)的攻擊手段,并提前研究出有效的防攻擊措施。

第二,如何構(gòu)建互聯(lián)網(wǎng)復(fù)雜環(huán)境下的統(tǒng)一聲紋平臺(tái)。當(dāng)前整個(gè)互聯(lián)網(wǎng)中充斥著各種編碼格式、信道、噪音的語(yǔ)音,因此如何在此類(lèi)復(fù)雜環(huán)境下準(zhǔn)確高效的完成聲紋識(shí)別和身份認(rèn)證也是一項(xiàng)巨大的挑戰(zhàn)。

第三,如何解決“雞尾酒舞會(huì)”(多說(shuō)話(huà)人)問(wèn)題。在實(shí)際應(yīng)用中,語(yǔ)音信號(hào)通常會(huì)同時(shí)夾雜著多個(gè)說(shuō)話(huà)人,因此如何實(shí)現(xiàn)多說(shuō)話(huà)人場(chǎng)景下的實(shí)時(shí)說(shuō)話(huà)人檢測(cè)也將是一大研究難點(diǎn)。若該問(wèn)題得以解決,其將在許多領(lǐng)域得以應(yīng)用,如公安刑偵中的快速目標(biāo)說(shuō)話(huà)人檢測(cè)。

雷峰網(wǎng)原創(chuàng)文章,未經(jīng)授權(quán)禁止轉(zhuǎn)載。詳情見(jiàn)轉(zhuǎn)載須知。

分享:
相關(guān)文章

編輯、作者

跟蹤互聯(lián)網(wǎng)安全、黑客、極客。微信:qinqin0511。
當(dāng)月熱門(mén)文章
最新文章
請(qǐng)?zhí)顚?xiě)申請(qǐng)人資料
姓名
電話(huà)
郵箱
微信號(hào)
作品鏈接
個(gè)人簡(jiǎn)介
為了您的賬戶(hù)安全,請(qǐng)驗(yàn)證郵箱
您的郵箱還未驗(yàn)證,完成可獲20積分喲!
請(qǐng)驗(yàn)證您的郵箱
立即驗(yàn)證
完善賬號(hào)信息
您的賬號(hào)已經(jīng)綁定,現(xiàn)在您可以設(shè)置密碼以方便用郵箱登錄
立即設(shè)置 以后再說(shuō)