0
本文作者: 李勤 | 2017-10-24 15:29 |
10月23日,2017年極棒大賽舉辦的前一天,一個(gè) H5 悄無聲息地在朋友圈上線了,這個(gè) H5 可以讓玩家上傳自己的聲音與妲己、武則天、諸葛亮等人的聲音比對(duì),給出比對(duì)結(jié)果。
宅客頻道中了這個(gè)套路,在模仿一個(gè)角色的聲音中,相似度達(dá)到了94%,于是迅速轉(zhuǎn)發(fā)了PK 結(jié)果,并在酒店里自嗨了很久,覺得要再模仿幾次突破自己。室友編輯小田迅速關(guān)上了房門和窗子,緊張地問了句:如果隔音不好,別人不會(huì)以為我們?cè)诟墒裁床豢擅枋龅氖虑榘桑?/p>
是的,編輯在模仿妲己說的這句臺(tái)詞:“主人,我能為你做點(diǎn)什么?”然后又變身武則天,瞬間霸氣上身,儼然精分的深井冰。
終于,編輯和妲己達(dá)到了 97 %的相似度,有種分分鐘要迷倒紂王的良好感覺。萬萬沒想到,后來朋友圈里出現(xiàn)了 99 %的相似者,還不止一個(gè)。
我不服!
10月24日,極棒大會(huì)一個(gè)工作人員告訴宅客,因?yàn)槭且粋€(gè)H5,所以聲音比對(duì)沒那么嚴(yán)格,采用了微信后端的技術(shù)。要看真的比對(duì)PK,你還是看極棒上的五組選手實(shí)打?qū)嵉谋荣惏伞?/p>
10月24日,極棒大賽的仿聲項(xiàng)目中,五組一共十幾個(gè)選手,只有一個(gè)組有唯一一個(gè)妹子,居然要模仿妲己?
當(dāng)然,他們不止模仿妲己。
賽制是這樣的:
選手預(yù)先得到被模仿人物的錄音文件并從中學(xué)習(xí)語音特征,每個(gè)隊(duì)的攻破目標(biāo)4個(gè),前一天隊(duì)伍拿到其中2個(gè)人物的語料訓(xùn)練內(nèi)容(該內(nèi)容只做訓(xùn)練用,不在現(xiàn)場(chǎng)給出的正式比賽語音物料中),進(jìn)行一個(gè)小時(shí)的調(diào)試,并提交技術(shù)報(bào)告。決賽時(shí)間20分鐘,組委對(duì)不同設(shè)備指定不同內(nèi)容,選手分別合成語音,如果合成的語音被設(shè)備誤認(rèn)為是被模仿人物,則攻破成功。至少攻破一個(gè)設(shè)備的隊(duì)伍有資格獲獎(jiǎng),以被攻破數(shù)量進(jìn)行排名,數(shù)量相同則用時(shí)少的隊(duì)伍獲勝。
因?yàn)楝F(xiàn)場(chǎng)藍(lán)牙通訊干擾很大,導(dǎo)致POS機(jī)項(xiàng)目組選手第一次挑戰(zhàn)破解失敗。一位工作人員特地來到雷鋒網(wǎng)所在的媒體區(qū)告訴大家,跟上述項(xiàng)目一樣殘酷的是,現(xiàn)場(chǎng)有上百號(hào)觀眾,而選手們要避開嗡嗡的雜音,讀取指定的剩下2個(gè)被模仿人物的原聲。
如果原聲讀取有問題,勢(shì)必影響接下來的比賽。
雷鋒網(wǎng)了解到,這個(gè)原聲樣本中,有兩句妲己的為比賽特別錄制的聲音,另外兩句是評(píng)委徐昊的聲音。剩余17分11秒時(shí),一個(gè)隊(duì)伍(左起第一組)已經(jīng)率先亮起了兩盞燈,這意味著他已經(jīng)攻破了兩個(gè)目標(biāo)。
這位選手,你可是一個(gè)人作戰(zhàn)的藍(lán)孩子啊!
還剩13分05秒時(shí),包含一個(gè)女選手的隊(duì)伍smartparrot (左起第三組)也亮起了一盞燈。還剩下9分04秒時(shí),左起第四組和第五組選手開始亮燈,第五組亮了兩個(gè)燈。剩余6分20秒時(shí),第五組亮起了第三盞燈。
只要第五組率先亮起最后一盞燈,他們就贏了!
懂套路的主辦方立馬切入了第一組(2燈)和第五組(3燈)選手的對(duì)比實(shí)時(shí)PK 視頻,第一組(神牛gogo)選手緊張地回了下頭。
剩余 57秒時(shí),戰(zhàn)局沒有變化。
比賽結(jié)束時(shí),第五組(清晨李唐王)獲勝,達(dá)成了三個(gè)目標(biāo)!
現(xiàn)場(chǎng)評(píng)委稱,有幾個(gè)仿聲攻擊方式:人模仿(技藝精湛的配音人員可以做到)、語音合成(相對(duì)比較容易抓包)、語音轉(zhuǎn)換(比合成難防,相對(duì)比較難)、錄音。
“清晨李唐王”中的黃雨晨和王木均來自清華大學(xué),他們告訴雷鋒網(wǎng),賽前收到了妲己的一條語音測(cè)試數(shù)據(jù),另外一條測(cè)試數(shù)據(jù)是“評(píng)委隨便說的一句話”。在此次比賽中,“清晨李唐王”成功破解了兩句妲己的原聲以及一條徐昊錄制的智能音箱的開機(jī)語,另一條徐昊錄制的語音“更上一層樓”沒有被“破解”。
雷鋒網(wǎng)宅客頻道獨(dú)家采訪了冠軍隊(duì)伍中的黃雨晨、王木以及極棒該項(xiàng)目的一位評(píng)委鄭方。有意思的是,鄭方也在清華大學(xué)任語音和語言技術(shù)中心主任,同時(shí)是北京得意音通公司的董事長(zhǎng)。該公司兩個(gè)月前發(fā)布了一款聲紋識(shí)別門鎖新品,為的就是防黑客。
[王木(左)、黃雨晨(右)]
但這卻是鄭方和獲勝隊(duì)伍的第一次正式見面,黃雨晨和王木甚至不知道得意音通在兩個(gè)月前的清華某禮堂內(nèi)舉辦過發(fā)布會(huì)。
黃雨晨和王木隸屬于清華的深圳研究所,兩人專注的方向都是語音合成,不太涉及聲紋識(shí)別領(lǐng)域,不過,“清晨李唐王”在賽前準(zhǔn)備了兩種語音仿制模式的三個(gè)模型,分別為拼接合成和參數(shù)合成。
讓鄭方出乎意料的是,他在賽前一天曾預(yù)判過所有的選手的破解模式,本來以為拼接合成會(huì)更容易讓選手達(dá)到目標(biāo),仿真成功,沒有想到,促使“清晨李唐王”達(dá)到三個(gè)目標(biāo)的卻是參數(shù)合成模式。
“其實(shí)拼接合成模式合成出來的語音也不錯(cuò),但是通過外放設(shè)備放出來時(shí)效果不對(duì)了,與設(shè)備有關(guān)?!?黃雨晨介紹。
王木解釋:“拼接是用原聲的聲紋,做出來的語音會(huì)一模一樣,參數(shù)模式更難,需要‘打補(bǔ)丁’,音色可能不一樣,需要看原聲語調(diào)和參數(shù)模型,所以做起來還挺難的?!?/p>
得意音通之前的發(fā)布會(huì)上也曾上演過單純的最難防的錄音攻擊,當(dāng)時(shí)智能門禁曾成功識(shí)別到底是用戶的真人聲音還是錄音。
雷鋒網(wǎng)提出,為什么此次比賽中沒有選手直接使用原聲的錄音,甚至直接使用原聲再次錄音版進(jìn)行攻擊?鄭方認(rèn)為,恰恰這最簡(jiǎn)單的攻擊方法,卻是最有效的攻擊手段,也是最難防的,不過在此次比賽中,默認(rèn)沒有防的措施,以及沒有錄音檢測(cè)措施。
另一位獲得第三名的團(tuán)隊(duì)的選手稱,錄播的話,在現(xiàn)場(chǎng)雜音如此大的情況下,就算把現(xiàn)場(chǎng)主辦方給的錄音再轉(zhuǎn)錄一遍,聲紋圖像和原來差距會(huì)很大。
雷鋒網(wǎng)提出一個(gè)終極疑問:“雖然你們和評(píng)委徐昊不熟,你們沒玩過王者榮耀嗎?為什么你們不拿妲己的聲音訓(xùn)練?”兩位誠(chéng)實(shí)的選手表示,絕不能作弊違反規(guī)則。
兩位選手還稱,在現(xiàn)實(shí)生活中,只要沒有針對(duì)錄音攻擊的防范措施,跟蹤一個(gè)聲紋識(shí)別的用戶,錄制其半個(gè)小時(shí)的語料,并了解用戶開聲紋鎖的漢字密碼,這種攻擊方式可以復(fù)現(xiàn)。
不過,鄭方稱,還好他家生產(chǎn)的門鎖有應(yīng)對(duì)這種錄音攻擊的方式,并在幾年前就針對(duì)現(xiàn)場(chǎng)選手的一些攻擊方式進(jìn)行了防范。
鄭方介紹,應(yīng)對(duì)這類攻擊,無論合成還是轉(zhuǎn)換,仿真語音和原聲在連貫性(時(shí)域、頻譜)上均有區(qū)別,現(xiàn)場(chǎng)演示的其實(shí)都算錄音攻擊,聲紋、信號(hào)會(huì)被破壞,波形圖有肉眼看不見但機(jī)器能識(shí)別的區(qū)別。
看來,道高一尺、魔高一丈,到底在現(xiàn)實(shí)生活中,能否成功實(shí)現(xiàn)此類攻擊,完全取決于攻防雙方是不是都是上述級(jí)別的對(duì)手。
注:GeekPwn由國(guó)內(nèi)頂尖信息安全團(tuán)隊(duì)碁震(KEEN)于2014年發(fā)起并主辦,至今已成功舉辦三年。
雷峰網(wǎng)原創(chuàng)文章,未經(jīng)授權(quán)禁止轉(zhuǎn)載。詳情見轉(zhuǎn)載須知。