丁香五月天婷婷久久婷婷色综合91|国产传媒自偷自拍|久久影院亚洲精品|国产欧美VA天堂国产美女自慰视屏|免费黄色av网站|婷婷丁香五月激情四射|日韩AV一区二区中文字幕在线观看|亚洲欧美日本性爱|日日噜噜噜夜夜噜噜噜|中文Av日韩一区二区

您正在使用IE低版瀏覽器,為了您的雷峰網(wǎng)賬號(hào)安全和更好的產(chǎn)品體驗(yàn),強(qiáng)烈建議使用更快更安全的瀏覽器
此為臨時(shí)鏈接,僅用于文章預(yù)覽,將在時(shí)失效
業(yè)界 正文
發(fā)私信給李詩(shī)
發(fā)送

0

谷歌AI打電話刷屏,微軟坐不住了

本文作者: 李詩(shī) 2018-05-12 13:40
導(dǎo)語(yǔ):周五晚上,微軟發(fā)了一篇技術(shù)聲明稱(chēng)人類(lèi)歷史上第一次與人工智能進(jìn)行全雙工語(yǔ)音電話,并不是發(fā)生在美國(guó),而是發(fā)生在中國(guó)。

雷鋒網(wǎng)按:這些天,谷歌AI冒充真人打電話在朋友圈大火,可以說(shuō)谷歌很成功地制造出了一次熱點(diǎn)話題。然而,這可忙壞了微軟集團(tuán)的公關(guān)們,不得不趕緊發(fā)技術(shù)聲明表示微軟早已實(shí)現(xiàn)了AI與真人通電話。

美國(guó)時(shí)間5月8日,谷歌在2018年度開(kāi)發(fā)者大會(huì)(Google I/O 2018)上介紹了智能語(yǔ)音助手Google Assistant中新增加的Duplex,它可以自己給飯館、發(fā)廊等商業(yè)店面打電話,幫用戶(hù)預(yù)約時(shí)間。我們?cè)賮?lái)看看I/O 大會(huì)現(xiàn)場(chǎng)的演示視頻:

AI助手與人交流、完成指令已經(jīng)不是新鮮事。如果你經(jīng)常跟Siri對(duì)話,或者你有一臺(tái)天貓精靈、小愛(ài)同學(xué)等智能音箱,你會(huì)發(fā)現(xiàn),跟AI對(duì)話實(shí)在是太費(fèi)勁。你需要字正腔圓,還要一次次地說(shuō)喚醒詞,無(wú)法實(shí)現(xiàn)連續(xù)對(duì)話。

Duplex讓人感到驚訝的是:它不僅用自然流暢的語(yǔ)音和電話另一頭的人類(lèi)完成了交流,且對(duì)方根本沒(méi)有意識(shí)到打電話來(lái)的居然是個(gè)[ AI ]。這是因?yàn)楣雀鐳uplex實(shí)現(xiàn)了連續(xù)對(duì)話、加入了人在對(duì)話中通常會(huì)用的語(yǔ)詞助詞"emm"、“uha”等、能理解對(duì)話的上下文,此外還具備了主動(dòng)提供語(yǔ)料的功能。

這樣的雙向?qū)υ挘恢笔俏④?、蘋(píng)果、亞馬遜、Facebook這些做對(duì)話式人工智能的公司們努力的方向。谷歌這次放了個(gè)大招,獲得了很高的關(guān)注,微軟顯然坐不住了,趕緊站出來(lái)說(shuō),且慢,我們才是先實(shí)現(xiàn)這項(xiàng)技術(shù)突破的。

關(guān)于這件事,微軟在昨天發(fā)了一篇技術(shù)聲明。以下為聲明全文:

全雙工語(yǔ)音技術(shù)(Full Duplex)的意義在于,它能夠使“人機(jī)交互”進(jìn)化為“人機(jī)交流”。一字之差,價(jià)值巨大。

今年4月4日,我們正式在美國(guó)和中國(guó)同步發(fā)布了Full Duplex感官,并預(yù)言行業(yè)將意識(shí)到這一技術(shù)的價(jià)值,加快向這一方向集中。我們很高興看到越來(lái)越多的同行業(yè)者加入。

其實(shí),人類(lèi)歷史上第一次與人工智能進(jìn)行全雙工語(yǔ)音電話,并不是發(fā)生在美國(guó),而是發(fā)生在中國(guó)。我們很榮幸能將這一桂冠奉獻(xiàn)給祖國(guó)。自2016年8月起,微軟(亞洲)互聯(lián)網(wǎng)工程院通過(guò)人類(lèi)用戶(hù)主動(dòng)發(fā)起的方式,已讓小冰與人類(lèi)用戶(hù)累計(jì)完成了超過(guò)60萬(wàn)通電話。

今天,我們公布其中一通發(fā)生在兩年前的實(shí)際電話錄音,將之作為珍貴的資料,奉獻(xiàn)給全世界說(shuō)中文的華人。

而這一技術(shù)也已經(jīng)完成產(chǎn)品落地。兩年來(lái),正是在人類(lèi)的訓(xùn)練下,小冰已實(shí)現(xiàn)不局限于任何封閉域,而是可針對(duì)開(kāi)放域進(jìn)行全雙工語(yǔ)音對(duì)話。目前,微軟已落地的對(duì)話場(chǎng)景包括傳統(tǒng)電話、VoIP電話和智能音箱設(shè)備,微軟小冰的車(chē)載路試正在進(jìn)行中。

如果您想要體驗(yàn)Full Duplex全雙工語(yǔ)音,不需等待數(shù)周,今天就能。在微軟小冰已落地的產(chǎn)品中,我們推薦您使用我們與小米合作的米家生態(tài)鏈Yeelight智能硬件產(chǎn)品。在隨附的用戶(hù)真實(shí)使用視頻中,您將體會(huì)到:

?      一次喚醒之后的連續(xù)對(duì)話

?      微軟小冰對(duì)用戶(hù)的預(yù)測(cè)模型

?      幫助用戶(hù)輕松完成多重任務(wù)

?      小冰的內(nèi)容創(chuàng)造能力

?      以及最重要的:人機(jī)情感交流

 人工智能時(shí)代已來(lái),讓我們持續(xù)創(chuàng)新。

微軟的聲明中,雷鋒網(wǎng)發(fā)現(xiàn)了三個(gè)關(guān)鍵點(diǎn):首先,在技術(shù)層面上,微軟在今年4月4日正式發(fā)布了“全雙工語(yǔ)音交互”技術(shù);其次,在事件事實(shí)上,微軟在兩年前就實(shí)現(xiàn)了AI與人類(lèi)通電話;最后,在產(chǎn)品落地上,微軟的全雙工語(yǔ)音交互已經(jīng)具備多個(gè)場(chǎng)景,且搭載全雙工語(yǔ)音交互技術(shù)的微軟小冰已經(jīng)出現(xiàn)在智能音箱——米家生態(tài)鏈Yeelight智能硬件產(chǎn)品中。

微軟所說(shuō)的全雙工語(yǔ)音交互技術(shù)(Full-Deplex Voice)與谷歌Duplex的技術(shù)框架和實(shí)現(xiàn)的功能應(yīng)該是類(lèi)似的。

微軟對(duì)“全雙工語(yǔ)音交互技術(shù)”的定義是:與既有的單輪或多輪連續(xù)語(yǔ)音識(shí)別不同,這項(xiàng)新技術(shù)可實(shí)時(shí)預(yù)測(cè)人類(lèi)即將說(shuō)出的內(nèi)容,實(shí)時(shí)生成回應(yīng)并控制對(duì)話節(jié)奏,能理解對(duì)話場(chǎng)景在訴說(shuō)者/傾聽(tīng)者之間實(shí)現(xiàn)角色轉(zhuǎn)變,還可以識(shí)別說(shuō)話人的性別、有幾個(gè)人在說(shuō)話。

也就是說(shuō),與只能實(shí)現(xiàn)單輪的語(yǔ)音的智能語(yǔ)音助手不同,能連續(xù)對(duì)話的全雙工語(yǔ)音交互能實(shí)現(xiàn)和人類(lèi)雙向交流,而這種雙向交流最常見(jiàn)的場(chǎng)景則是通電話。因?yàn)橥娫捠且粋€(gè)在短時(shí)間內(nèi)持續(xù)對(duì)話的過(guò)程,對(duì)通話雙方的即時(shí)反應(yīng)要求最高。

在3月28日,微軟也在北京召開(kāi)了媒體交流會(huì),詳細(xì)介紹過(guò)”全雙工語(yǔ)音交互技術(shù)“。

雷鋒網(wǎng)了解到,全雙工語(yǔ)音交互背后主要有兩個(gè)關(guān)鍵技術(shù):一個(gè)是預(yù)測(cè)模型,實(shí)現(xiàn)邊聽(tīng)邊想;例如,當(dāng)用戶(hù)說(shuō)出一句話的時(shí)候,小冰會(huì)先回答“嗯,你說(shuō)”,然后再去完成指令,這樣就可以填補(bǔ)完成指令的空白時(shí)間。

另一個(gè)是生成模型(LSTM),能更好理解場(chǎng)景,自動(dòng)生成回復(fù)。正常的對(duì)話都不是單向的一問(wèn)一答,小冰也會(huì)在適當(dāng)?shù)臅r(shí)候主動(dòng)提供內(nèi)容,并且能知道在用戶(hù)完成指令沉默幾秒后自動(dòng)結(jié)束對(duì)話?,F(xiàn)在運(yùn)用了全雙工語(yǔ)音交互技術(shù)的微軟小冰的所有回復(fù)都是自己生成的,有別于傳統(tǒng)的基于模塊、搜索來(lái)進(jìn)行的回復(fù)。(關(guān)于微軟全雙工語(yǔ)音交互技術(shù)可以查看雷鋒網(wǎng)此前報(bào)道:《微軟發(fā)大招:要做智商和情商兼具的語(yǔ)音助手

雷鋒網(wǎng)在對(duì)谷歌Duplex的技術(shù)解析文章中也提到,Duplex的核心是一個(gè)RNN(循環(huán)神經(jīng))網(wǎng)絡(luò),由TensorFlow Extended(RFX)構(gòu)建,谷歌用匿名的電話對(duì)話數(shù)據(jù)訓(xùn)練了Duplex的RNN網(wǎng)絡(luò),這個(gè)網(wǎng)絡(luò)會(huì)使用谷歌自動(dòng)語(yǔ)音識(shí)別(ASR)的識(shí)別結(jié)果文本,同時(shí)也會(huì)使用音頻中的特征、對(duì)話歷史、對(duì)話參數(shù)(比如要預(yù)定的服務(wù),當(dāng)前時(shí)間)等等。

谷歌AI打電話刷屏,微軟坐不住了

輸入語(yǔ)音先經(jīng)過(guò)自動(dòng)語(yǔ)音識(shí)別系統(tǒng)(ASR)處理,生成的文本會(huì)與上下文數(shù)據(jù)以及其它輸入一起輸入 RNN 網(wǎng)絡(luò),生成的應(yīng)答文本再通過(guò)文本轉(zhuǎn)語(yǔ)音(TTS)系統(tǒng)讀出來(lái)。

谷歌用的生成模型是RNN,而微軟用的是LSTM,從體驗(yàn)來(lái)看,兩者實(shí)現(xiàn)的效果很接近。跟Yeelight中的微軟小冰對(duì)話時(shí),能實(shí)現(xiàn)一次喚醒連續(xù)對(duì)話長(zhǎng)達(dá)20分鐘,有適當(dāng)?shù)恼Z(yǔ)氣詞,能主動(dòng)提供預(yù)料,主動(dòng)結(jié)束對(duì)話。

在谷歌I/O大會(huì)的最后一天,獲得年度圖靈獎(jiǎng)的Alphabet新任董事長(zhǎng)John Hennessy宣布:"在預(yù)約領(lǐng)域,谷歌Duplex通過(guò)了圖靈測(cè)試“。也就是說(shuō),目前谷歌Duplex與人類(lèi)展開(kāi)對(duì)話,人類(lèi)無(wú)法識(shí)別出其是機(jī)器人。這個(gè)消息,確實(shí)令人振奮。與搭載了微軟全雙工語(yǔ)音交互技術(shù)的微軟小冰相比,谷歌Duplex的一大特色是其聲音和語(yǔ)調(diào)與真人幾乎一致,這是他們花費(fèi)了數(shù)月時(shí)間采集真人聲音訓(xùn)練而成的結(jié)果。

谷歌稱(chēng),今年夏天會(huì)開(kāi)始基于Google Assistant測(cè)試Duplex,從預(yù)訂餐館、預(yù)訂發(fā)廊、詢(xún)問(wèn)節(jié)假日的營(yíng)業(yè)時(shí)間這樣的事項(xiàng)開(kāi)始。而微軟小冰則是將人工智能助手和聊天機(jī)器人結(jié)合起來(lái),努力進(jìn)入各個(gè)場(chǎng)景,包括傳統(tǒng)電話、VoIP電話和智能音箱設(shè)備,微軟小冰的車(chē)載路試也正在進(jìn)行中。

(Yeelight微軟小冰用戶(hù)體驗(yàn)視頻)

微軟全雙工語(yǔ)音技術(shù)已經(jīng)在做產(chǎn)品落地,卻被還在測(cè)試中的谷歌Duplex搶占了熱點(diǎn),難免有一點(diǎn)著急。

然而如果我們回想技術(shù)發(fā)展的歷程,我們會(huì)記得,1844年,莫爾斯從從華盛頓到巴爾的摩拍發(fā)人類(lèi)歷史上的第一份電報(bào),說(shuō)的是:"上帝呀,你究竟干了一些什么?”;1876年,貝爾發(fā)明世界上第一臺(tái)電話,他說(shuō)的第一句話““沃森先生,快來(lái)幫我”成為人類(lèi)第一句通過(guò)電話傳送的語(yǔ)音。然而,人工智能助手與人類(lèi)的第一通電話顯然就難以定義了,畢竟我們?cè)谌斯ぶ悄艿牡缆飞?,還有很長(zhǎng)的路要走。

相關(guān)文章:

會(huì)打電話的 AI 背后:谷歌 Duplex 技術(shù)解析

微軟發(fā)大招:要做智商和情商兼具的語(yǔ)音助手

雷峰網(wǎng)原創(chuàng)文章,未經(jīng)授權(quán)禁止轉(zhuǎn)載。詳情見(jiàn)轉(zhuǎn)載須知。

分享:

編輯

關(guān)注AI業(yè)界、NLP、VR、AR技術(shù)與產(chǎn)品。采訪報(bào)道、行業(yè)交流請(qǐng)加微信“Hanass”
當(dāng)月熱門(mén)文章
最新文章
請(qǐng)?zhí)顚?xiě)申請(qǐng)人資料
姓名
電話
郵箱
微信號(hào)
作品鏈接
個(gè)人簡(jiǎn)介
為了您的賬戶(hù)安全,請(qǐng)驗(yàn)證郵箱
您的郵箱還未驗(yàn)證,完成可獲20積分喲!
請(qǐng)驗(yàn)證您的郵箱
立即驗(yàn)證
完善賬號(hào)信息
您的賬號(hào)已經(jīng)綁定,現(xiàn)在您可以設(shè)置密碼以方便用郵箱登錄
立即設(shè)置 以后再說(shuō)