丁香五月天婷婷久久婷婷色综合91|国产传媒自偷自拍|久久影院亚洲精品|国产欧美VA天堂国产美女自慰视屏|免费黄色av网站|婷婷丁香五月激情四射|日韩AV一区二区中文字幕在线观看|亚洲欧美日本性爱|日日噜噜噜夜夜噜噜噜|中文Av日韩一区二区

您正在使用IE低版瀏覽器,為了您的雷峰網(wǎng)賬號安全和更好的產(chǎn)品體驗,強烈建議使用更快更安全的瀏覽器
此為臨時鏈接,僅用于文章預覽,將在時失效
業(yè)界 正文
發(fā)私信給朱恒偉
發(fā)送

3

智能語音,能聽會說能糾錯才是真智能

本文作者: 朱恒偉 2015-05-24 11:11
導語:先看一分鐘視頻【來源:東方衛(wèi)視】:2014年,奧斯卡最佳原創(chuàng)劇本獎頒給了一部人工智能影片——《Her》,講述的是男主角與電腦語音助手之間的浪漫愛情。風靡全球的科幻動畫片《超能陸戰(zhàn)隊》,萌萌的“大白”機器人的溝通毫無障礙,既詼諧又溫情。而最近,兩部接連上映的好萊

先看一分鐘視頻【來源:東方衛(wèi)視】:

2014年,奧斯卡最佳原創(chuàng)劇本獎頒給了一部人工智能影片——《Her》,講述的是男主角與電腦語音助手之間的浪漫愛情。風靡全球的科幻動畫片《超能陸戰(zhàn)隊》,萌萌的“大白”機器人的溝通毫無障礙,既詼諧又溫情。而最近,兩部接連上映的好萊塢科幻大片《超能查派》與《復仇者聯(lián)盟2》,核心角色都是高科技的人工智能生命體……

隨著科技發(fā)展,曾是科幻小說與影視作品中常見元素的人工智能,也逐漸走入我們的真實生活。而當我們談論“人工智能”的時候,必定離不開談及語音交互。人類的交互是自由而任性的,傳統(tǒng)的,而人類語言如此多元,情感又恨豐富,木訥的“一根筋”式的語音交互識別,根本已經(jīng)完全不能滿足自由的人機溝通的需求。

近日,在上海交大舉辦的中德雙邊研討會上,思必馳-上海交大智能語音實驗室發(fā)布了認知型人機對話系統(tǒng)技術,打破人與設備之間的溝通屏障。該技術已進入應用開發(fā)階段,有望于年底植入車載、家庭影院等領域。

突破技術瓶頸  “自適應語音識別”打造更好的智慧型人機交互

智能語音實驗室的負責人俞凱介紹,傳統(tǒng)語音識別是解決特定環(huán)境下的語音到文字轉換,這是模擬耳朵的感知功能;而更關鍵的是解決完整的口語人機交互問題,這是模擬人腦的全套認知功能。認知型的智能語音技術是更高層面的人工智能,它融入了自適應、理解糾錯、智能反饋的認知技術。這會使得機器可以適應更多的環(huán)境和口音,具有進化調(diào)整的能力,從“能聽會說”變成“會聽能做”:即聽得懂說的,懂得聽什么,聽不清楚了能問,搞錯了能糾正,最終能成功完成用戶的任務。

智能語音,能聽會說能糾錯才是真智能

 

思必馳-上海交大智能語音實驗室研發(fā)的語音識別自適應技術,采用了軟硬件結合的抗噪技術、結構化深度學習技術、環(huán)境和說話人的自動檢測及模型自適應調(diào)整技術,可以隨著說話人口音和噪聲環(huán)境的變化,自動選擇最合適的模型進行識別,顯著提升準確率。

人性化語音交互,告別單一語音識別時代

就像人類在聽不清的時候也可以進行理解和對話一樣,新型的人性化智能語音交互技術就包括了“深度理解”,以及“自動糾錯”的技術。

“深度理解”深度理解是把機器的識別狀態(tài)(比如識別結果的可靠度、環(huán)境嘈雜程度等)、用戶的個人特點(比如性別、方言地區(qū)、說話快慢等),和說話的情境(比如談話的領域,常識,前面談話的歷史等)等因素從大數(shù)據(jù)中提取出來,根據(jù)這些“情境”對識別結果再進行二次計算,使得語義理解的準確度大大提高。

在有歧義和錯誤的的情況下,機器仍然可以通過多人人機對話。讓機器識別和理解人的自然語言中的關鍵意圖和屬性,進而進行處理。前一段時間火爆的網(wǎng)絡視頻“糾正哥”,畫面中說著山東方言的男士對著安吉星說出一長串電話號碼,不巧有一兩位識別錯誤,于是頻繁打斷,不停糾正卻是對牛彈琴。俞凱說,“糾正哥”無法交互的核心難點是對話過程中的“打斷”和“糾正”。在汽車噪聲較大的時候,偶爾有一兩個數(shù)字的識別錯誤是很正常的事情,這種錯誤很難通過情境直接消除。但是通過邏輯關聯(lián)和智能對話,則可能幫助“糾正哥”把電話很快撥出去。

智能語音,能聽會說能糾錯才是真智能

 

真正的人機智能交互是追求機器能夠“聽話”,成為真正的“語音機器人”,有進化和適應的能力,用的越多越聽話。語音輸入不再局限于呆板簡單的句式限制,語音控制也不需要按照機器的設定去命令,在復雜環(huán)境和噪音影響下,在自由的說話方式(例如打斷)下,依然能夠保證優(yōu)異依然能夠保證良好而穩(wěn)定的語音識別和語義分析精度。

語音交互的未來應當是面向用戶,人性化的智能交互,而非過去模塊化的交互。拋棄過去單一的語音交互,把識別、語義理解和人機對話連在一起,幫助用戶完成任務,這將是一個嶄新的、劃時代的變革。

學術與業(yè)界的智匯交互

思必馳-上海交大智能語音實驗室成立于2012年,由思必馳信息科技有限公司與上海交大聯(lián)合成立,實驗室負責人是畢業(yè)于著名的劍橋大學的語音博士俞凱,他是上海市“東方學者”特聘教授,同時也是國內(nèi)學術界“青年”里唯一一位來自智能語音技術行業(yè)領域的語音專家。他所搭建的大詞匯連續(xù)語音識別系統(tǒng)曾經(jīng)多次獲得美國國家標準局(NIST)和美國國防部內(nèi)部評測的冠軍,也是國際上最早從事端到端的統(tǒng)計對話系統(tǒng)研究的研究者之一。

在真實工程系統(tǒng)上,上海交大與思必馳信息技術有限公司合作,率先發(fā)布了人性化的智能語音交互技術平臺:對話工場。并在此平臺下,以產(chǎn)學研一體化的模式,正在快速完成人性化的智能語音交互技術從學術研究到商業(yè)運作的轉變,進入民用市場,打造以用戶為中心的“語音機器人”,引領人機口語真正的交互的“人工智能”潮流。據(jù)悉,該系統(tǒng)將于下半年正式運用到智能車載、家居領域。

 

雷峰網(wǎng)原創(chuàng)文章,未經(jīng)授權禁止轉載。詳情見轉載須知。

分享:
相關文章
最新文章
請?zhí)顚懮暾埲速Y料
姓名
電話
郵箱
微信號
作品鏈接
個人簡介
為了您的賬戶安全,請驗證郵箱
您的郵箱還未驗證,完成可獲20積分喲!
請驗證您的郵箱
立即驗證
完善賬號信息
您的賬號已經(jīng)綁定,現(xiàn)在您可以設置密碼以方便用郵箱登錄
立即設置 以后再說