丁香五月天婷婷久久婷婷色综合91|国产传媒自偷自拍|久久影院亚洲精品|国产欧美VA天堂国产美女自慰视屏|免费黄色av网站|婷婷丁香五月激情四射|日韩AV一区二区中文字幕在线观看|亚洲欧美日本性爱|日日噜噜噜夜夜噜噜噜|中文Av日韩一区二区

您正在使用IE低版瀏覽器,為了您的雷峰網(wǎng)賬號安全和更好的產(chǎn)品體驗,強烈建議使用更快更安全的瀏覽器
此為臨時鏈接,僅用于文章預覽,將在時失效
智慧教育 正文
發(fā)私信給李菁瑛
發(fā)送

0

微軟上線語音評測功能:基于Azure云構建,賦能口語學習的教與學

本文作者: 李菁瑛 2020-06-22 12:48
導語:微軟這匹“黑馬”的進入,勢必會讓語音評測戰(zhàn)場的廝殺更為激烈。

近年來,隨著人工智能技術的不斷成熟,企業(yè)數(shù)字化轉型步伐的加快,AI的觸角逐漸深入到各個場景,使人類的生產(chǎn)生活變得更加智慧化。在聽覺方面,智能語音技術成為各大科技公司們攻堅的重要領域。

一家老牌科技巨頭微軟,在語音合成技術、語音識別技術上深耕多年,面向全球合作伙伴開放和落地其技術能力,提供多種智能語音解決方案。

5月中旬,在2020微軟Build開發(fā)者大會上,微軟上線了語音評測功能,該功能基于Azure語音服務Speech-to-text(語音轉文本)構建。用戶可以上傳跟讀文本和音頻對發(fā)音人的語音從準確度,流利度和完整度進行評測。在教育領域,尤其是口語學習方面,因具有高識別準確率、擬專家打分的高一致性,可以讓口語學習的教和學更加高效方便。

近日,微軟亞太研發(fā)集團智能語音團隊接受了雷鋒網(wǎng)等媒體的線上采訪,對微軟智能語音評測技術的優(yōu)勢和應用場景等內(nèi)容進行了詳細介紹。

微軟亞太研發(fā)集團云計算與人工智能事業(yè)部產(chǎn)品總監(jiān)丁秉公、微軟亞太研發(fā)集團云計算與人工智能事業(yè)部資深產(chǎn)品經(jīng)理馬莉莎參與了本次采訪。

語音評測的四個維度

微軟亞太研發(fā)集團云計算與人工智能事業(yè)部資深產(chǎn)品經(jīng)理馬莉莎表示,目前語音評測市場需求的考量方向主要有四個維度:

  1. 專業(yè)性。

  2. 實時性。

  3. 穩(wěn)定性。

  4. 可定制性。

對于專業(yè)性,微軟語音評測的每個語言從10萬小時以上的母語大數(shù)據(jù)中學習當?shù)卣Z言純正口音發(fā)音,針對各年齡段多維度精準打分,從文章——句子——詞——音素四個環(huán)節(jié),層層評估,擬專家團打分一致性高。

微軟上線語音評測功能:基于Azure云構建,賦能口語學習的教與學

馬莉莎提到,語音評測的專業(yè)性考量對比的是和母語專家評測的一致性。業(yè)內(nèi)通用皮爾森相關系數(shù)來反映兩個序列線性相關程度的統(tǒng)計量。范圍在-1到1之間,1表示完全相關,-1表示完全相反,0表示亂序無關,數(shù)值越大表示相關度越高。微軟語音評測在一致性上達到了0.75,與母語專家水平接近。

對于實時性,微軟語音評測支持音頻上傳流式處理,也就是邊朗讀邊處理,讀完立即反饋評估結果。

對于穩(wěn)定性,微軟語音評測基于NLP模型構建模糊匹配文本,針對垂直領域的特定場景的容錯率有良好的包容性,漏讀、錯讀、重復讀不影響打分有效性與準確性。

對于可定制性,ASR基礎模型與微軟在語音領域的全面技術能力,可以實現(xiàn)個性化評分標準,可適配口音、適配噪音環(huán)境以及適配年齡層等。

據(jù)了解,微軟語音評測除了支持英語評測外,還可擴展支持全球 40 多個國家和地區(qū)的語言評測,廣泛適用于教育領域解決方案的合作伙伴、APP開發(fā)者以及語言學校、培訓中心、教育機構、考試中心的各種語言學習、口語練習和考試等場景的開發(fā)。

最大的技術難點在于多點平衡

語音評測能力,在教育領域主要的受眾人群包括老師、學生,通常被廣泛應用于教師評估、作業(yè)練習和語言學習場景中。那么,對于口語學習,教育用戶的痛點是什么?語音評測最大的技術難點又是什么?

對此,馬莉莎表示,對于學生來說,他們的痛點在于非母語口語學習。學生們在學習新語言的過程中,如何及時準確地給學生的發(fā)音進行反饋,讓學生隨時隨地更方便地聯(lián)系對于提升口語學習的有效性至關重要。

對于學校和教育機構來說,他們的痛點在于老師的資源有限,如何把現(xiàn)有的優(yōu)質(zhì)教師資源拓展到一個穩(wěn)定的教學系統(tǒng)里。因此,老師需要這樣一個能力,不僅能模擬母語專家打分,還能夠?qū)W習到老師們的評測方法,讓老師們可以使用評測高效地一對多給學生提供在線和線下的指導和幫助。

教育用戶的這些痛點,對語音評測技術提出了更高的要求。馬莉莎認為,語音評測最大的技術難點在于語音識別技術本身,首先是多語言的理解和識別,不同的打分場景,包括噪聲環(huán)境、不同年齡段學生的發(fā)音情況等都要進一步優(yōu)化。

其次就是要達到包容性和魯棒性(注:robust,技術術語,此處可理解為穩(wěn)健性或抗變性)的平衡。既要模型做得好、識別好,還要能夠動態(tài)、實時構建,對大模型達到高實時地調(diào)用,而這些需求加起來就是難上加難了。

“在語音評測上我們的基礎儲備非常堅實,才能把方方面面做到比較好,以一個綜合的體現(xiàn)呈現(xiàn)給用戶,所以我們不是難在一個點上,而是多點平衡?!?/p>

據(jù)悉,積極探索數(shù)字化轉型和新教育模式的好未來,也是微軟語音評測功能的客戶之一。好未來AI科學家胡翔宇表示:

"如何快速而有效地針對不同學生進行口語評測是我們在線上線下的英語教學中遇到的一大挑戰(zhàn)。微軟智能語音服務為好未來內(nèi)部以及我們的合作伙伴提供強大的實時語音評測能力。根據(jù)我們的測試,微軟語音服務的發(fā)音測評功能更好地適配了我們的收音環(huán)境,并且具備更高的一致性,更加貼近專家的評估結果。" 

基于Azure云構建的一種能力:算法、數(shù)據(jù)、算力

微軟亞太研發(fā)集團云計算與人工智能事業(yè)部產(chǎn)品總監(jiān)丁秉公介紹,一般來說,我們看AI技術主要看三個方面:算法、數(shù)據(jù)、算力。從這三個方面來說,微軟的語音評測功能有自己獨特的優(yōu)勢。

  • 在算法層面,微軟在智能語音領域深耕多年,其語音識別已經(jīng)達到人類的水平,錯誤率在5.1%左右,正是有了這個算法基礎,所以在語音識別延伸的應用——語音評測方面能夠比較有信心。

  • 在數(shù)據(jù)層面,依靠微軟在語音方面的多年積累,通過將近10萬多小時母語的數(shù)據(jù)進行訓練,最后學習到當?shù)乇容^純正的口音。

  • 在算力層面,語音評測所有的技術都是基于微軟Azure云構建的,Azure是全球擁有數(shù)據(jù)中心最多、覆蓋區(qū)域最多的云,可支撐用戶大規(guī)模的計算需求。同時,Azure符合歐盟GDPR(《通用數(shù)據(jù)保護條例》)標準,保護用戶的數(shù)據(jù)安全性。

實際上,微軟語音評測不是一個具體的產(chǎn)品,而是基于Azure云構建的一種能力。即以微軟Azure為平臺,將微軟在人工智能領域30年的研究成果,開放API給合作伙伴、獨立軟件開發(fā)商、系統(tǒng)集成商,為他們提供認知服務之上的能力,從而進一步做出適合各自領域的方案。

微軟上線語音評測功能:基于Azure云構建,賦能口語學習的教與學

“可以打一個比方,如果微軟云是平臺的話,認知服務就是這個平臺上提供給用戶智能的部分。就好像一個人有眼睛、耳朵、頭腦,認知服務就是賦予想要在微軟Azure云上獲取這些能力的用戶,給他們提供擴展能力”,丁秉公說道。

“所謂授之以魚不如授之以漁,我們提供這樣的能力或者工具之后,便于合作伙伴基于垂直領域里豐富的場景定制或開發(fā)相應的解決方案以及產(chǎn)品,他們可以直接調(diào)取這樣的能力,而不需要從頭做任何人工智能方面的研究?!?/p>

據(jù)了解,目前,微軟語音評測的API有豐富的接口和參數(shù),支持高實時率多并發(fā)調(diào)用。如果第三方想調(diào)用API,在前期評測環(huán)節(jié)是免費的,而進入集成開發(fā)階段,會根據(jù)標準的Speech-To-Text(語音轉文本)服務的價格,按照評測音頻的時長來計費。

另外,丁秉公還提到,微軟Azure內(nèi)部有獨立的Microsoft Education團隊,專門針對教育領域提供不同的解決方案。除了語音評測外,Azure云在教育領域還有很多已落地的應用。

  • 例如,疫情期間的“停課不停學”,讓微軟遠程協(xié)作平臺Microsoft Teams被學生用來作為遠程學習的工具,在教育領域被廣泛使用。

  • 其次,在個性化教育方面,語音評測作為Azure上的服務,提供了個性化的打分能力,使在平臺上使用這個功能的用戶享受到屬于他自己的獨特服務。

  • 第三,Azure的語音技術可以幫助合成AI老師,幫助教育機構生成課件,解決教育資源稀缺的問題。

  • 除此之外,語音技術還可以幫助一些視障和聽障學生更好地學習。

馬莉莎認為,當前全球的教育行業(yè)都在進行數(shù)字化轉型,疫情的到來加速了教育行業(yè)的數(shù)字化和線上化。通過讓AI和云計算進一步賦能教育行業(yè),可以為學生提供多元化個性化的服務,打造一個更加智能的生態(tài)環(huán)境。

微軟在智能語音技術方面深耕多年,曾推出過多款耳熟能詳?shù)恼Z音產(chǎn)品,如微軟小娜(Cortana)、微軟小冰、Skype等,此次上線語音評測功能也是“順水推舟”之舉。語音評測市場,BAT和科大訊飛等科技巨頭爭相布局,微軟這匹“黑馬”的加入,勢必會讓語音評測戰(zhàn)場的廝殺更為激烈。(雷鋒網(wǎng)雷鋒網(wǎng))

雷峰網(wǎng)原創(chuàng)文章,未經(jīng)授權禁止轉載。詳情見轉載須知

分享:
相關文章

雷鋒網(wǎng)認證編輯

關注云計算、5G、智慧教育賽道,微信號:lijingying0451,業(yè)務交流請注明公司+職位。
當月熱門文章
最新文章
請?zhí)顚懮暾埲速Y料
姓名
電話
郵箱
微信號
作品鏈接
個人簡介
為了您的賬戶安全,請驗證郵箱
您的郵箱還未驗證,完成可獲20積分喲!
請驗證您的郵箱
立即驗證
完善賬號信息
您的賬號已經(jīng)綁定,現(xiàn)在您可以設置密碼以方便用郵箱登錄
立即設置 以后再說