丁香五月天婷婷久久婷婷色综合91|国产传媒自偷自拍|久久影院亚洲精品|国产欧美VA天堂国产美女自慰视屏|免费黄色av网站|婷婷丁香五月激情四射|日韩AV一区二区中文字幕在线观看|亚洲欧美日本性爱|日日噜噜噜夜夜噜噜噜|中文Av日韩一区二区

您正在使用IE低版瀏覽器,為了您的雷峰網(wǎng)賬號(hào)安全和更好的產(chǎn)品體驗(yàn),強(qiáng)烈建議使用更快更安全的瀏覽器
此為臨時(shí)鏈接,僅用于文章預(yù)覽,將在時(shí)失效
智慧教育 正文
發(fā)私信給李菁瑛
發(fā)送

0

微軟上線語(yǔ)音評(píng)測(cè)功能:基于Azure云構(gòu)建,賦能口語(yǔ)學(xué)習(xí)的教與學(xué)

本文作者: 李菁瑛 2020-06-22 12:48
導(dǎo)語(yǔ):微軟這匹“黑馬”的進(jìn)入,勢(shì)必會(huì)讓語(yǔ)音評(píng)測(cè)戰(zhàn)場(chǎng)的廝殺更為激烈。

近年來(lái),隨著人工智能技術(shù)的不斷成熟,企業(yè)數(shù)字化轉(zhuǎn)型步伐的加快,AI的觸角逐漸深入到各個(gè)場(chǎng)景,使人類的生產(chǎn)生活變得更加智慧化。在聽(tīng)覺(jué)方面,智能語(yǔ)音技術(shù)成為各大科技公司們攻堅(jiān)的重要領(lǐng)域。

一家老牌科技巨頭微軟,在語(yǔ)音合成技術(shù)、語(yǔ)音識(shí)別技術(shù)上深耕多年,面向全球合作伙伴開(kāi)放和落地其技術(shù)能力,提供多種智能語(yǔ)音解決方案。

5月中旬,在2020微軟Build開(kāi)發(fā)者大會(huì)上,微軟上線了語(yǔ)音評(píng)測(cè)功能,該功能基于Azure語(yǔ)音服務(wù)Speech-to-text(語(yǔ)音轉(zhuǎn)文本)構(gòu)建。用戶可以上傳跟讀文本和音頻對(duì)發(fā)音人的語(yǔ)音從準(zhǔn)確度,流利度和完整度進(jìn)行評(píng)測(cè)。在教育領(lǐng)域,尤其是口語(yǔ)學(xué)習(xí)方面,因具有高識(shí)別準(zhǔn)確率、擬專家打分的高一致性,可以讓口語(yǔ)學(xué)習(xí)的教和學(xué)更加高效方便。

近日,微軟亞太研發(fā)集團(tuán)智能語(yǔ)音團(tuán)隊(duì)接受了雷鋒網(wǎng)等媒體的線上采訪,對(duì)微軟智能語(yǔ)音評(píng)測(cè)技術(shù)的優(yōu)勢(shì)和應(yīng)用場(chǎng)景等內(nèi)容進(jìn)行了詳細(xì)介紹。

微軟亞太研發(fā)集團(tuán)云計(jì)算與人工智能事業(yè)部產(chǎn)品總監(jiān)丁秉公、微軟亞太研發(fā)集團(tuán)云計(jì)算與人工智能事業(yè)部資深產(chǎn)品經(jīng)理馬莉莎參與了本次采訪。

語(yǔ)音評(píng)測(cè)的四個(gè)維度

微軟亞太研發(fā)集團(tuán)云計(jì)算與人工智能事業(yè)部資深產(chǎn)品經(jīng)理馬莉莎表示,目前語(yǔ)音評(píng)測(cè)市場(chǎng)需求的考量方向主要有四個(gè)維度:

  1. 專業(yè)性。

  2. 實(shí)時(shí)性。

  3. 穩(wěn)定性。

  4. 可定制性。

對(duì)于專業(yè)性,微軟語(yǔ)音評(píng)測(cè)的每個(gè)語(yǔ)言從10萬(wàn)小時(shí)以上的母語(yǔ)大數(shù)據(jù)中學(xué)習(xí)當(dāng)?shù)卣Z(yǔ)言純正口音發(fā)音,針對(duì)各年齡段多維度精準(zhǔn)打分,從文章——句子——詞——音素四個(gè)環(huán)節(jié),層層評(píng)估,擬專家團(tuán)打分一致性高。

微軟上線語(yǔ)音評(píng)測(cè)功能:基于Azure云構(gòu)建,賦能口語(yǔ)學(xué)習(xí)的教與學(xué)

馬莉莎提到,語(yǔ)音評(píng)測(cè)的專業(yè)性考量對(duì)比的是和母語(yǔ)專家評(píng)測(cè)的一致性。業(yè)內(nèi)通用皮爾森相關(guān)系數(shù)來(lái)反映兩個(gè)序列線性相關(guān)程度的統(tǒng)計(jì)量。范圍在-1到1之間,1表示完全相關(guān),-1表示完全相反,0表示亂序無(wú)關(guān),數(shù)值越大表示相關(guān)度越高。微軟語(yǔ)音評(píng)測(cè)在一致性上達(dá)到了0.75,與母語(yǔ)專家水平接近。

對(duì)于實(shí)時(shí)性,微軟語(yǔ)音評(píng)測(cè)支持音頻上傳流式處理,也就是邊朗讀邊處理,讀完立即反饋評(píng)估結(jié)果。

對(duì)于穩(wěn)定性,微軟語(yǔ)音評(píng)測(cè)基于NLP模型構(gòu)建模糊匹配文本,針對(duì)垂直領(lǐng)域的特定場(chǎng)景的容錯(cuò)率有良好的包容性,漏讀、錯(cuò)讀、重復(fù)讀不影響打分有效性與準(zhǔn)確性。

對(duì)于可定制性,ASR基礎(chǔ)模型與微軟在語(yǔ)音領(lǐng)域的全面技術(shù)能力,可以實(shí)現(xiàn)個(gè)性化評(píng)分標(biāo)準(zhǔn),可適配口音、適配噪音環(huán)境以及適配年齡層等。

據(jù)了解,微軟語(yǔ)音評(píng)測(cè)除了支持英語(yǔ)評(píng)測(cè)外,還可擴(kuò)展支持全球 40 多個(gè)國(guó)家和地區(qū)的語(yǔ)言評(píng)測(cè),廣泛適用于教育領(lǐng)域解決方案的合作伙伴、APP開(kāi)發(fā)者以及語(yǔ)言學(xué)校、培訓(xùn)中心、教育機(jī)構(gòu)、考試中心的各種語(yǔ)言學(xué)習(xí)、口語(yǔ)練習(xí)和考試等場(chǎng)景的開(kāi)發(fā)。

最大的技術(shù)難點(diǎn)在于多點(diǎn)平衡

語(yǔ)音評(píng)測(cè)能力,在教育領(lǐng)域主要的受眾人群包括老師、學(xué)生,通常被廣泛應(yīng)用于教師評(píng)估、作業(yè)練習(xí)和語(yǔ)言學(xué)習(xí)場(chǎng)景中。那么,對(duì)于口語(yǔ)學(xué)習(xí),教育用戶的痛點(diǎn)是什么?語(yǔ)音評(píng)測(cè)最大的技術(shù)難點(diǎn)又是什么?

對(duì)此,馬莉莎表示,對(duì)于學(xué)生來(lái)說(shuō),他們的痛點(diǎn)在于非母語(yǔ)口語(yǔ)學(xué)習(xí)。學(xué)生們?cè)趯W(xué)習(xí)新語(yǔ)言的過(guò)程中,如何及時(shí)準(zhǔn)確地給學(xué)生的發(fā)音進(jìn)行反饋,讓學(xué)生隨時(shí)隨地更方便地聯(lián)系對(duì)于提升口語(yǔ)學(xué)習(xí)的有效性至關(guān)重要。

對(duì)于學(xué)校和教育機(jī)構(gòu)來(lái)說(shuō),他們的痛點(diǎn)在于老師的資源有限,如何把現(xiàn)有的優(yōu)質(zhì)教師資源拓展到一個(gè)穩(wěn)定的教學(xué)系統(tǒng)里。因此,老師需要這樣一個(gè)能力,不僅能模擬母語(yǔ)專家打分,還能夠?qū)W習(xí)到老師們的評(píng)測(cè)方法,讓老師們可以使用評(píng)測(cè)高效地一對(duì)多給學(xué)生提供在線和線下的指導(dǎo)和幫助。

教育用戶的這些痛點(diǎn),對(duì)語(yǔ)音評(píng)測(cè)技術(shù)提出了更高的要求。馬莉莎認(rèn)為,語(yǔ)音評(píng)測(cè)最大的技術(shù)難點(diǎn)在于語(yǔ)音識(shí)別技術(shù)本身,首先是多語(yǔ)言的理解和識(shí)別,不同的打分場(chǎng)景,包括噪聲環(huán)境、不同年齡段學(xué)生的發(fā)音情況等都要進(jìn)一步優(yōu)化。

其次就是要達(dá)到包容性和魯棒性(注:robust,技術(shù)術(shù)語(yǔ),此處可理解為穩(wěn)健性或抗變性)的平衡。既要模型做得好、識(shí)別好,還要能夠動(dòng)態(tài)、實(shí)時(shí)構(gòu)建,對(duì)大模型達(dá)到高實(shí)時(shí)地調(diào)用,而這些需求加起來(lái)就是難上加難了。

“在語(yǔ)音評(píng)測(cè)上我們的基礎(chǔ)儲(chǔ)備非常堅(jiān)實(shí),才能把方方面面做到比較好,以一個(gè)綜合的體現(xiàn)呈現(xiàn)給用戶,所以我們不是難在一個(gè)點(diǎn)上,而是多點(diǎn)平衡?!?/p>

據(jù)悉,積極探索數(shù)字化轉(zhuǎn)型和新教育模式的好未來(lái),也是微軟語(yǔ)音評(píng)測(cè)功能的客戶之一。好未來(lái)AI科學(xué)家胡翔宇表示:

"如何快速而有效地針對(duì)不同學(xué)生進(jìn)行口語(yǔ)評(píng)測(cè)是我們?cè)诰€上線下的英語(yǔ)教學(xué)中遇到的一大挑戰(zhàn)。微軟智能語(yǔ)音服務(wù)為好未來(lái)內(nèi)部以及我們的合作伙伴提供強(qiáng)大的實(shí)時(shí)語(yǔ)音評(píng)測(cè)能力。根據(jù)我們的測(cè)試,微軟語(yǔ)音服務(wù)的發(fā)音測(cè)評(píng)功能更好地適配了我們的收音環(huán)境,并且具備更高的一致性,更加貼近專家的評(píng)估結(jié)果。" 

基于Azure云構(gòu)建的一種能力:算法、數(shù)據(jù)、算力

微軟亞太研發(fā)集團(tuán)云計(jì)算與人工智能事業(yè)部產(chǎn)品總監(jiān)丁秉公介紹,一般來(lái)說(shuō),我們看AI技術(shù)主要看三個(gè)方面:算法、數(shù)據(jù)、算力。從這三個(gè)方面來(lái)說(shuō),微軟的語(yǔ)音評(píng)測(cè)功能有自己獨(dú)特的優(yōu)勢(shì)。

  • 在算法層面,微軟在智能語(yǔ)音領(lǐng)域深耕多年,其語(yǔ)音識(shí)別已經(jīng)達(dá)到人類的水平,錯(cuò)誤率在5.1%左右,正是有了這個(gè)算法基礎(chǔ),所以在語(yǔ)音識(shí)別延伸的應(yīng)用——語(yǔ)音評(píng)測(cè)方面能夠比較有信心。

  • 在數(shù)據(jù)層面,依靠微軟在語(yǔ)音方面的多年積累,通過(guò)將近10萬(wàn)多小時(shí)母語(yǔ)的數(shù)據(jù)進(jìn)行訓(xùn)練,最后學(xué)習(xí)到當(dāng)?shù)乇容^純正的口音。

  • 在算力層面,語(yǔ)音評(píng)測(cè)所有的技術(shù)都是基于微軟Azure云構(gòu)建的,Azure是全球擁有數(shù)據(jù)中心最多、覆蓋區(qū)域最多的云,可支撐用戶大規(guī)模的計(jì)算需求。同時(shí),Azure符合歐盟GDPR(《通用數(shù)據(jù)保護(hù)條例》)標(biāo)準(zhǔn),保護(hù)用戶的數(shù)據(jù)安全性。

實(shí)際上,微軟語(yǔ)音評(píng)測(cè)不是一個(gè)具體的產(chǎn)品,而是基于Azure云構(gòu)建的一種能力。即以微軟Azure為平臺(tái),將微軟在人工智能領(lǐng)域30年的研究成果,開(kāi)放API給合作伙伴、獨(dú)立軟件開(kāi)發(fā)商、系統(tǒng)集成商,為他們提供認(rèn)知服務(wù)之上的能力,從而進(jìn)一步做出適合各自領(lǐng)域的方案。

微軟上線語(yǔ)音評(píng)測(cè)功能:基于Azure云構(gòu)建,賦能口語(yǔ)學(xué)習(xí)的教與學(xué)

“可以打一個(gè)比方,如果微軟云是平臺(tái)的話,認(rèn)知服務(wù)就是這個(gè)平臺(tái)上提供給用戶智能的部分。就好像一個(gè)人有眼睛、耳朵、頭腦,認(rèn)知服務(wù)就是賦予想要在微軟Azure云上獲取這些能力的用戶,給他們提供擴(kuò)展能力”,丁秉公說(shuō)道。

“所謂授之以魚(yú)不如授之以漁,我們提供這樣的能力或者工具之后,便于合作伙伴基于垂直領(lǐng)域里豐富的場(chǎng)景定制或開(kāi)發(fā)相應(yīng)的解決方案以及產(chǎn)品,他們可以直接調(diào)取這樣的能力,而不需要從頭做任何人工智能方面的研究。”

據(jù)了解,目前,微軟語(yǔ)音評(píng)測(cè)的API有豐富的接口和參數(shù),支持高實(shí)時(shí)率多并發(fā)調(diào)用。如果第三方想調(diào)用API,在前期評(píng)測(cè)環(huán)節(jié)是免費(fèi)的,而進(jìn)入集成開(kāi)發(fā)階段,會(huì)根據(jù)標(biāo)準(zhǔn)的Speech-To-Text(語(yǔ)音轉(zhuǎn)文本)服務(wù)的價(jià)格,按照評(píng)測(cè)音頻的時(shí)長(zhǎng)來(lái)計(jì)費(fèi)。

另外,丁秉公還提到,微軟Azure內(nèi)部有獨(dú)立的Microsoft Education團(tuán)隊(duì),專門(mén)針對(duì)教育領(lǐng)域提供不同的解決方案。除了語(yǔ)音評(píng)測(cè)外,Azure云在教育領(lǐng)域還有很多已落地的應(yīng)用。

  • 例如,疫情期間的“停課不停學(xué)”,讓微軟遠(yuǎn)程協(xié)作平臺(tái)Microsoft Teams被學(xué)生用來(lái)作為遠(yuǎn)程學(xué)習(xí)的工具,在教育領(lǐng)域被廣泛使用。

  • 其次,在個(gè)性化教育方面,語(yǔ)音評(píng)測(cè)作為Azure上的服務(wù),提供了個(gè)性化的打分能力,使在平臺(tái)上使用這個(gè)功能的用戶享受到屬于他自己的獨(dú)特服務(wù)。

  • 第三,Azure的語(yǔ)音技術(shù)可以幫助合成AI老師,幫助教育機(jī)構(gòu)生成課件,解決教育資源稀缺的問(wèn)題。

  • 除此之外,語(yǔ)音技術(shù)還可以幫助一些視障和聽(tīng)障學(xué)生更好地學(xué)習(xí)。

馬莉莎認(rèn)為,當(dāng)前全球的教育行業(yè)都在進(jìn)行數(shù)字化轉(zhuǎn)型,疫情的到來(lái)加速了教育行業(yè)的數(shù)字化和線上化。通過(guò)讓AI和云計(jì)算進(jìn)一步賦能教育行業(yè),可以為學(xué)生提供多元化個(gè)性化的服務(wù),打造一個(gè)更加智能的生態(tài)環(huán)境。

微軟在智能語(yǔ)音技術(shù)方面深耕多年,曾推出過(guò)多款耳熟能詳?shù)恼Z(yǔ)音產(chǎn)品,如微軟小娜(Cortana)、微軟小冰、Skype等,此次上線語(yǔ)音評(píng)測(cè)功能也是“順?biāo)浦邸敝e。語(yǔ)音評(píng)測(cè)市場(chǎng),BAT和科大訊飛等科技巨頭爭(zhēng)相布局,微軟這匹“黑馬”的加入,勢(shì)必會(huì)讓語(yǔ)音評(píng)測(cè)戰(zhàn)場(chǎng)的廝殺更為激烈。(雷鋒網(wǎng)雷鋒網(wǎng))

雷峰網(wǎng)原創(chuàng)文章,未經(jīng)授權(quán)禁止轉(zhuǎn)載。詳情見(jiàn)轉(zhuǎn)載須知

分享:
相關(guān)文章

雷鋒網(wǎng)認(rèn)證編輯

關(guān)注云計(jì)算、5G、智慧教育賽道,微信號(hào):lijingying0451,業(yè)務(wù)交流請(qǐng)注明公司+職位。
當(dāng)月熱門(mén)文章
最新文章
請(qǐng)?zhí)顚?xiě)申請(qǐng)人資料
姓名
電話
郵箱
微信號(hào)
作品鏈接
個(gè)人簡(jiǎn)介
為了您的賬戶安全,請(qǐng)驗(yàn)證郵箱
您的郵箱還未驗(yàn)證,完成可獲20積分喲!
請(qǐng)驗(yàn)證您的郵箱
立即驗(yàn)證
完善賬號(hào)信息
您的賬號(hào)已經(jīng)綁定,現(xiàn)在您可以設(shè)置密碼以方便用郵箱登錄
立即設(shè)置 以后再說(shuō)