0
本文作者: 于勝越 | 2019-04-12 20:07 |
【大咖Live】AI自適應(yīng)教育專場(chǎng)第三期,朗播首席科學(xué)家賈艷明帶來(lái)了關(guān)于“AI+大數(shù)據(jù)落地語(yǔ)言學(xué)習(xí)的實(shí)踐和思考”的主題分享,詳解朗播在AI+教育方面的實(shí)踐經(jīng)驗(yàn)。目前,本期分享音頻及全文實(shí)錄已上線,「AI投研邦」會(huì)員可進(jìn)「AI投研邦」頁(yè)面免費(fèi)查看。
本文對(duì)本次分享進(jìn)行要點(diǎn)總結(jié)及PPT整理,以幫助大家提前清晰地了解本場(chǎng)分享重點(diǎn)。
AI在教育行業(yè)的應(yīng)用,以及朗播的看法;
AI在朗播語(yǔ)言學(xué)習(xí)的體系中如何具體落地;
教育新零售,以及在教育新零售下,AI學(xué)習(xí)助理是怎么樣更加有效地幫助大家學(xué)習(xí);
AI在未來(lái)教育場(chǎng)景中的展望。
以下為朗播首席科學(xué)家賈艷明的部分實(shí)錄摘取,雷鋒網(wǎng)【AI投研邦】在不改變?cè)獾幕A(chǔ)上做了整理和精編。
大家好! 我是來(lái)自朗播的首席科學(xué)家賈艷明,在朗播主要人工智能和大數(shù)據(jù)工作,也完成了自主知識(shí)產(chǎn)權(quán)的口語(yǔ)評(píng)分以及作文評(píng)分引擎,并在今年完成了AI學(xué)習(xí)助理的研發(fā),發(fā)表了很多相關(guān)的論文,申請(qǐng)了一些專利。
感謝雷鋒網(wǎng)「AI投研邦」給予機(jī)會(huì)和大家交流。朗播成立于2007年6月,是一家基于智能學(xué)習(xí)技術(shù)和行為大數(shù)據(jù)分析,以語(yǔ)言培訓(xùn)行業(yè)的標(biāo)準(zhǔn)輸出為核心的英語(yǔ)教育科技公司。產(chǎn)品已經(jīng)覆蓋出國(guó)留學(xué)考試,以及國(guó)內(nèi)四六級(jí)考試和通用學(xué)習(xí)產(chǎn)品,并且能夠提供課程練習(xí)測(cè)評(píng)問(wèn)答社區(qū)等一站式服務(wù)。
賈艷明提到,教育是什么呢?教育本質(zhì)上來(lái)說(shuō),是以知識(shí)為工具,教會(huì)他人思考的過(guò)程。它分成兩部分,一部分是以知識(shí)為工具,指的是知識(shí)的傳遞過(guò)程。第二個(gè)是教會(huì)他人思考,意思是,你把知識(shí)學(xué)會(huì)以后,能夠把它吸收內(nèi)化成自己的能力,這樣的話你才會(huì)思考,才會(huì)用你學(xué)到的東西去解決問(wèn)題。
實(shí)際上AI+教育真正重要的是什么?他認(rèn)為教研很重要,另外一個(gè)就是數(shù)據(jù)和技術(shù)。
首先教研是根本,如果有一個(gè)好的教研,它可能會(huì)產(chǎn)生一個(gè)偉大的教育公司。但是如果沒(méi)有好的教研,只有高超的技術(shù),它肯定也做不成一個(gè)好的教育公司,因?yàn)榻萄惺歉尽?/p>
第二個(gè)是數(shù)據(jù)和技術(shù),其實(shí)數(shù)據(jù)更重要,因?yàn)閿?shù)據(jù)相當(dāng)于原料。它相當(dāng)于你現(xiàn)在可以看到石油和煤,而技術(shù)只是一個(gè)加工原料的工具。而且隨著開(kāi)源工具的發(fā)展,技術(shù)重要性遠(yuǎn)遠(yuǎn)不如數(shù)據(jù)那么重要。因此總結(jié)下來(lái),如果一個(gè)公司沒(méi)有教研和數(shù)據(jù)是有問(wèn)題的,因此我總說(shuō),沒(méi)有教育和數(shù)據(jù)談AI+教育就是耍流氓。
總結(jié)下來(lái),AI+教育的關(guān)系是AI技術(shù)輔助教育,幫助我們改善學(xué)習(xí)效果,提高學(xué)習(xí)效率。再加一條的話,就是他可以改善大家學(xué)習(xí)的體驗(yàn),讓大家學(xué)得更加舒服,更加輕松。
二、 AI在朗播的實(shí)踐
朗播提供的是什么?朗播提供是一個(gè)專家經(jīng)驗(yàn)加能力圖譜為基礎(chǔ)的標(biāo)準(zhǔn)化產(chǎn)品。解釋一下為什么說(shuō)能力圖譜很重要,因?yàn)橹翱赡艽蠹衣?tīng)到的更多的是知識(shí)圖譜,為什么要強(qiáng)調(diào)能力?因?yàn)闊o(wú)論是實(shí)踐或者考試,能力是最根本的東西。所以我們是以能力突破為基礎(chǔ),并且也是以提高真正的語(yǔ)言能力為目標(biāo),而不僅僅是應(yīng)試。第二個(gè)是標(biāo)準(zhǔn)化,標(biāo)準(zhǔn)化意味著這個(gè)東西可以量化,可以控制的。
朗播提供的是標(biāo)準(zhǔn)化產(chǎn)品,在這個(gè)基礎(chǔ)上,我們會(huì)有基于AI和大數(shù)據(jù)的個(gè)性化的學(xué)習(xí)平臺(tái)。簡(jiǎn)單說(shuō)一下,相當(dāng)于我來(lái)這里學(xué)習(xí),首先是能力量化,進(jìn)行能力測(cè)評(píng),知道你哪里有問(wèn)題并測(cè)評(píng)出來(lái),然后就會(huì)給你做針對(duì)于個(gè)人能力不足的地方進(jìn)行能力訓(xùn)練的計(jì)劃,然后你去做練習(xí),再來(lái)測(cè)評(píng),以此反復(fù)循環(huán)并直到達(dá)到目標(biāo)。
中間會(huì)有智能的評(píng)測(cè)技術(shù)和行為數(shù)據(jù)來(lái)輔助個(gè)性的學(xué)習(xí),讓過(guò)程更加順暢,比如我們做完練習(xí)時(shí),我并不知道我做得怎么樣,但是加了智能測(cè)評(píng)之后,我就知道我到底做的怎么樣,從而系統(tǒng)會(huì)智能地引導(dǎo)我繼續(xù)再往下做。
有了數(shù)據(jù)之后,我們也能夠說(shuō)清楚哪塊和哪塊之間的關(guān)系是什么樣的,詞匯不好還是語(yǔ)法不好,都能夠通過(guò)數(shù)據(jù)看出來(lái)的。我們通過(guò)這樣的平臺(tái),就能夠?yàn)槊總€(gè)人提供屬于自己的個(gè)性化學(xué)習(xí)的方案。
具體來(lái)說(shuō),首先AI第一個(gè)應(yīng)用場(chǎng)景,就是基礎(chǔ)的智能評(píng)測(cè)技術(shù),它是更加客觀更加及時(shí)的。比如基于語(yǔ)音識(shí)別的口語(yǔ)評(píng)測(cè)技術(shù),這塊主要是來(lái)評(píng)測(cè)發(fā)音質(zhì)量的,相當(dāng)于測(cè)評(píng)發(fā)音標(biāo)準(zhǔn)與否的技術(shù)。
我們還有基于聲學(xué)空間的發(fā)音評(píng)測(cè)。左邊是一個(gè)學(xué)生在讀中國(guó)漢字時(shí)候的發(fā)音,大家可以看到他發(fā)U的時(shí)候,這幾個(gè)音都挨得很近的,那就說(shuō)明發(fā)的比較標(biāo)準(zhǔn),因?yàn)樗看伟l(fā)出來(lái)的聲音總能夠集中在某一個(gè)區(qū)域內(nèi)。所以說(shuō)它相對(duì)來(lái)比較標(biāo)準(zhǔn)。再看右邊,同樣是同一個(gè)學(xué)生,他在讀英語(yǔ)時(shí)可就不一樣。 這樣的話就相當(dāng)于發(fā)音控制的并不太好。同時(shí)我們也可以通過(guò)每個(gè)音的聚集的大小,以及每個(gè)音之間聚集的中心距離,判斷出學(xué)生的音到底更容易發(fā)成什么樣子,從而指出他問(wèn)題所在,幫助他改正。
除了口語(yǔ)評(píng)測(cè),我們還有一些主觀題評(píng)塊,主要是用到自然語(yǔ)言處理方法。我們強(qiáng)調(diào)能力訓(xùn)練系統(tǒng),很多題是我們自己的。教研老師出的非常好,就是為了真正的把能力鍛煉起來(lái),而不僅僅像普通的考試題,它其實(shí)起不到能力訓(xùn)練的作用,而只是在簡(jiǎn)單的刷題。
其實(shí)我們更多的是在作文的評(píng)分上會(huì)有自然語(yǔ)言的使用。比如說(shuō)我們可以對(duì)學(xué)生寫(xiě)的作文結(jié)構(gòu)進(jìn)行評(píng)分,比如說(shuō)他的論點(diǎn)是否明確,論述的如何,理由段怎么樣,是否有讓步段,結(jié)論是不是很清晰,結(jié)構(gòu)是不是完整。
我們會(huì)請(qǐng)教研專業(yè)老師做一些標(biāo)簽,通過(guò)機(jī)器學(xué)習(xí)模型訓(xùn)練出來(lái)結(jié)構(gòu)評(píng)分模型。內(nèi)容方面,我們也通過(guò)主題模型、相當(dāng)于學(xué)生寫(xiě)的論文是不是跟主題相關(guān),能否支持當(dāng)前的論點(diǎn)。教研老師會(huì)幫我們做一些標(biāo)簽,然后我們?nèi)ビ?xùn)練模型。
最后就是語(yǔ)言能力,它包括了拼寫(xiě)檢查以及語(yǔ)法檢查。拼寫(xiě)檢查用的是winnow算法加上語(yǔ)言模型。我們使用了綜合的語(yǔ)法檢查的模型,包括基于規(guī)則的模型、分類模型、神經(jīng)網(wǎng)絡(luò)翻譯模型,進(jìn)行了語(yǔ)法的檢查。
為了讓大家能夠更加清楚的看到自適應(yīng)學(xué)習(xí)過(guò)程是測(cè)學(xué)練的過(guò)程。在測(cè)的過(guò)程中知道你哪塊能力不行,提供一些快速精準(zhǔn)測(cè)評(píng)模型。測(cè)完之后就是要學(xué),在平時(shí)的傳統(tǒng)學(xué)習(xí)中,它應(yīng)該叫教學(xué),相當(dāng)于老師幫助你制定出學(xué)習(xí)計(jì)劃,然后你按這個(gè)計(jì)劃學(xué)習(xí),叫學(xué)習(xí)路徑的規(guī)劃。
規(guī)劃好了之后就去學(xué),即練習(xí)的過(guò)程,這也就是能力訓(xùn)練的過(guò)程。中間我們會(huì)有知識(shí)追蹤模型,告訴我們練習(xí)的進(jìn)展和成果如何。大家可以了解一下這幾個(gè)模型。
第一個(gè),我們首先介紹快速的測(cè)評(píng)模型,因?yàn)槠鋵?shí)我們還有一個(gè)更加精準(zhǔn)的模型,它時(shí)間比較長(zhǎng),需要兩個(gè)多小時(shí)的,評(píng)測(cè)也更加的準(zhǔn)確。
但因?yàn)槲覀冇袝r(shí)候其實(shí)需要一些快速測(cè)評(píng)模型,也要相對(duì)準(zhǔn)確。那么這時(shí)候我們就使用了一個(gè)基于信息增益的快速測(cè)評(píng)模型,基本上就是做少數(shù)的題就能夠得到你的能力點(diǎn)的基本范圍。其實(shí)它的原理并不那么復(fù)雜,但是我們需要很多的數(shù)據(jù)。相當(dāng)于我們能夠通過(guò)線下的大量學(xué)生做題,看到有一部分的題目是跟能力點(diǎn)評(píng)價(jià)有很強(qiáng)的相關(guān)性,從信息的角度來(lái)講,它們的貢獻(xiàn)更多, 剩下的提供信息少,這時(shí)候我們就會(huì)在線下把信息量提供最多的這些題選出來(lái),并且我們把這些題做對(duì)做錯(cuò)的關(guān)系跟能力點(diǎn)之間的范圍都記錄下來(lái)。
當(dāng)我們到了線上的時(shí)候,相當(dāng)于學(xué)生只需要做剛才記錄下來(lái)的那些信息量最大的題。做完之后,因?yàn)榇罅康膶W(xué)生已經(jīng)幫助我們統(tǒng)計(jì)出這些題到底對(duì)應(yīng)能力關(guān)系是怎么樣的,這兩個(gè)東西一結(jié)合,就通過(guò)少量的題就能夠知道能力會(huì)落在什么范圍內(nèi)。
第二是基于貝葉斯方法的能力水平預(yù)測(cè),我們能夠在很短的時(shí)間用很少的題幫助學(xué)生把他的能力水平測(cè)出來(lái),剩下就根據(jù)能力進(jìn)行推薦了。
根據(jù)能力推薦有很多種方法,比如貝葉斯方法、強(qiáng)化學(xué)習(xí)、KNN等方法,各有適用的場(chǎng)景。這里我給大家講講利用貝葉斯網(wǎng)絡(luò)實(shí)現(xiàn)學(xué)習(xí)路徑規(guī)劃的基本原理。貝葉斯網(wǎng)絡(luò)簡(jiǎn)單講相當(dāng)于每個(gè)節(jié)點(diǎn)之間有一定的相關(guān)性,節(jié)點(diǎn)之間的相關(guān)性是通過(guò)條件概率來(lái)反映,相當(dāng)于當(dāng)我的某個(gè)能力點(diǎn)高的時(shí)候,跟它相關(guān)的下一個(gè)節(jié)點(diǎn)的能力點(diǎn)高低的概率是多少。
整個(gè)的網(wǎng)絡(luò)通過(guò)專家經(jīng)驗(yàn)把節(jié)點(diǎn)和網(wǎng)絡(luò)結(jié)構(gòu)確定下來(lái),剩下通過(guò)數(shù)據(jù)把條件概率算出來(lái),作為一個(gè)基礎(chǔ)模型。當(dāng)某個(gè)學(xué)生來(lái)了之后,我們根據(jù)他輸入的當(dāng)前情況、未來(lái)目標(biāo)、中間通過(guò)測(cè)評(píng)能夠得到的能力點(diǎn)和對(duì)應(yīng)分?jǐn)?shù)的關(guān)系,我們就能夠推出來(lái),在這樣的條件下,他的其它一些節(jié)點(diǎn)到底個(gè)什么情況?相當(dāng)于他能力點(diǎn)低的概率有多少,高概率有多少。我們就能夠選擇出來(lái)適合于這個(gè)學(xué)生學(xué)習(xí)的最優(yōu)路徑。
當(dāng)他的學(xué)習(xí)路徑規(guī)劃好之后,就開(kāi)始練習(xí)。練習(xí)的時(shí)候,就會(huì)有一個(gè)知識(shí)追蹤模型,它其實(shí)是根據(jù)學(xué)生答題序列,通過(guò)知識(shí)追蹤模型得到知識(shí)掌握的概率,這是知識(shí)追蹤的概念。那么傳統(tǒng)知識(shí)追蹤,如圖所示,左邊是貝葉斯模型,后邊是深度學(xué)習(xí)的知識(shí)追蹤。左邊模型相當(dāng)于它只是針對(duì)一個(gè)知識(shí)點(diǎn)的話算得很準(zhǔn),后邊深度學(xué)習(xí)的知識(shí)追蹤模型需要大量的數(shù)據(jù)。
我們提出了貝葉斯深度學(xué)習(xí)的追蹤模型,把以前深度學(xué)習(xí)上面得每個(gè)參數(shù)點(diǎn),變成了概率分布。這樣的話模型會(huì)更加準(zhǔn)確,它相當(dāng)于是利用了所有的學(xué)生推斷下一個(gè)學(xué)生到底做得怎么樣,而不僅僅是當(dāng)前模型的固定點(diǎn)去推斷。
總的來(lái)說(shuō),朗播的語(yǔ)言學(xué)習(xí)體系中AI大概是這樣的結(jié)構(gòu)。首先會(huì)通過(guò)方法課進(jìn)行知識(shí)傳遞的過(guò)程,然后自適應(yīng)學(xué)習(xí)系統(tǒng)就會(huì)有知識(shí)吸收內(nèi)化變成能力的過(guò)程。AI和大數(shù)據(jù)會(huì)在每個(gè)環(huán)節(jié)發(fā)揮作用,讓學(xué)習(xí)模型更加精準(zhǔn),讓學(xué)習(xí)效率更高,讓學(xué)習(xí)體驗(yàn)更好。
我們?cè)趺礃咏鉀Q雙師問(wèn)題。教育新零售其實(shí)是基于新零售,馬云在16年提出來(lái)的利用線上服務(wù)和線下體驗(yàn),進(jìn)行新的零售模式。對(duì)于教育來(lái)講的話,朗播提供的線上就是中央廚房式的內(nèi)容標(biāo)準(zhǔn)化產(chǎn)品供給,線下是本地化標(biāo)準(zhǔn)流程的服務(wù),主要是輔導(dǎo)反饋和陪伴,中間是通過(guò)數(shù)據(jù)去打通的。
如果沒(méi)有AI,線上就是學(xué)員通過(guò)方法課和自適應(yīng)學(xué)習(xí)系統(tǒng),首先進(jìn)行線上學(xué)習(xí)。接下來(lái)就是線下的導(dǎo)師幫助他做一些歸因分析,提供解決方案,并且還有一些是可以給他陪伴、監(jiān)督他學(xué)習(xí)。中間通過(guò)數(shù)據(jù)打通就可以了。有了AI之后,在基于學(xué)員數(shù)據(jù)的基礎(chǔ)上,通過(guò)AI技術(shù)對(duì)學(xué)員的學(xué)習(xí)過(guò)程和能力提升情況進(jìn)行更精確的評(píng)價(jià),從而給他提供更客觀準(zhǔn)確的歸因和解決方案。線下導(dǎo)師可以利用AI學(xué)習(xí)助理進(jìn)行簡(jiǎn)單督學(xué),更多的是陪伴,讓人機(jī)接口更加明確,各自發(fā)揮自己的優(yōu)勢(shì),幫助學(xué)員更高效地學(xué)習(xí)。
第一個(gè)是學(xué)習(xí)的內(nèi)容和過(guò)程應(yīng)該是標(biāo)準(zhǔn)化的,但是每個(gè)人也有個(gè)性化,因?yàn)闃?biāo)準(zhǔn)化才能量化,之后我們才能夠?yàn)槊總€(gè)人都提供個(gè)性化的東西。第二個(gè)是教育新零售,利用大數(shù)據(jù)和人工智能打通了線上線下的隔閡,是更加有效的學(xué)習(xí)方式。它會(huì)解決雙師模式存在的問(wèn)題,而大數(shù)據(jù)和人工智能就會(huì)給學(xué)生提供一個(gè)線上線下一致的服務(wù)。
最后一點(diǎn)是人工智能不能取代教師,因?yàn)榻逃且粋€(gè)有溫度的職業(yè),它是不能取代教師的,但是教師的角色會(huì)發(fā)生變化,有一部分能力高的水平高的進(jìn)行知識(shí)傳授,有一部分水平稍微差一點(diǎn)的或者剛?cè)腴T(mén)的就可以做簡(jiǎn)單的輔導(dǎo)。那么剩下的就是像朗播這樣的學(xué)習(xí)產(chǎn)品,就需要教師變成一個(gè)產(chǎn)品經(jīng)理,進(jìn)行系統(tǒng)設(shè)計(jì)。 基本上我覺(jué)得未來(lái)AI跟教育也是這樣的關(guān)系。
完整內(nèi)容和視頻查看可進(jìn)入雷鋒網(wǎng)「AI投研邦」查看。
雷峰網(wǎng)原創(chuàng)文章,未經(jīng)授權(quán)禁止轉(zhuǎn)載。詳情見(jiàn)轉(zhuǎn)載須知。