丁香五月天婷婷久久婷婷色综合91|国产传媒自偷自拍|久久影院亚洲精品|国产欧美VA天堂国产美女自慰视屏|免费黄色av网站|婷婷丁香五月激情四射|日韩AV一区二区中文字幕在线观看|亚洲欧美日本性爱|日日噜噜噜夜夜噜噜噜|中文Av日韩一区二区

您正在使用IE低版瀏覽器,為了您的雷峰網(wǎng)賬號(hào)安全和更好的產(chǎn)品體驗(yàn),強(qiáng)烈建議使用更快更安全的瀏覽器
此為臨時(shí)鏈接,僅用于文章預(yù)覽,將在時(shí)失效
業(yè)界 正文
發(fā)私信給李秀琴
發(fā)送

0

考拉閱讀CEO趙梓淳:如何利用AI、語(yǔ)言學(xué)做出國(guó)內(nèi)首個(gè)中文分級(jí)閱讀系統(tǒng)?

本文作者: 李秀琴 2017-08-22 10:14
導(dǎo)語(yǔ):“分級(jí)閱讀系統(tǒng)只是一種工具,它并不能喧賓奪主說(shuō)可以取代老師。”

在一批在線教育試水者當(dāng)中,趙梓淳帶領(lǐng)的考拉閱讀有點(diǎn)不太一樣。

因?yàn)閲?guó)內(nèi)做分級(jí)閱讀的雖然不多,但是做中文的分級(jí)閱讀,國(guó)內(nèi)目前卻僅有他們一家。

考拉閱讀CEO趙梓淳:如何利用AI、語(yǔ)言學(xué)做出國(guó)內(nèi)首個(gè)中文分級(jí)閱讀系統(tǒng)?

考拉閱讀CEO趙梓淳

在在線教育這個(gè)領(lǐng)域,考拉閱讀算是一名新人——成立不足1年,團(tuán)隊(duì)堪滿60人,剛完成3000萬(wàn)的Pre-A輪融資。在創(chuàng)始人趙梓淳眼中,閱讀教育是一項(xiàng)非常龐大的產(chǎn)業(yè),AI+教育的未來(lái)仍存在很多不確定性??祭喿x也還處于摸索階段。

為什么要做中文的分級(jí)閱讀標(biāo)準(zhǔn)?

事實(shí)上,在國(guó)內(nèi),如好未來(lái)、VIPkid等一些在線教育企業(yè)已經(jīng)在做英文的分級(jí)閱讀,雖有其物,但一直沒(méi)多大水花。趙梓淳向雷鋒網(wǎng)透露,對(duì)于考拉閱讀來(lái)說(shuō),做英語(yǔ)的分級(jí)閱讀標(biāo)準(zhǔn)并沒(méi)有太大的技術(shù)難度,但他們并不想做。

原因很簡(jiǎn)單,國(guó)外已有一套很成熟的英文分級(jí)閱讀標(biāo)準(zhǔn)系統(tǒng),不僅運(yùn)行了將近40年且已覆蓋了美國(guó)90%的學(xué)校,如Lexile分級(jí)(藍(lán)思分級(jí))、GE分級(jí)等。而在國(guó)內(nèi),中文閱讀不僅連分級(jí)標(biāo)準(zhǔn)都未建立,很多教師甚至連分級(jí)閱讀都沒(méi)聽過(guò),尤其是在重要的K12教育領(lǐng)域,很多書店給童書分級(jí),只能給出諸如“適合8歲以下孩子閱讀的童話書”等基于感性、經(jīng)驗(yàn)基礎(chǔ)的文字建議。此外,教師、家長(zhǎng)對(duì)孩子的閱讀水平的了解也一直處于空白狀態(tài),因?yàn)楂@取這一數(shù)據(jù)的渠道不是沒(méi)有,就是非常非常有限。

在這兩大剛需的驅(qū)使下,再加上“全民閱讀”、二胎等相關(guān)政策的頒布,以及人工智能、機(jī)器學(xué)習(xí)和大數(shù)據(jù)的發(fā)展,又給前者提供了更充分的條件,這一切都讓趙梓淳覺(jué)得:做一套中文的分級(jí)閱讀標(biāo)準(zhǔn)很有必要,而且,時(shí)機(jī)也來(lái)了。

瞄準(zhǔn)AI,建立基于ER Framework的中文分級(jí)閱讀系統(tǒng)

丨中英文差異

考拉閱讀CTO任易向雷鋒網(wǎng)透露,在歐美,英文的分級(jí)閱讀主要有兩個(gè)維度:

?  語(yǔ)義:主要看詞頻,如果一個(gè)單詞出現(xiàn)的頻次很低,則系統(tǒng)會(huì)判定這個(gè)詞相對(duì)較難。

?  句法:主要看句子長(zhǎng)度,長(zhǎng)句一般較難去分析和理解。而句子難度跟從句、副詞、介詞等的使用也密切相關(guān)。

在這兩個(gè)維度上,歐美國(guó)家通過(guò)統(tǒng)計(jì)學(xué)的方法來(lái)完成分級(jí)閱讀標(biāo)準(zhǔn)的建立。任易表示,考拉閱讀的中文分級(jí)閱讀標(biāo)準(zhǔn)(ER Framework )借鑒了國(guó)外的“詞、句”的分析思想,因而和其有一定的相似性。但是,由于中文相較英文的「天生復(fù)雜性」,決定了考拉閱讀必須做得更加深入。

據(jù)趙梓淳介紹,中文和英文的三大本質(zhì)區(qū)別主要在于:

?  基礎(chǔ)單元:英文的基礎(chǔ)是26個(gè)字母,中文的常用漢字達(dá)3500個(gè),這就決定了中文閱讀的分析必然需要一個(gè)規(guī)?;恼Z(yǔ)料庫(kù)。

?  分詞:英文不需要分詞,僅需空格即可判定詞語(yǔ)的邊界,但漢字脫離不了分詞。如「量子自旋效應(yīng)」這個(gè)詞,有人可以將其分為「量子」、「自旋」、「效應(yīng)」三個(gè)詞,也有人認(rèn)為這就是一個(gè)詞。但在英文中就無(wú)此類困擾。

?  句式結(jié)構(gòu):在句式結(jié)構(gòu)上,英文要嚴(yán)謹(jǐn)?shù)枚?,如主從句之間會(huì)有that、which、what等來(lái)界定。中文的行文風(fēng)格則較為隨意,嵌套結(jié)構(gòu)也要混亂得多。

丨「字詞句段篇」五大維度+AI技術(shù)

考拉閱讀CEO趙梓淳:如何利用AI、語(yǔ)言學(xué)做出國(guó)內(nèi)首個(gè)中文分級(jí)閱讀系統(tǒng)?鑒于這三大區(qū)別,考拉閱讀基于ER Framework的分級(jí)閱讀標(biāo)準(zhǔn)在「詞」、「句」的基礎(chǔ)上再加入「字」、「段」、「篇」三個(gè)維度,即從「字詞句段篇」五大維度提取幾十個(gè)特征來(lái)表達(dá)中文的難度,并實(shí)現(xiàn)段落、主題等的分析。如在「字」其下還有常用性、構(gòu)形、組合性三個(gè)特征,「句」則有句法結(jié)構(gòu)、語(yǔ)義邏輯、修辭表達(dá)和嵌套深度四個(gè)特征等等。

趙梓淳告訴雷鋒網(wǎng),他們一共處理了幾百萬(wàn)字的非平衡語(yǔ)料庫(kù)和幾億字的平衡語(yǔ)料庫(kù)??祭喿x的非平衡語(yǔ)料庫(kù)主要來(lái)自各個(gè)版本的小學(xué)教材及其教輔資料,其是指垂直于某一品類的語(yǔ)料庫(kù),如小說(shuō)、歷史傳記各有其對(duì)應(yīng)的語(yǔ)料庫(kù);平衡語(yǔ)料庫(kù)即指一個(gè)孩子在日常生活中需要真實(shí)接觸的語(yǔ)料,如,按照一位10歲小孩需要看20%的名著小說(shuō)、50%的課文和20%的漫畫這種比例來(lái)配語(yǔ)料庫(kù)。

“因?yàn)橹形牡牡木渥酉噍^英文要復(fù)雜得多,機(jī)器在理解中文的第一步就會(huì)遇到詞性分析、語(yǔ)言模型上的困難。所以,有賴于現(xiàn)在流行的AI技術(shù),如RNN、LSTM等深度學(xué)習(xí)技術(shù),可以彌補(bǔ)中文在NLP上的缺失?!比我妆硎?,“現(xiàn)在我們可以做到,將一個(gè)句子按照句法樹、依賴關(guān)聯(lián)等予以拆解,以分析每一個(gè)成分在句子中的比重,從而實(shí)現(xiàn)閱讀文本的難度分級(jí)?!?/p>

而區(qū)別于歐美英文分級(jí)閱讀,考拉閱讀的分級(jí)閱讀系統(tǒng)最大的優(yōu)勢(shì)即在于AI在此發(fā)揮的作用。趙梓淳向雷鋒網(wǎng)透露,隨著用戶數(shù)量的增加,產(chǎn)生的數(shù)據(jù)越多,該系統(tǒng)中的模型可實(shí)現(xiàn)自主學(xué)習(xí),不斷優(yōu)化,從而對(duì)文本閱讀的難度感知越發(fā)準(zhǔn)確。

以教育局切入,「從上至下」走To B路線

據(jù)雷鋒網(wǎng)了解,目前趙梓淳帶領(lǐng)其團(tuán)隊(duì)共開發(fā)了三款產(chǎn)品:

?  基于ER Framework的個(gè)性化分級(jí)閱讀系統(tǒng);

?  基于ER Framework和“新課標(biāo)”的閱讀能力測(cè)評(píng);

?  針對(duì)公立學(xué)校的閱讀整體解決方案,包括教師培訓(xùn)、分級(jí)短文材料等。

其中,考拉閱讀的分級(jí)閱讀系統(tǒng)現(xiàn)在已經(jīng)進(jìn)入天津市200余所中小學(xué),被全市上百萬(wàn)的小學(xué)生使用。趙梓淳稱,考拉閱讀的用戶群主要為小學(xué)階段的孩子,目標(biāo)是利用AI和語(yǔ)言學(xué)的結(jié)合,全面提升這些孩子的閱讀能力。

在公司戰(zhàn)略決策的制定上,趙梓淳顯得非常冷靜而果斷,其稱,考拉閱讀的業(yè)務(wù)從一開始就是圍繞To B在展開,不會(huì)針對(duì)C端使用。原因有兩點(diǎn):

1、普通民眾并不明白什么是分級(jí)閱讀。對(duì)于考拉閱讀這種體量的創(chuàng)業(yè)公司而言,要轉(zhuǎn)變他們對(duì)分級(jí)閱讀的認(rèn)知,任務(wù)實(shí)在過(guò)于繁重。所以,更好的方式就是在一開始就從To B端的公立學(xué)校、教育機(jī)構(gòu)去切入,讓教育局、教師等為分級(jí)閱讀背書,且還能增強(qiáng)公司產(chǎn)品的公信力。

2、目前獲取C端用戶的成本依然很高。

基于此,趙梓淳表示,“所以我們還是想在B端穩(wěn)扎穩(wěn)打下去。后期公司發(fā)展到一定程度之后,必定會(huì)走向To C端,畢竟To B的天花板一定是可以預(yù)見的?!?/p>

丨牽手200余所中小學(xué)

然而,在在線教育這一慢熱的市場(chǎng),特別是在很多教育資源都被政府等相關(guān)機(jī)構(gòu)緊緊攥在手里的情況下,考拉閱讀又是如何打通這些壁壘,與教育局,以及地級(jí)市200余所學(xué)校成功牽手的呢?

趙梓淳告訴雷鋒網(wǎng),事實(shí)上,考拉閱讀一開始走這條路也不太順利——最先其采取對(duì)每家學(xué)校進(jìn)行單點(diǎn)突破的方式,卻發(fā)現(xiàn)效率非常低下。

趙梓淳帶領(lǐng)其團(tuán)隊(duì)觀察到這樣一個(gè)現(xiàn)象,國(guó)內(nèi)很多中小學(xué)都很重視學(xué)生的測(cè)評(píng),但在閱讀能力的測(cè)評(píng)上卻處于相對(duì)空白的狀態(tài)。于是,考拉閱讀聯(lián)合北京師范大學(xué)基礎(chǔ)教育評(píng)測(cè)中心合作「搞」了一件大事:在國(guó)內(nèi)的一線到四線城市,對(duì)近10萬(wàn)學(xué)生進(jìn)行了基于ER Framework和“新課標(biāo)”的閱讀能力測(cè)試,并對(duì)相關(guān)數(shù)據(jù)進(jìn)行分析,最終出具了一份中國(guó)學(xué)生的閱讀能力量表。在測(cè)評(píng)的助攻下,考拉閱讀成功打通了和中小學(xué)合作的路徑。

考拉閱讀CEO趙梓淳:如何利用AI、語(yǔ)言學(xué)做出國(guó)內(nèi)首個(gè)中文分級(jí)閱讀系統(tǒng)?

丨開設(shè)教師培訓(xùn)課程

同時(shí),在推進(jìn)分級(jí)閱讀標(biāo)準(zhǔn)的過(guò)程中,考拉閱讀發(fā)現(xiàn)「教師」這一角色反而是整個(gè)推進(jìn)過(guò)程的關(guān)鍵角色。因?yàn)殡m然已經(jīng)開發(fā)出中文分級(jí)閱讀標(biāo)準(zhǔn)及其配套工具和產(chǎn)品,但在趙梓淳看來(lái),這些工具和產(chǎn)品依然需要人來(lái)使用,需要教育者來(lái)向這些孩子傳遞教育的溫度和理念。但是,國(guó)內(nèi)教育理念跟不上,語(yǔ)文教師對(duì)整個(gè)前沿教育的趨勢(shì)掌握不到位......這些都是問(wèn)題。

針對(duì)這一痛點(diǎn),考拉閱讀還和學(xué)校合作開展了20課時(shí)和40課時(shí)不同版本的針對(duì)教師的培訓(xùn)課程,由其團(tuán)隊(duì)里具有深厚教研經(jīng)驗(yàn)的成員進(jìn)行研發(fā),分為線下集中輔導(dǎo)和線上遠(yuǎn)程支持兩種路徑,以培訓(xùn)教師們及時(shí)更新各種新興教育理念的能力,從而及時(shí)掌握教育閱讀的最新發(fā)展趨勢(shì)。

結(jié)語(yǔ)

分級(jí)閱讀進(jìn)入國(guó)內(nèi)的這些年,不是沒(méi)有遭受過(guò)質(zhì)疑之聲,有人認(rèn)為分級(jí)閱讀不適應(yīng)中國(guó)國(guó)情,比如有些孩子從小耳濡目染四大名著,可能會(huì)對(duì)超出分級(jí)閱讀系統(tǒng)推薦的書目以外的書籍感興趣,當(dāng)然不能排除這種可能性。

面對(duì)這一問(wèn)題,趙梓淳如此表示:

“分級(jí)閱讀系統(tǒng)只是一種工具,它并不能喧賓奪主說(shuō)可以取代老師。我們做分級(jí)閱讀的意義就在于,想告訴家長(zhǎng)和老師,哪種文本難度的書目是適合你的孩子或?qū)W生去閱讀的。至于讀還是不讀,依然需要家長(zhǎng)和老師去做出判斷?!?/p>

最后,談及在推進(jìn)分級(jí)閱讀教育過(guò)程的體會(huì)時(shí),趙梓淳坦言道,“教育是一件很大很大的事情,因?yàn)樗c人性直接相關(guān),不是僅僅做好產(chǎn)品就能實(shí)現(xiàn)「通吃」的。大家一直都在說(shuō)「教育科技」,而非「科技教育」,因?yàn)榻逃欢ㄊ菙[在第一位的?!?br/>

雷峰網(wǎng)原創(chuàng)文章,未經(jīng)授權(quán)禁止轉(zhuǎn)載。詳情見轉(zhuǎn)載須知。

分享:
相關(guān)文章

記者

跟蹤Fintech和區(qū)塊鏈(微信:cqmm16,備注身份姓名來(lái)意,thx)
當(dāng)月熱門文章
最新文章
請(qǐng)?zhí)顚懮暾?qǐng)人資料
姓名
電話
郵箱
微信號(hào)
作品鏈接
個(gè)人簡(jiǎn)介
為了您的賬戶安全,請(qǐng)驗(yàn)證郵箱
您的郵箱還未驗(yàn)證,完成可獲20積分喲!
請(qǐng)驗(yàn)證您的郵箱
立即驗(yàn)證
完善賬號(hào)信息
您的賬號(hào)已經(jīng)綁定,現(xiàn)在您可以設(shè)置密碼以方便用郵箱登錄
立即設(shè)置 以后再說(shuō)