0
本文作者: 張莉 | 2018-08-10 10:04 |
雷鋒網(wǎng)消息,近日,中文少兒分級(jí)閱讀平臺(tái)“考拉閱讀”宣布完成2000萬(wàn)美金B(yǎng)輪融資。此次融資由GGV紀(jì)源資本和XVC共同領(lǐng)投,CMC華人文化產(chǎn)業(yè)基金跟投,原有投資人啟明創(chuàng)投超額跟投。安可資本擔(dān)任本輪融資獨(dú)家財(cái)務(wù)顧問(wèn)。
此次融資將主要用于考拉閱讀原創(chuàng)“中文分級(jí)閱讀系統(tǒng)ER Framework”的優(yōu)化升級(jí)、優(yōu)質(zhì)閱讀內(nèi)容的生產(chǎn)聚合及市場(chǎng)規(guī)模的擴(kuò)大。
考拉閱讀創(chuàng)始人、CEO趙梓淳強(qiáng)調(diào):“考拉閱讀完成本輪融資后,一方面將繼續(xù)加大在技術(shù)和研發(fā)上的投入,推進(jìn)與高校等研究機(jī)構(gòu)的進(jìn)一步合作;另一方面則會(huì)持續(xù)加大市場(chǎng)投入,開(kāi)展中學(xué)市場(chǎng)的推進(jìn),保持公司在中文分級(jí)閱讀領(lǐng)域的絕對(duì)領(lǐng)先優(yōu)勢(shì)?!?/p>
另外,據(jù)考拉閱讀透露,在近半年時(shí)間里,考拉閱讀的日活用戶(hù)增長(zhǎng)近百倍,全產(chǎn)品矩陣日活接近百萬(wàn),目前學(xué)生端次日次周及次月留存均高達(dá)70%以上,平均日停留時(shí)長(zhǎng)約30分鐘。
考拉閱讀創(chuàng)立于2016年9月,據(jù)介紹,考拉閱讀是全球首家提出“中文少兒分級(jí)閱讀”概念的創(chuàng)業(yè)公司,依托自主研發(fā),全球首創(chuàng)量化中文分級(jí)閱讀系統(tǒng) ER Framework,將中文文本按照難度進(jìn)行量化分級(jí),并匹配學(xué)生不同的閱讀能力,進(jìn)而提供個(gè)性化的閱讀內(nèi)容及語(yǔ)文學(xué)習(xí)解決方案。
雷鋒網(wǎng)注:中文分級(jí)閱讀系統(tǒng) ER Framework
分級(jí)閱讀的關(guān)鍵難點(diǎn)之一是“如何科學(xué)劃分文本的難度等級(jí)”。不同于西方印歐語(yǔ)系繁復(fù)的格標(biāo)記語(yǔ)法系統(tǒng),漢語(yǔ)語(yǔ)法過(guò)于靈活、意合語(yǔ)義相當(dāng)復(fù)雜等特點(diǎn)也讓分級(jí)閱讀的技術(shù)實(shí)現(xiàn)面臨嚴(yán)峻挑戰(zhàn),要想完成規(guī)模化的解決方案只能依賴(lài)于現(xiàn)代科學(xué)技術(shù)的發(fā)展。
據(jù)介紹,考拉閱讀歷時(shí)兩年,構(gòu)建起全球最大的中文分級(jí)底層語(yǔ)料庫(kù),結(jié)合語(yǔ)言學(xué),測(cè)量心理學(xué)以及深度神經(jīng)網(wǎng)絡(luò)為代表的前沿AI算法解決了這一難題。
據(jù)考拉閱讀CTO任易介紹,考拉閱讀的中文分級(jí)閱讀標(biāo)準(zhǔn)(ER Framework )借鑒了國(guó)外的“詞、句”的分析思想,基于ER Framework的分級(jí)閱讀標(biāo)準(zhǔn)在「詞」、「句」的基礎(chǔ)上再加入「字」、「段」、「篇」三個(gè)維度,即從「字詞句段篇」五大維度提取幾十個(gè)特征來(lái)表達(dá)中文的難度,并實(shí)現(xiàn)段落、主題等的分析。如在「字」其下還有常用性、構(gòu)形、組合性三個(gè)特征,「句」則有句法結(jié)構(gòu)、語(yǔ)義邏輯、修辭表達(dá)和嵌套深度四個(gè)特征等等。
“因?yàn)橹形牡牡木渥酉噍^英文要復(fù)雜得多,機(jī)器在理解中文的第一步就會(huì)遇到詞性分析、語(yǔ)言模型上的困難。所以,有賴(lài)于現(xiàn)在流行的AI技術(shù),如RNN、LSTM等深度學(xué)習(xí)技術(shù),可以彌補(bǔ)中文在NLP上的缺失。”任易表示,“現(xiàn)在我們可以做到,將一個(gè)句子按照句法樹(shù)、依賴(lài)關(guān)聯(lián)等予以拆解,以分析每一個(gè)成分在句子中的比重,從而實(shí)現(xiàn)閱讀文本的難度分級(jí)。”
去年此時(shí),考拉閱讀剛完成3000萬(wàn)的Pre-A輪融資。趙梓淳在接受雷鋒網(wǎng)專(zhuān)訪的時(shí)候表示,他們一共處理了幾百萬(wàn)字的非平衡語(yǔ)料庫(kù)和幾億字的平衡語(yǔ)料庫(kù)。
據(jù)悉,考拉閱讀相關(guān)技術(shù)和研究成果已申請(qǐng)多項(xiàng)專(zhuān)利和國(guó)家重大課題項(xiàng)目,并獲得北京大學(xué)、北京師范大學(xué)等權(quán)威機(jī)構(gòu)專(zhuān)家認(rèn)證,構(gòu)建了從工具到到內(nèi)容的完整閉環(huán)。
趙梓淳介紹,從技術(shù)方面來(lái)說(shuō),考拉閱讀打造了一個(gè)頂尖的科學(xué)家團(tuán)隊(duì),聯(lián)合創(chuàng)始人任易博士畢業(yè)于北京大學(xué),主攻數(shù)據(jù)挖掘方向,曾在 IBM Waston for Life Service 和微軟亞洲研究院工作;首席數(shù)據(jù)科學(xué)家顧問(wèn)趙俊博博士曾在 Facebook 從事研究工作,師從于機(jī)器學(xué)習(xí)頂尖學(xué)者、深度學(xué)習(xí)的奠基人之一 Yann LeCun 教授;首席閱讀測(cè)評(píng)科學(xué)家魏久喬畢業(yè)于北京大學(xué)和新加坡國(guó)立大學(xué)應(yīng)用語(yǔ)言學(xué)專(zhuān)業(yè),主要研究方向?yàn)檎J(rèn)知語(yǔ)言學(xué)及自然語(yǔ)言處理;首席語(yǔ)言學(xué)家李?lèi)?ài)萍則為北京大學(xué)的應(yīng)用語(yǔ)言學(xué)博士。
相關(guān)文章:
CNNIC最新報(bào)告:K12英語(yǔ)在線(xiàn)教育火爆,AI+教育驅(qū)動(dòng)產(chǎn)業(yè)升級(jí)
最具成長(zhǎng)性的AI+教育公司都有哪些特質(zhì)?| CCF-GAIR 2018
前有“老大哥”,后有“新勢(shì)力”,AI+教育江湖誰(shuí)主沉?。?/a>
考拉閱讀CEO趙梓淳:如何利用AI、語(yǔ)言學(xué)做出國(guó)內(nèi)首個(gè)中文分級(jí)閱讀系統(tǒng)?
雷峰網(wǎng)原創(chuàng)文章,未經(jīng)授權(quán)禁止轉(zhuǎn)載。詳情見(jiàn)轉(zhuǎn)載須知。