2
本文作者: Misty | 2016-05-13 15:53 |
雖然現(xiàn)在的AI已經(jīng)發(fā)展到了相對(duì)成熟的地步,但是它仍不能識(shí)別和解析自然語(yǔ)言。而Google一直都在努力打造一套系統(tǒng)來(lái)幫助AI理解自然語(yǔ)言?,F(xiàn)在,Google在此領(lǐng)域的研究終于初見端倪。
近日,Google發(fā)布了開源的SyntaxNet自然語(yǔ)言神經(jīng)網(wǎng)絡(luò)框架,以幫助機(jī)器更好地理解自然語(yǔ)言。SyntaxNet中包括了Parsey McParseface,后者是一種專門用于“解剖”英語(yǔ)的語(yǔ)言解析器。Google稱之為世界上最準(zhǔn)確的語(yǔ)言解析器,并且已經(jīng)放出了允許人們借助自有數(shù)據(jù)來(lái)訓(xùn)練SyntaxNet的全部代碼。
SyntaxNet和Parsey McParseface都是自然語(yǔ)言理解(NLU)系統(tǒng)的一部分。給出一個(gè)句子,它就會(huì)將之分解成各種部分,比如名詞、動(dòng)詞、形容詞。
對(duì)自然語(yǔ)言研究人員和需要這種應(yīng)用程序的人們來(lái)說(shuō),這款開源工具顯然會(huì)助力相關(guān)研究的爆發(fā)式發(fā)展。
據(jù)Google自述,經(jīng)過(guò)TensorFlow框架訓(xùn)練后的Parsey McParseface,是其出產(chǎn)的“最復(fù)雜的網(wǎng)絡(luò)”之一。
在某一測(cè)試中,他們發(fā)現(xiàn)該模型的準(zhǔn)確度超過(guò)94%——作為比較,訓(xùn)練有趣的語(yǔ)言學(xué)家的準(zhǔn)確率在96-97%左右——這表明該軟件的技能熟練度已與人類相當(dāng)。
看到這里,如果你對(duì)SyntaxNet的運(yùn)行方式還是不甚其解,那小編給大家一個(gè)比喻:Parsey 和SyntaxNet就像5歲孩子學(xué)習(xí)句法結(jié)構(gòu)一樣。
在上面這個(gè)句子中,“saw”是基本詞(動(dòng)詞),”Alice”和”Bob”是非基本詞(名詞)。Paesey McParseface能正確地分析這一句子,也能理解下面這個(gè)更加復(fù)雜的例子:
Alice drove down the street in her car.
對(duì)于開發(fā)此自然語(yǔ)言神經(jīng)網(wǎng)絡(luò)框架的原因,Google是這樣回應(yīng)的:
解析語(yǔ)言最大的挑戰(zhàn)就是人類語(yǔ)言有很多歧義,一個(gè)正常長(zhǎng)度的句子(20到30字)也許有上百、上千,甚至上萬(wàn)中句法結(jié)構(gòu)。而要一個(gè)自然的語(yǔ)言解析過(guò)程就是掃描所有句法結(jié)構(gòu),然后找出最合適的句法結(jié)構(gòu)。
而雖然Parsey McParseface 和 SyntaxNet看起來(lái)牛逼哄哄,但它并不是自然語(yǔ)言解析的最終方式,它只是GoogleAI語(yǔ)言解析的第一步。
Via:TNW
雷峰網(wǎng)原創(chuàng)文章,未經(jīng)授權(quán)禁止轉(zhuǎn)載。詳情見轉(zhuǎn)載須知。