2
本文作者: Misty | 2016-05-13 15:53 |
雖然現(xiàn)在的AI已經(jīng)發(fā)展到了相對成熟的地步,但是它仍不能識別和解析自然語言。而Google一直都在努力打造一套系統(tǒng)來幫助AI理解自然語言?,F(xiàn)在,Google在此領(lǐng)域的研究終于初見端倪。
近日,Google發(fā)布了開源的SyntaxNet自然語言神經(jīng)網(wǎng)絡(luò)框架,以幫助機(jī)器更好地理解自然語言。SyntaxNet中包括了Parsey McParseface,后者是一種專門用于“解剖”英語的語言解析器。Google稱之為世界上最準(zhǔn)確的語言解析器,并且已經(jīng)放出了允許人們借助自有數(shù)據(jù)來訓(xùn)練SyntaxNet的全部代碼。
SyntaxNet和Parsey McParseface都是自然語言理解(NLU)系統(tǒng)的一部分。給出一個句子,它就會將之分解成各種部分,比如名詞、動詞、形容詞。
對自然語言研究人員和需要這種應(yīng)用程序的人們來說,這款開源工具顯然會助力相關(guān)研究的爆發(fā)式發(fā)展。
據(jù)Google自述,經(jīng)過TensorFlow框架訓(xùn)練后的Parsey McParseface,是其出產(chǎn)的“最復(fù)雜的網(wǎng)絡(luò)”之一。
在某一測試中,他們發(fā)現(xiàn)該模型的準(zhǔn)確度超過94%——作為比較,訓(xùn)練有趣的語言學(xué)家的準(zhǔn)確率在96-97%左右——這表明該軟件的技能熟練度已與人類相當(dāng)。
看到這里,如果你對SyntaxNet的運(yùn)行方式還是不甚其解,那小編給大家一個比喻:Parsey 和SyntaxNet就像5歲孩子學(xué)習(xí)句法結(jié)構(gòu)一樣。
在上面這個句子中,“saw”是基本詞(動詞),”Alice”和”Bob”是非基本詞(名詞)。Paesey McParseface能正確地分析這一句子,也能理解下面這個更加復(fù)雜的例子:
Alice drove down the street in her car.
對于開發(fā)此自然語言神經(jīng)網(wǎng)絡(luò)框架的原因,Google是這樣回應(yīng)的:
解析語言最大的挑戰(zhàn)就是人類語言有很多歧義,一個正常長度的句子(20到30字)也許有上百、上千,甚至上萬中句法結(jié)構(gòu)。而要一個自然的語言解析過程就是掃描所有句法結(jié)構(gòu),然后找出最合適的句法結(jié)構(gòu)。
而雖然Parsey McParseface 和 SyntaxNet看起來牛逼哄哄,但它并不是自然語言解析的最終方式,它只是GoogleAI語言解析的第一步。
Via:TNW
雷峰網(wǎng)原創(chuàng)文章,未經(jīng)授權(quán)禁止轉(zhuǎn)載。詳情見轉(zhuǎn)載須知。