AI“解剖”語言又獲新技能！谷歌開源Parsey McParseface自然語言解析器

本文作者： Misty

2016-05-13 15:53

導(dǎo)語：這可是全球最精準(zhǔn)的自然語言解析器。

雖然現(xiàn)在的AI已經(jīng)發(fā)展到了相對成熟的地步，但是它仍不能識別和解析自然語言。而Google一直都在努力打造一套系統(tǒng)來幫助AI理解自然語言?，F(xiàn)在，Google在此領(lǐng)域的研究終于初見端倪。

近日，Google發(fā)布了開源的SyntaxNet自然語言神經(jīng)網(wǎng)絡(luò)框架，以幫助機(jī)器更好地理解自然語言。SyntaxNet中包括了Parsey McParseface，后者是一種專門用于“解剖”英語的語言解析器。Google稱之為世界上最準(zhǔn)確的語言解析器，并且已經(jīng)放出了允許人們借助自有數(shù)據(jù)來訓(xùn)練SyntaxNet的全部代碼。

SyntaxNet和Parsey McParseface都是自然語言理解（NLU）系統(tǒng)的一部分。給出一個句子，它就會將之分解成各種部分，比如名詞、動詞、形容詞。

對自然語言研究人員和需要這種應(yīng)用程序的人們來說，這款開源工具顯然會助力相關(guān)研究的爆發(fā)式發(fā)展。

據(jù)Google自述，經(jīng)過TensorFlow框架訓(xùn)練后的Parsey McParseface，是其出產(chǎn)的“最復(fù)雜的網(wǎng)絡(luò)”之一。

在某一測試中，他們發(fā)現(xiàn)該模型的準(zhǔn)確度超過94%——作為比較，訓(xùn)練有趣的語言學(xué)家的準(zhǔn)確率在96-97%左右——這表明該軟件的技能熟練度已與人類相當(dāng)。

看到這里，如果你對SyntaxNet的運(yùn)行方式還是不甚其解，那小編給大家一個比喻：Parsey 和SyntaxNet就像5歲孩子學(xué)習(xí)句法結(jié)構(gòu)一樣。

AI“解剖”語言又獲新技能！谷歌開源Parsey McParseface自然語言解析器

在上面這個句子中，“saw”是基本詞（動詞），”Alice”和”Bob”是非基本詞（名詞）。Paesey McParseface能正確地分析這一句子，也能理解下面這個更加復(fù)雜的例子：

AI“解剖”語言又獲新技能！谷歌開源Parsey McParseface自然語言解析器

Alice drove down the street in her car.

對于開發(fā)此自然語言神經(jīng)網(wǎng)絡(luò)框架的原因，Google是這樣回應(yīng)的：

解析語言最大的挑戰(zhàn)就是人類語言有很多歧義，一個正常長度的句子（20到30字）也許有上百、上千，甚至上萬中句法結(jié)構(gòu)。而要一個自然的語言解析過程就是掃描所有句法結(jié)構(gòu)，然后找出最合適的句法結(jié)構(gòu)。

而雖然Parsey McParseface 和 SyntaxNet看起來牛逼哄哄，但它并不是自然語言解析的最終方式，它只是GoogleAI語言解析的第一步。

Via:TNW

雷峰網(wǎng)原創(chuàng)文章，未經(jīng)授權(quán)禁止轉(zhuǎn)載。詳情見轉(zhuǎn)載須知。

1人收藏

相關(guān)文章

Misty

編輯

歡迎合作，歡迎來撩。微信號：Misty_Yoong

發(fā)私信

當(dāng)月熱門文章