丁香五月天婷婷久久婷婷色综合91|国产传媒自偷自拍|久久影院亚洲精品|国产欧美VA天堂国产美女自慰视屏|免费黄色av网站|婷婷丁香五月激情四射|日韩AV一区二区中文字幕在线观看|亚洲欧美日本性爱|日日噜噜噜夜夜噜噜噜|中文Av日韩一区二区

您正在使用IE低版瀏覽器,為了您的雷峰網(wǎng)賬號(hào)安全和更好的產(chǎn)品體驗(yàn),強(qiáng)烈建議使用更快更安全的瀏覽器
此為臨時(shí)鏈接,僅用于文章預(yù)覽,將在時(shí)失效
業(yè)界專(zhuān)題 正文
發(fā)私信給趙小瑾
發(fā)送

0

將文學(xué)問(wèn)題變成數(shù)學(xué)問(wèn)題,Google的”看圖說(shuō)話“是這樣實(shí)現(xiàn)的

本文作者: 趙小瑾 2014-12-03 00:00
導(dǎo)語(yǔ):將一種語(yǔ)言翻譯成另一種,一直是一個(gè)艱巨的任務(wù)。但近年來(lái),Google已經(jīng)通過(guò)開(kāi)發(fā)機(jī)器翻譯算法使這種情況發(fā)生了改變,而如今,Google正在用同樣的機(jī)器學(xué)習(xí)技術(shù)來(lái)將圖片“翻譯”為文字,也許有一天,它就能看圖說(shuō)話,給我們講個(gè)故事了。

將文學(xué)問(wèn)題變成數(shù)學(xué)問(wèn)題,Google的”看圖說(shuō)話“是這樣實(shí)現(xiàn)的

將一種語(yǔ)言翻譯成另一種,一直是一個(gè)艱巨的任務(wù),Google已經(jīng)通過(guò)開(kāi)發(fā)機(jī)器翻譯算法使這種情況發(fā)生了改變,用Google翻譯改變了跨文化交流的本質(zhì)。而今,Google正在用同樣的機(jī)器學(xué)習(xí)技術(shù)來(lái)將圖片“翻譯”為文字,研究成果是一個(gè)可以自動(dòng)給圖片生成說(shuō)明文字的系統(tǒng)Neural Image Caption,所得的文字能夠準(zhǔn)確地描述出圖片的內(nèi)容。研究成果將有助于搜索引擎,以及幫助視障人士上網(wǎng)。

語(yǔ)言翻譯的常規(guī)方法是一個(gè)迭代過(guò)程,從翻譯單個(gè)單詞開(kāi)始,然后將詞和短語(yǔ)進(jìn)行重新排序,從而改進(jìn)翻譯。但近年來(lái),Google已經(jīng)研究出來(lái)了應(yīng)如何利用其龐大的搜索數(shù)據(jù)庫(kù),用一種全新的方式來(lái)翻譯文本。

該方法本質(zhì)上是計(jì)算字詞出現(xiàn)于其他字詞周?chē)蛘吒浇念l率,然后將這些詞定義在抽象的矢量空間中。如此一來(lái),每個(gè)字詞都由一個(gè)矢量代替,句子就由矢量的組合代替。

Google繼續(xù)做出一個(gè)重要的假設(shè)。在任何語(yǔ)言中,特定的字詞之間的關(guān)系不變。例如,矢量“國(guó)王–男人+女人=女王”成立于任何語(yǔ)言之中。

這就使得語(yǔ)言翻譯變?yōu)榱艘粋€(gè)矢量空間數(shù)學(xué)問(wèn)題。Google翻譯通過(guò)將句子轉(zhuǎn)化為矢量,再用矢量來(lái)生成另一門(mén)語(yǔ)言中意義相同的句子,從而實(shí)現(xiàn)語(yǔ)言的翻譯。

現(xiàn)在,Google的Oriol Vinyals和他的小伙伴們正在用類(lèi)似的方法將圖片轉(zhuǎn)化為文字。他們采用的技術(shù),是用神經(jīng)網(wǎng)絡(luò)來(lái)研究有著十萬(wàn)張圖片和配套圖片說(shuō)明的數(shù)據(jù)庫(kù),然后學(xué)著如何將圖片的內(nèi)容進(jìn)行分類(lèi)。

但他們的算法產(chǎn)生的是代表字詞關(guān)系的矢量,而不是一組描述圖片的字詞。這種矢量可以嵌入到Google現(xiàn)有的翻譯算法當(dāng)中,從而用英語(yǔ)或者其他語(yǔ)言產(chǎn)出圖片說(shuō)明。事實(shí)上,Google的機(jī)器學(xué)習(xí)方法已經(jīng)學(xué)會(huì)了將圖片“翻譯”成文字。

為了測(cè)試這種方法的有效性,他們讓從亞馬遜Mechanical Turk招募而來(lái)的人評(píng)估了以這種方式自動(dòng)生成的圖片說(shuō)明,以其他方式生成的說(shuō)明,以及人工寫(xiě)的圖片說(shuō)明。

結(jié)果表明,新系統(tǒng)運(yùn)轉(zhuǎn)良好,使用PASCAL圖片數(shù)據(jù)庫(kù)測(cè)試,它的表現(xiàn)明顯優(yōu)于其他自動(dòng)生成的方法,取得了59分,而目前最先進(jìn)的其他技術(shù)只有25分,人工寫(xiě)成的69分。

這個(gè)結(jié)果已經(jīng)不錯(cuò)了,并且隨著訓(xùn)練數(shù)據(jù)庫(kù)規(guī)模的增加,表現(xiàn)也會(huì)越來(lái)越好。顯然,這又回到了另一個(gè)問(wèn)題,人類(lèi)優(yōu)于機(jī)器的日子,是不是屈指可數(shù)了?

via mit

雷峰網(wǎng)原創(chuàng)文章,未經(jīng)授權(quán)禁止轉(zhuǎn)載。詳情見(jiàn)轉(zhuǎn)載須知。

分享:
相關(guān)文章
當(dāng)月熱門(mén)文章
最新文章
請(qǐng)?zhí)顚?xiě)申請(qǐng)人資料
姓名
電話
郵箱
微信號(hào)
作品鏈接
個(gè)人簡(jiǎn)介
為了您的賬戶安全,請(qǐng)驗(yàn)證郵箱
您的郵箱還未驗(yàn)證,完成可獲20積分喲!
請(qǐng)驗(yàn)證您的郵箱
立即驗(yàn)證
完善賬號(hào)信息
您的賬號(hào)已經(jīng)綁定,現(xiàn)在您可以設(shè)置密碼以方便用郵箱登錄
立即設(shè)置 以后再說(shuō)