1
本文作者: Travis | 2014-09-09 18:50 |
近日,谷歌通過官方博客,介紹了圖像識別領(lǐng)域取得的一些重大進展。這個識別技術(shù)最早是在ImageNet計算機視覺挑戰(zhàn)比賽(ILSVRC)上展示。ImageNet視覺識別挑戰(zhàn)每年舉辦一次,旨在發(fā)現(xiàn)更好的圖像技術(shù),尤其是物體識別和鎖定這兩方面。目前主要的參賽者來自于學術(shù)機構(gòu)和實驗室。
在今年的比賽里面,隸屬于Google的GoogLeNet團隊刷新了“分類和偵測”記錄,其精度比去年的記錄提升了兩倍。目前他們已經(jīng)把這個項目公開,希望能夠邀請更多人來參與其中,借此來加速項目的發(fā)展。
這個挑戰(zhàn)遵循三個步驟:分類、分類并鎖定以及偵測。分類主要是測試所選用的算法是否可以正確的給圖片中的物體貼上相應的標簽。分類并鎖定主要是測試算法在圖像識別和鎖定潛在物體上的能力。偵測和第二個步驟比較類似,但是這個環(huán)節(jié)會使用更加苛刻的評估標準,所使用的圖像包含了很多非常細小的物體。在偵測環(huán)節(jié)中,性能優(yōu)越的圖像識別技術(shù)是可以在復雜場景中精準鎖定和識別物體的。
Google的物體識別圖像技術(shù)涉及到神經(jīng)網(wǎng)絡技術(shù)和深度學習技術(shù)。該系統(tǒng)在無需龐大計算資源支撐的背景下,能夠?qū)ψR別物體的標準進行優(yōu)化和微調(diào),并最終識別出物體。從谷歌發(fā)布的照片中我們可以看出,目前這項技術(shù)可以識別出我們常見的物體,比如寵物貓、雞蛋、香蕉、橘子、電視機、顯示器、書架等。
這個技術(shù)目前還處于早期研發(fā)階段,隨著這個技術(shù)的進步與成熟,我們將可以用上更好的圖像識別技術(shù)。這個技術(shù)也可以直接對接到Google旗下的一些產(chǎn)品和服務,例如圖片搜索、YouTube、自動駕駛技術(shù)以及有必要使用圖像識別技術(shù)的領(lǐng)域。
via googleresearch
雷峰網(wǎng)原創(chuàng)文章,未經(jīng)授權(quán)禁止轉(zhuǎn)載。詳情見轉(zhuǎn)載須知。