0
本文作者: 井三胖 | 2015-02-04 22:20 |
近幾年來,正是多虧了深度學習技術的蓬勃發(fā)展,人類在“識圖”領域獲得了可喜進展。例如Google的“以圖搜圖”和Facebook的“人臉識別”功能,給網(wǎng)民們帶來了極大的便利。如今一家名為Clarifai公司正打算再次突破,這次他們借助于深度學習技術,實現(xiàn)了視頻文件的識別。
公司表示,目前它們的軟件能夠快速分析視頻文件,并且識別出1萬種以上的物體或者場景。在上周,某個深度學習研討會上,Clarifai的聯(lián)合創(chuàng)始人兼CEO Matthew Zeiler上傳了一個包括含有阿爾卑斯山風景的視頻文件,接下來便是見證奇跡的時刻:該軟件繪制出了一條縱向時間線,在不同的位置處標志出了不同物體和場景出現(xiàn)的時間,例如它識別出了“雪”和“山”分別出現(xiàn)和共同出現(xiàn)的時間點。另外該軟件的視頻識別時間也是短于正常人類的觀看時間的,在這次的演示中,這段三分半鐘的視頻的識別過程只用了10秒鐘。
Clarifai公司計劃將這項技術打造成一整套服務,比如說幫助用戶將廣告與在線視頻向配對,或者是成為組織、編輯視頻素材的工具。
深度學習的實現(xiàn)得益于類似“神經(jīng)元”搭建的網(wǎng)絡分析數(shù)據(jù)的過程,并且系統(tǒng)處理的實例數(shù)據(jù)越多,深度學習的能力便會愈加強大。值得一提的是,紐約大學的相關研究團隊對Clarifai公司的技術實現(xiàn)做出了極大的貢獻,并且Clarifai在2013年的一次高規(guī)格圖片識別軟件競賽中,獲得了前五名的好成績。
就像文章開頭所說的,現(xiàn)在深度學習領域的大多數(shù)研究仍然是著眼于圖片識別,而并非視頻。其實在去年Clarifai公司便已經(jīng)推出了靜止圖像識別服務,另一家創(chuàng)業(yè)公司Dextro在去年12月底發(fā)布了視頻處理服務。
對于廣大熱心網(wǎng)友們而言,現(xiàn)在的一個好消息就是任何人都可以進入到Clarifai官網(wǎng),免費上傳10Mb以內(nèi)的視頻文件進行數(shù)據(jù)分析。現(xiàn)在軟件可以識別出汽車、樹木甚至是人,而且還能夠識別出感官性的場景氛圍,例如“快樂”或者是“團聚”。
Zeiler額外補充道,這款軟件其實有額外的妙用,“它能夠識別并推論出,究竟在視頻文件的哪個節(jié)點上適合投放廣告。”簡單的解釋說,軟件能夠幫助視頻廣告更加精準的投放,而不會與本身的視頻內(nèi)容產(chǎn)生較大的“違和感”。他相信,在特定的時段投放廣告對廣告主來說,無疑有著極大的吸引力。舉個例子來說,借助于Clarifai的軟件,星巴克的廣告會在在線偶像劇中男女主角于咖啡廳約會之時,神不知鬼不覺的出現(xiàn)在頁面中。
另外,Zeiler表示公司也正在嘗試與一些有意使用該技術的公司展開合作。該軟件的功能仍然在不斷完善中,主要的兩個方向是:自動總結視頻內(nèi)容以及識別出在視頻中的特定時間點發(fā)生了什么特殊活動。
via technologyreview
雷峰網(wǎng)原創(chuàng)文章,未經(jīng)授權禁止轉(zhuǎn)載。詳情見轉(zhuǎn)載須知。