0
本文作者: 井三胖 | 2015-02-04 22:20 |
近幾年來,正是多虧了深度學(xué)習(xí)技術(shù)的蓬勃發(fā)展,人類在“識圖”領(lǐng)域獲得了可喜進(jìn)展。例如Google的“以圖搜圖”和Facebook的“人臉識別”功能,給網(wǎng)民們帶來了極大的便利。如今一家名為Clarifai公司正打算再次突破,這次他們借助于深度學(xué)習(xí)技術(shù),實(shí)現(xiàn)了視頻文件的識別。
公司表示,目前它們的軟件能夠快速分析視頻文件,并且識別出1萬種以上的物體或者場景。在上周,某個(gè)深度學(xué)習(xí)研討會上,Clarifai的聯(lián)合創(chuàng)始人兼CEO Matthew Zeiler上傳了一個(gè)包括含有阿爾卑斯山風(fēng)景的視頻文件,接下來便是見證奇跡的時(shí)刻:該軟件繪制出了一條縱向時(shí)間線,在不同的位置處標(biāo)志出了不同物體和場景出現(xiàn)的時(shí)間,例如它識別出了“雪”和“山”分別出現(xiàn)和共同出現(xiàn)的時(shí)間點(diǎn)。另外該軟件的視頻識別時(shí)間也是短于正常人類的觀看時(shí)間的,在這次的演示中,這段三分半鐘的視頻的識別過程只用了10秒鐘。
Clarifai公司計(jì)劃將這項(xiàng)技術(shù)打造成一整套服務(wù),比如說幫助用戶將廣告與在線視頻向配對,或者是成為組織、編輯視頻素材的工具。
深度學(xué)習(xí)的實(shí)現(xiàn)得益于類似“神經(jīng)元”搭建的網(wǎng)絡(luò)分析數(shù)據(jù)的過程,并且系統(tǒng)處理的實(shí)例數(shù)據(jù)越多,深度學(xué)習(xí)的能力便會愈加強(qiáng)大。值得一提的是,紐約大學(xué)的相關(guān)研究團(tuán)隊(duì)對Clarifai公司的技術(shù)實(shí)現(xiàn)做出了極大的貢獻(xiàn),并且Clarifai在2013年的一次高規(guī)格圖片識別軟件競賽中,獲得了前五名的好成績。
就像文章開頭所說的,現(xiàn)在深度學(xué)習(xí)領(lǐng)域的大多數(shù)研究仍然是著眼于圖片識別,而并非視頻。其實(shí)在去年Clarifai公司便已經(jīng)推出了靜止圖像識別服務(wù),另一家創(chuàng)業(yè)公司Dextro在去年12月底發(fā)布了視頻處理服務(wù)。
對于廣大熱心網(wǎng)友們而言,現(xiàn)在的一個(gè)好消息就是任何人都可以進(jìn)入到Clarifai官網(wǎng),免費(fèi)上傳10Mb以內(nèi)的視頻文件進(jìn)行數(shù)據(jù)分析?,F(xiàn)在軟件可以識別出汽車、樹木甚至是人,而且還能夠識別出感官性的場景氛圍,例如“快樂”或者是“團(tuán)聚”。
Zeiler額外補(bǔ)充道,這款軟件其實(shí)有額外的妙用,“它能夠識別并推論出,究竟在視頻文件的哪個(gè)節(jié)點(diǎn)上適合投放廣告。”簡單的解釋說,軟件能夠幫助視頻廣告更加精準(zhǔn)的投放,而不會與本身的視頻內(nèi)容產(chǎn)生較大的“違和感”。他相信,在特定的時(shí)段投放廣告對廣告主來說,無疑有著極大的吸引力。舉個(gè)例子來說,借助于Clarifai的軟件,星巴克的廣告會在在線偶像劇中男女主角于咖啡廳約會之時(shí),神不知鬼不覺的出現(xiàn)在頁面中。
另外,Zeiler表示公司也正在嘗試與一些有意使用該技術(shù)的公司展開合作。該軟件的功能仍然在不斷完善中,主要的兩個(gè)方向是:自動總結(jié)視頻內(nèi)容以及識別出在視頻中的特定時(shí)間點(diǎn)發(fā)生了什么特殊活動。
via technologyreview
雷峰網(wǎng)原創(chuàng)文章,未經(jīng)授權(quán)禁止轉(zhuǎn)載。詳情見轉(zhuǎn)載須知。