借助Clarifai的深度學(xué)習電腦也能看懂視頻了

本文作者：井三胖

2015-02-04 22:20

導(dǎo)語：Clarifai公司的軟件能夠快速分析視頻文件，并且識別出1萬種以上的物體或者場景，例如汽車、樹木甚至是人，而且還能夠識別出感官性的場景氛圍，例如“快樂”或者是“團聚”。

近幾年來，正是多虧了深度學(xué)習技術(shù)的蓬勃發(fā)展，人類在“識圖”領(lǐng)域獲得了可喜進展。例如Google的“以圖搜圖”和Facebook的“人臉識別”功能，給網(wǎng)民們帶來了極大的便利。如今一家名為Clarifai公司正打算再次突破，這次他們借助于深度學(xué)習技術(shù)，實現(xiàn)了視頻文件的識別。

公司表示，目前它們的軟件能夠快速分析視頻文件，并且識別出1萬種以上的物體或者場景。在上周，某個深度學(xué)習研討會上，Clarifai的聯(lián)合創(chuàng)始人兼CEO Matthew Zeiler上傳了一個包括含有阿爾卑斯山風景的視頻文件，接下來便是見證奇跡的時刻：該軟件繪制出了一條縱向時間線，在不同的位置處標志出了不同物體和場景出現(xiàn)的時間，例如它識別出了“雪”和“山”分別出現(xiàn)和共同出現(xiàn)的時間點。另外該軟件的視頻識別時間也是短于正常人類的觀看時間的，在這次的演示中，這段三分半鐘的視頻的識別過程只用了10秒鐘。

Clarifai公司計劃將這項技術(shù)打造成一整套服務(wù)，比如說幫助用戶將廣告與在線視頻向配對，或者是成為組織、編輯視頻素材的工具。

深度學(xué)習的實現(xiàn)得益于類似“神經(jīng)元”搭建的網(wǎng)絡(luò)分析數(shù)據(jù)的過程，并且系統(tǒng)處理的實例數(shù)據(jù)越多，深度學(xué)習的能力便會愈加強大。值得一提的是，紐約大學(xué)的相關(guān)研究團隊對Clarifai公司的技術(shù)實現(xiàn)做出了極大的貢獻，并且Clarifai在2013年的一次高規(guī)格圖片識別軟件競賽中，獲得了前五名的好成績。

就像文章開頭所說的，現(xiàn)在深度學(xué)習領(lǐng)域的大多數(shù)研究仍然是著眼于圖片識別，而并非視頻。其實在去年Clarifai公司便已經(jīng)推出了靜止圖像識別服務(wù)，另一家創(chuàng)業(yè)公司Dextro在去年12月底發(fā)布了視頻處理服務(wù)。

對于廣大熱心網(wǎng)友們而言，現(xiàn)在的一個好消息就是任何人都可以進入到Clarifai官網(wǎng)，免費上傳10Mb以內(nèi)的視頻文件進行數(shù)據(jù)分析。現(xiàn)在軟件可以識別出汽車、樹木甚至是人，而且還能夠識別出感官性的場景氛圍，例如“快樂”或者是“團聚”。

Zeiler額外補充道，這款軟件其實有額外的妙用，“它能夠識別并推論出，究竟在視頻文件的哪個節(jié)點上適合投放廣告。”簡單的解釋說，軟件能夠幫助視頻廣告更加精準的投放，而不會與本身的視頻內(nèi)容產(chǎn)生較大的“違和感”。他相信，在特定的時段投放廣告對廣告主來說，無疑有著極大的吸引力。舉個例子來說，借助于Clarifai的軟件，星巴克的廣告會在在線偶像劇中男女主角于咖啡廳約會之時，神不知鬼不覺的出現(xiàn)在頁面中。

另外，Zeiler表示公司也正在嘗試與一些有意使用該技術(shù)的公司展開合作。該軟件的功能仍然在不斷完善中，主要的兩個方向是：自動總結(jié)視頻內(nèi)容以及識別出在視頻中的特定時間點發(fā)生了什么特殊活動。

via technologyreview

雷峰網(wǎng)原創(chuàng)文章，未經(jīng)授權(quán)禁止轉(zhuǎn)載。詳情見轉(zhuǎn)載須知。

0人收藏

相關(guān)文章

井三胖

性別男

我酷斃了嗎？

發(fā)私信

當月熱門文章

借助Clarifai的深度學(xué)習 電腦也能看懂視頻了

借助Clarifai的深度學(xué)習電腦也能看懂視頻了