0
雷鋒網(wǎng)會于7月中旬在深圳舉辦全球人工智能與機器人峰會,屆時我們會發(fā)布一個年度Top 25人工智能項目榜單,目前,我們正在四處拜訪人工智能領(lǐng)域相關(guān)的業(yè)者。最近關(guān)于圖像識別這一塊,我們拜訪了若干公司,圖普科技是其中一家。如果你也想挑戰(zhàn)榜單中的公司,郵件聯(lián)系zhangxian#leiphone.com。
在讓計算機理解世界上,或許理解了什么并不重要,重要的是理解的能力。于是圖普科技想到讓它理解“小黃圖”。
圖普是一家圖像識別云服務(wù)公司,接入它的API,上傳圖片,服務(wù)器就能以一定的準確性解讀圖片。圖普告訴雷鋒網(wǎng),其產(chǎn)品包括圖像審核、増值及搜索,有鑒黃、人臉識別、場景識別等數(shù)十個模塊,目前日均處理3億張圖片,是國內(nèi)最大的圖像識別云服務(wù)公司。
不過圖普最知名的還是鑒別“小黃圖”,圖像視頻審核也是現(xiàn)在最主要的服務(wù),客戶包括受不良信息困擾的迅雷,和我老公思聰投過的直播平臺17等。
圖片來自圖普官網(wǎng)截圖
鑒別小黃圖聽起來像是個苦力活,但與其它類型的圖像一樣,用的也是深度學(xué)習(xí)技術(shù)。自誕生以來,深度學(xué)習(xí)已經(jīng)在計算機視覺和語音識別等領(lǐng)域展現(xiàn)了顯著的效果,其中在圖像識別的精確度上甚至超過了人類。雷鋒網(wǎng)與數(shù)位業(yè)內(nèi)人士交流中得知,深度學(xué)習(xí)可以說降低了機器學(xué)習(xí)的門檻。傳統(tǒng)的機器學(xué)習(xí)算法,如Boosting和SVM,在模式識別中要設(shè)計很多特征,這需要大量經(jīng)驗和技術(shù)積累。而深度學(xué)習(xí)在自動提取特征上有極大優(yōu)越性,輸入原始數(shù)據(jù),它能自行提取特征,不用人為設(shè)計,這讓圖像識別更多變成了工程問題。
創(chuàng)始人李明強告訴雷鋒網(wǎng),圖普的優(yōu)勢體現(xiàn)在工程及數(shù)據(jù)兩方面。雖然深度學(xué)習(xí)降低了技術(shù)門檻,但產(chǎn)品化過程中還會出現(xiàn)硬件與服務(wù)器不兼容,硬件配置與架構(gòu)搭建上的困難,以及響應(yīng)速度等問題。直播強調(diào)的是即時性,所以視頻審核也要做到毫秒級,如果一不小心沒審出來,主播們就要大白于天下了。圖普日均處理3億張圖片,用的是基于大規(guī)模GPU集群的超算平臺。李明強2012年前曾在騰訊工作七年,任QQ郵箱技術(shù)負責(zé)人,也是微信立項創(chuàng)始人之一,兩者都有海量數(shù)據(jù)需要處理。
對人工智能企業(yè)來說,數(shù)據(jù)是一個很大的門檻。數(shù)據(jù)越多,分析的準確度就越高;而準確度高又能吸引更多用戶,得到更多數(shù)據(jù)。圖普表示,與國內(nèi)主流的直播和短視頻平臺,如17、風(fēng)云直播、小咖秀等都有合作,接入的數(shù)據(jù)多,覆蓋全面。
李明強 / 圖片來自圖普科技
做到這一點的前提是找到方向和需求。圖普在做內(nèi)容審核前嘗試的方向是拍照搜衣,即給身上的衣服拍張照,到淘寶搜同款。但搜衣服務(wù)需求及盈利空間不大,而且搜同款用關(guān)鍵詞或許效果更好。后來由于快播事件,他們發(fā)現(xiàn)內(nèi)容審核對很多社交及云平臺都是剛需,才做起了鑒別小黃圖。
不過鑒黃并不是圖普的目標(biāo)。也許是繼承了騰訊的基因,李明強給圖普的定位是給視頻時代建立連接。在文字時代,只有對文字理解后才有搜索,才有內(nèi)容間的連接。同樣,圖像和視頻被計算機理解后,才能形成內(nèi)容間的連接。
現(xiàn)在視頻和圖像逐漸成為主要內(nèi)容和新的描述方式,推薦卻還是以“看了的人還喜歡”這種方式為主,而非基于視頻的內(nèi)容。如果計算機看懂了視頻,那推薦的理由就會變成類型,風(fēng)格,甚至是故事結(jié)構(gòu)了。
目前以鑒黃為代表,計算機可以識別人、物與場景,但對它們之前關(guān)系的理解還不夠深入。李明強認為,根據(jù)內(nèi)容進行推薦、搜索,提供差異化服務(wù),視頻行業(yè)才算到了第二階段,目前的審核服務(wù)是為了滿足基礎(chǔ)需求,技術(shù)成熟后會提供廣告投放和導(dǎo)購等增值服務(wù)。
看來,鑒別小黃圖還只是開始。
雷峰網(wǎng)原創(chuàng)文章,未經(jīng)授權(quán)禁止轉(zhuǎn)載。詳情見轉(zhuǎn)載須知。