1
本文作者: 劉芳平 | 2016-10-27 18:14 |
機器如何懂時尚?這是碼隆科技上一款產(chǎn)品希望解決的問題,那一次他們推出了StyleAI,希望用圖像識別結(jié)合深度學習來破解時尚密碼。
10月24日,該公司更進一步,推出ProductAI,將AI做成一項云服務,希望讓沒有AI技術能力的公司也能利用這一全新技術。同時還宣布獲得6200萬A輪融資,目前該公司員工人數(shù)還不到30人。
StyleAI是一項AI的具體應用,而此次推出的ProductAI則是一款企業(yè)端產(chǎn)品,具體來說它是一項PaaS(Platform-as-a-Service)服務,開發(fā)者可通過調(diào)用其接口來獲得人工智能服務。
ProductAI背后的兩項核心技術分別是“以圖搜圖”和“圖像識別”,它可以理解圖片“表達了什么意思”,還可以對圖片進行分類、處理、標注,實現(xiàn)更多應用。
在發(fā)布會現(xiàn)場,碼隆的程序員演示了用5分鐘時間在ProductAI平臺上搭建一個定制化的以圖搜圖引擎。
其收費模式也和一般的云服務類似,按照API接口調(diào)用量來收費,通常在千次10元左右,取決于調(diào)用的API和使用總量。目前ProductAI的客戶包括中國紡織信息中心、視覺中國、微軟在線暴風影音等 。
人工智能并不是一項解決所有問題的技術,它更適合在某個非常細分的領域發(fā)揮自己的功能。下面是ProductAI提供的一些主要功能。
假設你拍下了一張照片,照片中有麥當勞、公交車、老人、楊樹、白云、藍天,那么,ProductAI可以精準的將照片中的元素識別出來。比如下面這張圖片中,ProductAI將所有13輛汽車都識別出來。
ProductAI可以“以圖搜圖”,識別目標圖片中的類似場景。下圖是根據(jù)城堡圖片,搜索出的類似圖片。
ProductAI可以為海量的圖片自動打標簽,通過綜合識別模型,挖掘出語義信息并用文字標簽的形式將這些信息表達出來??山庾x的信息包括圖片中的客觀內(nèi)容(老人、樹、音樂廳等)、主觀感受(積極、成功、快樂等)、內(nèi)容衍生主題(健康生活方式、家庭等)、圖片顏色(彩色、黑白等)、圖片產(chǎn)生方式(攝影、剪貼畫等)、拍攝手法(剪影、留白、逆光等)等。
AI不是搜索引擎,但在很多層面和搜索引擎類似。在之前接受雷鋒網(wǎng)采訪時,碼隆科技的聯(lián)合創(chuàng)始人Matt Scott解釋了讓機器認識時尚的背后技術,
首先,我們從網(wǎng)絡上收集關于時尚的海量數(shù)據(jù),找出一些已經(jīng)存在時尚標簽的內(nèi)容(比如這張圖片是某位時尚明星的著裝照);然后,我們創(chuàng)造一個模型來分析這些數(shù)據(jù),用海量的數(shù)據(jù)來訓練它,使它能夠理解圖片的色彩、紋理和Style,同時還有一小部分人可以幫忙給數(shù)據(jù)貼上標簽;總的來說就是用類似搜索引擎的數(shù)據(jù)加上很強大的AI模型,收集數(shù)據(jù)并分析這里面的時尚視覺元素。
之后,我們會把分析的結(jié)果,比如版型、類別和衣服之間的關聯(lián)等提取出來,去匹配你的模型和喜好。
最后的產(chǎn)品,是一款可以了解用戶想要什么的個性化時尚工具。這其中AI的部分,主要就是通過深度學習構(gòu)建起來的可以自我學習的模型,并用數(shù)據(jù)去訓練這個模型。
而ProductAI是面向各種不同用戶定制化的AI服務,在不同的應用場景中,它需要勝任不同的任務,這意味著深度學習的模型也是不同的。
一個深度學習的模型,適用于某一個任務。就好像一個人,他去上大學,學的是中文?還是物理?還是建筑,大腦里面的結(jié)構(gòu)是不同的,這個不同是知識上有不同。那我們呢?就相當于要構(gòu)建一個這樣結(jié)構(gòu)的大腦,去適應相應的任務,就好像不同的人有不同的專業(yè)一樣。
Matt解釋道。
Matt告訴我們,在構(gòu)建特別的AI應用中時,一共有四個步驟:
首先是研究問題,明確我們需要解決的問題是什么,希望得到什么答案;
接著,建立適用于這個問題的神經(jīng)網(wǎng)絡架構(gòu);
然后,用海量的數(shù)據(jù)來訓練這個架構(gòu);
最后,如果沒有解決問題,再回去改。
碼隆科技與中國紡織信息中心的合作就是一個例子,需要解決的問題是識別面料,碼隆設計出一個神經(jīng)網(wǎng)絡架構(gòu),再利用中國紡織信息中心大量的面料圖像來訓練這個架構(gòu),最后得到的就是一款可以智能識別服裝面料的工具。
這里面架構(gòu)的好壞,數(shù)據(jù)的好壞與多寡都會影響最終工具的性能。碼隆科技表示,ProductAI平臺的圖像分類和識別度匹配識別能力比專業(yè)人員還高8%,顯示其在人工智能方面的技術實力。
碼隆科技創(chuàng)立于2014年7月,兩位創(chuàng)始人黃鼎?。–EO)和Matt Scott(CTO),一位是中國人一位是美國人,兩人曾在微軟共同合作“必應詞典”系列產(chǎn)品。
雷峰網(wǎng)原創(chuàng)文章,未經(jīng)授權禁止轉(zhuǎn)載。詳情見轉(zhuǎn)載須知。