0
本文作者: 陳彩嫻 | 2021-11-12 16:52 |
10月中旬,AI科技評(píng)論報(bào)道了《虛擬在左,真實(shí)在右:德國(guó)學(xué)者用AI合成一億像素逼真3D圖像,可任意旋轉(zhuǎn)》一文,有技術(shù)愛(ài)好者感嘆:
「原來(lái)計(jì)算機(jī)視覺(jué)也還沒(méi)有內(nèi)卷到無(wú)可救藥的地步。借助計(jì)算機(jī)圖形學(xué)與其他學(xué)科知識(shí),計(jì)算機(jī)視覺(jué)的發(fā)展也有望取得進(jìn)一步突破,更上一層樓?!?/p>
事實(shí)上,除了研究成果的創(chuàng)新,計(jì)算機(jī)視覺(jué)的商業(yè)落地也一直是產(chǎn)學(xué)研三界的熱門(mén)話題。長(zhǎng)久以來(lái),人們也一直對(duì)計(jì)算機(jī)視覺(jué)存在或多或少的誤解,其中一個(gè)最常見(jiàn)的問(wèn)號(hào)是:除了人臉識(shí)別,這項(xiàng)技術(shù)還有什么用?
在決策智能的話術(shù)逐漸占領(lǐng)傳播的高地后,感知智能的聲音開(kāi)始減弱。與此同時(shí),隨著「AI寒冬」的輿論對(duì)深度學(xué)習(xí)的批判,基于神經(jīng)網(wǎng)絡(luò)的視覺(jué)研究在商業(yè)前景上也跟著被「唱衰」,一度成為槍口的正中點(diǎn)。
不過(guò),決定創(chuàng)業(yè)的賈佳亞并不太在意這一點(diǎn)。2019年年底,從騰訊離職的他,在香港科技園創(chuàng)立思謀科技,宣布進(jìn)場(chǎng),沒(méi)多久就完成了IDG資本領(lǐng)投的數(shù)千萬(wàn)美元融資。今年6月,思謀科技又獲得2億美元的B輪融資,人員規(guī)模也在一年內(nèi)從最初的個(gè)位數(shù)擴(kuò)展到超過(guò)600人。
計(jì)算機(jī)視覺(jué)領(lǐng)域頂尖專(zhuān)家、IEEE Fellow、香港中文大學(xué)終身教授等頭銜,無(wú)疑為之加持,但無(wú)論是賈佳亞本人,亦或外界,都認(rèn)為思謀能在AI落地的急流中「站穩(wěn)腳跟」,除了深厚的技術(shù)積累,也離不開(kāi)正確的賽道:工業(yè)制造。
沈小勇是最早跟隨賈佳亞創(chuàng)業(yè)的學(xué)生之一。他對(duì)AI科技評(píng)論表示:「我認(rèn)為思謀科技不是一家AI公司,而是一家『工業(yè)制造+AI』的公司」。換言之,思謀科技的模式不是「AI+」,而是「X+AI」,其中的「X」,就是行業(yè)。
比如,他們發(fā)現(xiàn),在他們與國(guó)際頭部光學(xué)廠商合作的鏡片隱形二維碼識(shí)別項(xiàng)目中,最大的「助攻技能」竟然不是超強(qiáng)的算法,而是光學(xué)系統(tǒng)的設(shè)計(jì)。這個(gè)在計(jì)算機(jī)視覺(jué)領(lǐng)域有多年積累的創(chuàng)業(yè)團(tuán)隊(duì),也不得不面臨的「心理落差」是:要取得客戶的信任,除了算法能力,還要打好行業(yè)根基。
1、入場(chǎng)
公元二零二零年十二月,廣州黃埔區(qū)北邊知識(shí)城內(nèi)的一家廠房?jī)?nèi),經(jīng)過(guò)一番激烈的比拼、與數(shù)位頂尖同行切磋較量后,思謀科技戰(zhàn)略客戶經(jīng)理劉浩然走出思緒紛飛的房間,心滿意足地吸了一口南方的冷空氣。
在這場(chǎng)方案的提交之戰(zhàn)中,他所代表的思謀科技PK掉了其他同臺(tái)競(jìng)爭(zhēng)的廠商,取得這家有著超過(guò)175 年歷史的全球頂尖光學(xué)廠商(以下暫且起代號(hào)為「Z」)的信任,拿到了思謀創(chuàng)業(yè)一年后在精密光學(xué)領(lǐng)域的第一份合同。
這也意味著,在接下來(lái)的4-5個(gè)月內(nèi),思謀科技要研發(fā)出光學(xué)領(lǐng)域第一臺(tái)由人工智能初創(chuàng)企業(yè)開(kāi)發(fā)的鏡片隱形二維碼識(shí)別設(shè)備。
在此之前,思謀多是將計(jì)算機(jī)視覺(jué)用于3C消費(fèi)電子產(chǎn)品的零部件瑕疵檢測(cè)。但對(duì)于一個(gè)從創(chuàng)業(yè)之初就渴望成為「中國(guó)IBM」的團(tuán)隊(duì)來(lái)說(shuō),思謀還想挑戰(zhàn)更高難度的落地。所以,能夠拿下這家500強(qiáng)巨頭的訂單,對(duì)思謀來(lái)說(shuō),確有幾分里程碑式的意義。
圖 / 新廣州知識(shí)城
劉浩然不惜口舌之戰(zhàn)拿下的光學(xué)項(xiàng)目,是思謀科技毅然入場(chǎng)「工業(yè)制造」的一個(gè)縮影。
思謀科技的創(chuàng)始人賈佳亞是計(jì)算機(jī)視覺(jué)領(lǐng)域的知名學(xué)者,谷歌學(xué)術(shù)被引數(shù)超過(guò)36000次,曾培養(yǎng)出多位人工智能領(lǐng)域新秀,包括商湯科技的聯(lián)合創(chuàng)始人兼CEO徐立。在進(jìn)入工業(yè)界之前,他所創(chuàng)立的視覺(jué)實(shí)驗(yàn)室便已在圖像濾波、圖像稀疏處理、多頻段圖像信號(hào)的融合以及增強(qiáng)和逆向視覺(jué)問(wèn)題解法等方面有了深厚的技術(shù)積累。
因其在計(jì)算機(jī)圖像去模糊技術(shù)方向做出的貢獻(xiàn),他在2018年當(dāng)選了IEEE Fellow。
圖 / 賈佳亞
在創(chuàng)立思謀科技前,賈佳亞的第一段工業(yè)界之旅是在騰訊優(yōu)圖實(shí)驗(yàn)室(X-Lab)。
2017年5月加入騰訊時(shí),賈佳亞帶了兩位想跟自己到外面「闖一闖」的學(xué)生,沈小勇就是其中之一。那時(shí),沈小勇剛畢業(yè)沒(méi)多久,對(duì)研究落地也很感興趣,于是就跟著導(dǎo)師加入了X-Lab擔(dān)任研發(fā)負(fù)責(zé)人,并迅速成長(zhǎng)為當(dāng)時(shí)騰訊最年輕的T4科學(xué)家之一。后來(lái),2019年,賈佳亞決定離開(kāi)騰訊、創(chuàng)立思謀,沒(méi)多久,沈小勇也跟著離開(kāi),成為了思謀科技的聯(lián)合創(chuàng)始人兼CEO。
圖 / 沈小勇
據(jù)沈小勇介紹,他們?cè)隍v訊時(shí)就已經(jīng)有過(guò)將計(jì)算機(jī)視覺(jué)在工業(yè)生產(chǎn)上落地的探索:TCL旗下液晶面板生產(chǎn)子公司華星光電的面板缺陷檢測(cè)。
華星光電的液晶面板生產(chǎn)涉及上百道工序,生產(chǎn)過(guò)程中可能出現(xiàn)的面板缺陷種類(lèi)多達(dá)120種,賈佳亞帶領(lǐng)團(tuán)隊(duì)設(shè)計(jì)出人工智能質(zhì)檢設(shè)備搭載在生產(chǎn)產(chǎn)線上,可以在5秒內(nèi)識(shí)別出面板缺陷,產(chǎn)線所需的質(zhì)檢人員只需原先的50%。
正是有感于計(jì)算機(jī)視覺(jué)在工業(yè)生產(chǎn)優(yōu)化上的神奇作用,賈佳亞在啟動(dòng)思謀科技時(shí),就確定了接下來(lái)的賽道:工業(yè)制造。
從18世紀(jì)60年代開(kāi)始,工業(yè)革命對(duì)人類(lèi)歷史的進(jìn)程產(chǎn)生了重要影響。如許多前沿學(xué)者一樣,賈佳亞也相信,人類(lèi)歷史的當(dāng)下正處于「工業(yè)4.0」時(shí)代:
「工業(yè)1.0」是機(jī)械制造,即通過(guò)引入機(jī)械設(shè)備實(shí)現(xiàn)工廠機(jī)械化的制造時(shí)代。上世紀(jì)40年代進(jìn)入「工業(yè)2.0」,電氣與自動(dòng)化時(shí)代開(kāi)創(chuàng)了產(chǎn)品批量生產(chǎn)的高效模式。70年代開(kāi)始并持續(xù)至今的信息化則是「工業(yè)3.0」,通過(guò)數(shù)字化的技術(shù)將信息存儲(chǔ)起來(lái),方便工廠的決策者管理。而如今的「工業(yè)4.0」時(shí)代,是智能制造時(shí)代,對(duì)生產(chǎn)力提出了更高的要求,背后的動(dòng)力極有可能是如今蓬勃發(fā)展的人工智能技術(shù)。
前三次工業(yè)革命,中國(guó)都沒(méi)趕上。18世紀(jì),中國(guó)處于閉關(guān)鎖國(guó)的封建時(shí)期;上世紀(jì) 40年代,中國(guó)處于動(dòng)蕩之中;70年代,中國(guó)則剛剛起步發(fā)展。因此,對(duì)當(dāng)下的中國(guó)來(lái)說(shuō),國(guó)泰民安,人才培養(yǎng)增多,資源豐富,抓住「工業(yè)4.0」的智能制造時(shí)代機(jī)遇至關(guān)重要。
智能制造的核心在于「智能」:智能并不是簡(jiǎn)單的自動(dòng)化,而是讓制造擁有「大腦」和讓大腦決策的各種「神經(jīng)系統(tǒng)」。
沈小勇介紹,本質(zhì)上,計(jì)算機(jī)視覺(jué)要解決的是「看得清」與「看得懂」的問(wèn)題,也就是看完后還要進(jìn)行分析,對(duì)應(yīng)人的眼睛與大腦。只有擁有敏銳的「眼睛」與聰明的「大腦」,才能最大化發(fā)揮自動(dòng)化「手臂」的作用,而AI正是讓制造擁有會(huì)思考的機(jī)器設(shè)備的核心所在。
思謀的創(chuàng)始團(tuán)隊(duì)相信,新一代AI將貫穿于設(shè)計(jì)、生產(chǎn)、管理、服務(wù)等生產(chǎn)活動(dòng)的全鏈條,使制造具備自感知、自學(xué)習(xí)、自決策、自執(zhí)行、自適應(yīng)等功能的新型生產(chǎn)方式。
在2015年提出的「中國(guó)制造2025」計(jì)劃中,工業(yè)計(jì)算機(jī)視覺(jué)應(yīng)用占了重要位置。
從人臉識(shí)別到工業(yè)智造,計(jì)算機(jī)視覺(jué)的落地目前已跨越了半導(dǎo)體、汽車(chē)、航空、新能源、精度光學(xué)等行業(yè),如鏡片分揀、軸承檢測(cè)、特種條碼設(shè)計(jì)與識(shí)別、偏光彎膜、模具檢測(cè)、AVI檢測(cè)等。以芯片檢測(cè)為例,基于深度學(xué)習(xí)的計(jì)算機(jī)視覺(jué)算法就有可以完成億級(jí)晶體結(jié)構(gòu)的全自動(dòng)聚類(lèi)分析:檢出率超過(guò)99.99%、單流程處理效率提高96%、AI自動(dòng)化全檢處理效率提升90%。
傳統(tǒng)制造業(yè)在國(guó)家經(jīng)濟(jì)中的占比,就是智能制造未來(lái)的市場(chǎng)容量。據(jù)國(guó)家統(tǒng)計(jì)局?jǐn)?shù)據(jù)顯示,2019年、2020年,中國(guó)工業(yè)增加值的規(guī)模均超過(guò)了31萬(wàn)億。工業(yè)領(lǐng)域1-2%的效率提升就意味著數(shù)千億級(jí)的經(jīng)濟(jì)增值。
在此背景下,自然不止思謀科技這一家AI出身的團(tuán)隊(duì)盯上「工業(yè)制造」與「數(shù)字轉(zhuǎn)型」的賽道。
但在了解計(jì)算機(jī)視覺(jué)賦能工業(yè)制造的雄心前,我們無(wú)法逃避面對(duì)的一個(gè)事實(shí)是:無(wú)論是「工業(yè)」,亦或「工廠」,都是一個(gè)極其龐大的存在。這也意味著,計(jì)算機(jī)視覺(jué)算法只是繁雜工藝中的一環(huán),要嵌入完整的生產(chǎn)線上,必然會(huì)遇到與其他環(huán)節(jié)合作的挑戰(zhàn)、甚至與工業(yè)本身的相互磨合。
2、樂(lè)起
仔細(xì)說(shuō)來(lái),這并不是一個(gè)多么跌宕起伏的故事。
簡(jiǎn)單來(lái)說(shuō),在與Z的合作中,思謀科技要做的事情,就是設(shè)計(jì)一臺(tái)能夠智能定位識(shí)別及讀取不同度數(shù)的鏡片上的隱形二維碼設(shè)備(Enigma Reading Machine),安裝在Z的產(chǎn)線上,方便Z在生產(chǎn)的全過(guò)程中把控鏡片的質(zhì)量,實(shí)現(xiàn)防偽功能。
我們可以將這個(gè)二維碼理解為「普通」的二維碼,只不過(guò)它由0.125毫米點(diǎn)陣組成,載體是一個(gè)個(gè)曲面鏡片毛胚(我們?nèi)粘4鞯慕曆坨R鏡片原材料),并且是「隱形」的。
這個(gè)設(shè)備的工作步驟也很簡(jiǎn)單,只有兩步:一,對(duì)整個(gè)鏡片進(jìn)行完整拍攝;二,在1-2秒內(nèi)成功讀取鏡片上的隱形二維碼,并自動(dòng)將數(shù)據(jù)上傳到Z的內(nèi)部質(zhì)檢系統(tǒng)中。
但、就是這么看似簡(jiǎn)單的兩個(gè)步驟,卻難倒了這家頭部光學(xué)廠商的幾乎所有供應(yīng)商。在Z拋出這個(gè)問(wèn)題時(shí),也曾有許多工業(yè)視覺(jué)或AI整體解決方案的公司嘗試迎接挑戰(zhàn),但都以失敗告終。
識(shí)別鏡片中隱形二維碼的難度極高,難點(diǎn)主要體現(xiàn)在三個(gè)方面:
(一)只有從特定的角度往鏡片上打光,隱形二維碼才有可能顯現(xiàn)。而為什么只是「有可能」呢?因?yàn)閆使用了先進(jìn)的鍍膜工藝對(duì)鏡片表面做了高透設(shè)計(jì),即使從完全相同的角度打光,隱形二維碼的讀取也可能失敗。換言之,讀碼率的穩(wěn)定性極低。
(二)鏡片的度數(shù)、厚度與品類(lèi)(如近視眼鏡與墨鏡)不一,造成光線的反射率也不一樣,因此隱形二維碼的嵌入方式與位置也會(huì)有所差異。
(三)鏡片的材質(zhì)是透明玻璃,會(huì)反光。即使是沒(méi)有任何折射角度的無(wú)度數(shù)鏡片,機(jī)器也不一定能在透明的介質(zhì)上自動(dòng)識(shí)別到隱形二維碼。更嚴(yán)峻的現(xiàn)實(shí)是,鏡片分為凹透鏡與凸透鏡,度數(shù)不一,光線折射的角度也不一。
圖 / 鏡片中的二維碼極小,只有在特定的角度與光線上才能顯現(xiàn)
思謀科技的解決方案架構(gòu)師周工介紹,識(shí)別隱形二維碼的技術(shù)難度絕對(duì)處于金字塔的頂尖級(jí)別:
「就打光來(lái)說(shuō),它就已經(jīng)完全顛覆了傳統(tǒng)的視覺(jué)打光方式。傳統(tǒng)的打光方式是被測(cè)物體與打光鏡頭基本成一個(gè)相對(duì)位置,比如被測(cè)物垂直于光源,直接受光。而在隱形二維碼的識(shí)別技術(shù)中,被測(cè)物的點(diǎn)陣二維碼的呈現(xiàn)是通過(guò)思謀自研光源發(fā)出光束穿過(guò)鏡片直接照射到膜材、然后反射回直徑小于0.125毫米的一群小光束的原理?!?/p>
借用賈佳亞對(duì)半導(dǎo)體產(chǎn)品缺陷檢測(cè)難度的表述,要在曲面類(lèi)型多樣的玻璃鏡片上準(zhǔn)確識(shí)別直徑只有0.125毫米的隱形二維碼,難度絕對(duì)比「在整個(gè)廣東省內(nèi),一秒鐘內(nèi)定位出一個(gè)有輕微故障的紅綠燈」還要高!
這不僅要求研發(fā)團(tuán)隊(duì)具備算法能力,他們還要精通光學(xué)原理與膜材設(shè)計(jì)。
換作普通的光學(xué)廠商,一遇到這么棘手的問(wèn)題,可能早就擺手不干、尋找其他性?xún)r(jià)比更快的替代方案了。但Z這樣歷史悠久、實(shí)力雄厚的企業(yè)不同,他們作為標(biāo)桿,凡事追求「最好」,畢竟具備足夠的技術(shù)創(chuàng)新條件。而不斷追求技術(shù)實(shí)力甩對(duì)手幾條街的理念,也正是他們能夠佇立國(guó)際市場(chǎng)多年而不倒的根源所在。
所以,即使難度重重,Z也不惜克服萬(wàn)難,尋找可以定位并識(shí)別隱形二維碼這一「小滑頭」的方法。
此前,Z識(shí)別隱形二維碼的方法主要有兩種:
第一種是「源頭管控」,開(kāi)模時(shí)就預(yù)先在模具上刻出隱形二維碼,在鏡片成型時(shí)將二維碼一同印在鏡片上,然后通過(guò)模具的編號(hào)進(jìn)行鏡片追溯。這種方法的短板是只能在源頭管控。
隱形二維碼就相當(dāng)于一個(gè)鏡片的「身份證」,每完成一道生產(chǎn)工序就要進(jìn)行一次識(shí)別,以證明該二維碼「順利」地走完了所有工序。因此,如果只是在源頭管控,就相當(dāng)于只監(jiān)測(cè)到了最開(kāi)始的開(kāi)模工序,無(wú)法通過(guò)在全產(chǎn)線中追蹤該二維碼、以把控每一個(gè)生產(chǎn)環(huán)節(jié)的質(zhì)量。
第二種方法是高價(jià)購(gòu)入一臺(tái)德國(guó)隱形碼識(shí)別設(shè)備。但很遺憾,這是一臺(tái)單體設(shè)備,只能人工手動(dòng)檢測(cè),識(shí)別的速度慢,價(jià)格也十分高昂。此外,由于設(shè)備從德國(guó)進(jìn)口,受知識(shí)產(chǎn)權(quán)的保護(hù),Z只能購(gòu)買(mǎi)標(biāo)準(zhǔn)的模塊,無(wú)法集成其他設(shè)備,也就是無(wú)法配合他們的產(chǎn)線進(jìn)行定制化設(shè)計(jì)。
3、副歌
當(dāng)時(shí),作為一家剛成立不到一年的「小廠」,思謀科技選擇挑戰(zhàn)Z的這個(gè)項(xiàng)目,更多是想要抓住一個(gè)重要的「成長(zhǎng)機(jī)會(huì)」。
他們的目標(biāo)陣地是工業(yè)產(chǎn)品的外觀檢測(cè),如果能成功突破鏡片隱形二維碼識(shí)別的技術(shù),那么對(duì)他們進(jìn)軍精密光學(xué)領(lǐng)域自然大有幫助。
所以,在剛接到任務(wù)時(shí),他們也是心情澎湃,擼起袖子就準(zhǔn)備大干一場(chǎng)。
但理想很豐滿,現(xiàn)實(shí)很骨感。很快他們就發(fā)現(xiàn):事情沒(méi)有那么簡(jiǎn)單。
雖是「識(shí)別」,但他們要攻克的技術(shù)卻不只是機(jī)器的「眼睛」,還有目標(biāo)識(shí)別物背后的光學(xué)原理。而且,后者才是他們要面對(duì)的「大boss」。
所幸,思謀有先見(jiàn)之明,在剛成立時(shí)就為進(jìn)軍工業(yè)賽道籌備了兩大團(tuán)隊(duì)。在工業(yè)產(chǎn)品缺陷檢測(cè)中,核心技術(shù)有兩個(gè):一是視覺(jué)算法,二是光學(xué)成像。所以,除了賈佳亞、沈小勇帶領(lǐng)的CV能人,思謀在一開(kāi)始就成立了一個(gè)光學(xué)實(shí)驗(yàn)室,并招募了一批經(jīng)驗(yàn)老道的光學(xué)系統(tǒng)研發(fā)人才。
機(jī)器要識(shí)別的隱形二維碼大小為2mm*2mm,其中,每一個(gè)小方塊(即「點(diǎn)陣」)的直徑則是0.125mm。
從光學(xué)的原理來(lái)看,在打光時(shí),鏡片的膜材料必須將光源分解為一束束直徑比125μm還小的光束,隱形二維碼才能顯現(xiàn)出來(lái)。這是因?yàn)楣馐ㄟ^(guò)微小間隙后的傳播不一定是線性的,如果同時(shí)通過(guò)兩個(gè)小孔,就會(huì)產(chǎn)生衍射條紋。而衍射條紋并不是固定的,就會(huì)導(dǎo)致檢測(cè)失敗。
此外,鏡片是一種三層結(jié)構(gòu),即「空氣-膜-玻璃」。光的入射角、膜的厚度與折射率等等都會(huì)影響光的傳播,某些角度下甚至可能在膜里產(chǎn)生全反射,導(dǎo)致隱形的二維碼無(wú)法被檢測(cè)。
也就是說(shuō),思謀要用計(jì)算機(jī)視覺(jué)算法成功識(shí)別鏡片上的隱形二維碼,最大的難題其實(shí)是找到一種高透光度、高光潔度、耐高溫、滿足高精度陶瓷刀具加工強(qiáng)度的特殊膜材料,并且能夠兼容不同曲率、不同折射率的鏡片,使光束能從不同的方向平行射出。雷峰網(wǎng)
在4個(gè)月的項(xiàng)目期里,除了開(kāi)發(fā)算法與制造設(shè)備,他們花費(fèi)了超過(guò)一半的時(shí)間與精力在尋找適合「機(jī)器識(shí)別」的膜材料上。
為了弄明白如何使隱形二維碼的成像更清晰,他們推理膜材料的加工原理,買(mǎi)來(lái)了各種原材料進(jìn)行驗(yàn)證。周工對(duì)AI科技評(píng)論回憶:「我們做了不下100次的實(shí)驗(yàn)!單單光學(xué)原理驗(yàn)證,就花了3個(gè)月?!?/p>
功夫不負(fù)有心人。最終,他們選擇了多面體微鉆石結(jié)構(gòu)的光源反射膜,但所需的膜材料十分特殊,市場(chǎng)上沒(méi)有,所以他們需要自己研發(fā)設(shè)計(jì)。雷峰網(wǎng)(公眾號(hào):雷峰網(wǎng))
「這一環(huán)消耗的時(shí)間最多,因?yàn)榧庸さ哪げ牧弦蠹{米級(jí)的精度,刀具要從日本定制?!?/p>
在這個(gè)過(guò)程中,他們頻繁地與國(guó)內(nèi)外的光學(xué)廠商、高校研究團(tuán)隊(duì)交流,「最常交流的是原材料廠商,因?yàn)樗麄儠?huì)知道膜材在什么溫度下的加工效果最好,透射率與折射率如何達(dá)標(biāo)等等?!怪軇P鵬談道。
經(jīng)過(guò)100多次的膜材開(kāi)發(fā)與反光測(cè)試,就像在上課鈴響的1秒鐘沖入教室一樣,今年4月,他們終于在約定交付日期的前兩天解決了膜材料問(wèn)題,并完成生產(chǎn)加工。交付時(shí),Z所提供的44片100-700度的鏡片樣品全部掃碼成功,令Z的代表十分驚喜。雷峰網(wǎng)
最后,思謀科技自研的膜材料可以做到:無(wú)論鏡片是凹是凸、度數(shù)多少,機(jī)器都可以將鏡片上的隱形二維碼完整識(shí)別出來(lái)。度數(shù)越低,識(shí)別的速度越快,500度以下的鏡片甚至可以在50毫秒內(nèi)識(shí)別出來(lái)。
圖 / 思謀科技的視覺(jué)檢測(cè)軟硬件一體化設(shè)備
縱觀計(jì)算機(jī)視覺(jué)在工業(yè)上的落地,他們的此次探索對(duì)于透明介質(zhì)產(chǎn)品的缺陷檢測(cè)具有劃時(shí)代的意義。除了玻璃鏡片,他們的方案也可以拓展至面板類(lèi)產(chǎn)品的裂痕檢測(cè)與缺陷檢測(cè)中,比如車(chē)燈透鏡與手機(jī)攝像頭的瑕疵檢測(cè)。
但很顯然,從上述的故事中,我們看到的似乎更多是沉悶的、陌生的光學(xué)難題,而不是AI的「大力出奇跡」。
一位精密光學(xué)領(lǐng)域的行家告訴AI科技評(píng)論,在工業(yè)生產(chǎn)中,材料、方法與環(huán)境往往占主導(dǎo)位置,基于神經(jīng)網(wǎng)絡(luò)的視覺(jué)算法只是眾多方法中的一個(gè)組成部分,甚至在大多數(shù)情況下,「不一定需要多復(fù)雜的算法,而是更多地受到其他現(xiàn)實(shí)因素的影響?!?/p>
因此,AI在工業(yè)上的落地,更偏向于高速視覺(jué)識(shí)別或精密視覺(jué)識(shí)別的范疇。計(jì)算機(jī)視覺(jué)團(tuán)隊(duì)要想取得突破,難點(diǎn)也自然更多地落在了「成像」與「控制」,而不完全是「算法」。
4、尾聲
一個(gè)有趣的視角可能是:在AI、甚至任何一項(xiàng)技術(shù)的落地中,任何強(qiáng)大的科學(xué)家都不再是「科學(xué)家」,而是「技術(shù)供應(yīng)商」。最終,決定科學(xué)家創(chuàng)立的公司是否能在市場(chǎng)競(jìng)爭(zhēng)中存活的,也許不是學(xué)術(shù)積累的深度,而是技術(shù)落地的實(shí)力。
計(jì)算機(jī)視覺(jué)在精密制造中的落地,是一個(gè)科學(xué)/工程探索過(guò)程,不僅需要先進(jìn)的深度學(xué)習(xí)算法,還要深諳光學(xué)原理與材料工藝,掌握多學(xué)科、懂機(jī)理、能實(shí)現(xiàn)的技術(shù)。
沈小勇談道:「別人問(wèn)我科學(xué)家創(chuàng)業(yè)的問(wèn)題與挑戰(zhàn)時(shí),我回答比較多的是,最難的是在將商業(yè)價(jià)值最大化的情況下形成技術(shù)到產(chǎn)品、再到市場(chǎng)的閉環(huán)?!?/p>
此外,技術(shù)的落地,也許無(wú)法避免采取「以點(diǎn)帶面」的策略。對(duì)于大多數(shù)工業(yè)制造廠商來(lái)說(shuō),他們對(duì)AI技術(shù)并不精通,在傳播深度學(xué)習(xí)視覺(jué)算法的優(yōu)勢(shì)時(shí),往往要先通過(guò)一個(gè)項(xiàng)目合作來(lái)呈現(xiàn)、滲透,然后再去展示人工智能在工業(yè)制造與數(shù)字轉(zhuǎn)型上的力量。
這個(gè)項(xiàng)目完成后,他們繼續(xù)與Z開(kāi)展了其他合作,讓計(jì)算機(jī)視覺(jué)與其他機(jī)器學(xué)習(xí)方法在精密光學(xué)領(lǐng)域有了更多的應(yīng)用。除了鏡片隱形二維碼的識(shí)別,Z又向思謀提出了更多生產(chǎn)線上的需求,包括難度極高的AR鍍膜工藝大數(shù)據(jù)分析。
而與Z的合作,也讓思謀有一個(gè)深刻的體會(huì):「只有創(chuàng)新,才可以創(chuàng)造價(jià)值?!?/p>
對(duì)于一個(gè)精通深度學(xué)習(xí)的視覺(jué)算法團(tuán)隊(duì)來(lái)說(shuō),所謂的「創(chuàng)新」,大約就是不斷挑戰(zhàn)算法與行業(yè)結(jié)合的技術(shù)邊界,掌握更多算法以外的工業(yè)制造知識(shí),從而實(shí)現(xiàn)「X+AI」的藍(lán)圖。
而這,也是AI落地的時(shí)代所趨。雷鋒網(wǎng)
(文中劉浩然與周工為化名,李揚(yáng)霞、劉杏花對(duì)本文亦有貢獻(xiàn))
參考鏈接:
https://baijiahao.baidu.com/s?id=1670795055818283346&wfr=spider&for=pc
雷峰網(wǎng)原創(chuàng)文章,未經(jīng)授權(quán)禁止轉(zhuǎn)載。詳情見(jiàn)轉(zhuǎn)載須知。