0
本文作者: 劉路遙 | 2023-08-30 18:06 |
如果問最近哪個(gè)行業(yè)最熱,無疑是大模型。
ChatGPT的落地證明了,大模型已經(jīng)能夠針對(duì)任務(wù)進(jìn)行場(chǎng)景化應(yīng)用,離用戶更近了。
當(dāng)一批類ChatGPT的通用大模型層出不窮時(shí),另一批參與者著眼于“更容易落地”的行業(yè)垂直大模型,也走到了舞臺(tái)中央。
機(jī)器視覺作為大模型重點(diǎn)應(yīng)用的垂直領(lǐng)域,必將從這場(chǎng)技術(shù)革命中受益,但工業(yè)場(chǎng)景與生俱來的碎片化、樣本量少等特點(diǎn),也對(duì)大模型的應(yīng)用提出了挑戰(zhàn)。
大模型這一顛覆性的技術(shù),究竟應(yīng)當(dāng)如何應(yīng)用于工業(yè)中,大家還處在相應(yīng)的探索中。
在人工智能和機(jī)器人領(lǐng)域,存在一個(gè)莫拉維克悖論,即對(duì)于計(jì)算機(jī)而言,只需很少的計(jì)算能力,就能掌握人類的邏輯推理等高級(jí)智慧,但對(duì)于人類無意識(shí)的感知、運(yùn)動(dòng)等低級(jí)智慧,卻需要極大的計(jì)算資源。
這一悖論,在工業(yè)領(lǐng)域更加凸顯。
在工業(yè)領(lǐng)域,用自動(dòng)化的機(jī)器人替代人類,完成一個(gè)簡(jiǎn)單的動(dòng)作,存在極大的瓶頸。
以摁壓、扣接這類精密組裝的動(dòng)作為例,人類可以在手指不做出明顯向前位移的情況下,僅通過肌肉的彈力或指尖的觸感出色完成工作;但對(duì)于機(jī)器人來說,僅為了完成這一簡(jiǎn)單的動(dòng)作,就需要進(jìn)行大量的計(jì)算。
不僅如此,由于工業(yè)各細(xì)分領(lǐng)域千差萬別,每一項(xiàng)固定工序背后都需要進(jìn)行大量的計(jì)算,這些訓(xùn)練工作疊加起來的時(shí)間和成本,是企業(yè)難以負(fù)荷的。
當(dāng)下,小樣本學(xué)習(xí)技術(shù)、預(yù)訓(xùn)練、預(yù)適應(yīng),是目前階段最適合工業(yè)場(chǎng)景的,這源于工業(yè)實(shí)際應(yīng)用場(chǎng)景的嚴(yán)苛要求:樣本少、時(shí)間短、爬坡要求高。
樣本量少是工業(yè)領(lǐng)域的典型難題。
很多情況下,工廠里的邊緣AI應(yīng)用,缺少豐富、多樣化的產(chǎn)品樣本,并不利于進(jìn)行模型的訓(xùn)練。
“缺陷檢測(cè)場(chǎng)景中,工廠里會(huì)有很多正常的好樣本,但異常樣本的積累,通常要花幾個(gè)月甚至半年的時(shí)間?!绷柙乒庵R(shí)理性研究院副院長(zhǎng)全煜鳴告訴雷峰網(wǎng)。
假設(shè)一款新手機(jī)即將發(fā)布,前期模組生產(chǎn)已經(jīng)耗費(fèi)大量時(shí)間,最終組裝僅剩兩三個(gè)月,很難在這段時(shí)間中積累到足夠的異常樣本。
要在獲取的樣本極少,而產(chǎn)能爬坡要求極高的情況下,讓整個(gè)產(chǎn)線適應(yīng)新產(chǎn)品,就會(huì)對(duì)小樣本、預(yù)訓(xùn)練、預(yù)適應(yīng)提出極高的要求。
對(duì)于小樣本來說,模型上面需要有極其嚴(yán)苛的適應(yīng)性,數(shù)據(jù)上面要有很好的增廣能力,要具備在樣本少的情況下,增廣樣本給自己的模型做訓(xùn)練的能力。
尋找共性,是增廣樣本數(shù)量一個(gè)較為常用的辦法。有一些缺陷,在某幾個(gè)行業(yè)是相通的,比如中框、結(jié)構(gòu)件的外觀檢測(cè)和手機(jī)整機(jī)的外觀檢測(cè),再比如鋰電和光伏的外觀缺陷檢測(cè)等,都存在一定的相通性。
“凌云光建立了擁有500萬樣本的專用工業(yè)數(shù)據(jù)集,可以對(duì)缺陷的機(jī)理進(jìn)行研究,再加上深度學(xué)習(xí)和人工智能算法平臺(tái)F.Brain,能夠使得預(yù)訓(xùn)練模型和積累的工業(yè)數(shù)據(jù)集,有比較好的樣本擴(kuò)增的功能?!比哮Q接著補(bǔ)充道:“生成缺陷只是第一步,還要兼顧與場(chǎng)景融合過程中的科學(xué)性,才能夠保證小樣本缺陷圖增廣的有效性。”
預(yù)適應(yīng)和小樣本一樣,其目的在于使相關(guān)模型具有更好的精度和更廣的適應(yīng)范圍,以滿足不同工業(yè)場(chǎng)景,從而在一定程度上緩解產(chǎn)品在實(shí)驗(yàn)室中表現(xiàn)穩(wěn)定,一到真實(shí)產(chǎn)線上就“歇菜”的普遍問題。
一邊,工業(yè)場(chǎng)景對(duì)小樣本學(xué)習(xí)技術(shù)提出了高要求;另一邊,工業(yè)場(chǎng)景對(duì)產(chǎn)品的要求也日益提高。
首先,生產(chǎn)的精度要求越來越高。
寧德時(shí)代的倪軍教授曾提出“極限制造”的概念,表示工業(yè)領(lǐng)域做到6σ(每百萬個(gè)產(chǎn)品里頭有一兩個(gè)不良品)遠(yuǎn)遠(yuǎn)不夠,而是需要做到9σ-12σ,即對(duì)不良品的要求上升到十億級(jí),每十億個(gè)產(chǎn)品當(dāng)中,只允許出現(xiàn)1-3個(gè)不良品,這對(duì)機(jī)器視覺廠商是個(gè)極大的挑戰(zhàn)。
其次,3C制造領(lǐng)域、汽車、印刷品等行業(yè)的升級(jí),對(duì)產(chǎn)品良率和產(chǎn)品形態(tài)提出了更高的要求。
在此過程中,怎樣將物理世界的缺陷,通過攝像頭感知到光電領(lǐng)域、數(shù)字領(lǐng)域,并對(duì)不同類型和程度的瑕疵進(jìn)行科學(xué)分級(jí),最終定義良品與不良品,實(shí)際上是一個(gè)難題。
這是因?yàn)椋瑹o瑕疵的產(chǎn)品幾乎不存在,所謂的良品來自于人們對(duì)其的定義。
比如,蘋果和富士康通過三級(jí)質(zhì)量分級(jí)完成了對(duì)于良品的定義,為其提供視覺感知系統(tǒng)的凌云光,則對(duì)標(biāo)人眼感知,將缺陷細(xì)化分級(jí)為十級(jí),以此針對(duì)不同客戶的質(zhì)量要求,通過微調(diào)來滿足需求。
這一切,都建立在一個(gè)前提基礎(chǔ)上,即有一套能夠精確感知缺陷的視覺系統(tǒng)。
其中有兩大挑戰(zhàn),一個(gè)來自于數(shù)據(jù),一個(gè)來自于平臺(tái)架構(gòu)。
人工智能由兩個(gè)部分驅(qū)動(dòng),一是數(shù)據(jù),二是模型。
數(shù)據(jù)的重要性,正如ML(Machine Learning)大牛吳恩達(dá)提出的著名“二八定律”:80%數(shù)據(jù)+20%模型=更好的AI。
隨著預(yù)訓(xùn)練大模型技術(shù)的發(fā)展,對(duì)于數(shù)據(jù)質(zhì)量、數(shù)量和多樣性的要求越來越高。
從樣本中積累行業(yè)知識(shí)、場(chǎng)景知識(shí)是一條重要的路徑。以顯示屏裂紋檢測(cè)為例,只有掌握了相關(guān)缺陷和產(chǎn)品物理位置的關(guān)系、物理形態(tài)上是否垂直于邊緣、不同位置產(chǎn)生缺陷的概率等數(shù)據(jù),才能夠打造出好的預(yù)訓(xùn)練模型。
但要獲取到精準(zhǔn)的數(shù)據(jù),卻并不容易。
一是數(shù)據(jù)的完整性問題;
二是數(shù)據(jù)的維度單一性問題,檢測(cè)點(diǎn)獲取到的數(shù)據(jù)以及制程點(diǎn)的人機(jī)料法環(huán)測(cè)數(shù)據(jù),能否從邏輯上實(shí)現(xiàn)閉環(huán)建模;
三是做知識(shí)抽取和知識(shí)沉淀時(shí),實(shí)際上獲取到的結(jié)論在驗(yàn)證階段仍會(huì)出現(xiàn)偏差,需要更大數(shù)據(jù)量的驗(yàn)證;
全煜鳴坦言,即使是有著20多年行業(yè)積累,已經(jīng)擁有數(shù)十億級(jí)相關(guān)樣本的凌云光,在數(shù)據(jù)獲取過程中也依然面對(duì)上述的挑戰(zhàn)。
在全煜鳴看來,減少上述問題帶來的影響,需要做到精準(zhǔn)感知和數(shù)據(jù)獲取的標(biāo)準(zhǔn)化。
精準(zhǔn)感知是對(duì)器件提出的要求。
照明系統(tǒng)、感知元件、光學(xué)傳遞相應(yīng)的鏡頭以及待測(cè)目標(biāo),都要能夠做到相關(guān)的標(biāo)準(zhǔn)度。只有在模塊級(jí)做到精準(zhǔn),才能夠在系統(tǒng)級(jí)的度量達(dá)到成像性能的一致性。
對(duì)于照明系統(tǒng)來說,輻射通量、光譜信息、時(shí)間的穩(wěn)定性、溫度的穩(wěn)定性等度量指標(biāo),要能夠在模塊級(jí)進(jìn)行測(cè)量和度量;對(duì)于感知元件來說,靈敏度、量子的效率、暗噪聲、動(dòng)態(tài)范圍,也要能夠進(jìn)行精準(zhǔn)的度量、調(diào)節(jié);對(duì)于被測(cè)目標(biāo),要能夠完整的對(duì)光電成像的過程進(jìn)行物理建模和理論分析。
數(shù)據(jù)的標(biāo)準(zhǔn)化是從維度上說的。
比如對(duì)一個(gè)產(chǎn)品進(jìn)行質(zhì)檢,其維度包括整體產(chǎn)品數(shù)據(jù)、瑕疵數(shù)據(jù)、產(chǎn)品履歷、不同制程段的檢測(cè)結(jié)果等各個(gè)方面,既有圖像數(shù)據(jù)又有文本數(shù)據(jù),有結(jié)構(gòu)化數(shù)據(jù)和非結(jié)構(gòu)化數(shù)據(jù)。
但需要注意的是,并非所有數(shù)據(jù)都有價(jià)值,數(shù)據(jù)的標(biāo)準(zhǔn)化過程,需要舍棄那些永遠(yuǎn)無人關(guān)心的沉默數(shù)據(jù),留下有用的數(shù)據(jù)。
“數(shù)據(jù)的標(biāo)準(zhǔn)化是一個(gè)系統(tǒng)性的問題,對(duì)數(shù)據(jù)的單位、背景條件、存儲(chǔ)都應(yīng)該有相應(yīng)的標(biāo)準(zhǔn)。比如,數(shù)據(jù)需要以什么樣的形式存儲(chǔ)下來,是不是要有產(chǎn)品的大圖,有缺陷的小圖用什么格式定義,在什么地方可以獲取到等?!比哮Q對(duì)雷峰網(wǎng)(公眾號(hào):雷峰網(wǎng))介紹道。
實(shí)現(xiàn)數(shù)據(jù)標(biāo)準(zhǔn)化只是第一步,在此基礎(chǔ)上,還需要進(jìn)一步實(shí)現(xiàn)數(shù)據(jù)的精準(zhǔn)化,以及數(shù)據(jù)知識(shí)化。
數(shù)據(jù)的精準(zhǔn)化,指的是能夠重復(fù)獲取的、穩(wěn)定的、客觀的數(shù)據(jù)。實(shí)現(xiàn)精準(zhǔn)的數(shù)據(jù),是挖掘到帶有工藝知識(shí)和場(chǎng)景的知識(shí)化數(shù)據(jù)的基礎(chǔ)。
以手機(jī)維修產(chǎn)線為例,維修不同產(chǎn)品過程中產(chǎn)生的數(shù)據(jù),其實(shí)就包含了對(duì)手機(jī)或者手機(jī)主板怎樣進(jìn)行下一步檢測(cè)的知識(shí)。最終將維修記錄整合成標(biāo)準(zhǔn)操作流程的過程,就是將一般數(shù)據(jù)變成帶有知識(shí)沉淀的數(shù)據(jù)的過程。
將帶有知識(shí)沉淀的數(shù)據(jù),用到知識(shí)圖譜和大模型上,可以幫助終端客戶縮短整體業(yè)務(wù)流程。
比如,富士康主板維修嚴(yán)重依賴于有經(jīng)驗(yàn)的工人,但制造業(yè)人力供應(yīng)鏈存在不穩(wěn)定的弊端,對(duì)于富士康產(chǎn)線的工人來說,離職率會(huì)達(dá)到100%以上,尤其是一些有經(jīng)驗(yàn)的工人很難被留住。相應(yīng)的,老師傅的知識(shí)和經(jīng)驗(yàn)也會(huì)跟著人一起走。
“通過知識(shí)圖譜將大模型拓展至主板維修環(huán)節(jié),過去 1500 步工序才能搞定一塊主板,現(xiàn)在 15 步就能完成,產(chǎn)線 UPPH 足足提升了37%,讓一線維修工真正可以‘入職三個(gè)月,五年老司機(jī)’?!?/strong>
從標(biāo)準(zhǔn)化數(shù)據(jù),到精準(zhǔn)化數(shù)據(jù),再到帶有工藝知識(shí)的數(shù)據(jù),三者之間層層遞進(jìn),而數(shù)據(jù)自始至終都是穿插在中間的一條重要主線。
機(jī)器視覺設(shè)計(jì)多個(gè)學(xué)科,其復(fù)雜性導(dǎo)致通用性差,且高度依賴數(shù)據(jù)驅(qū)動(dòng)。
在全煜鳴看來,機(jī)器視覺到今天,依舊像一門民間藝術(shù),光、機(jī)、電、算、軟各自為戰(zhàn),從成像的硬件,到成像的方案,再到算法軟件平臺(tái),并沒有形成一個(gè)整體的解決方案。
與此同時(shí),隨著大模型時(shí)代的到來,要把數(shù)據(jù)處理好,對(duì)技術(shù)架構(gòu)帶來全新挑戰(zhàn)。如果沒有全新的技術(shù)架構(gòu)和全新的解決方案做支撐,就會(huì)出現(xiàn)技術(shù)投入越大,復(fù)雜度越高,但可持續(xù)性越弱的問題。
基于此,行業(yè)在思考如何高效地利用數(shù)據(jù)迭代模型的同時(shí),也越來越重視技術(shù)架構(gòu)的創(chuàng)新。
不過,企業(yè)在技術(shù)架構(gòu)的搭建過程中,需要注意兩個(gè)問題。
首先,要警惕脫離具體場(chǎng)景訴求談技術(shù)架構(gòu),要基于業(yè)務(wù)搭建技術(shù)架構(gòu)、平臺(tái),否則就是做無用功。
做架構(gòu)的第一件事,是把需求捋清楚,把業(yè)務(wù)目標(biāo)捋清楚,然后才有可能找到合適的方案。
據(jù)全煜鳴介紹,為更好做到從場(chǎng)景中來回到場(chǎng)景中去,凌云光將技術(shù)規(guī)劃和產(chǎn)品規(guī)劃分成了三個(gè)部分。
第一部分是目前已經(jīng)落地應(yīng)用的解決方案,比如2D視覺、3D視覺的量測(cè)、檢測(cè)方案,思考怎樣提高效率、提高精度,降低整體對(duì)端側(cè)算力的要求。
第二部分是在一些新興,短期有落地應(yīng)用機(jī)會(huì)的創(chuàng)新方案上,領(lǐng)先行業(yè)半步,進(jìn)行人才補(bǔ)齊等資源投入。
不過,全煜鳴也提到,“因?yàn)椴荒苊撾x客戶的實(shí)際需求做研究,因此判斷怎么樣才是技術(shù)上提前半步,是比較難的?!?/p>
第三部分是針對(duì)超前的研究,進(jìn)行提前布局。比如,凌云光三年前開始進(jìn)行大模型和知識(shí)圖譜的能力構(gòu)建,提前將整體的技術(shù)框架進(jìn)行落地。
也就是說,對(duì)于不同時(shí)期或者不同成熟度的解決方案,應(yīng)當(dāng)能夠分梯次落地應(yīng)用,并且做到一個(gè)閉環(huán)。
其次,當(dāng)前構(gòu)建的架構(gòu)要有足夠的靈活性,能應(yīng)對(duì)未來的變化,保持旺盛的生命力。
也就是說,要具備能夠誕生多個(gè)可模塊化快速?gòu)?fù)制的集成用例,并且在平臺(tái)化的技術(shù)架構(gòu)基礎(chǔ)上設(shè)計(jì)橫向快速?gòu)?fù)制的方法。
一個(gè)既支持現(xiàn)在,又能支持未來的架構(gòu),不僅可以避免重復(fù)建設(shè),節(jié)約成本投入,還可以更好地得到綜合成本的下降。
技術(shù)架構(gòu)走向平臺(tái)化是重要趨勢(shì)之一,凌云光2018年左右開始向平臺(tái)化方向轉(zhuǎn)變,時(shí)隔5年,到今年又發(fā)布了全新的KingKong技術(shù)架構(gòu),包含視覺、數(shù)字基準(zhǔn)、大腦、自動(dòng)化和駕駛艙五個(gè)部分。
在全煜鳴看來,KingKong技術(shù)架構(gòu)的特征可以概括為三點(diǎn):
對(duì)于視覺領(lǐng)域,是一個(gè)科學(xué)的標(biāo)定和圖像的科學(xué)評(píng)價(jià),整體系統(tǒng)的一致性非常好;
在數(shù)據(jù)層面,有精準(zhǔn)的數(shù)據(jù),并且是帶有知識(shí)的數(shù)據(jù);
AI 模型上,是數(shù)據(jù)加知識(shí)的雙輪驅(qū)動(dòng)。
對(duì)于凌云光而言,這些技術(shù)為平臺(tái)構(gòu)建了豐富的、有差異化的平臺(tái)功能與服務(wù),提高了基礎(chǔ)技術(shù)能力,為業(yè)務(wù)的安全、穩(wěn)定、高效運(yùn)行提供了保障。
對(duì)于客戶來說,一個(gè)更具有一致性的技術(shù)架構(gòu),更能幫助提升缺陷產(chǎn)品的檢出精度,加快交付,從而帶來生產(chǎn)效率的提升,拉動(dòng)產(chǎn)能。
一般而言,新設(shè)備進(jìn)入工廠要經(jīng)過NPI新品導(dǎo)入,之后便是產(chǎn)量和質(zhì)量爬坡階段。這個(gè)階段越短,客戶就越能省下更多物料和人員成本,更快進(jìn)入大批量生產(chǎn)階段。
“KingKong技術(shù)架構(gòu)調(diào)整后,能夠讓手機(jī)的中框、頂框、底框的外觀檢測(cè),到手機(jī)的整機(jī)外觀檢測(cè),交付時(shí)間縮短。并且這樣的解決方案,能夠拓展到鋰電外觀、圓柱外觀檢測(cè)上。”全煜鳴介紹道。
人工智能領(lǐng)域的發(fā)展突飛猛進(jìn),大模型將對(duì)全行業(yè)都將產(chǎn)生顛覆性地重構(gòu),已經(jīng)是業(yè)界共識(shí)。
在工業(yè)領(lǐng)域,從生產(chǎn)優(yōu)化到供應(yīng)鏈管理,從質(zhì)量控制到創(chuàng)新設(shè)計(jì),大模型正逐漸改變著工業(yè)領(lǐng)域的運(yùn)作方式和業(yè)務(wù)模式。
然而,工業(yè)領(lǐng)域的復(fù)雜性和專業(yè)性,決定了通用大模型無法直接應(yīng)用,尤其在一些要求高精度和領(lǐng)域?qū)I(yè)知識(shí)的領(lǐng)域。
面對(duì)種種挑戰(zhàn),能針對(duì)行業(yè)細(xì)分領(lǐng)域提供更精確、可解釋、安全和定制化的解決方案,比通用模型更具優(yōu)勢(shì)和適用性的垂直模型,受到越來越廣泛的關(guān)注。
通用大模型雖然在多個(gè)領(lǐng)域都表現(xiàn)出色,但并不具備深入的領(lǐng)域?qū)I(yè)知識(shí)。
以工業(yè)質(zhì)檢領(lǐng)域?yàn)槔?,產(chǎn)品質(zhì)檢涉及到大量數(shù)據(jù)和復(fù)雜的圖像、聲音、視頻等信息,要求模型能夠準(zhǔn)確地識(shí)別和分析各種缺陷和問題,甚至是微小的變化。
但是,通用模型很難在短時(shí)間內(nèi)學(xué)會(huì)這些領(lǐng)域知識(shí),也很難捕捉到產(chǎn)線上工藝流程和設(shè)備運(yùn)行等細(xì)節(jié)。
垂直模型具備專業(yè)知識(shí),能夠更好的理解和處理行業(yè)數(shù)據(jù)和任務(wù),并且能達(dá)到更高的精度和性能,提供更準(zhǔn)確的結(jié)果。
工業(yè)領(lǐng)域數(shù)據(jù)的稀缺性和特殊性,也使得通用模型難以應(yīng)對(duì)。
要達(dá)到高精度,模型通常需要大量高質(zhì)量的訓(xùn)練數(shù)據(jù),然而在某些工業(yè)領(lǐng)域,特別是新興或者小規(guī)模領(lǐng)域,短期內(nèi)難以積累足夠的異常樣本,經(jīng)常出現(xiàn)模型缺乏足夠數(shù)據(jù)進(jìn)行訓(xùn)練的情況。
此外,工業(yè)領(lǐng)域的數(shù)據(jù)還具有許多特殊性,對(duì)大量實(shí)時(shí)數(shù)據(jù)、多種類型數(shù)據(jù)、異常數(shù)據(jù)的處理和分析,是一項(xiàng)異常復(fù)雜的工作,難以被通用模型所理解。
垂直模型則降低了對(duì)數(shù)據(jù)的需求,只需較少的場(chǎng)景訓(xùn)練數(shù)據(jù),就能實(shí)現(xiàn)高效開發(fā),且定制成本更低。
工業(yè)領(lǐng)域講求實(shí)際,對(duì)穩(wěn)定性、可控性的要求極高,垂直模型更能獲得客戶的信任。
對(duì)于工廠來說,需要模型能夠提供清晰的解釋和推理過程,以便能夠理解和信任模型的判斷,從而做出下一步?jīng)Q策。
通用大模型通常是“黑盒模型”,內(nèi)部運(yùn)行機(jī)制較為復(fù)雜,難以提供透明的解釋,較高的風(fēng)險(xiǎn)使其難以獲得客戶的信任;垂直大模型則能將其決策過程和推理邏輯展現(xiàn)出來。
安全和隱私問題,是敲開工業(yè)客戶的最后一道大門。
工業(yè)領(lǐng)域的數(shù)據(jù)龐大且復(fù)雜,通用大模型尚難以提供足夠的數(shù)據(jù)安全保障,并且工業(yè)領(lǐng)域的生產(chǎn)流程、產(chǎn)品工藝、設(shè)備參數(shù)等都屬于工業(yè)企業(yè)的敏感數(shù)據(jù),通用大模型的在訓(xùn)練過程中必然會(huì)接觸廣泛的公共數(shù)據(jù),存在將工廠敏感數(shù)據(jù)泄露出去的風(fēng)險(xiǎn)。因此,很多企業(yè)在權(quán)衡風(fēng)險(xiǎn)與收益后,并不愿意將自己的數(shù)據(jù)提供出來。
垂直模型由于可以在特定領(lǐng)域內(nèi)進(jìn)行本地化處理,從而能夠減少數(shù)據(jù)共享和隱私泄露的風(fēng)險(xiǎn)。
大模型的產(chǎn)生讓人們意識(shí)到,整個(gè)機(jī)器視覺的解決方案,很有可能被一些極具革命性和創(chuàng)造力的新模型所重構(gòu)。
全煜鳴坦言,“最近看到很多顛覆性技術(shù),一些原先的技術(shù)路徑或者解決方案,很有可能會(huì)被新技術(shù)顛覆。目前,凌云光F.Brain深度學(xué)習(xí)平臺(tái)已實(shí)現(xiàn)工業(yè)場(chǎng)景數(shù)據(jù)、算法(模型訓(xùn)練)、推理為一體的云邊端協(xié)同一體化平臺(tái)。首先,通過算法平臺(tái)進(jìn)行特定場(chǎng)景的數(shù)據(jù)增廣,模型訓(xùn)練精調(diào),再由推理平臺(tái)完成對(duì)多端多平臺(tái)的部署優(yōu)化?!?/p>
不過,工業(yè)場(chǎng)景對(duì)精確度、可靠性的要求極高,現(xiàn)階段,這些新模型的直接導(dǎo)入應(yīng)用還存在一定的瓶頸。
在全煜鳴看來,這是時(shí)代拋給企業(yè)的兩個(gè)命題,一邊企業(yè)要沿著已有的路線不停迭代,保證滿足客戶4個(gè)9,12個(gè)σ的確定性需求和規(guī)格;一邊要保持技術(shù)的敏感性和興奮度,警惕會(huì)帶來顛覆性的新技術(shù)。
然而,要打磨出對(duì)行業(yè)有顛覆性價(jià)值的模型,絕不是一項(xiàng)閉門造車的工程。
企業(yè)需要在通用大模型基礎(chǔ)上,微調(diào)行業(yè)大模型,最后再精調(diào)成相關(guān)制造場(chǎng)景的模型。
過程中,企業(yè)需要對(duì)不同產(chǎn)品和行業(yè)特點(diǎn)有深刻的認(rèn)識(shí);需要有行業(yè)高質(zhì)量數(shù)據(jù)的積累;有在數(shù)據(jù)上進(jìn)行研發(fā)、運(yùn)算及推理的能力;有懂行業(yè)know-how的研究員和科學(xué)家等等。
這意味著,那些深耕于產(chǎn)業(yè),能觸達(dá)更多客戶的行業(yè)場(chǎng)景,更容易從生產(chǎn)線上獲取大量行業(yè)數(shù)據(jù),且已經(jīng)積累了較多科學(xué)精準(zhǔn)樣本的企業(yè),將更好地滿足工業(yè)領(lǐng)域的需求和挑戰(zhàn),同時(shí)具備更快的技術(shù)迭代速度和競(jìng)爭(zhēng)優(yōu)勢(shì)。
ChatGPT 帶來的熱度,就像是將一根針丟進(jìn)了一片鐵屑中,其與各行各業(yè)之間的連接,是確定無疑的。
但現(xiàn)階段,關(guān)于大模型應(yīng)當(dāng)怎樣在工業(yè)領(lǐng)域落地,怎樣在邊端、云端做相應(yīng)的優(yōu)化、輕量化,最終怎樣做到投資回報(bào)的閉環(huán),給工業(yè)帶來效益,還處在相應(yīng)的探索中。
這一過程中,充滿著無數(shù)的變數(shù),很難評(píng)判哪一家公司更有可能勝出。
但可以確定的是,市場(chǎng)競(jìng)爭(zhēng)的核心將始終圍繞一個(gè)詞:真實(shí)需求。
接下來,在機(jī)器視覺領(lǐng)域,能在包括光學(xué)相機(jī)成像系統(tǒng)、軟件和算法等AI技術(shù)上,做出對(duì)客戶的提質(zhì)增效、降本減存有數(shù)量級(jí)和革命性幫助的解決方案,將獲得更大的加速度。如果您有更多關(guān)于機(jī)器視覺的故事和看法,歡迎添加作者微信MOON_ERS進(jìn)行交流。
雷峰網(wǎng)原創(chuàng)文章,未經(jīng)授權(quán)禁止轉(zhuǎn)載。詳情見轉(zhuǎn)載須知。