0
作者:辛夷
編輯:余快
大模型,帶來了AI 2.0,也帶來了無限可能。
但無論其未來有多“無限可能”,還是會面臨同一個核心問題:如何落地。
這么多年來,要選一個AI落地過程中的最大挑戰(zhàn),AI產品恐怕是其中之一。技術浪潮迭代,場景紛繁復雜,而產品作為連接兩者之間的橋梁,一直沒有被很好地定義。
海量應用場景之下,AI產品將如何定義?
去年,曠視提出了“算法定義硬件”的概念。近日,曠視推出了魔方B4T系列產品。如果說“算法定義硬件”是曠視的解題思路,那么“魔方B4T系列”就是曠視階段性的答案。
作為一個擁有十多年積累的AI玩家,“算法定義硬件”到底能不能行得通?面對即將到來的大模型時代,曠視對于AI產品的理解又將發(fā)生哪些變化?
識別率提升、精度突破、榜單排行,是早期AI界的主旋律。
那時候的AI企業(yè),也處于看到算法領域的難題就解決目標的狀態(tài),因此他們將注意力放在研發(fā)出標準化的模塊和SaaS服務類產品。
嘗試落地的他們很快發(fā)現,每個場景沒有通用解決方案,客戶需要的不是單個模塊或開發(fā)包,也不具備集成SDK的能力,標準的SDK可以落地,但未必能解決客戶的問題。
比如,即使同一品牌,幾百款不同產品,具備不同的芯片、傳感器性能、解析度大小、焦距遠近等,規(guī)格、要求各不相同,每個應用場景,都對應一套硬件和一套算法,是一個巨大的工作量。
歸根結底,AI本身并不是一個產品。
曠視意識到,他們必須改變路徑。于是,他們決定圍繞自己核心的AI能力做產品化方案。
將人工智能技術產品化,并落地到諸多行業(yè)場景中,這并不是一件容易的事。
在人工智能產業(yè)化過程中,技術到產品之間存在一個巨大的鴻溝。
企業(yè)不僅需要從技術角度考慮可實現性,更從工程角度考慮落地方案,注重工程現場與算法性能結合。比如視頻應用環(huán)境各式各樣,有白天、晚上、下雨等等,不同條件下的成像都不太相同,就會要求算法必須要滿足復雜的開放環(huán)境。
曠視因此走上了五六年的產品化探索之路,從重技術,轉變?yōu)槌酥丶夹g,也重產品、重客戶、重生態(tài)。
與此同時,市場也在發(fā)生巨大變化:AI需求大量爆發(fā)。AI等技術日趨成熟,與碎片化行業(yè)場景不斷深度融合,越來越多的細分領域的長尾需求被激發(fā),一個海量AIoT市場慢慢浮出。
明廚亮灶、火焰識別、電動車識別、吸煙識別、反光衣識別、快遞爆倉識別、疲勞駕駛檢測......
無數散落在全國各地區(qū)、各行業(yè)的AI需求,像潺潺流水的小溪,正流淌、貫穿出一副山河巨制。
但市場太大,供應太少。而且,扎根長尾市場的企業(yè)少,也沒有一家公司能涵蓋所有算法。
這些場景里,基數更多的中小企業(yè),于他們而言,算法生產門檻高、周期長、成本高、效果差。
說白了,AI依然是貴族技術,長尾場景難擁有。
AI產業(yè)界的共同富裕,就是讓各行各業(yè)真正從智能化、數字化變革中獲益,其中非常核心的要點,是算法類別的豐富性和算法的高性價比。
針對AIoT的場景化需求與當下的困境,曠視提出了自己的解法:算法定義硬件。
AI技術要能形成一個真正的商業(yè)閉環(huán),需要在與場景深度結合基礎上,找到合適的載體,即算法+硬件+應用,針對場景匹配最優(yōu),才能規(guī)模落地。
曠視通過“標準化硬件+開放算法平臺”的產品組合來解決落地問題。
簡單來說就是通過海量算法+一定數量的通用型/標準硬件,滿足AIoT領域海量的碎片化場景需求,為萬千場景提供普惠的人工智能算法。
曠視聯合創(chuàng)始人、企業(yè)業(yè)務產研負責人楊沐告訴雷峰網(公眾號:雷峰網),雖然整個B端市場的場景多樣、需求碎片,但這些年,企業(yè)客戶市場已經發(fā)生幾大趨勢:基礎設施的云化、核心技術的互聯網化、應用的數據化和智能化。
曠視也開發(fā)了幾個大品類的通用硬件,比如模組、邊緣計算盒子、面板機、AI IPC等,在這些通用硬件載體之上,針對不同場景,開發(fā)不同算法。
曠視給予合作伙伴算法量產能力,讓大家基于自己行業(yè)理解能開發(fā)出更好的產品,讓更多人懂AI、用AI,并結合生態(tài)伙伴,賦能千行百業(yè)。
曠視想要實現的,不只是行業(yè)“用上”AI,還有“用好”AI。
楊沐看來,真正的“好產品”,核心就兩個字:簡單。好產品,讓用戶簡單用AI。
此前數十年,曠視建立了一套強大的技術體系,但僅有好的AI技術還遠遠不夠,好技術必須變成最好的產品。曠視一直以AI技術立身,如今,曠視要以產品立命。
這是曠視“算法定義硬件”軟硬一體產品設計理念的延伸,也與AI平民化一脈相承。
楊沐認為,To B的好產品,不只是用戶用起來,還要用得好,用得降本增效。不同環(huán)節(jié)的好產品定義不同,而簡單,是所有環(huán)節(jié)最有效、最終極的事情。
“好技術的評判標準眾多,但產品,市場是唯一檢驗標準?!?/p>
曠視的“簡單”分成三個層面:選品環(huán)節(jié)“易決策”、履約環(huán)節(jié)“輕交付”、使用環(huán)節(jié)“好口碑”。
一是高效選品,通俗講,就是能夠支持客戶“閉著眼睛選”。高性能、高性價比、少而精的產品會讓客戶的決策更簡單,因此要求產品集成度高;
二是輕交付,通過更好的產品定義、更簡單的配置方法,讓價值交付更簡單;
三是好口碑,讓伙伴省心、客戶放心、用戶舒心。
“當一個產品能夠被簡單決策、使用和認可,就能說明是好產品,自然也能獲得好口碑?!睏钽宸Q。
在推動算法在各行各業(yè)的實際場景落地的過程中,曠視一直堅持“落地實用是算法價值的最終檢驗標準”。
其實,好產品的背后一定是好技術,能夠降低AI使用門檻的技術,而好技術是能夠切實讓AI更好用,兩者是相輔相成,相互促進的。
“好的產品,是將‘簡單’遞到用戶手中,將‘復雜’的技術留給自己。我們這幾年一直在聚焦、聚焦再聚焦,希望能把產品做得更少,但是做得更好?!睏钽灞硎?。
魔方B4T系列就是這樣一套解決方案,它是曠視基于“算法定義硬件”理念而打造的一款簡單、易用的產品方案,集曠視AIS算法生產平臺、邊緣計算智能分析盒、算法訓練服務于一體。
首先是算法,最大程度簡化算法落地。
AI算法之所以是貴族技術,原因之一在于算法從生產到落地是一個多環(huán)節(jié)、長鏈條、高復雜的過程。它包含需求分析,數據處理,模型訓練,上線部署,到最后的應用落地。其中,算法還需要反復多輪的打磨。
AIS平臺將數據生產、算法模型和推理框架這三大核心環(huán)節(jié)標準化,并預先集成了多個核心底層模型。同時,魔方B4T將AI算法的生產、部署、運行與維護整合到一個平臺上,配合智能分析盒,平臺、硬件、服務,用戶的算法需求可以在平臺上一站式解決。
算法量產問題解決了,訓練步驟和訓練周期太長?
魔方B4T的零代碼、高精度開發(fā)方式,將算法訓練過程從12步簡化為僅5步,無需編寫任何代碼,使非技術人員也能輕松上手。目前,AIS平臺已經能夠支持100多種業(yè)務模型訓練,最快2小時即可完成。
而在使用端,用戶對這些都是無感的,用戶只需知道如何使用平臺,而不需要了解底層代碼,簡單上手就能訓練出自己想要的場景算法。
千行萬業(yè)數字化,需求不盡相同。合作伙伴可以基于自身行業(yè)know-how,量身定制產品方案。
而這些,不僅限于曠視的合作伙伴。這套方案提供授權服務,合作伙伴在自己項目中使用訓練出的算法和模型,還可以將它們授權給自己的合作伙伴。
這讓魔方B4T的輻射路徑,從點到線,再到面,向更多場景延伸,加速了算法推廣速度,進一步激發(fā)場景創(chuàng)新。
降低算法開發(fā)的門檻和成本,讓算法得到量產,提升算法生產效率并加速算法落地。魔方B4T已經在促進千行萬業(yè)加速奔向數字化的路上。
軟件開發(fā)是人類歷史上最復雜的腦力協作。
這是軟件工程領域的一個共識。
而大模型這個“超級隊員”的到來,將創(chuàng)造新的模型研發(fā)范式。
首先,是開發(fā)方式的改革。
一個顯著的變化是從機器語言向自然語言的改變。以代碼開發(fā)為例,在大模型以前,系統(tǒng)無法理解自然語言,軟件是由人類工程師編寫,他們需要是去visual studio等軟件,為計算機提供明確的、逐步的指令,用機器的語言和機器交互。
相比之下,大模型是建立在一個使用數十億個語言詞匯進行訓練的神經網絡之上。它創(chuàng)造了新的人機交互界面,可以按照開發(fā)者的自然語言指示生成機器語言。于是,現在在一個聊天窗口,用人類的語言就能和機器交互。
另一個是從程序員手寫到人機協作完成的改變。比如,大模型能實現自動代碼生成/補全。其中GitHub Copilot,可能已經有了10倍的效率提升。
其次,在算法訓練效率上。
傳統(tǒng)算法訓練模式,每個新算法都需要重新采集大量樣本數據、開發(fā)訓練。
從前端數據采集到樣本標注,從模型研發(fā)、訓練到算法落地,戰(zhàn)線長,人力物力成本高企。在千行萬業(yè)源源不斷涌現算法需求下,這種模式越來越難以為繼。
通過海量數據進行預訓練形成的大模型,融合了億級圖片、萬級視頻、十億級圖文的大模型,融合了更多模態(tài)信息,大規(guī)模自監(jiān)督學習的多模態(tài)人工智能算法,具備超強的泛化能力。
“大規(guī)模預訓練﹢精調”模式,使得用戶不用收集大量樣本數據集,基于大模型通過零樣本、小樣本學習就能調優(yōu),從而滿足場景多元化需求。
“預訓練+精調”或將成為新的研發(fā)范式,讓研發(fā)過程更加標準化,顯著降低了人工智能模型研發(fā)門檻。
某種角度,大模型是傳統(tǒng)AI“作坊式”生產模式的一次救贖。
而且,AI智能體技術的快速發(fā)展,有望進一步加速AI落地應用的進程。比如,AutoGPT和AgentGPT等AI agent,可以自動化理解、拆解并執(zhí)行任務,進一步解放人力,加速業(yè)務全流程推進。
今年,曠視科技升級了AIS一站式算法訓練平臺,可結合曠視自研行業(yè)大模型,高效地定制、開發(fā)全新的算法模型,從而解決碎片場景中的問題。這將大大加速AIoT場景應用的落地。
這些最新的大模型技術,將逐步緩解一直以來承擔“最復雜的腦力”工作的AI研發(fā)人員研發(fā)壓力。
在未來,大模型將進一步降低了算法生產的門檻,提升了算法從生產到落地的整體效率。
大模型“海納百川”的魅力縱然令人著迷,但大模型就像是雷神之錘,如果沒有適合它的釘子,就難以發(fā)揮被期許的價值。
短期看,大模型轉化成生產力,還有一段距離。
大模型具有強大的通識能力,但是面對海量碎片化場景,仍缺少行業(yè)知識和高質量數據的積累。此外,受邊緣側設備算力限制,大模型難以部署。
通用大模型的“大”和“通用”看著誘人,但對于細分領域的B端行業(yè)客戶,他們更需要的不是通用大模型的“全能”能力、綜合技術上的碾壓,而是模型的精度和質量,即能在具體需求上追求極致,可以實現功能最大化的產品。
換句話說,行業(yè)客戶愿意為合理開發(fā)利用的功能買單,但不會為自己用不到的功能買單。
因此技術只有與具體行業(yè)結合變成產品,帶來實際的使用體驗和轉化成效,才真正具有價值。
不同行業(yè)垂直度高,專業(yè)需求強,如何訓練一個“更懂我”、“只懂我”的大模型?并在滿足細分領域需求的基礎上,做到成本可控?
短期內,大小模型將以“組合拳”形式存在,大小模型各司其職,云邊協同發(fā)展,實現落地應用。
一方面,通用大模型可以通過預訓練+微調,產生行業(yè)專用大模型。另一方面大模型通過蒸餾、量化等方式,變成邊側易部署&升級的“小模型”,滿足客戶追求性價比的需求。
這也意味著,那些深耕于產業(yè),能觸達更多的行業(yè)場景,更容易從生產線上獲取大量行業(yè)數據,且已經積累了較多科學精準樣本的企業(yè),同時具備更快的技術迭代速度,將更好地滿足碎片化領域的需求和挑戰(zhàn)。
無論是大模型,還是AI,只要跟現實真實世界產生交互,無非只有三種模式,視覺、語音和文本。
這三種模式都是多模態(tài)覆蓋的,其中,視覺是重中之重。
AIoT的實現路徑,是通過收集通過物聯網終端產生的海量數據,存儲于云端、邊緣端,再被大數據分析后,并通過人工智能,基于數據來描述物質世界,實現萬物數據化、萬物智聯化。
在AIoT的世界,視頻就是數據的一個強入口,產生的源源不斷高質數據將成為數字化時代的新能源。
而視覺能力,則是曠視等AI企業(yè)在市場上已經得到“千錘百煉”的強項。
在過去的十二年里,曠視已經積累了豐富的產品矩陣,覆蓋消費物聯網、城市物聯網、供應鏈物聯網等AIoT各個領域。
在大模型時代,以技術為刃,切開更廣闊的空間,AIoT企業(yè)正在抵達的下一站。雷峰網雷峰網雷峰網
雷峰網原創(chuàng)文章,未經授權禁止轉載。詳情見轉載須知。