0
計算機領域年度盛會 CNCC2021(中國計算機大會)將于2021年10月28日-30日在中國深圳舉行,主題為“計算賦能加速數(shù)字化轉型”(Expediting Digital Transformation with Computing Empowerment)。大會舉辦方為中國計算機協(xié)會(CCF),今年的技術論壇多達111個,預計參會人數(shù)將達萬人。
阿里巴巴集團副總裁、高級研究員,阿里巴巴達摩院城市大腦實驗室負責人華先勝博士將作為本次大會的特邀報告講者,發(fā)表“產業(yè)數(shù)字化轉型中的視覺智能規(guī)模實戰(zhàn)——從算法到平臺到系統(tǒng)”主題演講。
華博士曾講過“AI創(chuàng)新的基本流程是從項目到產品到平臺”,那這里的系統(tǒng)指的是什么呢?
華先勝被業(yè)界公認為“視覺識別和視覺搜索領域的國際級權威學者",是國際電氣與電子工程師協(xié)會會士(IEEE Fellow),美國計算機協(xié)會杰出科學家,他一直倡導“無行業(yè)不AI”的理念。
在大會開始之前,AI科技評論有幸與華先勝博士對話,以下根據(jù)對話內容整理而成,并進行了不修改原意的編輯。
AI創(chuàng)新的基本流程是從項目到產品到平臺,即通過項目磨練的算法,算法沉淀產品,然后再將其平臺化。平臺實際上是把AI的能力平臺化以后,能夠讓更多的人在AI平臺上做創(chuàng)新。
“如果簡單來講AI平臺,那就是三件事情。第一個是,AI算法+AI平臺,我把它叫做‘AI中臺’;第二個是算法所依賴的平臺;第三個是支撐平臺的算法?!?/span>平臺本身也需要算法來支撐,比如調度、引擎都需要算法。
平臺化后可以讓更多人在平臺上創(chuàng)新,解各行各業(yè)的問題,這樣也會避免AI的從業(yè)者需要一個一個地深入行業(yè),“如果真要AI專家一個一個地深入行業(yè),可能大半輩子都要過去了”。
華博士特別指出這里所講的平臺不是研發(fā)平臺。AI的研發(fā)平臺有一定相對的通用性,通過研發(fā)平臺研發(fā)出AI的能力。而AI的能力平臺是生產或者服務平臺,是指有什么能力以及這種能力是以什么樣的方式運行的,與研發(fā)平臺不是一個概念。
AI的能力平臺可以用平臺化的方式賦能更多的算法研發(fā)者和應用研發(fā)者在平臺上做更多的創(chuàng)新、應用和業(yè)務拓展。這樣會提高研發(fā)效率,使部署運維更為快捷、安全、穩(wěn)定,可以讓更多的人基于平臺做應用,如智慧城市領域里面的廠家可以在不具備AI能力的情況下,只要有工程能力就可以基于平臺做應用。
平臺化的目標實際上是規(guī)模化和全民化
目前,除了對AI的學術研究以外,從業(yè)者做的更多的是技術研究、基礎研究到應用落地。在落地方面要深入行業(yè),但是每個行業(yè)都有domain知識,如果都讓AI專家深入行業(yè)來做是沒有辦法實現(xiàn)規(guī)模化的,所以華博士提出要把AI平臺化。即使不是AI工程師,有些情況下也可以做到低代碼甚至是零代碼的開發(fā)。因此更多領域和行業(yè)的IT工程師、軟件開發(fā)工程師,甚至是行業(yè)的專家,都可以通過平臺做AI能力的開發(fā),AI在各行各業(yè)就可以實現(xiàn)落地的規(guī)模化。
另外一個詞叫做全民化。它意思是讓AI不要掌握在少數(shù)懂AI的人手里,能讓更多的人使用AI,“實際上我們以平臺化的方式實現(xiàn)規(guī)?;彩亲屗窕?。
基于平臺可以做更多事情
華博士列舉了幾個例子來說明:
“比如在做大規(guī)模城市的市政管理時,需要有大量的能力生成,通過平臺就會比較快速的生成能力?!?/span>
“在工業(yè)視覺平臺方面,雖然很早以前我們就發(fā)布了一個基礎版本,但是我們一直都沒有特別去講它。一方面是認為我們對做的東西還沒那么滿意,第二方面市場也沒有很ready,所以我們一直悶頭在做。最近我們推出3.0版本就開始真正的推廣它,甚至開始有培訓課程。前不久,我們組織了第一期的培訓課程,邀請工業(yè)視覺領域里做軟件開發(fā)的企業(yè)來參加培訓,培訓后就可以利用我們的平臺去做AI能力的生成,而不是做AI能力的使用。只要能夠收集一些數(shù)據(jù)做些簡單的標注,然后在該平臺調一些參數(shù)的設置就可以自動訓練出一個模型并且把它部署成一個服務,就可以直接在應用當中使用了?!?/span>
“現(xiàn)在有不少人在用這個平臺去生產AI的能力,有一個公司用我們的平臺生產新的視覺檢測的能力,還有一個公司利用這個能力去做了一個茅臺酒防偽標志的自動識別,他還把它做成了一個盒子,把酒放進去,一掃描就能識別出來的這個酒到底是真的還是假的,只要收集一些樣本,通過我們這套系統(tǒng)就能把AI的能力生產出來了?!?/span>
”還有一個例子是開放視覺,即大量的AI能力在云上??梢宰尯芏嗳讼襁^去在windows下面調用一個API一樣去調用人工智能API。當時我們也通過這些API舉辦了一些創(chuàng)新創(chuàng)意大賽。比如有人把它用來為盲人開發(fā)APP,去識別一些盲人看不見但是馬上手機可以照到的那些信息自動識別出來,比如說前面有什么。大型的商場有一些的open space,有時候也會擺一些攤位,那這個攤位到底怎么估價,怎么使用,擺什么樣的攤兒更合適之類的問題,有的人就通過視覺的技術做自動的評估和自動匹配。“
”未來我們在醫(yī)療領域、農業(yè)領域里也都在做,每一個平臺的定位都不完全一樣,但總體定位是一樣的。比如像城市大腦,針對的用戶群其實是略有不同的,因為還要考慮行業(yè)屬性。研發(fā)平臺其實沒有明顯的行業(yè)屬性,但我們的這個生產服務平臺是有明確的行業(yè)屬性的。“
之后因為要讓AI能夠有更強的生命力,能夠讓它有一定的通用性,那就要解決三高的問題。三高指的是高精準、高覆蓋、高效率。
“雖然之前我們做了很多事情,比如算法本身也可以往這個方向做,但這實際上是蠻難的一件事情。所以我們今天在思路上還是有一些變化,想通過系統(tǒng)的方式和算法結合的方式去實現(xiàn)三高。”
人工智能在歷史上的發(fā)展是三起兩落,我們現(xiàn)在處于“第三起”階段。華博士認為要解決真正規(guī)?;@一問題還是要分析此次“第三起”人工智能的發(fā)展的規(guī)律、趨勢。
華博士為“第三起”人工智能的發(fā)展劃分了三個階段。
第一個階段是2012年前后,深度學習在解決問題上確確實實前進了一大步。華博士認為這個階段人工智能給未來行業(yè)帶來的影響可能會比較大,有可能所有的行業(yè)都會受到AI的影響。所以將這個階段叫做“無行業(yè)不AI”。
“這是一個對未來非常樂觀的預判,認為沒有一個行業(yè)不受AI的影響。那個時候只是一些星星點點的嘗試,確實在技術上邁出了很大一步。”
后來人工智能專家就開始做行業(yè)的落地,卻發(fā)現(xiàn)解決實際問題還是要深入行業(yè)才可以解。有一些看上去好像已經解得很好的問題,但實際仍然存在大量問題。
因此華博士發(fā)現(xiàn)還要通過深入行業(yè)的數(shù)據(jù)場景來解決這一問題,進一步打磨人工智能算法模型,這是第二個階段,也是目前大部分人所處的階段。對于這一階段華博士也將其叫做“無行業(yè)不AI”,但是對它的解釋是不深入行業(yè)就沒有AI的落地,深入行業(yè)來解決一個行業(yè)的問題,盡量創(chuàng)造核心價值。
華博士還表示這種模式大部分都是人工智能從業(yè)者在驅動?!耙徊糠秩俗黾夹g的研發(fā),一部分人做應用的落地,大部分都是做人工智能的一部分然后推到各行各業(yè)中應用。我認為這種模式是很難實現(xiàn)規(guī)?;摹!比A博士還舉例說明了有少數(shù)是本身就是做場景的人去做人工智能的技術,比如淘寶。淘寶APP里面很多人工智能技術是自己完成的,像搜索引擎背后的人工智能技術也是自己完成的。
“我認為第三個階段行業(yè)也應該更多的參與進來甚至起非常重要的作用。就像淘寶一樣,淘寶自己做這個東西自己就把人工智能解了。其他行業(yè)不見得一定要像淘寶這樣做,但是要知道自己需要什么,要解什么樣的問題,需要怎樣變革。不見得要知道AI的技術,但是要知道怎樣去做這件事情,需要什么樣的技術去解決什么樣的問題,然后推動它的落地和變革。”
因此對第三階段,華博士也把它叫做“無行業(yè)不AI”,但它的解釋又發(fā)生變化了,即沒有行業(yè)的深度參與就沒有AI的遍地開花結果。
“前面講的是‘落地’,現(xiàn)在講的是‘遍地開花’。這個階段對AI的從業(yè)者而言并不是降低要求,實際上是對AI從業(yè)者提出了更高的要求。那就是要把AI的能力做得更好,把它做平臺化、把它的工具做好,這也是為什么我們要做平臺化。我們的實踐都是把AI平臺化、AI的能力平臺化,AI能力平臺化包括AI算法本身以及AI算法所依賴運行或服務的平臺?!?/span>
據(jù)華博士講,早期有些情況下也會把平臺叫做系統(tǒng)化,但系統(tǒng)實際上是一個更大的概念??梢哉f平臺是系統(tǒng)的一部分。
“平臺更多地強調這個東西能夠為別人很好地再次使用,就像一個臺子大家可以在上面表演”。
系統(tǒng)中有一部分功能是平臺,可以讓別人在上面做事情,但是系統(tǒng)本身還是一個統(tǒng)一整體。華博士從其它幾個特性上來解釋系統(tǒng)“比如說它能夠自我進化,不斷地演進”。
他向我們分享了最近在做的城市大腦,“我們要把它做成一個協(xié)同進化系統(tǒng),也就是說我們把大腦的這一套系統(tǒng)部署出去以后,不但可以讓別人在上面做二次開發(fā)、做創(chuàng)新,這個系統(tǒng)也會自我演變、自我進化,能夠變得越來越好,至少不會變得越來越差”。
在整個場景不斷地發(fā)生變化中,AI系統(tǒng)若不維護,就有可能就會變得越來越差。因此華博士認為系統(tǒng)相較于平臺應該是“再往上走一個臺階”。華博士也特別提到這是他本人在他所講的這個體系里面定義的平臺和系統(tǒng),“關于其他定義可能不見得是我講的這個體系里面的”。
從平臺走向系統(tǒng),華博士希望通過系統(tǒng)能夠實現(xiàn)某個領域里面相對通用的人工智能。華博士指的還不是通用的人工智能,“雖然現(xiàn)在學術界也在研究,包括一些非常知名的專家也在做,肯定是更通用的,但我覺得這條路可能會比較長,挑戰(zhàn)還是很大的”。
所以華博士提出的是在某個領域里面比較通用的人工智能。他提到智慧城市里面,相對通用的人工智能的應用?!安皇钦f只能解決一點問題其他問題解決不了,而是能夠解決一大片的問題,并且能做到高精準、高效率和高覆蓋,這也算是AI發(fā)展的一個進展”。
近年來行業(yè)已經開始擔憂深度學習遭遇算力瓶頸,比如有一篇文章就指出“將深度學習算法錯誤率減半,需要500倍的算力”,對此華博士給出了他的看法:
“這就是我為什么要去做系統(tǒng)的一個特別好的支撐。我們要提升三高,極高的準確率、極高的效率、極高的覆蓋率,我上面提到我們也可以從算法層面來做。那就可能會遇到這樣一些問題:瓶頸也比較高。我要用原來的這套思路將模型做得越來越好甚至越來越復雜、訓練時間越來越長、數(shù)據(jù)越來越多,這就是一根筋的做法。那可能就會帶來算力的問題,甚至算力都不見得能解的問題?!?/span>
另外一條思路是可以通過系統(tǒng)的方法來做?!拔抑v其中的一個側面,比如說我們做云邊協(xié)同進化系統(tǒng)。實際上我是有個中心的大腦、中心的模型的,這個模型可能很大很復雜。但是它不是真正干活兒的,真正干活兒的實際上是在邊緣側,邊緣側就像智慧城市的場景邊緣,它只解決當前一個地方的問題。比如說這個攝像頭它只看到它的一個場景,只要把它的這個場景解決好就行了。我今天通用的做法是我有一個模型,可以打遍天下的。我所有的東西都是用同一套模型,希望他能做好,但是今天如果做極致地優(yōu)化的時候,實際上我可以讓當前這個攝像頭在它這個場景下做到極致就可以了。如果我只做這一層的優(yōu)化,那我既可以把準確率做到極高,也可以把效率做到極高。因為只是一個簡單的動作,任務就會比較簡便、比較單一。那么分開去做就會很難做,所以必須要有一套系統(tǒng)來支撐它。我不可能每個都去訓練模型,你沒有辦法做,你必須要靠系統(tǒng)自動去實現(xiàn)這件事情“。
如果有一個中央模型,它能夠不斷地自我更新,每一個端上面每個邊上還有它的模型,給它不斷地進行自我更新、自我優(yōu)化、自我進化,這樣才能實現(xiàn)大規(guī)模的高精準、高效率。這種模式存在之后,也會比較容易開發(fā)新的能力,所以可以帶來高覆蓋。
”這是做這件事情的另外一種不同的思路,我其實更看好這條思路,但是前面那個啃硬骨頭,一定還需要再繼續(xù)啃的,一定要繼續(xù)創(chuàng)造新的方法從算法模型的角度提升三高。但是另外一個角度就是通過系統(tǒng)的方法來實現(xiàn)?!?/span>
真正深入行業(yè)解決問題
“真正地深入行業(yè)去解決問題這個是我一直在做的,雖然我們講做平臺,但是仍然會解決實戰(zhàn)性的具體問題。我們不解決好問題也沒有辦法做好平臺,這是相輔相成的,我們只有知道怎么解決實際問題才可以把這些能力沉淀成為一個平臺,同時平臺也能幫助我們更高效地做實戰(zhàn)?!?/span>
近年來智慧城市里講得更多的是交通和市政管理領域。據(jù)華博士分享,交通從過去一般的城市的事件、事故現(xiàn)在已進行到車路系統(tǒng)階段。"車路系統(tǒng)是我們現(xiàn)在的一個重點,就是‘智能的車+智慧的路’。我們做的是從路測這一端來講怎樣讓路測能夠給車更高的質量,路測的信息能否賦予交通管理更多的能力,而車有自動駕駛系統(tǒng)是從車的一端做的”。
華博士舉例子來說明車路系統(tǒng):在成渝高速上就實現(xiàn)車路系統(tǒng)的應用。從路測上的傳感器和飛行器基礎的結果傳給車,車不僅獲取到自己視野里看到的信息,它能夠看到全局的信息,這樣可以很好地提升交通的安全性和通行的效率。
“我們認為未來的交通應該是車路協(xié)同的。這會涉及到很多視覺以及視覺與其他模態(tài)的融合,比如我們也會做毫米波雷達、激光雷達。這樣會對路上信息的識別更為精準。還有我們在做城市的三維重建和城市的模擬,一個大型的場館,比如體育館或者是一個演唱會,可能會引起的交通和人流的戰(zhàn)略性變化。我們可以進行模擬會不會出現(xiàn)各種各樣的異常的事件,通過三維重建和三維模擬可以把場景近似的預測出來。”
據(jù)華博士所講,未來的變化趨勢是避免產生各種各樣的意外。同時交通也可以做模擬,對交通的優(yōu)化也會起到很好的作用。工業(yè)方向華博士團隊很早以前就做過光伏電池、化纖紡織領域等。在醫(yī)療領域,華博士之前做了新冠肺炎CT的檢測、骨科的測量、還有心臟血管的重建等一些單點的技術。
“我覺得比較可圈可點的是廢鋼的定級。廢鋼是鋼鐵煉鋼中很重要的原料之一,但是廢鋼在收購的時候到底應該怎么定級。這其實既是一個比較危險又有一定隨意性的問題,每個人定的可能都不太一樣,沒有一定的標準,有標準地執(zhí)行的時候也會有很大的差異。行業(yè)里面一直沒有解決這個問題,我們是第一個去解這個問題的。我們做到高達95%的準確率。還有扣重,因為里面可能有雜質,會出現(xiàn)應該扣掉多少這個問題,對此可達90%的準確率,可超過一個非常有經驗的評估員。”
AI落地的關鍵點
AI落地最關鍵的問題是尋找或創(chuàng)造不可替代的價值,即有沒有創(chuàng)造不可替代的價值。
“今天更多的人還是停留在AI的能力深入行業(yè)這一部分。我想還是需要更多的人能夠對AI長遠一些的未來做一些思考,能夠提前做一些準備,比如說平臺化、系統(tǒng)化。還有一點是要從核心價值的角度來考慮有沒有帶來革新或者不可替代的價值。有時候技術有局限性,但這并不是代表它不能提供價值。比如說有些東西我做不到很高的準確率,但是并不代表它不能創(chuàng)造價值。因為創(chuàng)造價值不是從準確率上來講的。今天只能做到這個樣子的時候也不見得是不能創(chuàng)造價值的,比如說降低人力成本、時間成本、提升操作的安全性等都是不可替代的價值。實現(xiàn)的方法是平臺化和系統(tǒng)化,算法當然是基礎,這里不是說算法不重要,只是說我們如果只停留在算法這一層就可能很難實現(xiàn)規(guī)模化。”
關于使成熟的技術與用戶需求相匹配華博士總結了三重境界。
第一層境界是深入行業(yè),深入行業(yè)才能知道解什么樣的問題才是對用戶有價值的。華博士之前也講過價值的三重境界:錦上添花、雪中送炭、無中生有。
“我們當時瞄準的是雪中送炭,就是把無中生有放在心里,實現(xiàn)了當然更好?,F(xiàn)在主要是解決雪中送炭就可以了,或者叫做不可替代——AI產生的這個價值是不可替代。所以我們一定要深入行業(yè)、深入數(shù)據(jù)、深入場景、深入這個領域里面的核心問題”。
第二重境界是深入創(chuàng)新,這個時候解決的不僅僅是現(xiàn)有的核心問題,而是有了新的技術可以不限于行業(yè)中原來的流程、方法去做以前或者更多的事情。
第三重境界是自我協(xié)同進化。能夠不斷地讓系統(tǒng)解決的越來越多的問題,并且精準度越來越高、效率越來越高,這樣AI起到的作用更大?!扒懊嫖覀冞€沒有強調說它一定要起特別大的更廣泛的作用,它只要專門解決其中的一個問題就行了,其它的問題有別的方式來解。但是如果說我們有AI的自我協(xié)同進化系統(tǒng),也許它解的面會越來越寬,但這些還是在研發(fā)階段”。
人工智能規(guī)模化的應用,會不會增加人工智能帶來的風險呢?華博士是這樣回答的:
“任何新技術使用,在帶來便利的同時一定會帶來一定的束縛。不僅是產業(yè),包括我們每個人使用新的技術,比如說我們今天有電,那很多東西都依賴電,如果沒有電了那很多事情也做不了,這個是沒有辦法的事情。我今天如果用人工智能,如果沒有電了或者人工智能出了故障一定是會受影響的?!?/span>
華博士認為人工智能的規(guī)模化應用并沒有帶來新的問題,它帶來的問題和過去電帶來的問題、軟件數(shù)字化帶來的問題是沒有本質區(qū)別的。解決方法就是像云計算一樣提高它的可靠性,需要通過基礎設施的保障,提高可用性和穩(wěn)定性。人工智能系統(tǒng)在系統(tǒng)層面的穩(wěn)定性、安全性和容錯性這些方面也肯定是要考慮。
“這個是所有的軟件系統(tǒng)都會面臨的幾個問題,不是AI自己帶來的問題。但是有另外一個問題是AI自己的安全性的問題,這個也是非常重要的,比如說它會不會被欺騙。我們今天也做了一些研究,目前這還不是一個嚴重的問題,但是未來會是,這個也有很多人在做研究。這也是'道高一尺魔高一丈,道高十丈'這樣一種博弈的過程,跟過去的病毒、網(wǎng)絡、木馬等等這些也沒有本質區(qū)別,但也需要有法律法規(guī)的幫助,安全性其實一方面是技術,另一方面是法律法規(guī)。”
華博士在最后表示希望此次大會能夠聽到更多的人分享前沿技術的創(chuàng)新。
“不管是工業(yè)界還是學術界,我對技術的創(chuàng)新和技術創(chuàng)新之后應用的落地和規(guī)?;叶缄P心,所以我會非常愿意看到更多技術創(chuàng)新的進展。另外我也想要看到更多在產業(yè)創(chuàng)新應用上可供借鑒的經驗和案例。我也希望有更多的人不僅僅關心眼前的AI算法,能夠抬起頭來,和我們一起為AI的長久的發(fā)展做更多、更深入的思考和布局”。
在上述內容中,華先勝博士向我們展示了人工智能規(guī)?;瘧玫淖钚掳l(fā)展進程,同時也表達了對未來科技創(chuàng)新的期待。未來人工智能規(guī)模化的發(fā)展需要更多的人做深入思考,共同創(chuàng)造人工智能發(fā)展的美好愿景。
阿里巴巴一直非常重視科學研究的發(fā)展,也是本次CNCC大會的頂級贊助,與中國計算機協(xié)會(CCF)的合作也非常密切。今年阿里巴巴與CCF也聯(lián)合推出了新的合作項目。
雷鋒網(wǎng)雷鋒網(wǎng)
雷峰網(wǎng)原創(chuàng)文章,未經授權禁止轉載。詳情見轉載須知。