0
無人豬場,需要EasyDL。
“母豬正在生產(chǎn)中,無法實時知道有幾只豬崽,健康情況如何”,一位坐擁上數(shù)千頭豬的河南養(yǎng)豬大戶最近總是陷入這樣的焦慮。
席卷全國各地的豬瘟剛剛過去,為了加強防護(hù),他的豬場幾乎開啟了無人養(yǎng)殖的模式,這也為他帶來了很多頭疼的問題。
工作人員進(jìn)出一次豬棚,需要消毒、檢測,全副武裝,對于大規(guī)模養(yǎng)殖來說,成本、耗時不說,更重要的風(fēng)險很高,他清楚地記得一頭豬感染豬瘟,導(dǎo)致豬棚內(nèi)上百只豬死亡的畫面。
在嚴(yán)格的控制人員進(jìn)出的情況下,像“豬口普查”,“健康檢查”等工作也變更難了。
回想起去年這個時候的焦慮,這位養(yǎng)豬大戶輕松了不少。現(xiàn)在的他通過AI技術(shù),可以在家中實時監(jiān)控豬棚內(nèi)的狀況、判斷豬崽的健康狀態(tài)。
不僅降低了管理的風(fēng)險和成本,提高了效率,而且還避免了因其他工作人員經(jīng)驗不足,而對豬崽健康狀況的判斷失誤,這也是大規(guī)模養(yǎng)殖普遍存在的一個痛點。
而這項AI技術(shù)就是百度的零門檻AI開發(fā)平臺—EasyDL。
EasyDL是基于百度飛槳深度學(xué)習(xí)平臺推出的高效易用的零門檻、一站式AI開發(fā)平臺,支持智能數(shù)據(jù)、模型開發(fā)、服務(wù)部署等全流程服務(wù)。目前已經(jīng)支持圖像分類、物體檢測、圖像分割、音視頻分類、語音識別自訓(xùn)練、表格數(shù)據(jù)預(yù)測、文本分類、情感傾向分析等任務(wù)類型,可以幫助中小企業(yè)結(jié)合業(yè)務(wù)需求,解決效率和成本的問題。
怎么理解呢?
比如,上述豬崽體檢方面,用戶只需將病豬的圖像數(shù)據(jù)導(dǎo)入EasyDL平臺,訓(xùn)練定制化AI模型,就可以將“人為診斷經(jīng)驗”復(fù)制為機器學(xué)習(xí)經(jīng)驗,再經(jīng)過物體檢測技術(shù),無需人眼觀察也可以準(zhǔn)確判斷豬崽的健康狀態(tài)。
如此來說,EasyDL可以理解成:根據(jù)定制化場景需求,通過學(xué)習(xí)“有經(jīng)驗的專家知識”,來代替人類解決規(guī)?;膹?fù)雜問題,進(jìn)而提升成本和效益。
值得一提的是,百度AI平臺研發(fā)部總經(jīng)理忻舟,在接受雷鋒網(wǎng)采訪時多次提到:
“EasyDL的目標(biāo)是降低AI門檻,讓零算法基礎(chǔ)的用戶,不用一行代碼也可以基于需求和數(shù)據(jù),定制自己的AI解決方案”。
這一點在AI養(yǎng)豬、肉牛稱重,工業(yè)質(zhì)檢、橋梁檢修等諸多成功案例中都有所體現(xiàn),而且也普遍受到了用戶的好評。
但忻舟也強調(diào):
“簡單不意味著妥協(xié),EasyDL會始終秉持最初的研發(fā)理念:簡單且專業(yè)”。
自2017年底上線,到如今近三年的技術(shù)研發(fā)和迭代,EasyDL在數(shù)據(jù)服務(wù)、模型精度、部署服務(wù)等方面不斷升級,已經(jīng)能夠處理更多、更復(fù)雜的應(yīng)用場景。
在這里,忻舟為我們分享了一個典型案例:EasyDL幫助一家專業(yè)獵頭公司解決了其核心業(yè)務(wù)問題。
這家公司名為瀚才獵頭,自創(chuàng)立以來一直面臨著一個核心問題:200萬條數(shù)據(jù)的人才庫,利用率只有不到10%。
作為一家獵頭公司,如何高效地為客戶推薦合適的人才是他們的核心業(yè)務(wù),也是其在行業(yè)發(fā)展中的核心競爭力。
瀚才獵頭有5位創(chuàng)始人,在業(yè)務(wù)發(fā)展過程中積累了很多重要的客戶資源和龐大的人才庫,但其非結(jié)構(gòu)化數(shù)據(jù)庫和傳統(tǒng)簡歷初篩方法,讓這些資源和優(yōu)勢沒有得到很好的發(fā)揮和利用。
而這個局面在使用EasyDL后發(fā)生了改變。以前按照關(guān)鍵詞搜索的方法,每天只能找到60-70份合適的候選者簡歷,現(xiàn)在經(jīng)過數(shù)據(jù)結(jié)構(gòu)化處理后,20分鐘就可能達(dá)到600-1000份,而且精準(zhǔn)度達(dá)到了95%以上。
整個效率提升了200倍,節(jié)省了時間、人力成本的同時,200萬簡歷庫也得到了充分的利用。
一位創(chuàng)始人坦言,他們之所以選用EasyDL,不僅是因為數(shù)據(jù)結(jié)構(gòu)化的效果好,更重要的是其零開發(fā)門檻、一站式服務(wù)的特性,節(jié)省了自己配置技術(shù)團(tuán)隊,做數(shù)據(jù)處理、算法研發(fā)和算力支持的成本。
那么,無任何開發(fā)經(jīng)驗的HR是如何完成AI模型訓(xùn)練和部署的呢?
EasyDL操作流程只需以下四步:創(chuàng)建模型、數(shù)據(jù)準(zhǔn)備、模型訓(xùn)練和應(yīng)用部署。
他們根據(jù)業(yè)務(wù)需求,按照“職級”和“職能”兩級分類對200萬數(shù)據(jù)的人才庫進(jìn)行了結(jié)構(gòu)化處理:
創(chuàng)建模型:登錄EasyDL平臺,完成注冊和模型選擇。
數(shù)據(jù)方面:200萬人才數(shù)據(jù),手動標(biāo)記1萬條,再通過EasyData智能標(biāo)注完成剩余199萬條數(shù)據(jù)標(biāo)注。
模型訓(xùn)練:導(dǎo)入全部數(shù)據(jù),在平臺內(nèi)置的文心(ERNIE)預(yù)訓(xùn)練模型基礎(chǔ)上進(jìn)行訓(xùn)練。
部署方面:訓(xùn)練好的模型可直接生成供調(diào)用的API,而且有完善的SDK代碼包可以使用。
可以看到,以上操作過程無需任何代碼基礎(chǔ),只要按照業(yè)務(wù)需求,完成數(shù)據(jù)處理和提交,選擇部署方式即可,而且精準(zhǔn)度很高。不過1小時的AI模型訓(xùn)練,幫助他們解決了自創(chuàng)業(yè)以來最頭疼的業(yè)務(wù)問題。
另外,需要強調(diào)的是,以上看似簡單,易操作的背后,是其內(nèi)部復(fù)雜、先進(jìn)的AI技術(shù)支持。
在數(shù)據(jù)處理環(huán)節(jié),EasyData提供了數(shù)據(jù)采集、清洗、擴充、標(biāo)注全方位服務(wù)。
根據(jù)2019年AI機器學(xué)習(xí)項目調(diào)研的報告,96%的企業(yè)都在“數(shù)據(jù)”一環(huán)遇到了難題,尤其是數(shù)據(jù)標(biāo)注,耗時,而且準(zhǔn)確度不高。
針對這一問題,忻舟介紹稱,EasyData提供了豐富的智能標(biāo)注方案,支持物體檢測、圖像分割和文本分類三種數(shù)據(jù)類型的智能標(biāo)注,只需標(biāo)注少量數(shù)據(jù),其余便可通過“智能標(biāo)注”自動完成。在相同任務(wù)和同等模型效果下,數(shù)據(jù)標(biāo)注量平均可以減少70%。
在上述簡歷庫的文本分類中,員工手動標(biāo)記了1萬條,其余199萬全部是自動完成。
另外,在數(shù)據(jù)采集、清洗和擴充方面也經(jīng)常出現(xiàn)問題。忻舟介紹稱,一家做果蔬智能識別系統(tǒng)的創(chuàng)業(yè)公司,他們的果蔬電子秤,在超市試運營時,經(jīng)常會出現(xiàn)因物體遮擋、光線不足,導(dǎo)致數(shù)據(jù)采集質(zhì)量差的問題。
在使用EasyDL后,通過對圖像數(shù)據(jù)進(jìn)行相似度的去重去模糊,剪裁,旋轉(zhuǎn),鏡像以及數(shù)據(jù)增強等處理,在50種水果的測試中,準(zhǔn)確率達(dá)到了95%以上。
同時,EasyDL還在數(shù)據(jù)采集方面,提前對端設(shè)備進(jìn)行了測評和適配,免除了使用者在設(shè)別選型、調(diào)試和集成開發(fā)工作上的成本,將采集效率從“周級”提升到了“小時級”。
最后,忻舟重點強調(diào)稱,EasyDL根據(jù)實際的用戶需求還提供了數(shù)據(jù)回流功能,在數(shù)據(jù)處理上形成了一個完整閉環(huán),使數(shù)據(jù)處理更加高效。
在模型訓(xùn)練方面,EasyDL內(nèi)置了基于百度海量數(shù)據(jù)庫的超大規(guī)模視覺預(yù)訓(xùn)練模型和文心ERNIE 2.0。“這也是EasyDL性能遠(yuǎn)超其他AutoDL產(chǎn)品的獨特優(yōu)勢”,忻舟強調(diào)稱。
瀚才的簡歷文本分類采用文心(ERNIE)預(yù)訓(xùn)練模型,訓(xùn)練效果達(dá)到了95%+。預(yù)訓(xùn)練相當(dāng)提前學(xué)習(xí)了大量NLP語料,在一定的背景知識下,再通過持續(xù)學(xué)習(xí)的語義理解框架,對輸入數(shù)據(jù)進(jìn)行識別,可以有效提高識別的精準(zhǔn)度。
在模型訓(xùn)練上,百度還融合了自研的高性能自動數(shù)據(jù)增強(Auto Augment)、自動超參搜索(Auto Finetuner)和NAS(自動網(wǎng)絡(luò)架構(gòu)搜索)等自動化建模技術(shù),可以進(jìn)行模型自動調(diào)優(yōu),降低算法工程師的調(diào)優(yōu)成本,同時,模型精度也可以平均提升10%以上。
在服務(wù)部署環(huán)節(jié),EasyDL提供了公有云 API、本地服務(wù)器部署、設(shè)備端 SDK、軟硬一體產(chǎn)品,4大部署方式,用戶只需經(jīng)過簡單的設(shè)置,就可以將訓(xùn)練好的模型轉(zhuǎn)換為滿足業(yè)務(wù)場景需求的服務(wù)。
其中,設(shè)備端 SDK,適配了NV Jetson 系列、Intel 神經(jīng)加速棒、華為 NPU、華為 Atlas、高通 DSP、RK 等十幾種業(yè)界主流的端設(shè)備。
在軟硬件一體部署上,EasyDL適配了市面上6種高性價比的軟硬件,覆蓋高中低全矩陣,模型識別速度可提升十倍,例如EasyDL加小體積低功耗的英特爾芯片,在輕量級模型MobileNet V2上,25毫秒就可以完成端到端的預(yù)測和推理;英偉達(dá)Jason可以滿足中高性能和超高性能的場景化需求,而它在V2模型上只需要4毫秒。
2020年,EasyDL開始走向加速AI場景化落地的階段。
AI落地,是近些年人工智能產(chǎn)業(yè)發(fā)展的主旋律。一方面,計算機視覺、自然語言處理等技術(shù)已逐漸趨于成熟,急需走向現(xiàn)實場景發(fā)揮價值,另一方面,隨著社會的快速發(fā)展,中小企業(yè)的AI需求空間也在進(jìn)一步突顯。
但要想在AI和需求之間達(dá)到最佳匹配,還存在很多挑戰(zhàn)。
從2017年正式上線,實現(xiàn)從0到1的躍遷,到2018年成功案例的大量出現(xiàn),EasyDL在AI落地方面已經(jīng)初見成效。忻舟表示,2020年,隨著技術(shù)的逐步成熟,EasyDL會加快落地速度,進(jìn)一步提升AI落地能力。
具體來講,將繼續(xù)從以下三個難點入手:
AI門檻:這是所有企業(yè)尋求智能化轉(zhuǎn)型的首要痛點,尤其是對于中小企業(yè)而言,一方面不懂技術(shù),不知道哪些場景需求可以通過AI來實現(xiàn)。即使了解,對于復(fù)雜的AI技術(shù),學(xué)會應(yīng)用也是一大難點。
另一方面,對于有技術(shù)團(tuán)隊的企業(yè)來講,AI底層基礎(chǔ)設(shè)施要求很高,需要大量的資源、成本投入,而且最終達(dá)成的效果可能也未必能夠滿足需求。
從這兩點出發(fā),EasyDL一直致力于開發(fā)零算法基礎(chǔ),人人可用的AI開發(fā)平臺,同時,基于百度的海量數(shù)據(jù)和研發(fā)優(yōu)勢提升模型訓(xùn)練性能,打造從端到端的一站式服務(wù),滿足算法工程師們的應(yīng)用需求。
目前EasyDL的零門檻、專業(yè)性強等特性已經(jīng)被中小企業(yè)廣泛接收,其官網(wǎng)顯示,使用EasyDL的用戶數(shù)已經(jīng)超過70萬,覆蓋20多個行業(yè)場景,包括互聯(lián)網(wǎng)、工業(yè)、農(nóng)業(yè)、醫(yī)療、物流、零售、教育、交通等;
定制化需求:各行各業(yè)有著豐富的定制化場景需求,其中,最為明顯可以說是零售行業(yè),如商品檢測中的相似、遮擋檢測,智能結(jié)算中的 SKU 快速更新等,都需要定制化的AI解決方案。
在這方面,EasyDL除了提供通用版本外,還開發(fā)了零售行業(yè)版。為了應(yīng)對更復(fù)雜場景的檢測需求,零售版主要新增了以下核心功能:
打造軟硬一體的全自動 SKU 采集箱,降低 SKU 數(shù)據(jù)采集成本,讓采集數(shù)據(jù)更加標(biāo)準(zhǔn)、規(guī)范。
自動圖像合成技術(shù),基于SKU 單品圖和貨架圖,自動合成各類實景圖,模擬真實場景中物品的遮擋、旋轉(zhuǎn)、重疊等狀況,提高模型的泛化能力。
提供除商品檢測外的翻拍識別、貨架拼接、貨架層數(shù)識別、價簽識別等增值功能,并提供完善的 SDK。
基于以上技術(shù),零售版已經(jīng)在商品陳列審核、無人藥柜等多個場景下被廣泛使用。百度團(tuán)隊透露,接下來,還會針對農(nóng)業(yè)、工業(yè)等行業(yè)推出更多定制化版本。
AI技術(shù)能力:它是任何AI產(chǎn)品應(yīng)用落地的基礎(chǔ),也是核心。在這方面,基于百度飛槳開源深度學(xué)習(xí)平臺的EasyDL具備獨特的領(lǐng)先優(yōu)勢。
一般來講,市場上AutoDL產(chǎn)品的核心競爭力,無外乎兩個方面:一是效率問題,AI應(yīng)用最基礎(chǔ)的訴求就是如何幫助企業(yè)降低時間成本,搶占市場先機。
圍繞這一點,EasyDL在模型方面,基于飛槳的超大規(guī)模預(yù)訓(xùn)練、并行訓(xùn)練,顯著提升模型訓(xùn)練速度;在數(shù)據(jù)服務(wù)方面,為數(shù)據(jù)采集提前適配主流硬件,并提供從采集到回流的完整解決方案,節(jié)省數(shù)據(jù)處理時間。EasyDL是業(yè)內(nèi)首個提供一站式智能數(shù)據(jù)服務(wù)的產(chǎn)品。
最后值得一體的是,設(shè)備端的部署服務(wù)。忻舟介紹稱,邊緣端部署因為算力低、內(nèi)存小的特性,近些年在行業(yè)內(nèi)非?;鸨?,用戶需求非常大。因此,為企業(yè)提供高性能的邊緣端部署方案也是EasyDL的重點研發(fā)方向。
二是使用效果,這是滿足企業(yè)AI需求的關(guān)鍵性指標(biāo)。從技術(shù)層面來看,可以具體理解為文本分類的準(zhǔn)確性,物體檢測的精準(zhǔn)度。
在這方面,EasyDL內(nèi)置的基于飛槳的文心ERNIE和超大規(guī)模圖像預(yù)訓(xùn)練模型發(fā)揮了獨特優(yōu)勢,經(jīng)檢測,在視覺任務(wù)中,通過百度數(shù)據(jù)庫10萬+分類、6500萬張圖片訓(xùn)練的預(yù)訓(xùn)練模型,平均精度可提升 3.24%-7.73%;在物體檢測任務(wù)中,經(jīng)過800+標(biāo)簽、170萬圖片,1000萬+檢測框訓(xùn)練的預(yù)訓(xùn)練模型,平均精度可提升1.78%-4.53%。
除此之外,百度團(tuán)隊還升級了模型壓縮技術(shù),通過降低端側(cè)模型體積,進(jìn)一步提升模型性能。
最后談到EasyDL的進(jìn)一步研發(fā)方向,忻舟表示,將繼續(xù)圍繞簡單、但更專業(yè)的理念來開展,具體來說涉及以下幾個方面:
覆蓋范圍:除了擴展已有的算法類型,如 CV、NLP,傳統(tǒng)ML方向,語言識別方向外,還將推出OCR、視頻追蹤等定制化能力。
技術(shù)優(yōu)化:持續(xù)提升模型效果,提高訓(xùn)練速度和精度,加速模型推理。同時結(jié)合不用場景,推出更多類型的預(yù)訓(xùn)練模型。
易用性:在數(shù)據(jù)、模型、服務(wù)等方面,持續(xù)降低使用門檻。
另外,忻舟還重點提及了EasyDL的共享生態(tài)建設(shè)。他表示,希望更多企業(yè)能夠加入到EasyDL落地中來,通過真實的業(yè)務(wù)需求,探索更多AI應(yīng)用空間,由此,EasyDL也能夠根據(jù)實際場景,不斷提升技術(shù)能力,為更多企業(yè)賦能。
出于這一目的,百度團(tuán)隊近日還推出了“萬有引力計劃”,進(jìn)一步降低AI門檻,助力中小企業(yè)降本增效。
毋庸置疑的是,AI應(yīng)用場景巨大且豐富,但需要深度的探索和挖掘。
此次,為了顛覆各行各業(yè)對AI高門檻的認(rèn)知,百度EasyDL面向所有中小企業(yè)推出了——萬有引力計劃。
該計劃旨在為萬家有AI需求的企業(yè)各提供一萬元專項基金,推動其智能化轉(zhuǎn)型。
通過EasyDL經(jīng)典版免費完成模型定制、部署與應(yīng)用,即可領(lǐng)取萬元專項代金券。
無需了解算法細(xì)節(jié),最快10分鐘就可以訓(xùn)練出高精度AI模型。如果AI落地效果突出,還有機會獲得最高十萬元的特殊補貼!
參與詳情見:百度EasyDL零門檻AI開發(fā)平臺。雷鋒網(wǎng)雷鋒網(wǎng)
雷峰網(wǎng)原創(chuàng)文章,未經(jīng)授權(quán)禁止轉(zhuǎn)載。詳情見轉(zhuǎn)載須知。