0
本文作者: AI研習(xí)社-譯站 | 2020-08-18 11:36 |
字幕組雙語(yǔ)原文:六點(diǎn)規(guī)則讓你的ML模型部署的更快
英語(yǔ)原文:Six Rules for Deploying your Machine Learning Models Faster
翻譯:雷鋒字幕組(yhfwww)
數(shù)據(jù)科學(xué)和機(jī)器學(xué)習(xí)幾乎可以改善組織的任何方面,但前提是你的想法得到利用。在過(guò)去的一年中,我們學(xué)到了很多關(guān)于更快地構(gòu)建和部署機(jī)器學(xué)習(xí)模型的知識(shí),我們想分享一些我們?cè)谶@里學(xué)到的東西。
圖:《棕色田野上奔跑的獵豹》 來(lái)自《Unsplash》,作者Cara Fuller
在我們的組織中,我們需要盡快從我們的分析投資中獲得回報(bào)。我們需要更快地將機(jī)器學(xué)習(xí)模型應(yīng)用到生產(chǎn)中。最重要的是,我們不想讓偉大的想法停留在紙面上,只能等著被使用。
傳統(tǒng)上,我們將為每個(gè)數(shù)據(jù)產(chǎn)品構(gòu)建為定制解決方案。每個(gè)定制解決方案之間幾乎沒(méi)有重用。我們需要的是一條生產(chǎn)數(shù)據(jù)產(chǎn)品的流水線(xiàn)。
因此,我們建立了一條流水線(xiàn)來(lái)構(gòu)建、測(cè)試和部署數(shù)據(jù)產(chǎn)品,我們稱(chēng)之為機(jī)器學(xué)習(xí)平臺(tái)。有了它,我們現(xiàn)在可以在幾分鐘內(nèi)將模型部署到生產(chǎn)環(huán)境中。我們不再需要等那么長(zhǎng)時(shí)間才能享受分析投資的回報(bào)。
在這個(gè)過(guò)程中,我們學(xué)習(xí)了一些關(guān)于如何安全、快速地構(gòu)建、測(cè)試和部署機(jī)器學(xué)習(xí)模型的重要規(guī)則。這些規(guī)則改變了我們的工作方式,希望您會(huì)發(fā)現(xiàn)它們對(duì)您和您的組織有用。
在我們的機(jī)器學(xué)習(xí)平臺(tái)存在之前,數(shù)據(jù)科學(xué)家創(chuàng)建的模型將交給IT部門(mén),這樣他們就可以為每個(gè)模型創(chuàng)建數(shù)據(jù)管道和模型部署環(huán)境。有些模型在部署之前甚至被重寫(xiě)成另一種語(yǔ)言。
我們構(gòu)建了機(jī)器學(xué)習(xí)平臺(tái),為模型構(gòu)建者提供了通過(guò)內(nèi)部模型管理流程自主部署模型的能力。自助服務(wù)是提高速度的關(guān)鍵。
容器提供了一種很好的隔離和模型版本管理的方法。如果您的組織使用標(biāo)準(zhǔn)服務(wù)器負(fù)載,您可能會(huì)發(fā)現(xiàn)很難在該標(biāo)準(zhǔn)服務(wù)器上安裝依賴(lài)項(xiàng)和構(gòu)件。容器解決了這個(gè)問(wèn)題??赡芊?wù)器管理員安裝程序包的時(shí)間太長(zhǎng)。容器也能解決這個(gè)問(wèn)題。您可能需要托管同一模型的新版本和舊版本一段時(shí)間,每個(gè)版本都需要一組不同的依賴(lài)關(guān)系。容器也有助于版本控制策略。
您的企業(yè)可能是全云的,有云的,或者沒(méi)有云的,但是即使您當(dāng)前沒(méi)有使用云,您也可能在考慮它。容器非常輕便。如果您采用基于容器的方法,您可以在本地或云上的任何地方運(yùn)行這些模型。
讓您的數(shù)據(jù)科學(xué)家能夠自助服務(wù)地將模型部署到生產(chǎn)環(huán)境中,同時(shí)還要負(fù)責(zé)編寫(xiě)產(chǎn)品質(zhì)量代碼。
這可能意味著你的模型構(gòu)建團(tuán)隊(duì)必須提升他們的軟件工程水平。了解一點(diǎn)Python語(yǔ)法并調(diào)用API并不能使您成為一名優(yōu)秀的軟件工程師。當(dāng)您構(gòu)建組織將在生產(chǎn)系統(tǒng)中使用的軟件時(shí),軟件質(zhì)量至少與數(shù)據(jù)和模型質(zhì)量同等重要。
這可能意味著采用諸如測(cè)試驅(qū)動(dòng)開(kāi)發(fā)和代碼評(píng)審之類(lèi)的實(shí)踐。這可能意味著嘗試配對(duì)編程。在使用notebook時(shí),您應(yīng)該仔細(xì)考慮如何以及何時(shí)使用筆記本,以及對(duì)軟件質(zhì)量的影響。幸運(yùn)的是,這些模式在軟件工程界是眾所周知的,并且非常適合大多數(shù)團(tuán)隊(duì)。
平臺(tái)的速度和穩(wěn)定性都依賴(lài)于模型部署平臺(tái)和過(guò)程的自動(dòng)化。如果你想更快,那就毫不妥協(xié)地采用自動(dòng)化。在我們的機(jī)器學(xué)習(xí)平臺(tái)上,我們已經(jīng)自動(dòng)化了整個(gè)模型生命周期。持續(xù)集成和持續(xù)交付推動(dòng)了平臺(tái)上的模型測(cè)試和模型部署。
我們還自動(dòng)化了底層平臺(tái)基礎(chǔ)設(shè)施的配置和部署。在這樣做的過(guò)程中,我們的團(tuán)隊(duì)學(xué)會(huì)了將這些自動(dòng)化虛擬機(jī)視為一次性資源。沒(méi)有人登錄到服務(wù)器進(jìn)行管理,所有管理任務(wù)都是自動(dòng)化的。這意味著無(wú)論我們擴(kuò)展多少,每個(gè)服務(wù)器都是一致配置的。我們沒(méi)有升級(jí)服務(wù)器,而是用新的基礎(chǔ)設(shè)施自動(dòng)重新部署平臺(tái)。
到目前為止,我主要關(guān)注構(gòu)建、培訓(xùn)和部署,但這只是機(jī)器學(xué)習(xí)模型生命周期的第一部分。許多型號(hào)都會(huì)逐漸變差,隨著時(shí)間的推移性能會(huì)下降。部署的模型需要監(jiān)控和調(diào)整。每個(gè)部署的模型都應(yīng)該記錄所有的輸入、輸出和異常。模型部署平臺(tái)需要提供日志存儲(chǔ)和模型性能可視化。
在我們的機(jī)器學(xué)習(xí)平臺(tái)上,每個(gè)模型將每次執(zhí)行記錄為一個(gè)通用格式。每個(gè)托管模型應(yīng)用程序都以一種通用的方式發(fā)出日志。我們路由和存儲(chǔ)這些日志,使用它們監(jiān)視模型性能并幫助識(shí)別模型漂移。最后,我們會(huì)自動(dòng)創(chuàng)建模型儀表板,以提供關(guān)于每個(gè)模型如何執(zhí)行的額外見(jiàn)解。
密切關(guān)注模型性能是有效管理機(jī)器學(xué)習(xí)模型生命周期的關(guān)鍵。不能忽視模型監(jiān)視作為模型整個(gè)生命周期的一部分。
軟件工程師已經(jīng)提出了很棒的方法和設(shè)計(jì)模式,我們可以用它們來(lái)構(gòu)建可移植的和有彈性的應(yīng)用程序。如果您的模型構(gòu)建者知道這些方法,那么其中許多方法可以很容易地適應(yīng)機(jī)器學(xué)習(xí)應(yīng)用程序。利用外面的東西。
機(jī)器學(xué)習(xí)平臺(tái)的非官方座右銘?-????noShelfWare
將這六條規(guī)則結(jié)合起來(lái)有助于我們更快地獲得結(jié)果,我希望它們也能幫助貴公司。數(shù)據(jù)科學(xué)應(yīng)該是創(chuàng)造有影響力的軟件。白皮書(shū)、儀表盤(pán)、詞云和餅圖再也不能削減開(kāi)支了,如果他們真的這樣做的話(huà)。取得成果需要很困難的工作。
這不是一條容易的路。史蒂夫·喬布斯說(shuō):“偉大的創(chuàng)意和偉大的產(chǎn)品之間還有著大量的工程步驟?!币肟焖龠M(jìn)入市場(chǎng),你可能需要戴上DevOps的帽子。這意味著你的團(tuán)隊(duì)可能需要提升他們的軟件工程技能。
但是,這是值得的。過(guò)去有時(shí)需要12個(gè)月的時(shí)間,現(xiàn)在在我們公司只需要幾分鐘。更重要的是,我們不是在構(gòu)建分析書(shū)架軟件。
雷鋒字幕組是一個(gè)由 AI 愛(ài)好者組成的翻譯團(tuán)隊(duì),匯聚五百多位志愿者的力量,分享最新的海外AI資訊,交流關(guān)于人工智能技術(shù)領(lǐng)域的行業(yè)變革與技術(shù)創(chuàng)新的見(jiàn)解。
團(tuán)隊(duì)成員有大數(shù)據(jù)專(zhuān)家、算法工程師、圖像處理工程師、產(chǎn)品經(jīng)理、產(chǎn)品運(yùn)營(yíng)、IT咨詢(xún)?nèi)?、在校師生;志愿者們?lái)自IBM、AVL、Adobe、阿里、百度等知名企業(yè),北大、清華、港大、中科院、南卡羅萊納大學(xué)、早稻田大學(xué)等海內(nèi)外高校研究所。
如果,你也是位熱愛(ài)分享的AI愛(ài)好者。歡迎與雷鋒字幕組一起,學(xué)習(xí)新知,分享成長(zhǎng)。
雷鋒網(wǎng)雷鋒網(wǎng)
雷峰網(wǎng)版權(quán)文章,未經(jīng)授權(quán)禁止轉(zhuǎn)載。詳情見(jiàn)轉(zhuǎn)載須知。