調(diào)試機(jī)器學(xué)習(xí)模型的六種方法

本文作者： skura

2019-11-05 16:45

導(dǎo)語：在投入大量時間訓(xùn)練模型之前，先搞清楚什么時候會出問題至關(guān)重要

在傳統(tǒng)的軟件開發(fā)中，一個 bug 通常會導(dǎo)致程序崩潰。這對用戶來說是很煩人的，因此解決這些問題對開發(fā)人員來說很重要——當(dāng)程序失敗時，開發(fā)人員可以檢查錯誤以了解原因。

在機(jī)器學(xué)習(xí)模型中，開發(fā)人員有時會遇到錯誤，但經(jīng)常會在沒有明確原因的情況下導(dǎo)致程序崩潰。雖然這些問題可以手動調(diào)試，但機(jī)器學(xué)習(xí)模型通常由于輸出預(yù)測不佳而失敗。更糟糕的是，當(dāng)模型失敗時，通常沒有信號顯示模型失敗的原因或時間。而使情況更為復(fù)雜的是，這可能是由于一些因素造成的，包括糟糕的訓(xùn)練數(shù)據(jù)、高損失誤差或缺乏收斂速度。

調(diào)試機(jī)器學(xué)習(xí)模型的六種方法

在這篇博客文章中，我們將討論如何調(diào)試這些無聲故障，以便它們不會影響我們機(jī)器學(xué)習(xí)算法的性能。以下是我們將要介紹的內(nèi)容的簡要概述：

如何發(fā)現(xiàn)輸入數(shù)據(jù)中的缺陷。
如何使模型從較少的數(shù)據(jù)中學(xué)到更多。
如何為訓(xùn)練準(zhǔn)備數(shù)據(jù)，避免常見陷阱。
如何尋找最優(yōu)模型超參數(shù)。
如何安排學(xué)習(xí)速率以減少過擬合。
如何用權(quán)重和偏差監(jiān)測訓(xùn)練進(jìn)度。

值得注意的是，作為一名數(shù)據(jù)科學(xué)/機(jī)器學(xué)習(xí)實踐者，你需要認(rèn)識到機(jī)器學(xué)習(xí)項目失敗的原因有很多。大多數(shù)與工程師和數(shù)據(jù)科學(xué)家的技能無關(guān)（僅僅因為它不起作用并不意味著你有缺陷）。我們的收獲是，如果我們能夠盡早發(fā)現(xiàn)常見的陷阱或漏洞，我們可以節(jié)省時間和金錢。在金融、政府和醫(yī)療等高風(fēng)險應(yīng)用領(lǐng)域，這將是至關(guān)重要的。

1.如何發(fā)現(xiàn)輸入數(shù)據(jù)中的缺陷

在想知道我們的數(shù)據(jù)是否能夠勝任訓(xùn)練一個好模型的任務(wù)，可以考慮兩個方面：

數(shù)據(jù)能預(yù)測我們想要預(yù)測的結(jié)果嗎？
有足夠的數(shù)據(jù)嗎？

為了弄清楚我們的模型是否包含預(yù)測信息，我們可以捫心自問：給定這些數(shù)據(jù)，人類能做出預(yù)測嗎？

如果一個人不能理解一幅圖像或一段文字，那么我們的模型也不會預(yù)測出有意義的結(jié)果。如果沒有足夠的預(yù)測信息，給我們的模型增加更多的輸入并不會使它變得更好；相反，模型會過擬合，變得不太準(zhǔn)確。

調(diào)試機(jī)器學(xué)習(xí)模型的六種方法

一旦我們的數(shù)據(jù)有足夠的預(yù)測信息，我們就需要弄清楚我們是否有足夠的數(shù)據(jù)來訓(xùn)練一個模型來提取信號。有幾個經(jīng)驗法則可以遵循：

對于分類，我們每類至少應(yīng)有 30 個獨(dú)立樣本。
對于任何特征，特別是結(jié)構(gòu)化數(shù)據(jù)問題，我們至少應(yīng)該有 10 個樣本。
數(shù)據(jù)集的大小與模型中參數(shù)的數(shù)量成正比。這些規(guī)則可能需要根據(jù)你的特定應(yīng)用程序進(jìn)行調(diào)整。如果你能利用遷移學(xué)習(xí)，那么你可以大大減少所需樣本的數(shù)量。

2.如何使模型從較少的數(shù)據(jù)中學(xué)習(xí)更多

在許多情況下，我們只是沒有足夠的數(shù)據(jù)。在這種情況下，最好的選擇之一是擴(kuò)充數(shù)據(jù)。再進(jìn)一步，我們可以用自動編碼器和生成對抗網(wǎng)絡(luò)等生成模型生成自己的數(shù)據(jù)。

同樣，我們可以找到外部公共數(shù)據(jù)，這些數(shù)據(jù)可以在互聯(lián)網(wǎng)上找到。即使數(shù)據(jù)最初不是為我們的目的而收集的，我們也可以潛在地重新標(biāo)記它或?qū)⑵溆糜谶w移學(xué)習(xí)。我們可以在一個大數(shù)據(jù)集上為不同的任務(wù)訓(xùn)練一個模型，然后使用該模型作為任務(wù)的基礎(chǔ)。同樣，我們可以找到一個別人為不同任務(wù)訓(xùn)練過的模型，并將其重新用于我們的任務(wù)。

調(diào)試機(jī)器學(xué)習(xí)模型的六種方法

重要的是，要記住，在大多數(shù)情況下，數(shù)據(jù)的質(zhì)量勝過數(shù)據(jù)的數(shù)量。擁有一個小的、高質(zhì)量的數(shù)據(jù)集并訓(xùn)練一個簡單的模型是在訓(xùn)練過程早期發(fā)現(xiàn)數(shù)據(jù)中問題的最佳實踐。許多數(shù)據(jù)科學(xué)家犯的一個錯誤是，他們花時間和金錢獲取一個大數(shù)據(jù)集，但后來發(fā)現(xiàn)他們的項目有錯誤的數(shù)據(jù)類型。

3.如何準(zhǔn)備訓(xùn)練數(shù)據(jù)并避免常見的陷阱

有三種常用方法可以預(yù)處理訓(xùn)練過程的數(shù)據(jù)特征：

標(biāo)準(zhǔn)化確保所有數(shù)據(jù)的平均值為 0，標(biāo)準(zhǔn)偏差為 1。這是減少特征的最常見方式。如果你懷疑數(shù)據(jù)中包含異常值，那么它甚至更有用。
最小—最大重縮放通過減去最小值，然后除以值的范圍，將所有數(shù)據(jù)的值縮放到 0 和 1 之間。
平均值規(guī)范化確保數(shù)據(jù)的值介于（-1）和 1 之間，平均值為 0。我們減去平均值，除以數(shù)據(jù)的范圍。

調(diào)試機(jī)器學(xué)習(xí)模型的六種方法

然而，我們在準(zhǔn)備特征時，只測量測試集上的度量因子、平均值和標(biāo)準(zhǔn)差是很重要的。如果我們在整個數(shù)據(jù)集上測量這些因素，由于信息暴露，算法在測試集上的性能可能會比在實際生產(chǎn)中更好。

4.如何找到最優(yōu)模型超參數(shù)

手動調(diào)整神經(jīng)網(wǎng)絡(luò)模型的超參數(shù)可能非常繁瑣。這是因為當(dāng)涉及到超參數(shù)調(diào)整時，沒有科學(xué)的規(guī)則可供使用。這就是為什么許多數(shù)據(jù)科學(xué)家已經(jīng)轉(zhuǎn)向自動超參數(shù)搜索，使用某種基于非梯度的優(yōu)化算法。

為了了解如何在權(quán)重和偏差的情況下找到模型的最優(yōu)超參數(shù)，讓我們看看 mask r-cnn 計算機(jī)視覺模型的這個例子。為了實現(xiàn)語義分割任務(wù)的 mask r-cnn，connor 和 trent 調(diào)整了控制模型運(yùn)行方式的不同超參數(shù)：學(xué)習(xí)速率、梯度剪輯歸一化、權(quán)重衰減、比例、各種損失函數(shù)的權(quán)重……他們想知道圖像的語義分割是如何進(jìn)行的。由于模型使用不同的超參數(shù)進(jìn)行訓(xùn)練，因此他們集成了一個 imagecallback（）類來同步到 wandb。此外，他們還寫了一個腳本，用于運(yùn)行參數(shù)掃描，這些掃描可以適應(yīng)不同的超參數(shù)或同一超參數(shù)的不同值。

調(diào)試機(jī)器學(xué)習(xí)模型的六種方法

他們的結(jié)果可以在 Wandb Run 頁面上找到。高梯度裁剪集和高學(xué)習(xí)速率可以提高模型精度，在迭代次數(shù)增加的情況下，驗證損失分?jǐn)?shù)會迅速下降。

5.如何安排學(xué)習(xí)率以減少過度適應(yīng)

其中最重要的超參數(shù)之一是學(xué)習(xí)速率，這是很難優(yōu)化的。學(xué)習(xí)速率小導(dǎo)致訓(xùn)練速度慢，學(xué)習(xí)速率大導(dǎo)致模型過度擬合。

在尋找學(xué)習(xí)速率方面，標(biāo)準(zhǔn)的超參數(shù)搜索技術(shù)不是最佳選擇。對于學(xué)習(xí)速率，最好執(zhí)行一個行搜索并可視化不同學(xué)習(xí)速率的損失，因為這將使你了解損失函數(shù)的行為方式。在進(jìn)行直線搜索時，最好以指數(shù)方式提高學(xué)習(xí)率。你更可能關(guān)心學(xué)習(xí)速率較小的區(qū)域。

調(diào)試機(jī)器學(xué)習(xí)模型的六種方法

一開始，我們的模型可能離最優(yōu)解很遠(yuǎn)，因此，我們希望盡可能快地移動。然而，當(dāng)我們接近最小損失時，我們希望移動得更慢以避免超調(diào)。因此，我們應(yīng)該定義一個學(xué)習(xí)速率表，以便在訓(xùn)練期間根據(jù)指定的規(guī)則更新速率。

6.如何用權(quán)重和偏差監(jiān)控訓(xùn)練進(jìn)度

調(diào)試模型的一個重要部分是，在投入大量時間訓(xùn)練模型之前，先搞清楚什么時候會出問題。wandb 提供了一種無縫的方式來可視化和跟蹤機(jī)器學(xué)習(xí)實驗。你可以搜索/比較/可視化訓(xùn)練運(yùn)行，分析運(yùn)行時的系統(tǒng)使用指標(biāo)，復(fù)制歷史結(jié)果，等等。

安裝完 wandb 之后，我們要做的就是在我們的訓(xùn)練腳本中包含這段代碼：

import wandb
# Your custom arguments defined here
args = …
wandb.init(config=args, project=”my-project”)
wandb.config[“more”] = “custom”
def training_loop():
while True:
# Do some machine learning
epoch, loss, val_loss = …
# Framework agnostic / custom metrics
wandb.log({“epoch”: epoch, “l(fā)oss”: loss, “val_loss”: val_loss})

或者，我們可以將 tensorboard 集成在一行中：

wandb.init(sync_tensorboard=True)

調(diào)試機(jī)器學(xué)習(xí)模型的六種方法

TensorBoard 是 TensorFlow 擴(kuò)展，它允許我們在瀏覽器中輕松監(jiān)視模型。為了提供一個接口，我們可以從中觀察模型的進(jìn)程，tensorboard 還提供了一些對調(diào)試有用的選項。例如，我們可以在訓(xùn)練過程中觀察模型的權(quán)重和梯度的分布。如果我們真的想深入研究這個模型，tensorboard 提供了一個可視化的調(diào)試器。在這個調(diào)試器中，我們可以逐步執(zhí)行 tensorflow 模型并檢查其中的每個值。如果我們正在研究復(fù)雜的模型，比如變分自動編碼器，并且試圖理解復(fù)雜事物為什么會崩潰，這一點(diǎn)尤其有用。

結(jié)論

我們現(xiàn)在有大量的工具可以幫助我們運(yùn)行實際的機(jī)器學(xué)習(xí)項目。確保模型在部署之前能夠正常工作是至關(guān)重要的，如果不這樣做，我們會損失很多錢。希望這篇博客文章能為你提供實用的技術(shù)，使模型具有通用性，易于調(diào)試。

via：https://mc.ai/six-ways-to-debug-a-machine-learning-model/

雷鋒網(wǎng)雷鋒網(wǎng)雷鋒網(wǎng)

雷峰網(wǎng)版權(quán)文章，未經(jīng)授權(quán)禁止轉(zhuǎn)載。詳情見轉(zhuǎn)載須知。

1人收藏

相關(guān)文章

skura

編輯

發(fā)私信

當(dāng)月熱門文章