丁香五月天婷婷久久婷婷色综合91|国产传媒自偷自拍|久久影院亚洲精品|国产欧美VA天堂国产美女自慰视屏|免费黄色av网站|婷婷丁香五月激情四射|日韩AV一区二区中文字幕在线观看|亚洲欧美日本性爱|日日噜噜噜夜夜噜噜噜|中文Av日韩一区二区

<label id="qtdnu"></label>

<li id="qtdnu"><legend id="qtdnu"></legend></li>

<span id="qtdnu"></span>

您正在使用IE低版瀏覽器，為了您的雷峰網(wǎng)賬號安全和更好的產(chǎn)品體驗，強烈建議使用更快更安全的瀏覽器

此為臨時鏈接，僅用于文章預(yù)覽，將在時失效

人工智能開發(fā)者正文

發(fā)私信給skura

發(fā)送

0

不再受限于數(shù)據(jù)集和硬件，下一代 ML 軟件如何構(gòu)建？

本文作者： skura

2020-02-11 16:09

導(dǎo)語：深度學(xué)習(xí)不再難

在不久以前，數(shù)據(jù)科學(xué)團(tuán)隊需要一些東西來有效地利用深度學(xué)習(xí)：

一種新穎的模型結(jié)構(gòu)，這個結(jié)構(gòu)可能是內(nèi)部設(shè)計的
訪問大型且、專有的數(shù)據(jù)集
大型模型訓(xùn)練的硬件或資金

這些條件將深度局限于滿足它們的少數(shù)項目中，阻礙了深度學(xué)習(xí)的發(fā)展。

然而，在過去幾年里，情況發(fā)生了變化。

在 Cortex，我們看到用戶推出了基于深度學(xué)習(xí)的新一代產(chǎn)品，與以前不同的是，這些產(chǎn)品并非都是使用獨一無二的模型架構(gòu)構(gòu)建的。

這種增長背后的驅(qū)動力是遷移學(xué)習(xí)。

什么是遷移學(xué)習(xí)？

廣義上講，遷移學(xué)習(xí)是指為特定任務(wù)訓(xùn)練的模型中積累的知識，例如，識別照片中的花可以遷移到另一個模型中，以幫助對不同的相關(guān)任務(wù)（如識別某人皮膚上的黑色素瘤）進(jìn)行預(yù)測。

如果你想在遷移學(xué)習(xí)上有更專業(yè)的鉆研，Sebastian Ruder 已經(jīng)寫了一本很棒的入門書：https://ruder.io/transfer-learning/ 。

遷移學(xué)習(xí)有多種方法，但有的方法特別是微調(diào)方法被廣泛采用。

在這種方法中，團(tuán)隊接受一個預(yù)先訓(xùn)練的模型，并移除/重新訓(xùn)練模型的最后一層，以專注于一個新的、相關(guān)的任務(wù)。例如，AI Dungeon 是一款開放世界的文本冒險游戲，它的人工智能生成的故事非常有說服力：

不再受限于數(shù)據(jù)集和硬件，下一代 ML 軟件如何構(gòu)建？

圖片來源：AI Dungeon

值得注意的是，AI Dungeon 不是在谷歌的研究實驗室里開發(fā)的，它是一個由個人工程師建造的黑客競技項目。

AI Dungeon 的創(chuàng)建者 Nick Walton 并不是從頭開始設(shè)計模型，而是通過采用最先進(jìn)的 NLP 模型 OpenAI 的 GPT-2，然后根據(jù)自己選擇的冒險文本進(jìn)行微調(diào)獲得的。

這項工作之所以有效，是因為在神經(jīng)網(wǎng)絡(luò)中，最初的層關(guān)注簡單的、一般的特征，而最后的層則關(guān)注更多特定于任務(wù)的分類、回歸。Andrew Ng 通過想象一個圖像識別模型來可視化這些層和它們的相對特異性水平：

不再受限于數(shù)據(jù)集和硬件，下一代 ML 軟件如何構(gòu)建？

圖片來源：Stanford

事實證明，基本層的一般知識通?？梢院芎玫剞D(zhuǎn)化為其他任務(wù)。在 AI Dungeon 的例子中，GPT-2 對常用的英語有著最先進(jìn)的理解，它只需要在它的最后一層進(jìn)行一些再訓(xùn)練，就可以在自己選擇的冒險類型中表現(xiàn)出色。

通過這個過程，一個工程師可以在幾天內(nèi)將一個模型部署到一個新的域中，從而獲得最新的結(jié)果。

為什么遷移學(xué)習(xí)是下一代 ML 的軟件的關(guān)鍵

在前面，我提到了機器學(xué)習(xí)和深度學(xué)習(xí)所需要的條件，特別是要有效地使用這些條件。你需要訪問一個大的、干凈的數(shù)據(jù)集，你需要能夠設(shè)計一個有效的模型，你需要訓(xùn)練它的方法。

這意味著在默認(rèn)情況下，在某些領(lǐng)域或沒有某些資源的項目是不可行的。

現(xiàn)在，通過遷移學(xué)習(xí)，這些瓶頸正在消除：

1.小數(shù)據(jù)集不再是瓶頸

深度學(xué)習(xí)通常需要大量的標(biāo)記數(shù)據(jù)，然而在許多領(lǐng)域中，這么多數(shù)據(jù)根本不存在。遷移學(xué)習(xí)可以解決這個問題。

例如，哈佛醫(yī)學(xué)院下屬的一個研究小組最近部署了一個模型，該模型可以「根據(jù)胸片預(yù)測長期死亡率，包括非癌癥死亡」。

不再受限于數(shù)據(jù)集和硬件，下一代 ML 軟件如何構(gòu)建？

圖片來源：JAMA Network

有了大約50000個標(biāo)記圖像的數(shù)據(jù)集，他們沒有從零開始訓(xùn)練 CNN 所需的數(shù)據(jù)。實際上，他們采用了一個預(yù)先訓(xùn)練過的 Inception-v4 模型（在超過 1400 萬張圖像的 ImageNet 數(shù)據(jù)集上進(jìn)行訓(xùn)練），并使用了遷移學(xué)習(xí)和輕微的架構(gòu)修改來使模型適應(yīng)他們的數(shù)據(jù)集。

最后，他們的 CNN 成功地為每位患者僅使用一張胸部圖像來生成與患者實際死亡率相關(guān)的風(fēng)險評分。

2.模型可以在幾分鐘內(nèi)訓(xùn)練，而不是幾天

在海量數(shù)據(jù)上訓(xùn)練模型不僅有獲取大型數(shù)據(jù)集的問題，還有資源和時間的問題。

例如，當(dāng) Google 開發(fā)最先進(jìn)的圖像分類模型 exception 時，他們訓(xùn)練了兩個版本：一個是 ImageNet 數(shù)據(jù)集（包含 1400 萬張圖像），另一個是 JFT 數(shù)據(jù)集（包含 3.5 億張圖像）。

在 60 NVIDIA K80 GPU 上進(jìn)行各種優(yōu)化的訓(xùn)練，運行一個 ImageNet 實驗需要 3 天。JFT 的實驗花了一個多月的時間。

然而，現(xiàn)在已經(jīng)發(fā)布了預(yù)訓(xùn)練的異常模型，團(tuán)隊可以更快地微調(diào)自己的版本。

例如，伊利諾伊大學(xué)和阿貢國家實驗室的一個小組最近訓(xùn)練了一個模型，將星系的圖像分類為螺旋狀或橢圓形：

不再受限于數(shù)據(jù)集和硬件，下一代 ML 軟件如何構(gòu)建？

資料來源：阿貢計算設(shè)備

盡管只有 35000 個標(biāo)記圖像的數(shù)據(jù)集，他們能夠在 8 分鐘內(nèi)使用 NVIDIA GPU 對異常進(jìn)行微調(diào)。

當(dāng)它在 GPU 上服務(wù)時，所得到的模型能夠?qū)⑿窍狄悦糠昼姵^ 20000 個的超人速度進(jìn)行歸類，且準(zhǔn)確率高達(dá) 99.8% 。

3.訓(xùn)練模型不再像投資一樣有風(fēng)險

即便模型在 60 個 gpu 上訓(xùn)練數(shù)月的時間，谷歌可能也不太在乎成本。然而，對于那些沒有谷歌規(guī)模預(yù)算的團(tuán)隊來說，模型訓(xùn)練的價格是一個真正令人擔(dān)憂的問題。

例如，當(dāng) OpenAI 第一次公布 GPT-2 的結(jié)果時，他們發(fā)布了模型架構(gòu)，但由于擔(dān)心有問題，于是并沒有發(fā)布完整的預(yù)訓(xùn)練模型。

作為回應(yīng)，Brown 的一個團(tuán)隊按照本文所述的架構(gòu)和訓(xùn)練過程復(fù)制了 GPT-2，并調(diào)用了他們的模型 OpenGPT-2。他們花了大約 5 萬美元去訓(xùn)練，但表現(xiàn)不如 GPT-2。

如果一個模型的性能低于最先進(jìn)的水平，那么 50000 美元對于任何一個團(tuán)隊來說都是一個巨大的風(fēng)險，因為他們是在沒有大量資金的情況下構(gòu)建真正的生產(chǎn)軟件。

幸運的是，遷移學(xué)習(xí)大大降低了這一成本。

當(dāng) Nick Walton 創(chuàng)建 AI Dungeon 時，他通過微調(diào) GPT-2 來完成。OpenAI 已經(jīng)投入了大約 27118520 頁的文本和數(shù)千美元來訓(xùn)練這個模型，而 Walton 不需要重新創(chuàng)建。

相反，他使用了從 chooseyourstory.com 上截取的一組小得多的文本，并在完全免費的 Google Colab 中對模型進(jìn)行了微調(diào)。

機器學(xué)習(xí)工程正在成為一個真正的生態(tài)系統(tǒng)

將軟件工程看作一個并行的過程，我們通常會看到生態(tài)系統(tǒng)以相當(dāng)標(biāo)準(zhǔn)的模式「成熟」。

一種新的編程語言將有一些令人興奮的特性，人們將把它用于專門的用例、研究項目和玩具。在這個階段，任何使用它的人都必須從頭開始構(gòu)建所有的基本實用程序。

接下來，社區(qū)中的人們開發(fā)庫和項目，將公共實用程序抽象出來，直到工具能夠穩(wěn)定地用于生產(chǎn)。

在這個階段，使用它來構(gòu)建軟件的工程師并不關(guān)心發(fā)送 HTTP 請求或連接到數(shù)據(jù)庫，所有這些都是抽象出來的，只關(guān)注于構(gòu)建他們的產(chǎn)品。

換句話說，F(xiàn)acebook 構(gòu)建 React，Google 構(gòu)建 Angular，工程師使用它們來構(gòu)建產(chǎn)品。隨著遷移學(xué)習(xí)的發(fā)展，機器學(xué)習(xí)工程正朝著這一步邁進(jìn)。

隨著 OpenAI、Google、Facebook 和其他科技巨頭發(fā)布強大的開源模型，機器學(xué)習(xí)工程師的「工具」變得更加強大和穩(wěn)定。

機器學(xué)習(xí)工程師們不再花時間用 PyTorch 或 TensorFlow 從頭開始構(gòu)建模型，而是使用開源模型和遷移學(xué)習(xí)來構(gòu)建產(chǎn)品，這意味著全新一代的 ML 驅(qū)動軟件即將面世。

現(xiàn)在，機器學(xué)習(xí)工程師只需要擔(dān)心如何將這些模型投入生產(chǎn)。

注意：如果你對使用經(jīng)過微調(diào)的模型構(gòu)建軟件感興趣，請查看 Cortex，一個用于部署模型的開源平臺：https://github.com/cortexlabs/cortex 。

via：https://towardsdatascience.com/deep-learning-isnt-hard-anymore-26db0d4749d7

雷鋒網(wǎng)雷鋒網(wǎng)雷鋒網(wǎng)

雷峰網(wǎng)版權(quán)文章，未經(jīng)授權(quán)禁止轉(zhuǎn)載。詳情見轉(zhuǎn)載須知。

0人收藏

分享：

相關(guān)文章

skura

編輯

發(fā)私信

當(dāng)月熱門文章

最新文章

熱門搜索

聯(lián)想支付寶財報 intel 小鵬汽車 DIY RIM 上汽 ?？?/a> api MIUI

為了您的賬戶安全，請驗證郵箱

您的郵箱還未驗證,完成可獲20積分喲！

重發(fā)郵箱修改郵箱

請驗證您的郵箱

立即驗證

完善賬號信息

您的賬號已經(jīng)綁定，現(xiàn)在您可以設(shè)置密碼以方便用郵箱登錄

立即設(shè)置 以后再說