丁香五月天婷婷久久婷婷色综合91|国产传媒自偷自拍|久久影院亚洲精品|国产欧美VA天堂国产美女自慰视屏|免费黄色av网站|婷婷丁香五月激情四射|日韩AV一区二区中文字幕在线观看|亚洲欧美日本性爱|日日噜噜噜夜夜噜噜噜|中文Av日韩一区二区

<label id="qtdnu"></label>

<li id="qtdnu"><legend id="qtdnu"></legend></li>

<span id="qtdnu"></span>

<rt id="xpvqe"><small id="xpvqe"></small></rt>

您正在使用IE低版瀏覽器，為了您的雷峰網(wǎng)賬號安全和更好的產(chǎn)品體驗，強烈建議使用更快更安全的瀏覽器

此為臨時鏈接，僅用于文章預(yù)覽，將在時失效

人工智能正文

發(fā)私信給skura

發(fā)送

0

云腦科技徐昊：AutoML 工程實踐與大規(guī)模行業(yè)應(yīng)用 | AI研習(xí)社104期大講堂總結(jié)

本文作者： skura

2019-01-05 10:42

導(dǎo)語：關(guān)于 AutoML 算法進展、工程落地等問題~

雷鋒網(wǎng)AI 科技評論按： AutoML 是今年的機器學(xué)習(xí)的熱點，該技術(shù)潛力很大，在工程實踐能夠產(chǎn)生巨大的價值?，F(xiàn)階段，業(yè)界主要在探討 AutoML 的難點與方向階段，目前還沒有一家推出系統(tǒng)性的方案。在工程實踐上，AutoML 還沒有成為機器學(xué)習(xí)流程自動化、智能化的主要推動力。在實際應(yīng)用中，針對大數(shù)據(jù)大模型的 AutoML 優(yōu)化在 research 與 engineering 兩方面都很缺乏。在本次公開課中，嘉賓分享了關(guān)于 AutoML 的算法和工程落地等實際問題。

分享嘉賓：

徐昊，云腦科技核心算法工程師，機器學(xué)習(xí)與高性能計算專家。在機器學(xué)習(xí)，自然語言處理，高性能分布式計算、圖計算、隨機優(yōu)化等領(lǐng)域有著十余年研發(fā)經(jīng)驗。辛辛那提大學(xué)計算機工程博士，發(fā)表 IEEE/ACM 頂級論文 20 余篇，曾獲第八屆國際低能耗電子器件會議唯一最佳論文獎。曾任 ANSYS 軟件首席工程師，主持了 10 億級節(jié)點的分布式概率圖計算系統(tǒng)的開發(fā)。

公開課回放地址：
http://www.mooc.ai/course/607/learn?lessonid=2939#lesson/2939

分享主題：AutoML 工程實踐與大規(guī)模行業(yè)應(yīng)用

分享提綱：

AutoML 業(yè)界動態(tài)
AutoML 算法前沿進展
AutoML 大規(guī)模工程應(yīng)用落地問題
云腦科技高效 AutoML 系統(tǒng)
云腦 AutoML 在推薦,、游戲,、金融等領(lǐng)域的應(yīng)用

雷鋒網(wǎng) AI 科技評論將其分享內(nèi)容整理如下：

AutoML 在 2018 年是一個比較火的話題，salesforce 和微軟都開源了 AutoML 的庫，有很多開源軟件包，如 AUTO KERAS，Auto-Sklearn 和 AutoWeka。

云腦科技徐昊：AutoML 工程實踐與大規(guī)模行業(yè)應(yīng)用 | AI研習(xí)社104期大講堂總結(jié)

在算法上，今年在科研上比較受歡迎的是 NAS 算法，主要涉及神經(jīng)網(wǎng)絡(luò)結(jié)構(gòu)方面的搜索。在超參的搜索方面，研究比較多的是 Model Based Sequential Optimization，基本思路是在超參空間里面先采樣后建模，選擇下一個提升概率比較高的超參點，比較流行的模型是貝葉斯和 TPE 模型等。Google 的 paper《Hyperband》上一種簡單的 Bandit 方法使用的較多，基本思路是先在超參空間撒點采樣，然后對每個點進行訓(xùn)練，訓(xùn)練結(jié)果更好的點可以獲得更多的資源。還有 Population based Algorithm 算法，這些都是組合優(yōu)化問題比較經(jīng)典的解法。

云腦科技徐昊：AutoML 工程實踐與大規(guī)模行業(yè)應(yīng)用 | AI研習(xí)社104期大講堂總結(jié)

在工程應(yīng)用的落地方面，AutoML 還處于實驗階段，模型的優(yōu)化和調(diào)試效率有一定的問題，但是工程潛力巨大。它的缺點是：計算量巨大，不能滿足項目快速迭代的需求；目前僅限于調(diào)參問題；在搜索和優(yōu)化的過程中像一個黑盒子，人機交互較少。因此，AutoML 在大項目中應(yīng)用落地還存在一定的問題。

云腦科技徐昊：AutoML 工程實踐與大規(guī)模行業(yè)應(yīng)用 | AI研習(xí)社104期大講堂總結(jié)

在工程實踐中落地要考慮哪些因素呢？首先是精確度、工程迭代速度、Serving 壓力，然后如果是深度學(xué)習(xí)，還要考慮深度學(xué)習(xí)優(yōu)化加速，最后，線上模型的動態(tài)效果也需要考慮，因為線上模型的表現(xiàn)和線下的可能不一樣。那么，對應(yīng)的優(yōu)化環(huán)節(jié)是下圖左邊的樣本效率、特征效率、模型選擇、優(yōu)化效率和線上策略效率。

云腦科技徐昊：AutoML 工程實踐與大規(guī)模行業(yè)應(yīng)用 | AI研習(xí)社104期大講堂總結(jié)

云腦在這些優(yōu)化環(huán)節(jié)是如何做的？

樣本效率

樣本效率是機器學(xué)習(xí)最核心的問題之一，機器學(xué)習(xí)本質(zhì)上是一個采樣加擬合的過程，但是這個過程在很多系統(tǒng)中并不是一次性完成的。很多情況下，樣本的處理都很簡單，大量樣本沒有用或者效率較低。樣本的選擇對精度的影響較大，其數(shù)量對耗時的影響是線性的。

我們把信息量大的樣本留下來，信息量小的去掉。如何衡量樣本信息量？可以從無監(jiān)督角度和業(yè)務(wù)角度考察樣本的信息量。

云腦科技徐昊：AutoML 工程實踐與大規(guī)模行業(yè)應(yīng)用 | AI研習(xí)社104期大講堂總結(jié)

下面來看一個例子。下圖是游戲點擊率的線上數(shù)據(jù)。這是一個重度玩家在 11 天內(nèi)樓蘭游戲時對不同游戲的點擊和曝光數(shù)。如果我們需要分析用戶的喜好，只需要輸入幾百個甚至幾十個樣本點，而不需要輸入全部 3000 個樣本點，這就是樣本的靜態(tài)效率可以提升的空間。

云腦科技徐昊：AutoML 工程實踐與大規(guī)模行業(yè)應(yīng)用 | AI研習(xí)社104期大講堂總結(jié)

樣本難度也是影響樣本效率的重要因素，提高模型精度的關(guān)鍵在于獲得更多的復(fù)雜樣本。其次，需要去掉噪聲樣本。那么如何分析樣本的難度？一般使用模型預(yù)測值和真實標簽 cross entropy。保持原有數(shù)據(jù)的分布對樣本訓(xùn)練過程來說非常重要。

特征效率

特征（尤其是稀疏特征）對訓(xùn)練數(shù)據(jù)的效率影響很大。在項目工期緊張的時候，把所有的特征扔進模型學(xué)習(xí)是不實際的，因此我們進行定量分析。維度大的特征對訓(xùn)練的影響非常大。稀疏特征也需要重點分析。對過于稀疏的特征值截斷處理也可以提高特征效率。我們現(xiàn)在比較重視變長特征的處理。變長特征通常是在嵌入以后取平均值或求和，變長特征長的樣本對 batch 的影響較大。

云腦科技徐昊：AutoML 工程實踐與大規(guī)模行業(yè)應(yīng)用 | AI研習(xí)社104期大講堂總結(jié)

AutoML 自動優(yōu)化效率

AutoML 是在 5 維度超大空間聯(lián)合分布里面尋找最優(yōu)點：數(shù)據(jù)維度、特征維度、模型維度、優(yōu)化維度和線上策略維度。傳統(tǒng)方法里面，人負責(zé)數(shù)據(jù)采樣、特征工程和調(diào)參，只有深度學(xué)習(xí)模型是自動學(xué)習(xí)的。而前沿的算法：Model based sequential optimization 基本上是建模加采樣的方法，它假設(shè)整個超參空間是連續(xù)的；Bandit based 是一種純采樣的算法，其假設(shè)是優(yōu)化空間優(yōu)化過程中的精度的連續(xù)的，其缺點在于它是純采樣，沒有模型。而實際項目中由于各種原因，全局最優(yōu)解是個非常復(fù)雜的問題。

云腦科技徐昊：AutoML 工程實踐與大規(guī)模行業(yè)應(yīng)用 | AI研習(xí)社104期大講堂總結(jié)

在實際工程中，還需要考慮機器學(xué)習(xí)全流程優(yōu)化的問題。它包括數(shù)據(jù)清洗、特征工程和模型調(diào)試中的工程迭代效率。我們還需要考慮線上 serving 效率、線上策略優(yōu)化和深度學(xué)習(xí)優(yōu)化加速問題。

云腦科技徐昊：AutoML 工程實踐與大規(guī)模行業(yè)應(yīng)用 | AI研習(xí)社104期大講堂總結(jié)

云腦的 AutoML 系統(tǒng)全貌如下圖所示。

云腦科技徐昊：AutoML 工程實踐與大規(guī)模行業(yè)應(yīng)用 | AI研習(xí)社104期大講堂總結(jié)

云腦 AutoML 在多個領(lǐng)域都有應(yīng)用：

云腦科技徐昊：AutoML 工程實踐與大規(guī)模行業(yè)應(yīng)用 | AI研習(xí)社104期大講堂總結(jié)

雷鋒網(wǎng)

雷峰網(wǎng)版權(quán)文章，未經(jīng)授權(quán)禁止轉(zhuǎn)載。詳情見轉(zhuǎn)載須知。

2人收藏

分享：

相關(guān)文章

skura

編輯

發(fā)私信

當(dāng)月熱門文章

最新文章

熱門搜索

平板電腦 Kickstarter 美國聯(lián)發(fā)科 O2O 李彥宏 Apple Pay 眾籌 iWatch 數(shù)字貨幣圖像識別

為了您的賬戶安全，請驗證郵箱

您的郵箱還未驗證,完成可獲20積分喲！

重發(fā)郵箱修改郵箱

請驗證您的郵箱

立即驗證

完善賬號信息

您的賬號已經(jīng)綁定，現(xiàn)在您可以設(shè)置密碼以方便用郵箱登錄

立即設(shè)置 以后再說

<label id="xzfni"><legend id="xzfni"></legend></label>

<label id="xzfni"></label>

<span id="xzfni"></span>

<label id="xzfni"></label>