阿里巴巴開源深度學習框架 X-Deep Learning，引領高維稀疏數(shù)據(jù)場景的深度學習標準

本文作者：叢末

編輯：汪思穎

2018-11-28 14:22

導語：業(yè)界首個面向高維稀疏數(shù)據(jù)場景的深度學習開源框架~

阿里媽媽事業(yè)部

AI影響因子

開發(fā)

企業(yè)：阿里巴巴

操作：開源

內(nèi)容：阿里巴巴開源深度學習框架 X-Deep Learning

雷鋒網(wǎng) AI 科技評論按：日前，阿里巴巴宣布將旗下的大數(shù)據(jù)營銷平臺阿里媽媽的算法框架 X-Deep Learning（下文簡稱 XDL）進行開源。XDL 是阿里媽媽基于自身廣告業(yè)務自主研發(fā)的深度學習框架，目前已經(jīng)大規(guī)模部署應用在核心生產(chǎn)場景。

業(yè)界首個面向高維稀疏數(shù)據(jù)場景的深度學習開源框架

據(jù)悉，這是阿里巴巴首次公開的深度學習框架，不同于 TensorFlow、PyTorch、MxNet 等深度學習開源框架面向圖像、視頻、語音等低維稠密數(shù)據(jù)而設計，XDL 是業(yè)界首個面向超大規(guī)模高維稀疏數(shù)據(jù)場景的深度學習開源框架。

數(shù)據(jù)的高維稀疏性既是阿里媽媽業(yè)務場景的重要特征，也是互聯(lián)網(wǎng)的眾多核心應用場景（如廣告、推薦、搜索等）的特征，覆蓋了大多數(shù)互聯(lián)網(wǎng)企業(yè)的數(shù)據(jù)應用模式。而 XDL 對于推薦、搜索、廣告等互聯(lián)網(wǎng)場景的工業(yè)化應用意義重大，其針對推薦、搜索、廣告等場景的訓練方式獨創(chuàng)了結構化壓縮、高階模型嵌套訓練等范式，對大規(guī)模深度網(wǎng)絡的存儲、通信、計算等都有一個數(shù)量級以上的效率提升。

相較于 TensorFlow、PyTorch 等深度學習開源框架來說，XDL 的優(yōu)勢還體現(xiàn)在它不僅僅只是一個訓練框架，還是面向高維稀疏數(shù)據(jù)場景的完整解決方案，尤其是一系列在阿里媽媽的核心業(yè)務場景經(jīng)過生產(chǎn)驗證的算法模型，這對于推薦、搜索、廣告等領域從業(yè)者來說，有極高的參考價值，可以幫助這個行業(yè)的很多團隊實現(xiàn)技術的跨越式前進。

引領高維稀疏數(shù)據(jù)場景的深度學習標準，打造開放與易用的 XDL 框架

據(jù)阿里媽媽透露，XDL 框架從設計之初，就具備了足夠的開放性和易用性，開源是水到渠成的一步。據(jù)雷鋒網(wǎng)了解，XDL 框架具有五大系統(tǒng)核心能力：

第一，為高維稀疏數(shù)據(jù)場景而生。XDL 針對高維稀疏數(shù)據(jù)場景，進行了性能優(yōu)化，支持千億級參數(shù)的超大規(guī)模深度學習模型訓練；
第二，工業(yè)級分布式訓練。XDL 原生支持工業(yè)級的大規(guī)模分布式訓練，具備完整的分布式容災語義，可水平擴展至上干并發(fā)，支持批量學習與在線學習模式；
第三，橋接多后端支持。XDL 創(chuàng)造性地采用了橋接的架構設計理念，復用了現(xiàn)有的開學深度學習框架的單節(jié)點稠密計算能力，支持 TensorFlow 與 MxNet 作為其單節(jié)點計算后端。這種橋接的架構，使得 XDL 跟業(yè)界的開源社區(qū)無縫對接。此外，對于已經(jīng)在使用其它開源框架的企業(yè)或者個人用戶，也可以在原有系統(tǒng)基礎上輕松進行擴展。
第四，高效的結構化壓縮訓練。XDL 針對互聯(lián)網(wǎng)數(shù)據(jù)的特點，提出了結構化壓縮訓練模式，大幅縮減 IO 通信量和訓練計算量，訓練效率可達 10 倍以上的提升；
第五，獨創(chuàng)的高級模型服務器。XDL 提出了全新的 model shuffle 模式，原生支持多模態(tài)網(wǎng)絡、異構計算網(wǎng)絡等復雜算法。

創(chuàng)新的算法解決方案

除了核心的 XDL 訓練框架外，阿里媽媽透露將全面開源面向高維稀疏數(shù)據(jù)場景的系統(tǒng)化解決方案，計劃分批次對外發(fā)布，包括面向在線實時服務的高性能深度學習預估引擎、面向全庫實時檢索的全新深度學習匹配引擎。值得一提的是，這些系統(tǒng)解決方案還內(nèi)置阿里媽媽自主研發(fā)的一系列創(chuàng)新算法，包括：

點擊率預估領域的深度興趣網(wǎng)絡（Deep Interest Network，DIN）、用戶興趣演化網(wǎng)絡（Deep Interest Evolution Network，DIEN）以及跨媒介網(wǎng)絡（Cross Media Network，CMN）
轉化率預估領域的全空間多任務模型（Entire Space Multi-task Model，ESMM）
匹配召回領域的樹型深度匹配模型（Tree-based Deep Match，TDM）
模型壓縮領域的基于蒸餾模式的模型壓縮訓練算法（Rocket Training）

最后，我們也來回顧一下 TensorFlow、PyTorch 以及國內(nèi)的 Paddlepaddle 等深度學習開源框架：

TensorFlow：谷歌于 2015 年 11 月宣布開源 TensorFlow 深度學習框架，這一框架基于谷歌推出的第一代內(nèi)部深度學習框架——DistBelief 框架。在開源時，谷歌曾表示，開源 TensorFlow 能夠加速谷歌在人工智能上的部署，幫助其在人工智能發(fā)展日益重要的未來搶占更多主導權。過去三年間，TensorFlow 在開發(fā)者社區(qū)享有盛譽，已成為最為常用的深度學習框架之一，目前不僅支持 Eager Execution 動態(tài)圖機制，還集成了 NVIDIA TensorRT，此外，TensorFlow 中文社區(qū)論壇（https://www.tensorflowers.cn）也正式上線。據(jù)悉，谷歌將于 2019 年發(fā)布 TensorFlow v 2.0。
PyTorch：2017 年初，F(xiàn)acebook 在 Torch 的基礎上，針對 Python 語言發(fā)布了全新的機器學習工具包——PyTorch。目前，PyTorch 已經(jīng)融合了 Caffe2 和 ONNX 支持模塊化、面向生產(chǎn)的功能，并保留了其靈活、以研究為中心的設計。
Paddlepaddle：2016 年 8 月底，百度開源自研深度學習平臺 PaddlePaddle。2017 年 11 月，PaddlePaddle 發(fā)布三項新功能：PaddlePaddleFluid，PaddlePaddleCloud，PaddlePaddleEDL，這三大新功能的推出，進一步加強了 PaddlePaddle 的易用性，提高了效率，并降低了開發(fā)者的使用門檻。雷鋒網(wǎng)

雷峰網(wǎng)原創(chuàng)文章，未經(jīng)授權禁止轉載。詳情見轉載須知。

4人收藏

叢末

編輯

發(fā)私信

當月熱門文章

阿里巴巴開源深度學習框架 X-Deep Learning，引領高維稀疏數(shù)據(jù)場景的深度學習標準

業(yè)界首個面向高維稀疏數(shù)據(jù)場景的深度學習開源框架

引領高維稀疏數(shù)據(jù)場景的深度學習標準，打造開放與易用的 XDL 框架

創(chuàng)新的算法解決方案

阿里巴巴開源深度學習框架 X-Deep Learning，引領高維稀疏數(shù)據(jù)場景的深度學習標準