丁香五月天婷婷久久婷婷色综合91|国产传媒自偷自拍|久久影院亚洲精品|国产欧美VA天堂国产美女自慰视屏|免费黄色av网站|婷婷丁香五月激情四射|日韩AV一区二区中文字幕在线观看|亚洲欧美日本性爱|日日噜噜噜夜夜噜噜噜|中文Av日韩一区二区

您正在使用IE低版瀏覽器,為了您的雷峰網(wǎng)賬號安全和更好的產(chǎn)品體驗,強烈建議使用更快更安全的瀏覽器
此為臨時鏈接,僅用于文章預覽,將在時失效
人工智能 正文
發(fā)私信給叢末
發(fā)送

0

對話阿里媽媽 XDL 團隊:希望這一框架成為國內(nèi)推薦搜索廣告領域最主流的選擇

本文作者: 叢末 編輯:汪思穎 2018-12-29 21:48
導語:現(xiàn)在開源的 XDL 已經(jīng)經(jīng)歷了三次迭代。

雷鋒網(wǎng) AI 科技評論按:11 月 28 日,阿里巴巴宣布將旗下的大數(shù)據(jù)營銷平臺阿里媽媽的算法框架 X-Deep Learning(下文簡稱 XDL)進行開源,其中,XDL 的面向高維稀疏數(shù)據(jù)場景、工業(yè)級分布式訓練以及橋接多后端支持三大主要特點,更是引起了業(yè)界的廣泛關注。

12 月 21 日,阿里媽媽正式對 XDL 開源,雷鋒網(wǎng) AI 科技評論也借這一機會對阿里媽媽 XLD 團隊進行了采訪,來了解 XDL 研發(fā)背后的契機和技術積累、應用場景、特點優(yōu)勢及未來規(guī)劃。

XDL 四位主要負責人:

靖世:研究員,阿里媽媽定向廣告技術團隊負責人兼阿里媽媽算法平臺負責人

見獨:資深技術專家,阿里媽媽工程平臺技術負責人

懷人:資深算法專家,阿里媽媽算法平臺深度學習方向負責人兼定向廣告排序算法團隊負責人

樂迪:資深技術專家,阿里媽媽大數(shù)據(jù)計算與機器學習平臺的工程架構負責人

據(jù)悉,XDL 這一框架的研發(fā)萌芽于 2016 年年初,當時 XDL 團隊就開始探索深度學習在廣告技術中端到端建模的方法,在這個過程中遇到的來自業(yè)務和技術方面的挑戰(zhàn),則促成了 XDL 研發(fā)。

在采訪中,XDL 團隊透露,在阿里發(fā)布開源 XDL 這一消息后,就有超過十家以上的大中型公司向阿里媽媽團隊表達了它們的需求,這無疑大大也大大增強了團隊對于這一框架的信心。采訪最后,他們還表達了對 XDL 的愿景:「希望在國內(nèi)的推薦、搜索、廣告領域,XDL 是深度學習框架最主流的選擇?!?/p>

XDL 研發(fā)背后的契機和技術積累

1.這一框架是從什么時候開始進行研發(fā)的?基于怎樣的契機和阿里已有的技術積累?

XDL 是從 2016 年中期開始研發(fā)的。不過實際上,早在 2016 年初的時候,我們就在探討深度學習在廣告技術的發(fā)展方向,并在當時提出了面向核心的點擊率(CTR)預估建模的 Deep Interest Network 算法雛形;2016 年年中,我們啟動了第一個基于深度學習的端到端 CTR 模型的研發(fā),并且希望不只是采用 Embedding+MLP 這樣的簡單架構,而是實現(xiàn)深度學習模型更靈活多樣的創(chuàng)新迭代。這是 XDL 項目啟動前的一個大背景。

具體來說,XDL 的研發(fā)主要受業(yè)務和技術兩個層面的驅(qū)動,這也是該項目啟動的契機:

  • 一方面是業(yè)務場景對深度學習提出了更高的要求。在淘寶這樣的電商場景下,數(shù)據(jù)具有高維稀疏的特點,比如在淘寶上的一個用戶對應一個商品,二者間的樣本非常稀疏,因而給數(shù)據(jù)表示、組織以及傳輸、計算帶來了極大的挑戰(zhàn)。一開始,我們也曾嘗試過使用 TensorFlow 來構建技術框架來解決這一問題,但實踐后很快得出結(jié)論,單純使用 TensorFlow 很難解決阿里媽媽面對的問題。

  • 另一方面則是技術的變革驅(qū)動了我們在該技術領域的研究。隨著深度學習的發(fā)展,其網(wǎng)絡結(jié)構變得特別復雜,我們認為這種復雜的復合網(wǎng)絡結(jié)構的迭代、優(yōu)化的效率,在硬件和軟件層面都有很大的提升空間。

XDL 研發(fā)前,阿里主要有兩個技術積累:一是阿里媽媽事業(yè)部牽頭做的阿里巴巴最早一代的基于MPI 協(xié)議搭建的分布式機器學習平臺,其中實現(xiàn)了邏輯回歸、MLR、GBDT 等一系列大規(guī)模并行算法;另一個是阿里巴巴內(nèi)部之前啟動的圖像深度學習項目,做了一個類似分層的深度學習端到端的框架,但是由于這個框架跟 Caffe 的功能有較大重合,因此沒有對其進行開源,而之后我們也發(fā)現(xiàn)它對業(yè)界可能并沒有那么大的增量,因而只在內(nèi)部進行使用,最后也轉(zhuǎn)向其他框架的研發(fā)了。

2. 研發(fā)至今,經(jīng)歷了哪些比較大的迭代?

現(xiàn)在開源的 XDL 已經(jīng)經(jīng)歷了三次迭代。第一個版本是由算法團隊主導的,第二個版本則是由引擎工程團隊主導,現(xiàn)在的第三個版本是由工程團隊和算法團隊合作迭代的。

XDL 的應用場景和特點優(yōu)勢

3. XDL 目前用在阿里的哪些業(yè)務場景?未來是否會考慮將這一框架應用到其他場景?

XDL 作為阿里媽媽的一個橫向的機器學習平臺,在支撐阿里巴巴的各項業(yè)務,目前應用最多的是阿里媽媽的定向廣告,包括展示廣告和信息流廣告,在這個典型應用場景中,每天支撐大約 100 個模型的生產(chǎn)化訓練。

將這一框架應用到更多的其他場景中,也是我們對 XDL 進行開源的初衷。我們認為在廣告、推薦、搜索等互聯(lián)網(wǎng)業(yè)務中,在目前業(yè)內(nèi)已有的框架基礎上去搭建一個深度學習平臺還有很多工作要做,包括結(jié)構化數(shù)據(jù)處理、模型結(jié)構的創(chuàng)新研發(fā)等,但是如果不只是遵循谷歌、Facebook 等國外公司的網(wǎng)絡結(jié)構的話,就對框架及框架邊界提出了更高的要求。因此,我們將結(jié)構化數(shù)據(jù)處理以及模型分布式計算等與傳統(tǒng)結(jié)構不一樣的經(jīng)驗沉淀下來,從算法包到底層計算框架賦能企業(yè),使其在自己的業(yè)務上進行更好的迭代。

后期我們也會開放一些工業(yè)界的數(shù)據(jù)集,讓研究者也能以這些技術和數(shù)據(jù)集為基礎,進行獨立的創(chuàng)新研發(fā)。

4.相較于目前兩大深度學習開源框架 TensorFlow 和 PyTorch 來說,XDL 獨有的特色和產(chǎn)品優(yōu)勢集中體現(xiàn)在哪些方面?

相較于目前兩大深度學習開源框架 TensorFlow 和 PyTorch 來說,XDL 的特色和產(chǎn)品優(yōu)勢集中體現(xiàn)兩個方面:

  • 第一,XDL 面向超大規(guī)模高維稀疏特征的深度學習進行了分布式運行時的設計與優(yōu)化,這個對推薦、搜索、廣告等互聯(lián)網(wǎng)場景的工業(yè)化應用至關重要,而 TensorFlow、PyTorch 等開源深度學習框架更多的是面向圖像、視頻、語音等低維稠密數(shù)據(jù)場景進行了優(yōu)化。 例如,XDL 針對推薦、搜索、廣告等場景的訓練方式獨創(chuàng)了結(jié)構化壓縮、高階模型嵌套訓練等范式,對大規(guī)模深度網(wǎng)絡的存儲、通信、計算等有一個數(shù)量級以上的效率提升。

  • 第二,XDL 不僅僅只是一個訓練框架,我們開源的是面向高維稀疏數(shù)據(jù)場景的完整解決方案,尤其是一系列在阿里媽媽的核心業(yè)務場景經(jīng)過生產(chǎn)驗證的算法模型,這對于推薦、搜索、廣告等領域從業(yè)者來說,有極高的參考價值,可以幫助這個行業(yè)的很多團隊實現(xiàn)技術的跨越式前進。

5.在具體的應用上,XDL 的性能達到了什么程度,是否有針對 TensorFlow、PyTorch 的「槽點」進行更深層次的優(yōu)化?

由于 XDL 主要針對推薦、搜索、廣告這些場景,因此我們會重點考量 XDL 在這些高維稀疏場景下的性能,我主要從三個層面來講:

  • 第一個是從分布式水平擴展能力來看,TensorFlow、PyTorch 等適用于低維稠密數(shù)據(jù)的框架在機器并行度增加時,其性能無法實現(xiàn)較好的提升,例如 TensorFlow 在并發(fā)度達到百以上時,很難再通過增加更多的計算資源來提升整體的訓練吞吐率,而 XDL 在千級別的并發(fā)度上,也能實現(xiàn)線性的提升。

  • 第二個是從支持的特征和參數(shù)的規(guī)模來看,XDL 支持模型的規(guī)模和參數(shù)比傳統(tǒng)情況下有所提升,XDL 可以支持千億參數(shù)的大規(guī)模深度學習模型訓練,包括批量訓練模式和在線訓練模式。

  • 第三個是從實際運行的性能來看,在高維稀疏分布式訓練下,XDL 大部分模型比開源的 TensorFlow 模型整體高出十倍以上的一個量級。

6.開源之后,主要的用戶群體是哪些人?這一框架又是怎樣滿足不同領域的用戶需求的?

我們在 11 月 28 號發(fā)布了開源計劃后,就有超過十家以上的大中型公司向我們表達了需求,這是因為我們將 XDL 定義為一個偏向企業(yè)級用戶的框架,包括 XDL 所面向的高維稀疏場景以及推薦、搜索、廣告這三個互聯(lián)網(wǎng)最核心的典型場景,因此我們會在 To B 這個方向上有較大的著力點。

在滿足不同領域的用戶需求方面,首先,由于 XDL 本身帶有很強的歸屬性,它跟 TensorFlow 等通用開源框架不太一樣。一方面非企業(yè)級用戶并不需要處理太多的工業(yè)場景數(shù)據(jù),XDL 對他們的必要性不是很多;另一方面,在工業(yè)場景下,XDL 除了考慮訓練框架本身的基礎屬性,還需要考慮怎么跟生產(chǎn)系統(tǒng)耦合、怎么訪問和調(diào)度嵌入數(shù)據(jù)、數(shù)據(jù)訓練后又怎樣將模型發(fā)布到生產(chǎn)系統(tǒng)中等等一系列問題。對此,我們給出的其實是一整套解決方案。當然,這套方案并不能覆蓋所有用戶的需求,我們之所以開源,也是希望以生態(tài)化的開放方式,來讓業(yè)界共同發(fā)展這個領域。

另外從業(yè)務價值上講,推薦、搜索、廣告三大場景已是互聯(lián)網(wǎng)信息爆炸時代的一個「標配」,因為這些場景足夠大且足夠有特點,而阿里媽媽又正好覆蓋了這些場景,從業(yè)務場景到整個解決方案,有助于實際解決各種各樣的技術挑戰(zhàn)。

未來規(guī)劃

7. 對這一框架未來的發(fā)展有怎樣的愿景?

希望在國內(nèi)的推薦、搜索、廣告領域,XDL 是深度學習框架最主流的選擇。

8.目前 TensorFlow 和 PyTorch 的用戶群體已經(jīng)很大了,你們認為 XDL 的未來地位能否與二者并肩,又打算如何推廣 XDL?

XDL 確實對 TensorFlow 和 PyTorch 的一些能力進行了擴展,我們也希望能在推薦、搜索、廣告領域建立一個龐大的技術生態(tài)去與 PyTorch 和 TensorFlow 比肩,但目前還處于邁向這個目標的重要階段。當下,我們主要還是比較務實地將一些技術成果公布出來,按照我們認為對的方向以及業(yè)界的需求,希望能夠填補在搜索、推薦、廣告等高維稀疏場景的技術真空,至于最終能否實現(xiàn) TensorFlow 和 PyTorch 這樣的生態(tài)級別,需要我們和業(yè)界的共同努力。

9. 接下來是否會投入專門的團隊對這一框架進行維護和更新?有哪些更新計劃?

  • 一方面,這個框架進行開源后,一定會有很多人在使用過程中遇到一些問題或者需要我們幫助的地方,我們這邊會有專門的團隊來負責對用戶反饋的 bug 等整個社區(qū)的問題進行解答,社區(qū)建設是我們非??粗氐囊粋€方面。

  • 另一方面,針對對我們這個框架有迫切需求的公司,我們之后也會組織一些類似 workshop 這樣的會議和活動,來與他們進行面對面的交流。同時,我們還會有針對性地挑選出一些合作伙伴,以重點貼身服務的方式幫助其完成初期的全鏈路系統(tǒng)建設,并從它們的視角去考量用戶使用等方面的需求。

除此之外,我們還會結(jié)合阿里內(nèi)部其他團隊的力量,來將這件事情做起來。至于之后的發(fā)展方向和更新規(guī)劃,還需要我們團隊進行討論后才能正式公布。

109. 是否會考慮借用社區(qū)的形式,和開發(fā)者一起去維護這個框架?

當然會,因為我們希望給用戶帶來價值,我主要從以下三個層面來談一下:

  • 第一個層面是底層設計上的橋接兼容,可以讓用戶直接使用自己熟悉的編程方式就可以獲得 XDL 的結(jié)構化數(shù)據(jù)的分布式建模能力以及大規(guī)模稀疏數(shù)據(jù)的計算能力;

  • 第二個我們將 XDL 進行開源,也是希望讓用戶(有能力的情況下)可以在框架中自行改動,而不是僅僅給他們一個 API 接口,讓他們在云上跑一跑;

  • 第三個是我們也在框架中直接給了算法模板,展示了我們自己如何使用框架設計相關算法。

 XDL 目前已在 Github 社區(qū)開放,大家可前往以下地址獲?。?/span>

https://github.com/alibaba/x-deeplearning      雷鋒網(wǎng)

雷峰網(wǎng)原創(chuàng)文章,未經(jīng)授權禁止轉(zhuǎn)載。詳情見轉(zhuǎn)載須知。

對話阿里媽媽 XDL 團隊:希望這一框架成為國內(nèi)推薦搜索廣告領域最主流的選擇

分享:
相關文章
當月熱門文章
最新文章
請?zhí)顚懮暾埲速Y料
姓名
電話
郵箱
微信號
作品鏈接
個人簡介
為了您的賬戶安全,請驗證郵箱
您的郵箱還未驗證,完成可獲20積分喲!
請驗證您的郵箱
立即驗證
完善賬號信息
您的賬號已經(jīng)綁定,現(xiàn)在您可以設置密碼以方便用郵箱登錄
立即設置 以后再說