1
本文作者: 老王 | 2016-11-23 17:04 |
昨日,亞馬遜 CTO Werner Vogels 在博文中寫到 MXNet 被 AWS 正式選擇成為其云計(jì)算的官方深度學(xué)習(xí)平臺(tái)。Vogels 表示:
AWS將會(huì)為用戶提供軟件代碼、文檔,并且將會(huì)投入力量在 MXNet 的研發(fā),以及企業(yè)級(jí)生態(tài)上。
MXNet 是一個(gè)全功能、靈活且高擴(kuò)展性的深度學(xué)習(xí)框架,支持深度學(xué)習(xí)模型中的卷積神經(jīng)網(wǎng)絡(luò)和長(zhǎng)期短期記憶網(wǎng)絡(luò)。由學(xué)術(shù)界發(fā)起,由華盛頓大學(xué)和卡內(nèi)基梅隆大學(xué)的研究人員聯(lián)合發(fā)起。
其實(shí) AWS 此前也支持過(guò)其他的深度學(xué)習(xí)框架,如 TensorFlow、CNTK、Caffe、Torch,但這次 MXNet 直接被選為官方平臺(tái),成為正室。TensorFlow 和 CNTK 框架分別由谷歌和微軟發(fā)起,而 Caffe 則是來(lái)自加州大學(xué)伯克利分校的伯克利人工智能研究實(shí)驗(yàn)室。
針對(duì) MXNet 被 Amazon AWS 選為官方深度學(xué)習(xí)平臺(tái)這一事項(xiàng),業(yè)內(nèi)人士發(fā)表了自己的看法(雷鋒網(wǎng)已獲得以下評(píng)論的引用授權(quán)):
能夠讓 AWS 放棄自己造的輪子,并且明確的表示會(huì)支持一個(gè)主要由開源社區(qū)開發(fā)的系統(tǒng),其實(shí)非常不容易。對(duì)于 AWS 來(lái)說(shuō),最關(guān)心的是用戶體驗(yàn),然后是買資源賺錢。這里最保險(xiǎn)的是支持所有流行的 DL 框架。但 AWS 能夠強(qiáng)調(diào)說(shuō)未來(lái)會(huì)大力投入 MXNet,主要是對(duì)框架的發(fā)展前景,和小伙伴們工作的肯定。
MXNet 最早就是幾個(gè)人抱著純粹對(duì)技術(shù)和開發(fā)的熱情做起來(lái)的興趣項(xiàng)目,既沒有指望靠它畢業(yè),也沒想著用它賺錢。能夠一步一步慢慢的擴(kuò)大,我覺得最重要的是每個(gè)小伙伴對(duì)這個(gè)事情的投入,和抱著降低深度學(xué)習(xí)門檻的使命。也是讓大家只需要關(guān)心“數(shù)據(jù)量和運(yùn)算量”,而不是如何有效實(shí)現(xiàn)利用硬件;只需要“數(shù)學(xué)公式寫好,根本就不想知道你支持哪些 layer,分別是干什么的”,不用管自動(dòng)求導(dǎo)如何訓(xùn)練;只需要“把手上的數(shù)據(jù)交出去給云即可,然后花錢租算力”,而不是云上如何管理如何優(yōu)化。
大概可以永遠(yuǎn)告別 AWS 上跑個(gè) Deep Learning 要手裝一堆東西還不知道 Efficiency 怎么樣的年代了。話說(shuō)以前見大家吐槽 MXNet 的 Documentation 不清楚可是我覺得 Document 挺棒的啊,雖然確實(shí)比不上 Tensorflow 但是比 Torch 舒服多了,清楚易懂還便于 Develop,之前改過(guò)些 MXNet 代碼感覺還是挺輕松愉快的,比起 Caffe 自己輕易什么都不敢動(dòng),MXNet 給我的感覺是對(duì)開發(fā)者友好許多。Codebase 也不算大,上手也方便。有了 AWS Endorse 以后知名度肯定蹭蹭漲,相信在開源社區(qū)和 TensorFlow 可以一戰(zhàn)。
MXNet 發(fā)展到現(xiàn)在有一年多時(shí)間,是一個(gè)相對(duì)成熟的項(xiàng)目。
我對(duì)我們的技術(shù)很有信心。MXNet 的速度,節(jié)省內(nèi)存,接口靈活性,和分布式效率都是可圈可點(diǎn)的。作為一個(gè)由愛好者發(fā)起,沒有投資的項(xiàng)目,MXNet 以前最大的短板是文檔和宣傳。而 Amazon 作為大財(cái)主以后在這方面可以起到很好的作用。
實(shí)際上 Amazon 對(duì) MXNet 的支持已經(jīng)有一段時(shí)間了,在 Github 上提交了很多文檔方面的改進(jìn)??傮w來(lái)說(shuō) Amazon 對(duì)開源社區(qū)很友好,除了對(duì)文檔和穩(wěn)定性的要求嚴(yán)格了一些并沒有干涉我們的開發(fā)。Code Review 還是我們自己在做,是否接收代碼也是社區(qū)決定的。
在 Amazon 之前已經(jīng)有很多公司在默默的用 MXNet 了,只是沒有大肆宣傳。比如圖森互聯(lián)、地平線搞 Mathematica 的 Wolfram 都給 MXNet 貢獻(xiàn)了很多代碼。
作為亞馬遜曾經(jīng)最年輕的機(jī)器學(xué)習(xí)科學(xué)家,機(jī)器學(xué)習(xí)委員會(huì)成員,我發(fā)表下自己的看法:
歷史背后的故事
亞馬遜自己還開源過(guò)一個(gè)深度學(xué)習(xí)框架叫做 DSSTNE? (讀作 Destiny),DSSTNE 是 2016 年早些時(shí)候開源的,主要開發(fā)團(tuán)隊(duì)歸屬于亞馬遜零售業(yè)務(wù)部門,老大是 Jeff Wilk。
而這次聲稱支持 MXNet 的是云計(jì)算部門(老大是 Andrew Jassy),而發(fā)帖人是 Werner Vogels ,是亞馬遜的 CTO。這里面的宮斗還沒看出來(lái)嗎?
2016 年 4 月,Jeff Bezos 宣布將 Jeff Wilke 和 Andrew Jassy 同時(shí)分別晉升為了 Amazon Retail 和 AWS 部門的 CEO。這里面兩個(gè)信息:第一,下一任亞馬遜掌門人就是這兩位里面選的了;第二,Kindle 、Ads 啊神馬的,都好好給我站隊(duì),不要有非分之想。
緊接著 2016 年5月,Jeff Wilke 下面的零售部門先發(fā)制人宣布開源 DSSTNE,只可惜當(dāng)時(shí)大家都在 import keras,DSSTNE 沒有得到大力支持。
這些 AWS 的人能不著急嗎?機(jī)器學(xué)習(xí)領(lǐng)域向來(lái)都是 Jeff Bezos 的最愛,大力推廣機(jī)器學(xué)習(xí)的人都能提升很快,這表功的機(jī)會(huì)難道 AWS 不能搬回來(lái)一點(diǎn)?作為亞馬遜的老人,這些故事從上到下看的太多了。
MXNet 能給 AWS 業(yè)務(wù)方面干嘛?預(yù)測(cè)、供應(yīng)鏈、消費(fèi)者行為分析等方面均不能做。
現(xiàn)在 Theano, Tensorflow, Torch, Caffe 等包都是 g2 instance 直接預(yù)裝好的了,不需要 AWS 支持,大家自己也會(huì)搜一搜直接調(diào)用。就連亞馬遜自己的人也在 import keras。
李沐(MXNet 發(fā)起人)提出“把手上的數(shù)據(jù)交出去給云即可,然后花錢租算力”,這個(gè)說(shuō)法在亞馬遜已經(jīng)被提出過(guò)一次了。上一個(gè)發(fā)起者是 Joseph Sirosh,他領(lǐng)導(dǎo)了 Elastic Machine Learning,也就是 AWS Machine Learning 的雛形,在靠這個(gè)風(fēng)口升了一級(jí)以后迅速跳槽到了微軟當(dāng)了 CVP,當(dāng)然,后來(lái) EML 被證明用戶群體非常有限,基本上是個(gè)失敗的任務(wù)。
其實(shí) Hacker News 對(duì)這件事的評(píng)價(jià)要冷靜得多。
雷峰網(wǎng)原創(chuàng)文章,未經(jīng)授權(quán)禁止轉(zhuǎn)載。詳情見轉(zhuǎn)載須知。