0
本文作者: 岑大師 | 2017-12-16 13:34 |
如果要?dú)v數(shù)2017年在各大人工智能頂級(jí)學(xué)術(shù)會(huì)議上的國(guó)內(nèi)企業(yè),阿里巴巴必然是最活躍的公司之一。雷鋒網(wǎng)不僅在多個(gè)國(guó)際會(huì)議中均看到了阿里巴巴的身影和論文發(fā)表,在雷鋒網(wǎng)今年參加的IJCAI、CVPR、ACL、KDD、ACMMM、NIPS等六個(gè)頂級(jí)國(guó)際會(huì)議中,阿里巴巴均是白金級(jí)別贊助商,排名國(guó)內(nèi)企業(yè)贊助頂級(jí)國(guó)際學(xué)術(shù)會(huì)議數(shù)量之首;在學(xué)術(shù)會(huì)議的組織參與程度上,阿里巴巴不僅是KDD 2017數(shù)據(jù)挖掘競(jìng)賽的比賽贊助商及主辦者,同時(shí)還獲得了ACMMM 2020的舉辦權(quán),同樣領(lǐng)跑于其他國(guó)內(nèi)企業(yè)。
在吸引人工智能頂級(jí)人才上,阿里巴巴同樣也交出了一份不錯(cuò)的答卷。在今年3月的阿里巴巴集團(tuán)首屆員工技術(shù)大會(huì)上,馬云宣布啟動(dòng)內(nèi)部代號(hào)為“NASA”的計(jì)劃,面向未來20年組建強(qiáng)大的獨(dú)立研發(fā)部門;10月,阿里巴巴宣布成立全球研究院——阿里巴巴達(dá)摩院,3年投資1000億人民幣。2017年,王剛、任小楓、聶再清、李名揚(yáng)等國(guó)際級(jí)人工智能人才加盟阿里巴巴,而在此之前,前微軟亞洲研究院副院長(zhǎng)王堅(jiān)、IEEE 院士華先勝、普渡大學(xué)終身教授司羅,前微軟研發(fā)合伙人周靖人等科學(xué)家也紛紛選擇了阿里作為科技研究的新根據(jù)地。堅(jiān)實(shí)的人才儲(chǔ)備不僅使得阿里在各人工智能學(xué)術(shù)會(huì)議的表現(xiàn)步步走高,也為阿里的人工智能產(chǎn)品商業(yè)化打下了良好的基礎(chǔ)。
(阿里巴巴人工智能實(shí)驗(yàn)室高級(jí)專家張碩)
相應(yīng),在人工智能的頂級(jí)學(xué)術(shù)會(huì)議上,阿里也在不斷通過新的嘗試輸出自己的對(duì)外影響力。近日,在美國(guó)加州長(zhǎng)灘舉辦的 NIPS 2017 大會(huì)上,阿里巴巴人工智能實(shí)驗(yàn)室高級(jí)專家張碩、阿里巴巴首席工程師(Principal Engineer)李欣、阿里巴巴iDST院長(zhǎng)金榕分別開設(shè)了迷你研討會(huì),對(duì)各自領(lǐng)域在人工智能領(lǐng)域的工作及實(shí)踐進(jìn)行了介紹。
阿里巴巴人工智能實(shí)驗(yàn)室于2016年成立,目前擁有200余名研究員和科學(xué)家,負(fù)責(zé)人為淘寶首任產(chǎn)品經(jīng)理、智能生活事業(yè)部總經(jīng)理“淺雪”(陳麗娟),其定位更多偏向于消費(fèi)級(jí)產(chǎn)品的落地,如實(shí)驗(yàn)室的第一款智能語音終端設(shè)備“天貓精靈 X1”,以及背后的智能語音助手和開發(fā)者平臺(tái) AliGenie等。
阿里巴巴人工智能實(shí)驗(yàn)室自從成立以來一直保持低調(diào),今年7月5日的智能音箱“天貓精靈 X1”發(fā)布會(huì)是其成立一年以來的首次公開亮相。而在 NIPS 上,人工智能實(shí)驗(yàn)室也就自己所做的人工智能相關(guān)工作進(jìn)行了講解,以吸引更多的人才加盟。
(天貓精靈x1智能音箱)
在 NIPS 大會(huì)正會(huì)第一天,阿里巴巴人工智能實(shí)驗(yàn)室的高級(jí)專家張碩介紹,人工智能實(shí)驗(yàn)室主要任務(wù)是打造下一代的人機(jī)交互平臺(tái),在感知和推理能力(包括語音識(shí)別、語言理解、計(jì)算機(jī)視覺等)、知識(shí)數(shù)據(jù)庫(包括知識(shí)圖譜、用戶配置文件等)、按需行為(包括服務(wù)和流動(dòng)性等)等三方面創(chuàng)造人性化的機(jī)器。隨后張碩對(duì)實(shí)驗(yàn)室在今年推出的三個(gè)產(chǎn)品:智能音箱、語音開放平臺(tái)ALiGenie和AR開放平臺(tái)進(jìn)行了介紹。
據(jù)雷鋒網(wǎng)了解,張碩在2011年于康涅尼格大學(xué)獲得電子工程博士學(xué)位,在加入阿里巴巴之前,他是UTRC的主管工程師, 負(fù)責(zé)Sikorsky載人無人機(jī)SARA的環(huán)境感知系統(tǒng),此外他還曾擔(dān)任著名無人車創(chuàng)業(yè)公司nuTonomy美國(guó)感知技術(shù)組負(fù)責(zé)人。
作為一家有著80億款商品在線的電商公司,搜索對(duì)于阿里巴巴的重要性不言而喻。據(jù)阿里巴巴搜索事業(yè)部研究員李欣介紹,從2013年的MPI(Message passing interface)機(jī)器學(xué)習(xí)平臺(tái)算起,阿里巴巴的搜索技術(shù)每年都會(huì)有一次大的更新?lián)Q代,最近使用的是包含在線深度學(xué)習(xí)平臺(tái)與離線深度學(xué)習(xí)平臺(tái)結(jié)合的異構(gòu)計(jì)算,機(jī)器學(xué)習(xí)與深度學(xué)習(xí)在阿里的搜索體系中占據(jù)著重要的位置。
(阿里搜索事業(yè)部研究員李欣)
在具體業(yè)務(wù)上,阿里巴巴搜索團(tuán)隊(duì)為淘寶、天貓、聚劃算、淘搶購(gòu)、天天特價(jià)、淘金幣等業(yè)務(wù)提供搜索、個(gè)性化引擎和圖像引擎服務(wù),該團(tuán)隊(duì)的主要研究方向包括:構(gòu)建更大規(guī)模的排序系統(tǒng)的機(jī)器學(xué)習(xí)平臺(tái),提升大規(guī)模數(shù)據(jù)下系統(tǒng)對(duì)用戶行為的快速反應(yīng)能力、提升算法的效率。
李欣為我們舉了阿里在商品搜索和推薦中遇到的具體問題的例子?!袄缭陔p11的時(shí)候,有超過100萬的用戶購(gòu)買了阿里巴巴的天貓精靈X1智能音箱,無論是商品的價(jià)格、用戶的偏好以及相關(guān)產(chǎn)品的推薦,我們都需要進(jìn)行相應(yīng)的調(diào)整?!?/p>
對(duì)于這個(gè)問題,搜索團(tuán)隊(duì)采用的是一種被稱為“深度用戶感知網(wǎng)絡(luò)”(Deep User Perception Network,DUPN)的技術(shù),通過對(duì)用戶信息和商品信息的分析實(shí)現(xiàn)多個(gè)不同的任務(wù),如預(yù)測(cè)用戶的商品點(diǎn)擊率、價(jià)格偏好區(qū)間、對(duì)該用戶的商品排序等。DUPN的最大特點(diǎn)是基于環(huán)境變化的注意力機(jī)制,阿里采用的是兩套不同的深度學(xué)習(xí)平臺(tái),即在線深度學(xué)習(xí)平臺(tái)與離線深度學(xué)習(xí)平臺(tái)訓(xùn)練并進(jìn)行同步的方法,在正常情況下,兩套平臺(tái)每天同步一次,而在特殊的場(chǎng)景(如雙十一),線上模型可捕捉到環(huán)境變化,然后調(diào)整參數(shù),實(shí)現(xiàn)這兩套平臺(tái)的實(shí)時(shí)同步,對(duì)用戶的行為進(jìn)行更精準(zhǔn)的分析和推薦。從結(jié)果來看,DUPN 要比 DNN、CNN 和 LSTM 也有著更好的效果。
(實(shí)時(shí)同步示意圖)
李欣博士于伊利諾斯香檳分校獲得計(jì)算機(jī)博士學(xué)位。在加入阿里巴巴前,他曾在Yahoo和Bing擔(dān)任主任研究員及首席研發(fā)經(jīng)理,在核心搜索排名及查詢上發(fā)表了20余篇論文,并有6項(xiàng)美國(guó)專利。在未來阿里的搜索上,李欣博士表示在覆蓋新用戶和新產(chǎn)品、多模態(tài)交互和用語音和文字的交互進(jìn)行產(chǎn)品推薦等方面都是搜索的重點(diǎn)研究方向。
在正會(huì)的最后一天,阿里巴巴iDST院長(zhǎng)金榕在阿里巴巴展區(qū)進(jìn)行了《阿里巴巴的深度學(xué)習(xí)應(yīng)用》(Deep Learning at Alibaba)的分享。作為在電商領(lǐng)域有諸多業(yè)務(wù)的企業(yè),阿里巴巴對(duì)深度學(xué)習(xí)有很大的需求,尤其在信息檢索(搜索和推薦系統(tǒng))、語音技術(shù)(自動(dòng)語音識(shí)別、語音合成,對(duì)話管理)、自然語言處理(拼寫檢查、依存語法、問答和機(jī)器翻譯)等領(lǐng)域,阿里將深度學(xué)習(xí)應(yīng)用到業(yè)務(wù)中時(shí)會(huì)遇到許多學(xué)界人士不可能遇到的問題和新的挑戰(zhàn)。
(阿里iDST院長(zhǎng)金榕在阿里展位進(jìn)行技術(shù)分享)
例如在計(jì)算機(jī)視覺領(lǐng)域,金榕舉的例子是 2014 年上線、通過搜索圖片找產(chǎn)品的拍立淘。目前拍立淘擁有現(xiàn)在已經(jīng)有超過1億件商品的30億張圖片,每天有至少1500萬活躍用戶。這項(xiàng)業(yè)務(wù)的基礎(chǔ)就是通過深度學(xué)習(xí)對(duì)結(jié)果進(jìn)行排序,阿里研究人員通過用戶記錄的三元組數(shù)據(jù)(查詢圖片、點(diǎn)擊圖片和未點(diǎn)擊圖片)來訓(xùn)練模型的排序損失函數(shù),從而得到排序結(jié)果。
另外,金榕還展示了阿里在模型壓縮方面的成果。現(xiàn)在的深度學(xué)習(xí)模型變得越來越復(fù)雜,甚至有的模型已經(jīng)超過了1000層,參數(shù)空間達(dá)到了10億級(jí)。這使得深度網(wǎng)絡(luò)神經(jīng)學(xué)習(xí)在優(yōu)先的存儲(chǔ)器和計(jì)算資源下難以運(yùn)行。金榕在此提到了阿里的兩種解決方案:模型壓縮和淺網(wǎng)模型的構(gòu)建,在演講中,金榕提出了一個(gè)利用交替方向乘子法(Alternating Direction Method of Multipliers,ADMM)的low-bits量化神經(jīng)網(wǎng)絡(luò)的框架來壓縮模型。ADMM是一種求解優(yōu)化問題的計(jì)算框架,它能夠?qū)⑦B續(xù)解和離散解結(jié)合起來,利用連續(xù)解的梯度來指導(dǎo)離散解的搜索。此外為了更有效地運(yùn)行ADMM,他們還開發(fā)了額外梯度下架方法(extra gradient descent method)來解決優(yōu)化問題,這種方法能夠加速收斂。
隨著馬云在國(guó)際舞臺(tái)的頻頻亮相,不少外國(guó)人對(duì)于阿里巴巴和和淘寶均有著一定的認(rèn)知,這使得阿里巴巴在向現(xiàn)場(chǎng)參會(huì)者介紹時(shí)可以跳過了“阿里巴巴是誰”的環(huán)節(jié),直接進(jìn)入機(jī)器學(xué)習(xí)、深度學(xué)習(xí)等技術(shù)在阿里巴巴的應(yīng)用的介紹。
雷鋒網(wǎng)注意到,在諸多參加 NIPS 的中國(guó)展商中,阿里巴巴是唯一三天在展位現(xiàn)場(chǎng)都開展技術(shù)分享的中國(guó)企業(yè),而這幾次迷你研討會(huì)均吸引了不少參會(huì)者的關(guān)注,為阿里貢獻(xiàn)了不少的人流量。在演講結(jié)束后,還有不少參會(huì)者現(xiàn)場(chǎng)進(jìn)行技術(shù)交流,以及詢問如來阿里人工智能實(shí)驗(yàn)室、iDST實(shí)習(xí)及達(dá)摩院相關(guān)事宜。
隨著人工智能的火熱,吸引頂級(jí)人才的成本越來越高,在杰出人才百萬年薪計(jì)價(jià)的今天,國(guó)內(nèi)的頂級(jí)人工智能企業(yè)需要在像 NIPS 這樣的學(xué)術(shù)會(huì)議上“Show muscle”,引起更多人工智能學(xué)生和研究者們的注意。
據(jù)雷鋒網(wǎng)現(xiàn)場(chǎng)了解,不少參會(huì)學(xué)生均將“工作與自己領(lǐng)域是否相符”和“團(tuán)隊(duì)Leader的技術(shù)實(shí)力”作為在申請(qǐng)未來工作中最重要的衡量指標(biāo),相比起傳統(tǒng)展會(huì)上各家公司力推的產(chǎn)品和公司介紹,像阿里巴巴這種“技術(shù)大牛現(xiàn)身說法”的分享會(huì)也有著更好的效果,或許在不久的將來,類似的研討會(huì)也將成為各大展商展示自己實(shí)力的“標(biāo)配”。
雷峰網(wǎng)原創(chuàng)文章,未經(jīng)授權(quán)禁止轉(zhuǎn)載。詳情見轉(zhuǎn)載須知。