0
本文作者: 岑大師 | 2017-12-16 13:34 |
如果要歷數2017年在各大人工智能頂級學術會議上的國內企業(yè),阿里巴巴必然是最活躍的公司之一。雷鋒網不僅在多個國際會議中均看到了阿里巴巴的身影和論文發(fā)表,在雷鋒網今年參加的IJCAI、CVPR、ACL、KDD、ACMMM、NIPS等六個頂級國際會議中,阿里巴巴均是白金級別贊助商,排名國內企業(yè)贊助頂級國際學術會議數量之首;在學術會議的組織參與程度上,阿里巴巴不僅是KDD 2017數據挖掘競賽的比賽贊助商及主辦者,同時還獲得了ACMMM 2020的舉辦權,同樣領跑于其他國內企業(yè)。
在吸引人工智能頂級人才上,阿里巴巴同樣也交出了一份不錯的答卷。在今年3月的阿里巴巴集團首屆員工技術大會上,馬云宣布啟動內部代號為“NASA”的計劃,面向未來20年組建強大的獨立研發(fā)部門;10月,阿里巴巴宣布成立全球研究院——阿里巴巴達摩院,3年投資1000億人民幣。2017年,王剛、任小楓、聶再清、李名揚等國際級人工智能人才加盟阿里巴巴,而在此之前,前微軟亞洲研究院副院長王堅、IEEE 院士華先勝、普渡大學終身教授司羅,前微軟研發(fā)合伙人周靖人等科學家也紛紛選擇了阿里作為科技研究的新根據地。堅實的人才儲備不僅使得阿里在各人工智能學術會議的表現步步走高,也為阿里的人工智能產品商業(yè)化打下了良好的基礎。
(阿里巴巴人工智能實驗室高級專家張碩)
相應,在人工智能的頂級學術會議上,阿里也在不斷通過新的嘗試輸出自己的對外影響力。近日,在美國加州長灘舉辦的 NIPS 2017 大會上,阿里巴巴人工智能實驗室高級專家張碩、阿里巴巴首席工程師(Principal Engineer)李欣、阿里巴巴iDST院長金榕分別開設了迷你研討會,對各自領域在人工智能領域的工作及實踐進行了介紹。
阿里巴巴人工智能實驗室于2016年成立,目前擁有200余名研究員和科學家,負責人為淘寶首任產品經理、智能生活事業(yè)部總經理“淺雪”(陳麗娟),其定位更多偏向于消費級產品的落地,如實驗室的第一款智能語音終端設備“天貓精靈 X1”,以及背后的智能語音助手和開發(fā)者平臺 AliGenie等。
阿里巴巴人工智能實驗室自從成立以來一直保持低調,今年7月5日的智能音箱“天貓精靈 X1”發(fā)布會是其成立一年以來的首次公開亮相。而在 NIPS 上,人工智能實驗室也就自己所做的人工智能相關工作進行了講解,以吸引更多的人才加盟。
(天貓精靈x1智能音箱)
在 NIPS 大會正會第一天,阿里巴巴人工智能實驗室的高級專家張碩介紹,人工智能實驗室主要任務是打造下一代的人機交互平臺,在感知和推理能力(包括語音識別、語言理解、計算機視覺等)、知識數據庫(包括知識圖譜、用戶配置文件等)、按需行為(包括服務和流動性等)等三方面創(chuàng)造人性化的機器。隨后張碩對實驗室在今年推出的三個產品:智能音箱、語音開放平臺ALiGenie和AR開放平臺進行了介紹。
據雷鋒網了解,張碩在2011年于康涅尼格大學獲得電子工程博士學位,在加入阿里巴巴之前,他是UTRC的主管工程師, 負責Sikorsky載人無人機SARA的環(huán)境感知系統(tǒng),此外他還曾擔任著名無人車創(chuàng)業(yè)公司nuTonomy美國感知技術組負責人。
作為一家有著80億款商品在線的電商公司,搜索對于阿里巴巴的重要性不言而喻。據阿里巴巴搜索事業(yè)部研究員李欣介紹,從2013年的MPI(Message passing interface)機器學習平臺算起,阿里巴巴的搜索技術每年都會有一次大的更新換代,最近使用的是包含在線深度學習平臺與離線深度學習平臺結合的異構計算,機器學習與深度學習在阿里的搜索體系中占據著重要的位置。
(阿里搜索事業(yè)部研究員李欣)
在具體業(yè)務上,阿里巴巴搜索團隊為淘寶、天貓、聚劃算、淘搶購、天天特價、淘金幣等業(yè)務提供搜索、個性化引擎和圖像引擎服務,該團隊的主要研究方向包括:構建更大規(guī)模的排序系統(tǒng)的機器學習平臺,提升大規(guī)模數據下系統(tǒng)對用戶行為的快速反應能力、提升算法的效率。
李欣為我們舉了阿里在商品搜索和推薦中遇到的具體問題的例子。“例如在雙11的時候,有超過100萬的用戶購買了阿里巴巴的天貓精靈X1智能音箱,無論是商品的價格、用戶的偏好以及相關產品的推薦,我們都需要進行相應的調整?!?/p>
對于這個問題,搜索團隊采用的是一種被稱為“深度用戶感知網絡”(Deep User Perception Network,DUPN)的技術,通過對用戶信息和商品信息的分析實現多個不同的任務,如預測用戶的商品點擊率、價格偏好區(qū)間、對該用戶的商品排序等。DUPN的最大特點是基于環(huán)境變化的注意力機制,阿里采用的是兩套不同的深度學習平臺,即在線深度學習平臺與離線深度學習平臺訓練并進行同步的方法,在正常情況下,兩套平臺每天同步一次,而在特殊的場景(如雙十一),線上模型可捕捉到環(huán)境變化,然后調整參數,實現這兩套平臺的實時同步,對用戶的行為進行更精準的分析和推薦。從結果來看,DUPN 要比 DNN、CNN 和 LSTM 也有著更好的效果。
(實時同步示意圖)
李欣博士于伊利諾斯香檳分校獲得計算機博士學位。在加入阿里巴巴前,他曾在Yahoo和Bing擔任主任研究員及首席研發(fā)經理,在核心搜索排名及查詢上發(fā)表了20余篇論文,并有6項美國專利。在未來阿里的搜索上,李欣博士表示在覆蓋新用戶和新產品、多模態(tài)交互和用語音和文字的交互進行產品推薦等方面都是搜索的重點研究方向。
在正會的最后一天,阿里巴巴iDST院長金榕在阿里巴巴展區(qū)進行了《阿里巴巴的深度學習應用》(Deep Learning at Alibaba)的分享。作為在電商領域有諸多業(yè)務的企業(yè),阿里巴巴對深度學習有很大的需求,尤其在信息檢索(搜索和推薦系統(tǒng))、語音技術(自動語音識別、語音合成,對話管理)、自然語言處理(拼寫檢查、依存語法、問答和機器翻譯)等領域,阿里將深度學習應用到業(yè)務中時會遇到許多學界人士不可能遇到的問題和新的挑戰(zhàn)。
(阿里iDST院長金榕在阿里展位進行技術分享)
例如在計算機視覺領域,金榕舉的例子是 2014 年上線、通過搜索圖片找產品的拍立淘。目前拍立淘擁有現在已經有超過1億件商品的30億張圖片,每天有至少1500萬活躍用戶。這項業(yè)務的基礎就是通過深度學習對結果進行排序,阿里研究人員通過用戶記錄的三元組數據(查詢圖片、點擊圖片和未點擊圖片)來訓練模型的排序損失函數,從而得到排序結果。
另外,金榕還展示了阿里在模型壓縮方面的成果。現在的深度學習模型變得越來越復雜,甚至有的模型已經超過了1000層,參數空間達到了10億級。這使得深度網絡神經學習在優(yōu)先的存儲器和計算資源下難以運行。金榕在此提到了阿里的兩種解決方案:模型壓縮和淺網模型的構建,在演講中,金榕提出了一個利用交替方向乘子法(Alternating Direction Method of Multipliers,ADMM)的low-bits量化神經網絡的框架來壓縮模型。ADMM是一種求解優(yōu)化問題的計算框架,它能夠將連續(xù)解和離散解結合起來,利用連續(xù)解的梯度來指導離散解的搜索。此外為了更有效地運行ADMM,他們還開發(fā)了額外梯度下架方法(extra gradient descent method)來解決優(yōu)化問題,這種方法能夠加速收斂。
隨著馬云在國際舞臺的頻頻亮相,不少外國人對于阿里巴巴和和淘寶均有著一定的認知,這使得阿里巴巴在向現場參會者介紹時可以跳過了“阿里巴巴是誰”的環(huán)節(jié),直接進入機器學習、深度學習等技術在阿里巴巴的應用的介紹。
雷鋒網注意到,在諸多參加 NIPS 的中國展商中,阿里巴巴是唯一三天在展位現場都開展技術分享的中國企業(yè),而這幾次迷你研討會均吸引了不少參會者的關注,為阿里貢獻了不少的人流量。在演講結束后,還有不少參會者現場進行技術交流,以及詢問如來阿里人工智能實驗室、iDST實習及達摩院相關事宜。
隨著人工智能的火熱,吸引頂級人才的成本越來越高,在杰出人才百萬年薪計價的今天,國內的頂級人工智能企業(yè)需要在像 NIPS 這樣的學術會議上“Show muscle”,引起更多人工智能學生和研究者們的注意。
據雷鋒網現場了解,不少參會學生均將“工作與自己領域是否相符”和“團隊Leader的技術實力”作為在申請未來工作中最重要的衡量指標,相比起傳統(tǒng)展會上各家公司力推的產品和公司介紹,像阿里巴巴這種“技術大?,F身說法”的分享會也有著更好的效果,或許在不久的將來,類似的研討會也將成為各大展商展示自己實力的“標配”。
雷峰網原創(chuàng)文章,未經授權禁止轉載。詳情見轉載須知。