0
本文作者: 夏睿 | 2017-03-12 10:33 |
本周,國內(nèi)AI圈值得關(guān)注的事情有:FPGA 2017最佳論文出爐,雷鋒網(wǎng)對得主深鑒科技進(jìn)行了專訪;人工智能”進(jìn)入國家戰(zhàn)略層,AI公司最關(guān)注的是什么?AWE 2017本周在上海舉辦,海爾美的聯(lián)手百度DuerOS,共同推出“會說話的家用電器”;中國人工智能學(xué)會AIDL第二期【人工智能前沿講習(xí)班】日前在北京中科院自動化所舉行,北京大學(xué)王立威等教授參與講課;
國外AI圈新聞有:Ian Goodfellow 離開OpenAI,重回谷歌大腦團(tuán)隊;Google Cloud Next' 17云計算大會在美召開,李飛飛提出AI民主化四大戰(zhàn)略;Facebook 開源新一代 AI 訓(xùn)練服務(wù)器 Big Basin,速度提升一倍。
以下是本周新聞概述:
近日,深鑒科技的 ESE 語音識別引擎的論文在 FPGA 2017 獲得了唯一的最佳論文 ESE: Efficient Speech Recognition Engine with Sparse LSTM on FPGA。該項工作聚焦于使用 LSTM 進(jìn)行語音識別的場景,結(jié)合深度壓縮以及專用處理器架構(gòu),使得經(jīng)過壓縮的網(wǎng)絡(luò)在 FPGA 能夠?qū)崿F(xiàn)超越 Pascal Titan X GPU 一個數(shù)量級的能效比。論文中所描述的 ESE 語音識別引擎也是深鑒科技 RNN 處理器產(chǎn)品的原型。
針對 FPGA 2017 最佳論文以及深鑒科技,雷鋒網(wǎng)采訪了深鑒科技 CEO 姚頌,主要討論了深鑒科技的這篇論文的核心靈感來自于哪里、這篇論文主要在哪些方面有著較大的突破、Deep Compression 和 ESE 的原理與作用、如何有效結(jié)合 Compressing CNN 和 Intepretating CNN 發(fā)揮它們的勢能、如何保證公司處于有利地位等多個問題。以下為采訪摘要:
論文靈感來源:韓松之前做過一項名為 EIE (Efficient Inference Engine)的研究并發(fā)表在 ISCA 2016 ,該項研究主要針對于卷積神經(jīng)網(wǎng)絡(luò)里的全連接層,但并不能適應(yīng)語音識別這樣的復(fù)雜場景。因此在結(jié)合實(shí)際應(yīng)用后,我們設(shè)計出一套更為實(shí)用化的 ESE 架構(gòu),針對語音識別和 RNN 做了非常多的修改,并且將它實(shí)用化了。
論文突破:軟件方面,我們提出了 Load-balance-aware pruning。硬件方面,在整個硬件架構(gòu)過程做了一個重新設(shè)計,能夠支持多路用戶,也能夠支持 RNN。
從哪幾方面提高了它在語音識別中的效率:該方案的核心就是它能支持在大規(guī)模用戶的情況下大幅降低延遲;其次使得功耗明顯降低,同時使延遲會變得更低,使得語音識別的精確度得到更進(jìn)一步提升。
在3月5日上午李克強(qiáng)所做政府工作報告里,首次出現(xiàn)了“人工智能”這一詞匯,這給外界發(fā)出重要信號:人工智能這項技術(shù),開始由國家背書了。
加快培育壯大新興產(chǎn)業(yè)。全面實(shí)施戰(zhàn)略性新興產(chǎn)業(yè)發(fā)展規(guī)劃,加快新材料、人工智能、集成電路、生物制藥、第五代移動通信等技術(shù)研發(fā)和轉(zhuǎn)化,做大做強(qiáng)產(chǎn)業(yè)集群。支持和引導(dǎo)分享經(jīng)濟(jì)發(fā)展,提高社會資源利用效率,便利人民群眾生活。”
雖然只出現(xiàn)了一次,但這給外界發(fā)出重要信號:人工智能這項技術(shù),開始由國家背書了。我們可以預(yù)見到,各地政府在這一“中央精神”指導(dǎo)下,將會投入豐富的資源建立本地人工智能平臺和公司,更多傳統(tǒng)行業(yè)公司也會更加大膽地?fù)肀I技術(shù),而對于已有的AI公司來說,或許會因此獲得更多的扶持和資源機(jī)遇,又或許會因為更多玩家的涌入,面臨更加兇險的競爭。
為了加速百度人工智能戰(zhàn)略布局及人工智能產(chǎn)品化和市場化進(jìn)程,就在三周前,百度集團(tuán)總裁兼COO陸奇發(fā)出通告,宣布將原度秘團(tuán)隊升級為度秘事業(yè)部,直接向其匯報,這在當(dāng)時可算是科技圈的重磅新聞之一。
一個月還未到,度秘事業(yè)部就有了大動作。在剛剛開幕的AWE 2017中國家電及消費(fèi)電子博覽會上,度秘宣布與海爾、美的兩大家電巨頭達(dá)成戰(zhàn)略合作協(xié)議,并推出系列的智能家居產(chǎn)品。在度秘事業(yè)部剛成立的時候,陸奇就表示:「憑借語音與對話技術(shù)的優(yōu)勢,百度在引領(lǐng)新一代人機(jī)交互平臺上擁有巨大的機(jī)會,自然語言和其他智能交互方式有可能出現(xiàn)在從手機(jī)到家居的每一個設(shè)備中?!?,此次與兩大巨頭合作,是度秘在智能家居領(lǐng)域布局的一個重要信號,同樣也是兩個家電巨頭向「智能化」發(fā)展的重要標(biāo)志之一。
在與海爾合作方面,海爾與度秘DuerOS達(dá)成了戰(zhàn)略合作,將DuerOS對話式人工智能操作系統(tǒng)加入到海爾產(chǎn)品序列,并且在現(xiàn)場發(fā)布了雙方合作的首款搭載DuerOS的冰箱——海爾馨廚系列冰箱。
在與美的合作方面,美的介紹了他們的「美的智慧家居科技有限公司」,也就是原美的智慧家居研究院在智能家居方面的布局,緊接著又介紹了M-Smart智慧生活開放平臺。隨后,發(fā)布了美的與度秘深度合作打造的「智能語音盒」。
中國人工智能學(xué)會AIDL第二期【人工智能前沿講習(xí)班】日前在北京中科院自動化所舉行,本期講習(xí)班的主題為【機(jī)器學(xué)習(xí)前沿】。北京大學(xué)教授王立威帶來了題為《機(jī)器學(xué)習(xí)理論:回顧與展望》的主題報告,主要對機(jī)器學(xué)習(xí)中關(guān)于泛化能力的幾個重要理論進(jìn)行介紹。
北京大學(xué)教授王立威博士的主要研究領(lǐng)域集中于機(jī)器學(xué)習(xí),在包括COLT, NIPS,JMLR, PAMI等權(quán)威會議期刊發(fā)表論文60余篇。2010年入選AI’s 10 to Watch,是首位獲得該獎項的亞洲學(xué)者。2012年獲得首屆國家自然科學(xué)基金優(yōu)秀青年基金,新世紀(jì)優(yōu)秀人才。任NIPS等權(quán)威會議Area Chair,和多家學(xué)術(shù)期刊編委。在主題報告結(jié)束后,雷鋒網(wǎng)(公眾號:雷鋒網(wǎng))AI科技評論與王教授做了短時間交流,探討了1 人工智能現(xiàn)在能做什么、還不能做什么、和可能的突破口又在哪里,2 云計算已經(jīng)將計算力提升到一個以前不敢想象的高度,甚至已經(jīng)遠(yuǎn)遠(yuǎn)高于樣本的獲取能力,那么構(gòu)建樣本是否會成為未來的研究重點(diǎn)3 數(shù)據(jù)對于算法而言處于怎樣的地位等多個問題。
為了做好云服務(wù),這兩年谷歌一直很拼。砸錢、招人、出產(chǎn)品,谷歌攻城略地的三板斧總是屢試不爽。3月9日凌晨的Google Cloud Next' 17云計算大會上,四大天王(Diane Greene、CEO Sundar Pichai、Alphabet 執(zhí)行主席 Eric Schmidt 、云機(jī)器學(xué)習(xí)與人工智能首席科學(xué)家李飛飛)加上近十位合作企業(yè)的高管站臺,似乎也多了一分人多勢眾的感覺。
在全長兩個多小時的開場Keynote中,谷歌把大部分時間留給了合作企業(yè),這些來自零售、娛樂、電信、金融、電商等多個領(lǐng)域的巨頭逐一介紹自家業(yè)務(wù)是如何使用云服務(wù)的:
為普及谷歌云計算,使人工智能真正受惠于民眾,李飛飛在演講中講了“democratizing AI”(AI民主化),及其四個發(fā)力方向:計算力、算法、數(shù)據(jù)和人才。
針對AI民主化,雷鋒網(wǎng)也從更好的計算力、更通用的算法、更海量的數(shù)據(jù)、更優(yōu)秀的人才這四個方面進(jìn)行了梳理。
更好的計算力(Computing)
機(jī)器學(xué)習(xí)計算引擎Cloud Machine Learning Engine實(shí)際上早在去年就公布了測試版本,這個基于TensorFlow搭建的平臺能夠幫助開發(fā)機(jī)器學(xué)習(xí)模型。在李飛飛的理解中,人工智能技術(shù)以往需要精通編程才能順利駕馭,如今借助現(xiàn)有的框架,用戶可以將基礎(chǔ)架構(gòu)和模型搭建全權(quán)交給谷歌云進(jìn)行大規(guī)模處理,把更多的精力放在“做什么”而不是“怎么做”上。這也是谷歌實(shí)現(xiàn)技術(shù)普及的一個過程:降低用戶的使用門檻,把更多的基礎(chǔ)內(nèi)容交給更擅長的谷歌團(tuán)隊來做。
更通用的算法(Algorithms)
在Keynote上,李飛飛就發(fā)布了一系列通用模型API,這也是讓AI變得更加“親民”的一種方式。用于圖像識別的Vision
API實(shí)際上早已經(jīng)開發(fā)了一段時間,而視頻分析的Video Intelligence
API才是新推出的一大亮點(diǎn),它可以自動識別視頻中的物體,讓視頻實(shí)現(xiàn)可搜索。
用李飛飛的話來說,視頻是計算機(jī)視覺里面的“暗物質(zhì)”,因為它無法像圖片一樣實(shí)現(xiàn)便捷的搜索,但Video Intelligence API現(xiàn)在可以幫助開發(fā)者開發(fā)出從視頻中搜索實(shí)體的應(yīng)用,并標(biāo)記出對應(yīng)物體的出現(xiàn)位置。雷鋒網(wǎng)(公眾號:雷鋒網(wǎng))了解到,除了提取數(shù)據(jù),API還允許在對變換的場景打標(biāo)簽。
更海量的數(shù)據(jù)(Data)
不論是算法訓(xùn)練還是系統(tǒng)測試,龐大的數(shù)據(jù)量對于人工智能而言毫無疑問都非常寶貴。在與一些高校老師接觸的過程中,雷鋒網(wǎng)也了解到高校目前面臨著“數(shù)據(jù)荒”問題。高校研究目前都是采用公開數(shù)據(jù)集,主要目的是對算法的可行性進(jìn)行測試。但這些數(shù)據(jù)集比起企業(yè)級別的數(shù)據(jù)實(shí)在是九牛一毛?,F(xiàn)在不少高校教授同樣身兼企業(yè)的首席科學(xué)家,數(shù)據(jù)不得不說是一個非常重要的考量。李飛飛此前加入谷歌,或許也是看中了谷歌在數(shù)據(jù)的強(qiáng)大實(shí)力。
更優(yōu)秀的人才(Talent)
為了讓人工智能的普及范圍更廣,單從企業(yè)的基礎(chǔ)設(shè)施入手自然不夠,人才的培養(yǎng)與合作同樣重要。谷歌發(fā)布 Advanced Solution Lab的目的,也在于充分利用谷歌人才的實(shí)力,幫助其它企業(yè)解決復(fù)雜的機(jī)器學(xué)習(xí)問題;此外,該計劃還將贊助一些嘗試解決困難問題的研究者,讓他們與谷歌一同解決——自然,采用的服務(wù)也都會是谷歌生態(tài)下的系列產(chǎn)品,而這一舉措又能夠更好地吸引越來越多的用戶轉(zhuǎn)投谷歌麾下。
據(jù)雷鋒網(wǎng)AI 科技評論消息,Ian Goodfellow 已于今年 3 月份從 OpenAI 重回谷歌。
目前 Ian Goodfellow 的 LinkedIn 個人資料已經(jīng)新增了一列,頭銜為谷歌「Staff Research Scientist」,而 Twitter 上的資料顯示為「Google Brain research scientist」;不過維基和 Quora 上的資料暫時還沒有更新。
美國當(dāng)?shù)貢r間 3 月 8 日,F(xiàn)acebook 正式宣布了新一代的服務(wù)器設(shè)計方案——“Big Basin”,它是 AI 訓(xùn)練系統(tǒng) Big Sur 系列的繼承者。這些使用英偉達(dá)的 GPU 作為處理核心的服務(wù)器連接起來,形成一個巨大的 AI 訓(xùn)練網(wǎng)絡(luò),這使得 Facebook 的產(chǎn)品能夠進(jìn)行物體和面部識別、實(shí)時文本翻譯、以及理解并描述圖片和視頻中的內(nèi)容。
Facebook表示,與 Big Sur 相比,Big Basin 能夠訓(xùn)練比之前的規(guī)模大 30% 的機(jī)器學(xué)習(xí)模型。根據(jù)在標(biāo)準(zhǔn)神經(jīng)網(wǎng)絡(luò)模型上的測試,Big Basin 還可以通過壓縮訓(xùn)練 AI 系統(tǒng)需要的大量數(shù)據(jù)集,將訓(xùn)練速度提升一倍。
在正式推出面向大眾的產(chǎn)品之前,F(xiàn)acebook 會通過 Big Basin、Big Sur 這樣的服務(wù)器對這些 AI 系統(tǒng)進(jìn)行訓(xùn)練。正是因為 Facebook 的持續(xù)投入,才讓這一切變得可能。
雷峰網(wǎng)原創(chuàng)文章,未經(jīng)授權(quán)禁止轉(zhuǎn)載。詳情見轉(zhuǎn)載須知。