0
本文作者: 叨叨 | 2017-06-25 17:54 |
6月24日下午,鈦媒體和杉數(shù)科技主辦的2017 AI 大師論壇在京舉行,論壇邀請了五位算法優(yōu)化、機(jī)器學(xué)習(xí)領(lǐng)域的頂尖教授、學(xué)者出席并發(fā)表學(xué)術(shù)演講,他們分別是斯坦福大學(xué)李國鼎工程講座教授葉蔭宇,佐治亞理工學(xué)院終身教授藍(lán)光輝,紐約大學(xué)助理教授、Michael I.Jordan 的高徒陳溪,清華大學(xué)交叉信息研究院助理教授李建以及杉數(shù)科技 CTO、明尼蘇達(dá)大學(xué)助理教授王子卓。
論壇上,五位科學(xué)家圍繞算法、數(shù)據(jù)、應(yīng)用,結(jié)合各自的研究領(lǐng)域,暢談了現(xiàn)狀和未來的發(fā)展。
* 葉蔭宇
葉蔭宇教授是斯坦福大學(xué)李國鼎工程講座教授(K. T. Li Chair Professor),其研究領(lǐng)域為連續(xù)和離散優(yōu)化、數(shù)據(jù)科學(xué)和應(yīng)用、大規(guī)模算法設(shè)計和分析、計算博弈論/市場平衡,動態(tài)資源分配和隨機(jī)和魯棒決策等,他也是優(yōu)化領(lǐng)域基石算法之一——內(nèi)點算法的奠基人之一。
因貢獻(xiàn)突出,他曾獲得美國運籌與管理學(xué)會馮·諾依曼理論獎,也是迄今為止唯一獲得此獎的華人學(xué)者,也曾主持、參與美國波音、FICO、運通、美國衛(wèi)生部、美國科學(xué)基金、美國能源部,以及美國空軍科研部門等多個科研項目。此外,在工業(yè)界,葉教授也多有涉獵,擔(dān)任優(yōu)化軟件公司 MOSEK 科技顧問委員會主席、杉數(shù)科技的首席科學(xué)顧問,同時也參與中國國家電網(wǎng)調(diào)度,華為、京東商城收益管理、無人倉等項目。
在論壇上,葉蔭宇教授以“優(yōu)化算法的思想及應(yīng)用”為題做了演講。他早在1982年去美國斯坦福讀書、工作期間,就經(jīng)歷了一次 AI 的火爆和降溫,從最紅到無人問津,和現(xiàn)在的火爆有些相似,因此他認(rèn)為,AI 幾起幾落,但“優(yōu)化”始終如同不動點,各行各業(yè)都需要。
針對 AI 在大數(shù)據(jù)時代的商業(yè)決策,需要通過機(jī)器學(xué)習(xí)大量的數(shù)據(jù),然后進(jìn)行建模、決策。但決策過程,或許會用到一些很傳統(tǒng)的優(yōu)化模型和運籌學(xué)模型。反過來,AI 也對算法優(yōu)化領(lǐng)域提供了一條新的思路:
以前我認(rèn)為要搞出個萬能的算法,解所有的線性規(guī)劃都能解得快,但是后來反觀 AI 研究者的思維并非這樣,它是非常定制的,什么方法對某一類問題用的好就用那個方法,不追求某一個統(tǒng)一的算法,或者類別法。所以這點上,AI 對我們的思維有所改變。
* 藍(lán)光輝
藍(lán)光輝教授為佐治亞理工學(xué)院博士、佐治亞理工學(xué)院終身教授,他目前還擔(dān)任計算優(yōu)化和應(yīng)用(2014年至今)、優(yōu)化算法頂級期刊 Mathematical Programming(數(shù)學(xué)規(guī)劃,2016年至今)雜志的副主編,是國際上機(jī)器學(xué)習(xí)和深度學(xué)習(xí)算法方向的頂級專家。藍(lán)光輝教授的主要研究領(lǐng)域為:隨機(jī)優(yōu)化和非線性規(guī)劃的理論、算法和應(yīng)用,包括隨機(jī)梯度下降和加速隨機(jī)梯度下降,用于解決隨機(jī)凸和非凸優(yōu)化問題。
在論壇上,藍(lán)光輝教授以“凸優(yōu)化,機(jī)器學(xué)習(xí)及深度學(xué)習(xí)”為題做了演講。在回顧了凸優(yōu)化的歷史之后,藍(lán)教授講解了優(yōu)化和機(jī)器學(xué)習(xí)之間的關(guān)系。他認(rèn)為,機(jī)器學(xué)習(xí)的本質(zhì),就是要建立模型、描述數(shù)據(jù),輸入和輸出,模型和算法結(jié)合的部位那就是優(yōu)化,用優(yōu)化來解模型。
此外,他還介紹了優(yōu)化的“黑匣子”:
除了機(jī)器學(xué)習(xí)用起來做預(yù)測以外,最重要是要做決策。建立模型再做決策,涉及到優(yōu)化的系統(tǒng)集成,不管是在機(jī)器學(xué)習(xí)過程中還是在決策過程中,都需要用到優(yōu)化模型或者算法,那么有沒有一個工具,或者黑匣子能夠解決這個問題,有,我們叫做求解器。
有了求解器可以幫助企業(yè)解決很多的問題,比如用在做前端數(shù)據(jù)分析和尋找規(guī)律,比如用來做局測問題,然后再用于經(jīng)濟(jì)、金融、軍事、工業(yè)工程、管理、互聯(lián)網(wǎng)領(lǐng)域的應(yīng)用。根據(jù)問題的規(guī)模和問題的難度,求解精度的要求,可以設(shè)計不同類型的求解器,比如說中等規(guī)模的求解器,1000個到1000個變量或約束。更大規(guī)模的求解器你需要解10的9次方的這個變量或者6次方的變量,規(guī)模非常大,然后可能我們需要有不同的這個特定方法求解,加速算法、隨機(jī)梯度算法、坐標(biāo)梯度下降用來求解更大規(guī)模的問題。
頂級的機(jī)器學(xué)習(xí)求解器,第一個是H20,它發(fā)布最早,也是影響力最大的機(jī)器學(xué)習(xí)開源軟件之一,重要的客戶有思科、paypal、ebay;第二個是 TensorFlow,是谷歌全力開發(fā)并推的深度學(xué)習(xí)計算引擎,也可用通用的機(jī)器學(xué)習(xí)求解器,是 Github 排名第一的世界頂級開源項目,在語音識別、圖像識別、機(jī)器翻譯等AI領(lǐng)域隨處可見,重要客戶英特爾、高通、Airbnb等。
雷鋒網(wǎng)了解到,杉數(shù)科技也自主開發(fā)了一個求解器,和 TensorFlow進(jìn)行對比,在9個公開數(shù)據(jù)集上對兩種求解器進(jìn)行測試,比 TensorFlow 快了10倍-70倍。后續(xù),雷鋒網(wǎng)還將持續(xù)關(guān)注該求解器的詳細(xì)消息。
* 陳溪
陳溪博士目前是紐約大學(xué)商學(xué)院助理教授,CMU機(jī)器學(xué)習(xí)系博士,也曾跟隨 Michael I Jordan 做了為期一年多的博士后研究。同時,陳溪博士拿過 Google Faculty Research Award,在2017年還獲得了福布斯雜志全美 30 under 30 最有影響力的青年科學(xué)家稱號。陳溪博士的主要研究領(lǐng)域為:機(jī)器學(xué)習(xí)、高維統(tǒng)計和運籌學(xué)。
在論壇上,陳溪博士以“從學(xué)習(xí)到?jīng)Q策”為主題的演講。陳溪博士最早就讀于CMU的商學(xué)院,一年后轉(zhuǎn)向機(jī)器學(xué)習(xí)的研究,并將機(jī)器學(xué)習(xí)的技術(shù)應(yīng)用于商學(xué)院的傳統(tǒng)問題中,嘗試進(jìn)行解決,在跟隨 Michael I Jordan 做完博士后研究后,他進(jìn)入紐約大學(xué)商學(xué)院,繼續(xù)利用機(jī)器學(xué)習(xí)的技術(shù)和方法解決商學(xué)院關(guān)心的問題。他認(rèn)為:
做大規(guī)模的統(tǒng)計推斷,和運籌運營的管理,看似不相關(guān),但其實非常有聯(lián)系。最根本的聯(lián)系是這些學(xué)科都是用數(shù)據(jù)驅(qū)動的,并且最后都是要為數(shù)據(jù)服務(wù)的,挖掘數(shù)據(jù)核心的價值。我認(rèn)為這三個領(lǐng)域結(jié)合起來才能對數(shù)據(jù)有更深更好的理解,并且做出有效的決策。
此外,陳溪博士還認(rèn)為,真正商業(yè)的問題是極其復(fù)雜復(fù)雜的,光有機(jī)器學(xué)習(xí)是不夠的,要把機(jī)器學(xué)習(xí)和科學(xué)、統(tǒng)計結(jié)合起來,才會有新的數(shù)據(jù)產(chǎn)生。機(jī)器學(xué)習(xí)這幾年的發(fā)展,有圖像處理、文本處理的,通過數(shù)據(jù)可以得到更好的表現(xiàn),這大大推動了機(jī)器學(xué)習(xí)的算法發(fā)展。但商業(yè)上,大規(guī)模的公開數(shù)據(jù)集還是非常少的,以后會有更多的這樣的數(shù)據(jù)集,更多研究人員進(jìn)入這個領(lǐng)域,這樣我們就可以得到更多的知識,這樣可以推動商業(yè)化下的機(jī)器學(xué)習(xí)或者說決策技術(shù)的發(fā)展。
* 李建
李建在美國馬里蘭大學(xué)取得博士學(xué)位,目前任職清華大學(xué),是清華大學(xué)交叉信息研究院的助理教授。李建博士是 VLDB 2009 和 ESA 2010 最佳論文獎獲得者,也是清華211基礎(chǔ)研究青年人才支持計劃以及教育部新世紀(jì)人才支持計劃青年學(xué)者,他的主要研究方向為:算法設(shè)計與分析、機(jī)器學(xué)習(xí)與深度學(xué)習(xí)、隨機(jī)優(yōu)化與組合優(yōu)化。
在論壇上,李建博士以“深度學(xué)習(xí)預(yù)測算法的思想及應(yīng)用”為題做了演講。在演講中他講道:
深度學(xué)習(xí)在圖像識別、語音識別這些領(lǐng)域,都取得了比較成功的進(jìn)展,也有很成功的商業(yè)化模式,但在時空大數(shù)據(jù)方面的研究,只是剛剛起步,還沒有非常成熟的一套方法論。
李建博士認(rèn)為,深度學(xué)習(xí)在時空大數(shù)據(jù)領(lǐng)域,有非常廣闊的應(yīng)用前景,例如網(wǎng)約車訂單預(yù)測、出行時間的預(yù)測、商店選址等問題。
時空大數(shù)據(jù)的特點是有很多類型的數(shù)據(jù),要解決一個可以用到方方面面的問題,比如說預(yù)測,網(wǎng)約車的訂單供需量的應(yīng)用,數(shù)據(jù)的類型包含GPS、訂單數(shù)據(jù)、天氣數(shù)據(jù)、路況數(shù)據(jù)等等,這跟原來深度學(xué)習(xí)所處理的問題不一樣,做圖像識別只需要圖像就夠了,做語音識別只需要語音就夠了,現(xiàn)在有各種各樣的數(shù)據(jù),這些數(shù)據(jù)都是不同質(zhì)的,需要組合起來,才能來進(jìn)行學(xué)習(xí)和預(yù)測。
* 王子卓
王子卓博士19歲從清華畢業(yè),24歲就拿到了斯坦福的博士學(xué)位,目前執(zhí)教于明尼蘇達(dá)大學(xué),還擔(dān)任杉數(shù)科技的 CTO 。他為 IBM 定制的定價策略系統(tǒng)獲得兩項美國專利,并且自上線以來,已為 IBM 創(chuàng)造過億美元的利潤,另外此項目也被美國運籌管理學(xué)會收益管理分會提名為 2015 年最佳實際應(yīng)用獎。他的研究領(lǐng)域主要為:收益管理與運營管理、定價問題,優(yōu)化算法設(shè)計。
在論壇中,王子卓博士以“數(shù)據(jù)驅(qū)動的定價策略系統(tǒng)詳解”為題做了演講。在演講中,他認(rèn)為,在比較廣泛的意義上來說,一個好的定價策略,需要在正確的時間,正確的地點,以正確的價格,把正確的服務(wù)和商品賣給正確的消費者。這里包含很多需要做決策的地方,當(dāng)然價格是其中的最的一部分,這對企業(yè)來說,是非常重要的。
在行業(yè)里,哪個企業(yè)能夠利用有限的資源獲得更大的收益,就很可能決定這個企業(yè)在行業(yè)當(dāng)中能否脫穎而出,能否獲得成功,而定價策略可謂是很多公司的“生命線”。這里有很多新的機(jī)遇,有很多的挑戰(zhàn),通過數(shù)據(jù)驅(qū)動的方法,利用機(jī)器學(xué)習(xí)、人工智能技術(shù)、運籌學(xué)的技術(shù),就能來幫助新公司在新的時代更好的迎接挑戰(zhàn)。
記者:工業(yè)界相對學(xué)術(shù)界來說,有更多的資源優(yōu)勢,美國高校如何應(yīng)對學(xué)術(shù)人才流失的挑戰(zhàn)?
陳溪:美國高校提供更靈活的制度,以前不允許教授到企業(yè),而現(xiàn)在允許在學(xué)校工作3天,企業(yè)工作2天,像文本分析確實企業(yè)做的比學(xué)校好,學(xué)校會回歸到更加基礎(chǔ)的研究,更多理解深度學(xué)習(xí)為什么取得這么好的效果,有哪些局限性,根據(jù)我們理解,會開發(fā)出新的算法,以后有更加需要創(chuàng)新的,更加基礎(chǔ)的東西會在學(xué)校里完成,而大規(guī)模的應(yīng)用企業(yè)會推出。
記者:怎么看國內(nèi)運籌學(xué)這一塊人才緊缺這個事?
葉蔭宇:我覺得不是人才緊缺的問題,而是導(dǎo)向的問題。我個人認(rèn)為,中國學(xué)生學(xué)理工科都是很強(qiáng)的,但是,他們也是永遠(yuǎn)追那個最時髦的,我覺得這個風(fēng)氣要改一改。就像剛才講的說不定,過幾年 AI 就不那么火,所以我覺得學(xué)生還是要把基礎(chǔ)打好,我非常贊成這個教育,進(jìn)去不要就是搞 AI,或者搞機(jī)器學(xué)習(xí),搞搞OR,搞搞統(tǒng)計(也可以)。
另外,理工科變得愈來愈受歡迎,這不僅在中國,在美國也是這樣。我們斯坦福大學(xué),原來大部分本科生都在文理學(xué)院,而現(xiàn)在也都轉(zhuǎn)到工科學(xué)院,我覺得學(xué)文理學(xué)生去接觸一些理工科的知識,也沒有什么障礙。其實無非就是一些 1+1=2 這些簡單的術(shù)語就可以了。我記得我們斯坦福商學(xué)院的院長,也叫他們 MBA 的這個學(xué)生去聽機(jī)器學(xué)習(xí)的課。
藍(lán)光輝:在我們學(xué)校(佐治亞理工學(xué)院)其實主體部分是運籌學(xué),包括優(yōu)化、學(xué)習(xí)過程、統(tǒng)計等等,我們那個系排名第一,我們整個學(xué)校 10% 的學(xué)生在我們系,在美國找工作非常好找,一般本科生畢業(yè)之后會有4-5個 offer ,我們需要創(chuàng)造這樣的一個機(jī)會在國內(nèi),讓大家知道這個是有很大的需求。
記者:人工智能三起兩落,是不是又會帶來人才的流動,任何產(chǎn)業(yè)的變化一定是基于人才的流動,怎么看這個趨勢?以及國內(nèi)產(chǎn)學(xué)研的結(jié)合,會不會對人才有新的要求?
李建:人才是一個很基礎(chǔ)又很復(fù)雜的問題,比如說 AI 這一波火了,像我是在負(fù)責(zé)我們院的招生工作,明顯的感覺到一半多以上的學(xué)生都想學(xué) AI、機(jī)器學(xué)習(xí),但其實其他學(xué)科的也都非常的重要,報名的學(xué)生馬上就變少。
我覺得學(xué)生也是被媒體影響,比例有點趨高,并不是它有所突破這個比例應(yīng)該增加,我的感覺是增加過多了,很多重要的方向就非常缺乏學(xué)生,但這些方向也非常重要。
學(xué)生面試的時候,我們會給他說這個方向非常非常的重要,大家都往這個方向來,我們做了很多開導(dǎo)的工作,重新疏導(dǎo),雖然媒體沒有人報道,但是你學(xué)這個,以后也有可能非常成熟。媒體鋪天蓋地的宣傳,都想搞 AI,但是我們做的事情也都在做,至少對于我來說,即便跟我學(xué)深度學(xué)習(xí)、學(xué)AI,還是會讓他學(xué)優(yōu)化、學(xué)統(tǒng)計,把基礎(chǔ)打扎實。我們有一個術(shù)語叫煉丹,其實我們在煉丹,不確定性很大。我們希望學(xué)生,把基礎(chǔ)打好,從上到下,從理論到實際,都可以全面的應(yīng)對。
記者:未來 AI 的發(fā)展趨勢如何?
王子卓:這個其實是很難預(yù)測的,隨著科學(xué)技術(shù)的發(fā)展,實際上更多不是線性的往上去,而是一個爆發(fā)性的,可能某個點就有一個突然的進(jìn)度,而這個進(jìn)度之后,有些人就會跟著潮流解決相關(guān)的問題,解決完了之后又會停留在某個階段。
雖然這個事情很難預(yù)測,但企業(yè)需要提高效率的這個事情是永遠(yuǎn)都需要的,這里面應(yīng)該用什么方法提高效率,AI 的領(lǐng)先技術(shù)肯定是一種,我們現(xiàn)有的方式幫助他們提升。
葉蔭宇:我個人認(rèn)為,AI 肯定會發(fā)展,至于還叫不叫 AI 我就不知道了。大家仔細(xì)想一想,其實 AI 要解決的問題,以前不叫 AI ,或者說叫 OR 要解決的問題,統(tǒng)計要解決的問題,或者說計算機(jī)要解決的問題,關(guān)鍵還是要服務(wù)于人類,提高效率,減少風(fēng)險,而且應(yīng)用大量的數(shù)學(xué)或者量化的工具,這個趨勢是會越來越強(qiáng)的,在這點上,我說AI永遠(yuǎn)不會死,因為它和統(tǒng)計、運籌學(xué)都一樣的,但是它會不會以另外一個名詞來出現(xiàn),我覺得這個也是有可能的。
另外,我覺得中國的媒體或者所有的媒體都不需要局限于,這個叫 AI 還是不叫 AI,關(guān)鍵是它確實是用到了基于科學(xué)的決策上。反過來說在美國,我們剛剛開過一個會沒有多少人提 AI,國外根本還沒有 AI 這種專業(yè),我們的專業(yè)還是數(shù)學(xué)、物理、統(tǒng)計、優(yōu)化,在我們計算機(jī)系,學(xué)生一樣要學(xué)很多課程。所以在這點上,我覺得容易把一個名稱去炒的很火熱,以它來畫線,好像非 AI不 可。
藍(lán)光輝:我補(bǔ)充一點,我覺得還是需要一些本質(zhì)的思考,因為在歷史上,也是因為某一項技術(shù),或者知名度,過于把期望值提高,導(dǎo)致它解決所有的問題都非常迫切。從研究角度來說,那只是一個名字而已,真正秉承的還是一些數(shù)據(jù)的辦法、建模,不要去叫 AI 或者說不叫 AI 。
為什么在中國AI這么火,我覺得可能在某種意義上我們民族的浪漫主義,我們想到 AI。什么都可以做,有這樣的感覺,我們小的時候看的動畫片,都有這種民族的情懷,而很多的老美更加的實際一些。
雷鋒網(wǎng)后續(xù)還將奉上此次演講的全文整理以及對藍(lán)光輝教授、陳溪博士的專訪文章,敬請關(guān)注。
雷峰網(wǎng)原創(chuàng)文章,未經(jīng)授權(quán)禁止轉(zhuǎn)載。詳情見轉(zhuǎn)載須知。