0
一周之前,MIT 編輯部致電阿里巴巴人工智能實(shí)驗(yàn)室首席科學(xué)家王剛,向他傳達(dá)了獲獎(jiǎng)訊息,第一個(gè)蹦入王剛腦海的反應(yīng)是—— I'm lucky . 王剛向雷鋒網(wǎng)表示,在身邊優(yōu)秀的行業(yè)前沿人才如此多的情況下,獲此殊榮,運(yùn)氣成分要占一定比例。
1、
8月16日,《麻省理工學(xué)院科技評(píng)論》(MIT Technology Review)雜志揭曉了 2017 年全球青年科技創(chuàng)新人才榜(TR35)的評(píng)選結(jié)果。這一次,國(guó)內(nèi)阿里巴巴人工智能實(shí)驗(yàn)室首席科學(xué)家王剛、阿里云首席安全科學(xué)家吳翰清獲此殊榮。這也是自該獎(jiǎng)項(xiàng)創(chuàng)立18年以來(lái),首次中國(guó)公司里同時(shí)有兩人入選榜單。
本次35名上榜者中,共有6位華人,分別是——?jiǎng)?chuàng)立 Project Include 的 Pinterest 軟件工程師周怡君(Tracy Chou)、Law.ai 和 Wafa Games 的創(chuàng)始人龔曉思、柔宇科技創(chuàng)始人兼 CEO 劉自鴻、阿里巴巴人工智能實(shí)驗(yàn)室的首席科學(xué)家王剛、阿里云首席安全科學(xué)家吳翰清,以及 AutoX 創(chuàng)始人兼 CEO 肖健雄。
該榜單分為 5 大類別:
· 發(fā)明家(Inventors)
· 遠(yuǎn)見(jiàn)者(Visionaries)
· 先鋒者(Pioneers)
· 創(chuàng)業(yè)家(Entrepreneurs)
· 人文關(guān)懷者(Humanitarians)
所謂TR35 ,即是針對(duì)35歲以下青年科技才俊、為找出最有可能改變世界的牛人而設(shè)立的獎(jiǎng)項(xiàng)。從 1999 年開(kāi)始,該雜志每年會(huì)在全球 IT(計(jì)算機(jī)、通信、網(wǎng)絡(luò))和生物醫(yī)藥、商業(yè)等領(lǐng)域內(nèi),從影響力、創(chuàng)新力、進(jìn)取力、未來(lái)潛力、溝通力五個(gè)維度進(jìn)行評(píng)估,挖掘?qū)W術(shù)界和工業(yè)界的35位科技創(chuàng)新精英。
此前,Google 聯(lián)合創(chuàng)始人拉里·佩奇(2002年)和謝爾蓋·布林(2002年),Linux 之父林納斯·托瓦茲(1999年),F(xiàn)acebook 創(chuàng)始人馬克·扎克伯格(2007年),Yahoo 創(chuàng)始人楊致遠(yuǎn)(1999年),Apple 設(shè)計(jì)總監(jiān)喬納夫·伊森(1999年)等,都曾是該獎(jiǎng)的座上賓。
對(duì)于獲獎(jiǎng)原因,王剛對(duì)雷鋒網(wǎng)表示,評(píng)審團(tuán)應(yīng)該也是主要考量候選人對(duì)后續(xù)科技發(fā)展帶來(lái)積極的趨勢(shì)性影響。正如《MIT Technology Review》總編輯兼發(fā)行人Jason Pontin所說(shuō),“這些年來(lái),我們所選擇的這些青年才俊的創(chuàng)新成果和公司一直深刻地影響著人類進(jìn)步的方向。”
2、
王剛是誰(shuí)?
前新加坡南洋理工大學(xué)終身教授,同時(shí)也是人工智能領(lǐng)域最頂尖雜志IEEETransactions on Pattern Analysis and Machine Intelligence的編委(Associate Editor),曾多次受邀成為人工智能頂級(jí)學(xué)術(shù)會(huì)議如InternationalConference on Computer Vision的領(lǐng)域主席,在深度學(xué)習(xí)算法領(lǐng)域具有深厚的研究積累和國(guó)際權(quán)威。
今年3月,王剛加入阿里巴巴AI Labs,負(fù)責(zé)機(jī)器學(xué)習(xí)、計(jì)算機(jī)視覺(jué)和自然語(yǔ)言理解的研發(fā)工作。
實(shí)際上,早在2016年,王剛因在深度神經(jīng)網(wǎng)絡(luò)設(shè)計(jì)上的卓越貢獻(xiàn),便已成為MIT評(píng)選出的10名亞洲區(qū)35歲以下青年科技創(chuàng)新人才得主之一。在加入阿里巴巴之后,因推動(dòng)了AI商業(yè)化再次入選了MIT全球青年科技創(chuàng)新人才榜。今年7月,阿里AI labs發(fā)布的人工智能消費(fèi)級(jí)產(chǎn)品“天貓精靈X1”,就運(yùn)用了王剛的多項(xiàng)研究成果。
談到與阿里的結(jié)緣,王剛向雷鋒網(wǎng)表示,可以追溯到去年,即與阿里內(nèi)部人員有過(guò)接觸。阿里人工智能實(shí)驗(yàn)室定位為提供消費(fèi)級(jí) AI 產(chǎn)品緊密相關(guān),而其優(yōu)秀的人才團(tuán)隊(duì)與技術(shù)資源,可以輔助王剛將其耕耘多年的深度學(xué)習(xí)算法技術(shù)實(shí)現(xiàn)真正落地,離消費(fèi)者更近、直接創(chuàng)造C端產(chǎn)品,這也是他決定加入阿里的重要原因
加入阿里之后,王剛將主要精力放在AI labs上,人工智能新硬件與降低智能終端成本、生物認(rèn)知啟發(fā)、量子力學(xué)等,都是實(shí)驗(yàn)室正在攻克的方向。目前主要推出的落地產(chǎn)品,即為天貓精靈X1 。
對(duì)于目前智能音箱行業(yè)的泡沫現(xiàn)象,王剛對(duì)雷鋒網(wǎng)表示,目前行業(yè)還處于早期培育階段,每個(gè)新生事物出現(xiàn)時(shí),都要遭受很多質(zhì)疑,而支撐條件都是后天創(chuàng)造出來(lái)的。相信,未來(lái)在較短時(shí)間內(nèi),就能看到智能音箱產(chǎn)品逐漸成為大眾喜愛(ài)的產(chǎn)品。“不要受限于用戶現(xiàn)有的習(xí)慣 要為用戶創(chuàng)造習(xí)慣。”王剛這樣強(qiáng)調(diào)。
具體技術(shù)上,天貓精靈使用了AliGenie第一代中文人機(jī)交互系統(tǒng),能夠精確理解用戶語(yǔ)言,進(jìn)行智能對(duì)話,同時(shí)提供個(gè)性化用戶服務(wù)。阿里AI Labs將AliGenie開(kāi)放給開(kāi)發(fā)者、硬件廠商所使用,即是希望讓更多具有人工智能能力的產(chǎn)品,快速落地,被消費(fèi)者所使用。
即便如此,王剛對(duì)智能音箱未來(lái)的看法,仍是堅(jiān)持“語(yǔ)音+視頻”是大趨勢(shì)。他認(rèn)為,語(yǔ)言、圖像,包括觸摸、氣味等的輸入,會(huì)使學(xué)習(xí)更高效。當(dāng)然,面臨的挑戰(zhàn)也同時(shí)存在,“這是一個(gè)漸進(jìn)的過(guò)程?!?/p>
阿里人工智能實(shí)驗(yàn)室辦公室
3、
加入了阿里人工智能實(shí)驗(yàn)室的王剛,具體帶來(lái)哪些落地技術(shù)?
王剛主要的研究領(lǐng)域集中在深度神經(jīng)網(wǎng)絡(luò)上,他為阿里巴巴帶來(lái)的貢獻(xiàn)之一也來(lái)源于相關(guān)的研究成果。深度神經(jīng)網(wǎng)絡(luò)是一項(xiàng)關(guān)于機(jī)器學(xué)習(xí)的研究,它能夠讓機(jī)器在海量數(shù)據(jù)中尋找規(guī)律,自動(dòng)對(duì)數(shù)據(jù)進(jìn)行分析。同時(shí),此項(xiàng)技術(shù)也是AlphaGo的基礎(chǔ)理論之一。
但目前,據(jù)雷鋒網(wǎng)了解,大多數(shù)現(xiàn)有神經(jīng)網(wǎng)絡(luò)均需要科學(xué)家具備某一專業(yè)領(lǐng)域的相關(guān)知識(shí)才能驅(qū)動(dòng),不同的領(lǐng)域的神經(jīng)網(wǎng)絡(luò)所需要的知識(shí)理論也完全不同,這就極大地限制了神經(jīng)網(wǎng)絡(luò)的大規(guī)模應(yīng)用。
例如,當(dāng)我們?cè)谧鰣D片匹配時(shí),不同的圖像對(duì)應(yīng)的相似區(qū)域是不一樣的。但是大部分現(xiàn)有方法都沒(méi)有考慮到這樣的差異性,從而限制了深度學(xué)習(xí)的效果。
針對(duì)于此,王剛在深度神經(jīng)網(wǎng)絡(luò)的研究中,提出了自適應(yīng)神經(jīng)網(wǎng)絡(luò)。它降低了人工篩選數(shù)據(jù)的工作量,能夠根據(jù)輸入的數(shù)據(jù)特點(diǎn),自適應(yīng)的匹配數(shù)據(jù)進(jìn)行學(xué)習(xí),從而極大的增強(qiáng)了神經(jīng)網(wǎng)絡(luò)的效果。這個(gè)方法在很多重要的機(jī)器學(xué)習(xí)問(wèn)題上都取得了比傳統(tǒng)方法更好的結(jié)果,也應(yīng)用到了AI labs的具體產(chǎn)品中。
本質(zhì)來(lái)講,神經(jīng)網(wǎng)絡(luò)是人工智能的“大腦”,這項(xiàng)研究讓人工智能具備更強(qiáng)的學(xué)習(xí)能力,從“應(yīng)試教育”進(jìn)化到“自主學(xué)習(xí)”。
以行人的識(shí)別為例,在多個(gè)場(chǎng)景和攝像頭之間實(shí)現(xiàn)行人的再次識(shí)別,是視覺(jué)分析和場(chǎng)景監(jiān)控的核心技術(shù)。但,由于行人在不同場(chǎng)景下的變化,穩(wěn)定的行人再識(shí)別是非常有挑戰(zhàn)的問(wèn)題,因此,王剛創(chuàng)新地提出了一種神經(jīng)網(wǎng)絡(luò)結(jié)構(gòu)。
行人再識(shí)別的問(wèn)題是輸入兩張圖片,然后去識(shí)別這兩張圖片里是否包含了同一個(gè)人。傳統(tǒng)的神經(jīng)網(wǎng)絡(luò)方法,是在最后的特征表達(dá)層上,將兩張圖片結(jié)果進(jìn)行相似比較,而該網(wǎng)絡(luò)結(jié)構(gòu)創(chuàng)新地提出了門(mén)匹配的機(jī)制——在兩張圖片的各個(gè)中間特征層之間加入門(mén)匹配機(jī)制。
門(mén)機(jī)制圖解
這種起源于LSTM的門(mén)機(jī)制,可以在特征抽取的過(guò)程中,通過(guò)比較兩張待匹配照片之間的相關(guān)性,對(duì)那些有助于行人再識(shí)別的特征進(jìn)行強(qiáng)化,從而較好地提升行人再識(shí)別的準(zhǔn)確率。這種可以訓(xùn)練的門(mén)機(jī)制,不僅保留了端到端訓(xùn)練,而且實(shí)現(xiàn)了在預(yù)測(cè)過(guò)程中根據(jù)不同輸入情況進(jìn)行特征抽取的控制,是對(duì)傳統(tǒng)多層神經(jīng)網(wǎng)絡(luò)的非常重要的改進(jìn)。
雖然這是一項(xiàng)圖像識(shí)別技術(shù),但核心的門(mén)匹配機(jī)制可以擴(kuò)展到多個(gè)技術(shù)領(lǐng)域,實(shí)現(xiàn)更高精度的識(shí)別率。這一技術(shù)思路也同樣將應(yīng)用在AI labs的產(chǎn)品中。
雷峰網(wǎng)原創(chuàng)文章,未經(jīng)授權(quán)禁止轉(zhuǎn)載。詳情見(jiàn)轉(zhuǎn)載須知。