1
本文作者: 老王 | 2017-06-13 22:29 | 專題:雷峰網(wǎng)公開課 |
雷鋒網(wǎng)按:人工智能商業(yè)化落地進(jìn)度遠(yuǎn)不及AI算法的革新,究其原因,AI技術(shù)供應(yīng)商(乙方)不明確自己的技術(shù)可服務(wù)于誰,傳統(tǒng)機(jī)構(gòu)(甲方)不懂如何有效利用人工智能與大數(shù)據(jù)提升效率。與此同時(shí),AI公司對(duì)傳統(tǒng)公司的業(yè)務(wù)和行業(yè)場景的認(rèn)知也相對(duì)較淺。
雷鋒網(wǎng)硬創(chuàng)公開課邀請(qǐng)了iPIN創(chuàng)始人兼CEO楊洋博士,為大家深入剖析如何把產(chǎn)學(xué)研究成果成功商業(yè)化,并應(yīng)用在傳統(tǒng)行業(yè)中。
楊洋,商業(yè)認(rèn)知分析平臺(tái)iPIN創(chuàng)始人兼CEO,美國天普大學(xué)信息學(xué)博士,國際信息系統(tǒng)學(xué)會(huì)會(huì)員;曾任美國天普大學(xué)??怂股虒W(xué)院助理研究員&講師、哈爾濱工業(yè)大學(xué)副教授、歡聚時(shí)代全球化負(fù)責(zé)人;同時(shí)也是一位連續(xù)創(chuàng)業(yè)者。
楊洋曾在美國國家旅游與電子商務(wù)實(shí)驗(yàn)室(NLTeC)從事搜索引擎研究,師從世界著名信息科學(xué)家Rajiv Banker和Pei-yu Chen,進(jìn)行大規(guī)模眾包集智數(shù)據(jù)分析和研究;2013年,楊洋又成立了哈工大商業(yè)智能(BI)實(shí)驗(yàn)室,利用全球領(lǐng)先的大數(shù)據(jù)分析技術(shù)研究人力資源市場的多維度潛在信息,并領(lǐng)導(dǎo)和參與2項(xiàng)國家自然科學(xué)基金重要科研項(xiàng)目;楊洋還以第一作者身份共在ICIS, WISE, AoM,Information Systems Research, MISQ等世界頂級(jí)信息科學(xué)會(huì)議上發(fā)表研究論文共計(jì)8篇。另外,楊洋還曾獲得美國天普大學(xué)2011年跨學(xué)科優(yōu)秀青年學(xué)者獎(jiǎng)。
(注:本次雷鋒網(wǎng)硬創(chuàng)公開課中,楊洋博士展示了大量案例,并回答多個(gè)精彩問題,所以推薦優(yōu)先觀看視頻。)
很多人會(huì)問,人工智能跟認(rèn)知智能是什么關(guān)系?
目前市場上做認(rèn)知智能的公司比較少,整個(gè)人工智能從計(jì)算智能到感知智能再到認(rèn)知智能,它是一個(gè)逐步的過程。全世界做認(rèn)知智能、商業(yè)認(rèn)知智能最頂級(jí)的公司就是IBM Watson。
我們?cè)诤芏鄻I(yè)務(wù)形態(tài)和解決的問題、市場各方面確實(shí)是跟IBM Watson有非常大的相似性。我們做認(rèn)知智能已經(jīng)有差不多十年,有些業(yè)務(wù)確實(shí)有很大的相似性,但是在技術(shù)體系層面,我們屬于走自己的獨(dú)特路線。
今天來跟大家分享一下認(rèn)知智能它在各方面的應(yīng)用、發(fā)展?fàn)顟B(tài)以及它可以解決哪些問題。分享會(huì)分為三大方面,
一方面是對(duì)整個(gè)人工智能市場空間的展望;另一方面跟大家分析很多人很感興趣的AI+各行業(yè)案例。案例分享是因?yàn)橛幸粋€(gè)特殊原因,一是我們公司建了一個(gè)認(rèn)知分析平臺(tái),我們內(nèi)部叫AI+平臺(tái),iPIN會(huì)接觸各個(gè)行業(yè)AI的實(shí)際的應(yīng)用。與此同時(shí),我本人也是混沌研習(xí)社的導(dǎo)師,基于此,我走訪了很多混沌研習(xí)社學(xué)員企業(yè),并經(jīng)常與他們溝通他們對(duì)AI的需求;最后分享自己做認(rèn)知智能的實(shí)踐與感悟。
首先是人工智能市場的展望。人工智能技術(shù)簡單來講可以分成三大類:語音、圖像、文字。
整個(gè)社會(huì)產(chǎn)生的信息主要是以文字的形式去存儲(chǔ),溝通中的語言信息傳遞是人類的重要發(fā)明,是我們區(qū)別于其它動(dòng)物的關(guān)鍵因素,尤其是高級(jí)語言。如何用一些抽象化的東西去交流,現(xiàn)在人工智能在高度抽象語言的理解方面還是面臨非常多的挑戰(zhàn)。舉個(gè)例子,圖像、聲音它一旦存儲(chǔ)在電腦里面,它就是數(shù)字化的,但是語言存儲(chǔ)下來,依然是符號(hào)形式,它高度抽象,不能夠真正代表它的些含義。
比如我說華為、騰訊兩個(gè)公司名在座的可能都知道,但是對(duì)于絕大多數(shù)的小朋友來講,他們可能不知道什么意思。同樣,如果機(jī)器首次接觸這些概念,它們也不知道該如何去理解這些高度抽象的詞。
人工智能技術(shù)做了很多展望,它帶來的商業(yè)前景非常多。人工智能主要是代替人腦去做事,人腦涉及的領(lǐng)域從管理咨詢到投資、醫(yī)療到財(cái)務(wù)金融各方面是包羅萬象,它所面臨的市場非常龐大。我們每天90%的工作都是單調(diào)的、重復(fù)的、可以被大量取代的。
從這方面來講,人工智能會(huì)取代掉我們?nèi)粘?0%的工作量,它影響到的范圍相對(duì)來講非常大,帶來的商業(yè)機(jī)會(huì)非常多。
麥肯錫發(fā)布的12項(xiàng)顛覆性技術(shù)里面,其中有三項(xiàng)關(guān)于自動(dòng)化、新型機(jī)器人和自動(dòng)汽車,這三項(xiàng)都與人工智能直接相關(guān),在其它方面比如說物聯(lián)網(wǎng)、云、還有基因組學(xué)等等,各個(gè)方面都離不開人工智能。AI未來帶來的市場變化,首先會(huì)覆蓋到那些離錢比較近的行業(yè),如教育、醫(yī)療、法律、金融等。這些離錢特別近的行業(yè),是人工智能首當(dāng)其沖去應(yīng)用的。
現(xiàn)在按照我們公司自己的實(shí)踐來看,想做人工智能不單單是要去做人工智能,一個(gè)工作被計(jì)算機(jī)所替代,除了人工智能,還要去發(fā)展人機(jī)交互。我們公司在具體應(yīng)用就要做大量人際交互方面的研究,這方面當(dāng)然也會(huì)留意人工智能技術(shù)去提升人機(jī)交互的體驗(yàn)。
其次是高速計(jì)算,因?yàn)榇罅啃畔⒌挠?jì)算分析和理解對(duì)于計(jì)算的要求非常高,如何提升速度對(duì)各個(gè)人工智能公司都是一大瓶頸,也是一個(gè)挑戰(zhàn)。
兩年前,AI+可能還算是一個(gè)比較新的話題,但現(xiàn)在交通運(yùn)輸方面包括無人駕駛、無人機(jī),很多公司都有了廣泛的應(yīng)用。包括阿里巴巴和亞馬遜在倉儲(chǔ)方面的應(yīng)用,以及深圳停車場自動(dòng)停車等。這些技術(shù)都在快速的應(yīng)用,尤其是激光雷達(dá)、激光測距這些傳感器,它的效能提升對(duì)未來撬動(dòng)市場的影響越來越大。
在傳統(tǒng)制造業(yè)這方面,美的收購了全球最先進(jìn)的機(jī)器手臂制造商之一庫卡。東莞有一家叫李群自動(dòng)化的公司QKM,它也在生產(chǎn)機(jī)械手臂。機(jī)械手臂應(yīng)用在各種生產(chǎn)線和高空作業(yè),它可以配合無人機(jī)兩者結(jié)合,無人機(jī)可以代替人去到人想去但又無法到達(dá)的地方,讓機(jī)械手臂代替人的手臂去做具體操作,它給傳統(tǒng)制造業(yè)還有原來的高危行業(yè),比如高空維修電纜,都帶來很大的應(yīng)用空間。這些是傳統(tǒng)制造業(yè)的革命性變化。
與此同時(shí),在高端制造業(yè)這方面,人工智能也正在帶來變化。其中中芯國際,原來它們制造芯片模具,人用軟件去設(shè)計(jì),周期很長。但現(xiàn)在用人工智能基本上一周之內(nèi)就可以找到一套新的模具設(shè)計(jì)方案,效率得到大大提升。
在制藥行業(yè),做藥物的結(jié)構(gòu)選型,尤其中國很多制藥公司,他們想去仿專利,你不僅要仿專利還要繞過專利,如何通過結(jié)合計(jì)算化學(xué),把藥物的研發(fā)能快速找到更多的替代方案。原來花一年找個(gè)兩三個(gè)替代方案,現(xiàn)在用計(jì)算機(jī)很容易找到上百個(gè)替代方案,人工智能在高端制造業(yè)方面也展現(xiàn)出非常強(qiáng)大的實(shí)力。
接下來看一下教育,我們公司iPIN自己有一款產(chǎn)品,叫完美志愿,它是做高考志愿填報(bào)的,跟教育有非常大的關(guān)系,我們也對(duì)教育行業(yè)做了特別深入的了解。
全球最著名的公司Knewton,它是給美國一個(gè)叫ETS的考試機(jī)構(gòu)做自行打分起家的,后來把這套東西去幫助學(xué)生做自適應(yīng)學(xué)習(xí)計(jì)劃的制定。通過學(xué)生做題給他個(gè)性化分析他對(duì)知識(shí)點(diǎn)掌握的深度和廣度,給他定制化學(xué)習(xí)方案,就有了自適應(yīng)學(xué)習(xí)。
這套系統(tǒng)目前在全球很多國家都已經(jīng)得到大規(guī)模應(yīng)用,包括百度的作業(yè)幫,它是目前國內(nèi)整個(gè)教育行業(yè)里比較前沿的產(chǎn)品,用戶量非常龐大,也在往自適應(yīng)教育這個(gè)方向靠攏,自適應(yīng)教育應(yīng)該是未來顛覆教育很重要的大方向。
原來我們提互聯(lián)互聯(lián)網(wǎng)+教育很多年,但最后發(fā)現(xiàn)互聯(lián)網(wǎng)+教育對(duì)教育整個(gè)的顛覆性并不強(qiáng)。但自適應(yīng)學(xué)習(xí)出來之后各大教育公司都在積極跟進(jìn)投資,比如新東方投資的乂學(xué),好未來投資的Knewton等,百度的作業(yè)幫。各大教育公司都非常認(rèn)可自適應(yīng)學(xué)習(xí)在未來教育行業(yè)會(huì)是顛覆性的工具。
法律這塊IBM Watson有一個(gè)Ross機(jī)器人,它可以理解并回答法律問題。同樣基于我們iPIN的法律分析引擎有一個(gè)法律谷,可在中文環(huán)境下理解律師提問,找到相關(guān)的背景,分析律師背景還可以去跑法官,去做案件斷案,總體效果不錯(cuò)。
這是在非常嚴(yán)謹(jǐn)?shù)囊粋€(gè)法律產(chǎn)品下,AI表現(xiàn)出來非常強(qiáng)大的實(shí)力。
財(cái)務(wù)也是屬于商業(yè)里面非常常見的一個(gè)必不可少的一個(gè)環(huán)節(jié),德勤是全世界所有財(cái)務(wù)公司里面應(yīng)用的最好的一家公司。它投入了巨大的人力物力,還與IBM Watson合作去提升它整個(gè)財(cái)務(wù)、審計(jì)包括細(xì)節(jié)測試環(huán)節(jié)的工作,取得了非常好的效果。
中國的會(huì)計(jì)師事務(wù)所現(xiàn)在也有跟我們合作,去提升財(cái)務(wù)、審計(jì)的工作效率。在不久的將來,AI在財(cái)務(wù)方面就會(huì)有非常深入的突破。
醫(yī)療是IBM Watson最開始突破的領(lǐng)域,其實(shí)醫(yī)療這方面Google一直在投入非常大的力量。醫(yī)療是一個(gè)極其龐大的市場,最近幾次大的融資也出自國內(nèi)醫(yī)療AI公司。不過說實(shí)話,有一個(gè)問題是中國公司去做醫(yī)療,相比于國外公司,中國公司的優(yōu)勢在哪里?
這方面我們中國優(yōu)勢不明顯,一個(gè)是數(shù)據(jù)積累的量跟國外比有很大差距。另外一個(gè)是儀器,國內(nèi)醫(yī)療儀器的質(zhì)量跟國外比還是有一定的差距的,甚至這方面我們積累的數(shù)據(jù)質(zhì)量自然就會(huì)有些差距。
整個(gè)中國在醫(yī)療這方面,沒有做詳細(xì)的疾病分級(jí),這一方面對(duì)于我們的數(shù)據(jù)精準(zhǔn)性也有很大的挑戰(zhàn)。再就是人種,相對(duì)來講中國的人種比較單一,不像美國多種族,對(duì)于整個(gè)醫(yī)療研究是有很大的幫助。我個(gè)人覺得中國公司去做醫(yī)療AI,優(yōu)勢是不明顯的。
金融這方面離錢最近,今天有人問我說金融公司有數(shù)據(jù),但怎么去用AI。
說實(shí)話外面有很多號(hào)稱應(yīng)用了AI的炒股軟件,但這里面有個(gè)悖論。如果說一個(gè)公司它自己做炒股軟件很賺錢,它為什么要賣給你?一個(gè)愿意公開賣給你的炒股軟件,它一定做得不怎么好,如果做得好的它直接去賺錢就得了。
金融行業(yè)由于算法離錢特別近,只要你做得好就能變現(xiàn),所以AI早就進(jìn)入到金融領(lǐng)域。2013年2月6號(hào)就兩個(gè)高頻算法針對(duì)一個(gè)優(yōu)先股競價(jià)12分鐘,價(jià)格波動(dòng)范圍非常小的,還是個(gè)Virtu Financial。它在Market里面,差不多五年的交易日里居然只有一天出現(xiàn)虧損,因?yàn)樗罅康牟杉灰资袌隼锏臄?shù)據(jù),用Prediction Market去提升交易準(zhǔn)確性。股民在market上去炒股,只利用市場炒股操作上的便利,但是市場利用炒股股民的操作行為,把私有信息匯集起來,通過prediction market,加上AI算法,就可以得到不錯(cuò)的結(jié)果。
在文字工作這方面,在體育新聞中有一個(gè)奧運(yùn)AI小記者張小明曾對(duì)奧運(yùn)新聞進(jìn)行報(bào)道。不過文字工作者在AI的應(yīng)用還僅限于比較八股的狀態(tài),八股文是機(jī)器特別擅長去寫作的,用LSTM去學(xué)習(xí),在八股文固定的文章寫作格式上可以得到不錯(cuò)的結(jié)果。不過要說寫小說,機(jī)器人就做不到,因?yàn)闄C(jī)器人在高度復(fù)雜的邏輯構(gòu)思這方面有些無能為力。
有一篇新聞?wù)f日本的一個(gè)AI系統(tǒng)創(chuàng)作了四篇小說,通過了一個(gè)文學(xué)大獎(jiǎng)的初審,我只能說這個(gè)初審一定不負(fù)責(zé)任,很容易看出來小說很爛。
藝術(shù)創(chuàng)作這方面,Google在畫畫還有音樂方面都做了些嘗試,藝術(shù)創(chuàng)作AI的最大優(yōu)勢在于靈感創(chuàng)作,因?yàn)闄C(jī)器人對(duì)于靈感創(chuàng)意的產(chǎn)生幾乎屬于沒有限制。它不像人隨著自己成長,是有知識(shí)局限性的,會(huì)給我們帶來很多限制,導(dǎo)致創(chuàng)意發(fā)揮會(huì)被限制住。
但是機(jī)器不會(huì),創(chuàng)意在機(jī)器里它是一個(gè)隨機(jī)數(shù)。專門研究創(chuàng)意里面發(fā)現(xiàn)創(chuàng)意是個(gè)隨機(jī)數(shù),而人的創(chuàng)意發(fā)揮空間是一個(gè)扁平狀的,它是很難去沒有邊界發(fā)揮的。一般用人去做創(chuàng)意會(huì)需要群力群策,比如說要去做一個(gè)團(tuán)隊(duì),去腦暴才能獲得更多的創(chuàng)意,但是機(jī)器這一方面,它可以瞬間去產(chǎn)生大量創(chuàng)意,可以給人去提供的靈感,人再去識(shí)別里面哪些是屬于特別符合能夠去考慮,去加速藝術(shù)創(chuàng)作人員工作的效率。
再說編程這一方面,今年2月我去美國見了一個(gè)公司,也是一個(gè)華人辦的一個(gè)創(chuàng)業(yè)公司,它們正在做一個(gè)用機(jī)器人代替人去寫代碼的項(xiàng)目,我一聽覺得特別靠譜。為什么?因?yàn)閺腁I的角度來講的,首先代碼生成器是比較容易做的,我們可以跑一個(gè)固定目標(biāo),我們知道說是通過還是不通過,可以通過設(shè)定專門的測試去得到反饋,又有大量的歷史代碼做積累,從各種開源里很容易去獲取。
機(jī)器人學(xué)起來很快,而且我們都知道有一種開發(fā)的方法叫做Test-Driven Development,這種方法再配合AI是很容易讓機(jī)器去學(xué)習(xí)人怎么去寫代碼,甚至可以去創(chuàng)造新的寫代碼,尤其像對(duì)抗學(xué)習(xí)這種方式也都可以引進(jìn)來提升編程用機(jī)器人自我去編程。我們自己也在做,比如說做解析,希望提升解析這方面的能力,用機(jī)器人去做得更好。做智能解析都是為了代替人去做代碼編寫工作,尤其是對(duì)語言語義理解這方面都需要大量的使用這些東西。
以上就是我接觸的AI在各行業(yè)的應(yīng)用。今天我們處在一個(gè)非常特殊的時(shí)代,從來沒有哪一次技術(shù)顛覆它影響面如此之廣,而且?guī)淼挠绊懭绱酥钸h(yuǎn),我今天也思考哪個(gè)行業(yè)或者哪個(gè)職業(yè),它不會(huì)被人工智能影響。我不知道在座的各位有沒有想法,反正我是想不到為什么,理由很簡單,因?yàn)橹灰悄X力勞動(dòng),我們?nèi)巳粘5?0%腦力勞動(dòng)都屬于單調(diào)重復(fù),基于經(jīng)驗(yàn)的。那這些東西理論上來講它都可以具備被AI取代的可能性,哪個(gè)行業(yè),哪個(gè)職業(yè)不為人工智能影響幾乎是不可能的。
當(dāng)然,有一個(gè)職業(yè)我覺得永遠(yuǎn)是不會(huì)被機(jī)器人取代的——運(yùn)動(dòng)員,因?yàn)橐?guī)則不允許,你很難想象NBA會(huì)允許一個(gè)機(jī)器人上場打籃球,否則咱們還要勒布朗·詹姆斯、要科比干嘛。
第三部分跟大家分享一下我們自己做認(rèn)知智能的實(shí)踐和感悟。認(rèn)知智能領(lǐng)域,可能很多人對(duì)它比較陌生,今年3月份Yann LeCun在清華做演講時(shí),它提到整個(gè)AI的難題讓機(jī)器去掌握人類的常識(shí),這屬于認(rèn)知智能,對(duì)一個(gè)司空見慣的常識(shí),機(jī)器它能很好理解,常識(shí)它是不同于圖像或者聲音的,它是語言。
而有些常識(shí),如我剛才提到的華為、騰訊或者雷鋒網(wǎng),這些都是非常高度概括性的詞,如果從來沒有接觸過雷鋒網(wǎng),第一次聽說雷鋒網(wǎng),你要去理解它也需要花不少成本。如果是讓機(jī)器,它能夠代替人去理解,并且分析去做人在理解分析上的事情是現(xiàn)在面臨的一大挑戰(zhàn),這我們iPIN一直努力去做和突破的事情。iPIN是用機(jī)器認(rèn)知分析人和企業(yè),我們不會(huì)去做所有的認(rèn)知智能,只是在商業(yè)社會(huì)里面,核心是人和企業(yè),如何讓機(jī)器去認(rèn)知和分析人和企業(yè),這是我們現(xiàn)在做的事情。認(rèn)知智能也被認(rèn)為是整個(gè)人工智能的第三層級(jí),邁向強(qiáng)人工智能或者類人智能的第三層級(jí)。
在這方面它的應(yīng)用面非常廣,但也正是因?yàn)樗鼞?yīng)用面廣所以幾乎適合所有行業(yè)。每個(gè)行業(yè)有它自己獨(dú)特性的知識(shí)認(rèn)知,很難想象有一個(gè)公司能夠把所有的領(lǐng)域都做了,我們自己選擇的方案在理解商業(yè)社會(huì)的人和企業(yè)這一方面如何讓機(jī)器像人去理解和分析。
我們都知道人對(duì)信息的使用并不是一個(gè)特別復(fù)雜過程,首先是感知,如訊飛語音,包括我說這句話,把它轉(zhuǎn)述成文字,這一個(gè)典型感知過程。比如說“我是一個(gè)博士,或者說我當(dāng)過教授”,把它翻成一句話。
但是認(rèn)知,比如說有人說“我是一個(gè)博士”,博士這個(gè)詞我知不知道,如果知道,我知道,如果不知道,讓我想一想是什么意思,到分析我要更想深一層,博士表示你有非常高的學(xué)歷。但是高學(xué)歷對(duì)我接下來的行為產(chǎn)生了怎樣的影響,這時(shí)候就要考慮具體場景。如果說這是一個(gè)招聘的過程,我們就考慮他學(xué)歷是不是合格,達(dá)到了什么樣的要求。
如果在交友過程中,博士這個(gè)概念可以證明他是不是一個(gè)很厲害的人,不同場景同樣的一句,它在認(rèn)知分析層面會(huì)導(dǎo)致產(chǎn)出不同的結(jié)果,所以認(rèn)知的結(jié)果和具體場景有關(guān)系。我們希望用機(jī)器去模擬人對(duì)信息處理的整個(gè)過程。
認(rèn)知是圍繞人而來的,如何讓機(jī)器去無偏差地去理解一個(gè)事物,首先要去還原事物的真相,它能夠獲取足夠的信息,讓機(jī)器去做一個(gè)無偏差信息的匯集,在具體場景下該如何去理解。
我們認(rèn)為認(rèn)知是真相在具體場景下的一個(gè)投影,為了讓機(jī)器理解人類的常識(shí),花了非常大的力氣,用幾年時(shí)間去建成中國社會(huì)經(jīng)濟(jì)圖譜,同時(shí)也是我目前承擔(dān)的一個(gè)國家項(xiàng)目,就專門去把各種信息往人和企業(yè)上去嫁接,能夠讓機(jī)器去理解人和企業(yè)。
我們整個(gè)應(yīng)用用在好幾方面,一個(gè)是圍繞人的個(gè)人發(fā)展來的,我們開發(fā)了一款2C的產(chǎn)品,叫做完美志愿,專門幫高中生填報(bào)高考志愿的。去年這個(gè)產(chǎn)品在6、7月份使用人數(shù)高達(dá)394萬,整個(gè)使用量非常大,幫助人從海量信息里篩選出他能夠上的學(xué)校和專業(yè),并且根據(jù)用戶的意愿再進(jìn)一步優(yōu)化。
這里使用了大量的認(rèn)知計(jì)算,因?yàn)槿巳ダ斫庖粋€(gè)專業(yè)或者學(xué)科是不容易的,但是如果讓機(jī)器去理解,并且根據(jù)人的意向去個(gè)性化的匹配分析,其實(shí)就是一個(gè)典型的認(rèn)知計(jì)算的一過程。
除此之外,我們還在做一項(xiàng)人生導(dǎo)航儀的產(chǎn)品。我們的合作伙伴新東方創(chuàng)始人俞敏洪老師有一個(gè)很有名的文章,叫做人生的地圖。人在職業(yè)發(fā)展里面會(huì)遇到各種疑惑,那么到底該如何去規(guī)劃自己人生。
iPIN利用技術(shù)學(xué)習(xí)了大量人的職業(yè)發(fā)展軌跡,但這里面也需要用到大量的認(rèn)知計(jì)算,因?yàn)橛蟹浅6喔伺c企業(yè)相關(guān)的信息,而這些信息不能用表面的字詞去理解,一定要放到認(rèn)知層面。這方面我們做了非常非常多的工作,我們?cè)谂Υ蛟烊澜绲谝粋€(gè)人生導(dǎo)航儀,幫助初中升高中升大學(xué)生的年輕人,知道在人生發(fā)展職業(yè)規(guī)劃里面的每一步操作。
其實(shí)這有點(diǎn)類似下圍棋,我們說人生如棋,會(huì)面臨很多選擇,你到底該如何去選擇這一步,就要我們以史為鑒從,它直接放進(jìn)里面去學(xué)習(xí)到其中的規(guī)律,幫助人去找到最優(yōu)的捷徑,這就是我們整個(gè)人生導(dǎo)航儀的思想。
接下來談?wù)勎覀冊(cè)谄髽I(yè)應(yīng)用這方面的嘗試,這是我們的人才分析引擎,它可分析人的300多個(gè)維度。比如招聘啟事,原來需要用人去讀去理解,再去想我要用什么關(guān)鍵詞去搜索。iPIN將所有條件全部放到認(rèn)知層面去,根據(jù)各種條件從認(rèn)知層面,不非關(guān)鍵詞,基于認(rèn)知去做各種各樣的匹配,比如說剛才的崗位是一個(gè)房地產(chǎn)銷售崗位,它要找有房地產(chǎn)銷售背景的人,你看我們找出來結(jié)果,機(jī)器從認(rèn)知層面去匹配,它把所有這些詞在這里面去找。從這里面符合條件的,發(fā)現(xiàn)有一個(gè)銷售經(jīng)理是萬科和世聯(lián),它就用藍(lán)色的字標(biāo)記出來,因?yàn)槲覀儥C(jī)器從認(rèn)知層面判定,這個(gè)詞在認(rèn)知層面里面是符合的,要求是房產(chǎn)行業(yè)背景一個(gè)條件的,就能夠匹配到人。
從原來的關(guān)鍵詞匹配角度去做是很難做到的。
我們分析之后,達(dá)到了一個(gè)非常實(shí)際的效果,HR的工作效率得到了非常大的提升。無論是輸入的效率還是判斷的效率,還是整個(gè)匹配的準(zhǔn)確率和人才使用、人才庫使用都得到了很大的提升,這給HR的工作帶來非常大的提升。當(dāng)然還不能完全替代HR的所有工作,但至少在很多簡歷的甄選,占HR日常40%工作可以有很大的效益提升。
我有一個(gè)不大膽的預(yù)言,五年內(nèi)HR職業(yè)將會(huì)面臨大量失業(yè)。如果說你自己的子女在高考中填報(bào),你要擔(dān)心HR人力資源專業(yè),就不建議你的小孩去報(bào)了。
除此之外,我們還做了法務(wù)方面的分析,分析律師的背景、分析案情包括去幫助律師斷案,也都取得了不錯(cuò)的效果。
如果說我們想在未來用認(rèn)知智能代替人去做大量商業(yè)分析,這就是我們要去做的非常基礎(chǔ)的一個(gè)工作。甚至還包括宏觀經(jīng)濟(jì)的分析,比如區(qū)域宏觀經(jīng)濟(jì)結(jié)構(gòu)的分析,我們?yōu)樯钲谑心仙絽^(qū)政府做的一個(gè)區(qū)域性結(jié)構(gòu)分析,發(fā)現(xiàn)有些行業(yè)在上升,有的在下降。還包括全國的整個(gè)經(jīng)濟(jì)趨勢的分析,這都是宏觀層面的,尤其像智慧城市和政府的政策制定都是非常需要這些宏觀的信息,單靠人去做難度其實(shí)還挺大的。
除此之外,包括各種行業(yè)發(fā)展趨勢的分析,包括企業(yè)人才的戰(zhàn)略分析,還有包括市場的投資機(jī)會(huì),就類似于Compas,根據(jù)市場各種變化,從認(rèn)知層面去找出它的規(guī)律來,就能發(fā)現(xiàn)好的市場機(jī)會(huì),獲得投資機(jī)會(huì)。
整個(gè)創(chuàng)業(yè)說一下我的幾點(diǎn)感悟,雖然人工智能很火的,有很多AI公司在創(chuàng)業(yè),尤其是像我們公司,比如我們最開始創(chuàng)業(yè)的時(shí)候,人工智能一點(diǎn)都不火。
我們是2013年成立的,但現(xiàn)在人工智能特別火,有很多公司它的市場估值很高。但我個(gè)人認(rèn)為技術(shù)本身它是沒有太大的價(jià)值,真正的價(jià)值是你的技術(shù)能夠給生產(chǎn)效率帶來多大的提升,這才是人工智能技術(shù)的真正價(jià)值。
解決任何行業(yè)的問題,AI的技術(shù)絕對(duì)不是萬能的。我們從一個(gè)領(lǐng)域跨到另外一個(gè)領(lǐng)域,從生涯規(guī)劃跨到高考志愿填報(bào)再跨到招聘和法務(wù)甚至還有商業(yè)地產(chǎn)等等。我們?cè)谌タ绲矫總€(gè)行業(yè)的時(shí)候,我們都必須要跟行業(yè)專家緊密的合作,去深入的了解行業(yè)的規(guī)律,我們才能夠去解決問題。單純的技術(shù)是很難去說,你只要給我數(shù)據(jù)我就能跑,這種情況在解決細(xì)節(jié)問題上是根本不現(xiàn)實(shí)的。
我不認(rèn)為有任何一家AI公司說我這邊有一個(gè)平臺(tái)很牛逼,就能夠解決各種各樣的公司人工智能的問題,我覺得是非常扯淡的。隔行如隔山其實(shí)就是對(duì)事情最好的一個(gè)解釋,因?yàn)槟愀粜腥绺羯?,很多?duì)數(shù)據(jù)的理解,包括遷移學(xué)習(xí)方面,有些東西是可以遷移,但是絕大多數(shù)行業(yè)經(jīng)驗(yàn)是根本不可能遷移的。
另外今年2月份參加AAAI會(huì)議上就發(fā)現(xiàn)參會(huì)的人60%的是中國人,我們中國在AI方面有非常雄厚的人才儲(chǔ)備,在起跑線是不輸于美國的。不過現(xiàn)在市場依然AI人才非常匱乏,如何去實(shí)施戰(zhàn)略去獲得人才依然是一個(gè)很嚴(yán)峻的問題。第四個(gè)是整做人工智能,我們?cè)谧鰝鹘y(tǒng)行業(yè)時(shí)候特別強(qiáng)調(diào)說要專注,但是我們發(fā)現(xiàn)在做數(shù)據(jù)分析和機(jī)器學(xué)習(xí)的時(shí)候發(fā)現(xiàn)不專注是非常有價(jià)值的,你將A行業(yè)的信息學(xué)了之后,把這東西用到B行業(yè),是可以帶來非常多的價(jià)值。因?yàn)樾畔⒒蛘哒f知識(shí),很多東西都屬于相互關(guān)聯(lián)的,1+1往往能夠帶來大于2的效果。通過最近這幾年的接觸,我發(fā)現(xiàn)AI在各行業(yè)的應(yīng)用是突飛猛進(jìn),它的影響面非常廣,而且?guī)淼淖兓欠浅?shí)質(zhì)性的,人工智能這一波浪潮,它是一個(gè)千載難逢的行業(yè)機(jī)遇,絕對(duì)不是一個(gè)泡沫。
另外再講一下,我走訪了各個(gè)企業(yè)的AI的三大需求。首先一方面是屬于信息智能化管理,目的是企業(yè)主為了想提升決策效率,現(xiàn)在iPIN主要在做這一方面。另外核心業(yè)務(wù)流程的智能化,是為了去提升生產(chǎn)效益,所以說創(chuàng)業(yè)的機(jī)會(huì)幾乎就散落在每一個(gè)行業(yè)里邊。比如剛才說的高端制造業(yè),中芯國際它要對(duì)新品模具的開發(fā),如何去提升效率?基本上每個(gè)行業(yè)都會(huì)有這樣的機(jī)會(huì)。
第三個(gè)有很多公司,它們有大量單調(diào)重復(fù)的腦力勞動(dòng),比如有些公司存在大量的數(shù)據(jù)錄入員,還有公司它存在店銷的人員,如何去提升它們效率這方面是有非常多的AI公司在里面去做,有很大的機(jī)會(huì),因?yàn)樗梢蕴嵘髽I(yè)的利潤率。
1.AI滲入到傳統(tǒng)行業(yè),很多時(shí)候只能用很簡單的機(jī)器學(xué)習(xí)模型,復(fù)雜的模型往往無用武之地,所以大家會(huì)花大量時(shí)間,盡量優(yōu)化算法,性價(jià)比是否高?
在具體滲透到某一個(gè)行業(yè)的時(shí)候,我不認(rèn)為把時(shí)間花在這種模型算法的研究上,是我們最應(yīng)該大力投資的一點(diǎn)。以我們?cè)谧龇蔀槔?,我們將大量的時(shí)間是花在對(duì)行業(yè)的理解,就是你如何從這種行業(yè)專家的角度去理解他們所面臨的問題,還有就是有沒有辦法能夠去優(yōu)化這種數(shù)據(jù)的質(zhì)量。比如說能夠去得到更好的隱身數(shù)據(jù),或者能夠去發(fā)現(xiàn)新的數(shù)據(jù),或者能夠去接觸資源,能夠把別的領(lǐng)域的數(shù)據(jù)引用到領(lǐng)域,能夠去提升這種數(shù)據(jù)使用效率,這些問題我反而覺得是更加重要的。以我們自己做這種具體應(yīng)用背景的話,其實(shí)能夠發(fā)現(xiàn)絕大多數(shù)時(shí)間是在于理解數(shù)據(jù)和準(zhǔn)備數(shù)據(jù)這一階段,在模型優(yōu)化這方面當(dāng)你有了很好的理解,同時(shí)你也有很好的理論基礎(chǔ)的話,其實(shí)我們?cè)谀P退惴ㄟ@方面當(dāng)然如果說已經(jīng)具備很好的認(rèn)知,計(jì)算技術(shù)在解決商業(yè)問題的話,本來就是我們的一個(gè)先決條件,但我們的AI+平臺(tái)我們?cè)诮^大多數(shù)時(shí)間是花在去深入理解行業(yè),并且嘗試跟專家去理解問題,去準(zhǔn)備數(shù)據(jù),才是我們投入時(shí)的精力性價(jià)比最高的地方。
2.如何看待微軟首席AI科學(xué)家鄧力跳槽去對(duì)沖基金?
鄧力是非常厲害的一個(gè)科學(xué)家,如果沒記錯(cuò),他是中科大的神經(jīng)生物學(xué)方向,早期做人工智能很多人走的是邏輯方向,他非常幸運(yùn),在很早期走的是神經(jīng)網(wǎng)絡(luò)方向,然后一直做到現(xiàn)在??吹叫侣?,我覺得很震撼,但是并不驚訝,原因很簡單,就像剛才在分享里面說的人工智能現(xiàn)在滲透的首當(dāng)其沖的四大領(lǐng)域都是離錢最近的領(lǐng)域。尤其是對(duì)沖基金,我記得最近好像它們是管理200多億美元,這時(shí)候AI是有非常大的用武之地,做AI大家都是如果說有好的算法是立刻能變現(xiàn),而且好的算法的話,它能帶來的收益是非??斓模^對(duì)不會(huì)是通過開發(fā)金融產(chǎn)品賣給別人去獲利的,所以加入這種非常大的推動(dòng)是對(duì)AI的這種應(yīng)用非常直接的一個(gè)商業(yè)變現(xiàn)。這就是一個(gè)生產(chǎn)力提升,其實(shí)我覺得這不是第一次,后面也會(huì)有很多科學(xué)家會(huì)跳到里面去。
3.在跟同類公司競爭中與對(duì)手拉開差距的核心是深入業(yè)務(wù)和場景,更重要還是不斷優(yōu)化算法更重要呢?
我們公司之前也深入的反思過,我們舉個(gè)例子,比如說我們?cè)谧鰣D像識(shí)別這一方面,一旦你的識(shí)別準(zhǔn)確率達(dá)到了98%點(diǎn)幾,99%點(diǎn)幾的時(shí)候,在絕大多數(shù)的識(shí)別場景下,我們所需要識(shí)別的對(duì)象不是那么多的情況下已經(jīng)夠用了,除非是到了百萬級(jí)千萬級(jí)規(guī)模的人口才會(huì)說特別去追求小數(shù)點(diǎn)后面數(shù)字,而且如果說數(shù)據(jù)都差不多情況下,算法的優(yōu)勢一般來講,你很難長期去保持。反而是你如何在這種具體行業(yè)下深入的去建立你自己行業(yè)的獨(dú)特優(yōu)勢。數(shù)據(jù)的積累,獨(dú)有數(shù)據(jù)的積累反而會(huì)更加容易成為一種核心的競爭優(yōu)勢,成為你保護(hù)自己的商業(yè)模式一種壁壘,我覺得是更重要的。我們很多時(shí)候?yàn)榱双@取數(shù)據(jù),我們商業(yè)上是可以不去考慮商業(yè)價(jià)值,但你要為未來做好保護(hù),更重要是你如何能夠得到別人得不到的數(shù)據(jù),我覺得這才是一個(gè)AI公司所需要考慮的一個(gè)更重要的事情。
4.選擇深入一個(gè)行業(yè),主要看中行業(yè)的哪些商業(yè)因素呢?
我們公司其實(shí)是做了好幾個(gè)商業(yè)領(lǐng)域,但我們公司并不是每個(gè)商業(yè)領(lǐng)域都去做,我覺得這是戰(zhàn)略選擇因素。最重要的就是你能不能在行業(yè)里有你自己獨(dú)有的優(yōu)勢,比如前段時(shí)間我遇到一個(gè)人是程序員出身,有AI的背景,然后他想進(jìn)入醫(yī)療領(lǐng)域,但是我問他有醫(yī)療背景嗎?他說沒有。如果這樣就貿(mào)然去進(jìn)入醫(yī)療領(lǐng)域的話你的優(yōu)勢何在?所以我覺得要想進(jìn)入任何一個(gè)領(lǐng)域一定要考慮自己在行業(yè)里有沒有優(yōu)勢,你能不能深入理解行業(yè)。比如說我們貿(mào)然進(jìn)入法律行業(yè),就很吃力,因?yàn)橐稽c(diǎn)都不懂。如果一個(gè)公司還不大,沒有很深積累的時(shí)候,你要切的第一個(gè)領(lǐng)域要重點(diǎn)考慮你對(duì)行業(yè)的理解有多深是非常重要的。就像剛才說的切入一個(gè)行業(yè)一定是屬于AI科學(xué)家+行業(yè)專家,最理想你既是AI科學(xué)家,同時(shí)又是行業(yè)的專家。剛才提到中芯國際的人他自己既是AI科學(xué)家同時(shí)原來又是屬于芯片制造行業(yè)出去的,所以說他在這地方有天然優(yōu)勢。包括我們自己,我們?cè)谧鲞@一方面,做了這么多年的人力資源,可以把自己變成一個(gè)人力資源專家,所以說后來做的時(shí)候就是比很多人力資源專家更專家,否則的話真的很難。
5.今年7月份在深圳會(huì)有雷鋒網(wǎng)承辦的CCF-GAIR全球人工智能與機(jī)器人峰會(huì),楊老師會(huì)來跟大家分享什么內(nèi)容呢?
CCF-GAIR大會(huì)是必然要參加的,到時(shí)候我會(huì)更加深入地去跟大家深入分享認(rèn)知智能以及認(rèn)知智能具體在行業(yè)里的應(yīng)用。我今天雖然講了部分認(rèn)知智能在AI+方向的嘗試和應(yīng)用,但是認(rèn)知智能背后更深層次的東西,還是有很多朋友不清楚,大會(huì)中我會(huì)重點(diǎn)分享我們做認(rèn)知智能的方法、經(jīng)驗(yàn)與總結(jié)。
2017年7月7、8、9日, CCF-GAIR 2017——2017年全球人工智能與機(jī)器人大會(huì)將在深圳福田舉行,大會(huì)由深圳市政府指導(dǎo),中國計(jì)算機(jī)學(xué)會(huì)(CCF)主辦,雷鋒網(wǎng)和香港中文大學(xué)(深圳)承辦。大會(huì)設(shè)置了三天的議程,包括人工智能前沿專場、機(jī)器人專場、機(jī)器學(xué)習(xí)專場、智能駕駛專場、智能助手專場、金融科技專場、未來醫(yī)療專場、智能物流專場、AI+專場、CV+專場、AI創(chuàng)投專場等11個(gè)專場,每個(gè)專場分別邀請(qǐng)海內(nèi)外學(xué)術(shù)和產(chǎn)業(yè)界最頂尖的專家來做大會(huì)報(bào)告和對(duì)話交流。
屆時(shí)楊洋博士也將參加大會(huì),并作為機(jī)器學(xué)習(xí)專場的主講嘉賓,給大家?guī)砀嚓P(guān)于機(jī)器學(xué)習(xí)的干貨分享。如果你想了解更多機(jī)器學(xué)習(xí)的落地情況以及技術(shù)方向指引,歡迎購票參加!
雷峰網(wǎng)原創(chuàng)文章,未經(jīng)授權(quán)禁止轉(zhuǎn)載。詳情見轉(zhuǎn)載須知。