0
雷鋒網(wǎng)按:AI圈向來有個傳統(tǒng),傾向?qū)⒉煌娜税唇绶诸悶楣I(yè)界、學(xué)術(shù)界等。但真的要給肖京打標(biāo)簽時,我卻犯了糊涂。
“做人工智能,一定要尊重業(yè)務(wù)。”
你很難想到,上面這句話是從平安集團首席科學(xué)家肖京口中說出的。
他身上流著純正的AI學(xué)術(shù)派血統(tǒng),至今已發(fā)表學(xué)術(shù)論文102篇,擁有美國授權(quán)專利101項、中國發(fā)明專利109項。
去年10月21日,他還獲得了第九屆吳文俊人工智能杰出貢獻獎,該獎項被認(rèn)為是中國AI領(lǐng)域的最高榮譽。
但,肖京所說的每一句話,卻與往日里AI的陽春白雪模樣格格不入。
一場一個小時三十七分鐘的對話里,他總共提起了15次「價值」、20次「落地」。
本科畢業(yè)于中國科學(xué)技術(shù)大學(xué)的肖京,碩士被保送至中科院自動化研究所,師從原科技部副部長馬頌德。
1999年碩士畢業(yè)后,肖京前往卡耐基梅隆大學(xué)計算機系讀博,拜美國工程院院士金出武雄(Takeo Kanade)教授門下,主攻計算機視覺領(lǐng)域。
讀博時期的肖京,在美國AI圈就已站穩(wěn)腳跟。他所參與研發(fā)的AI技術(shù)被應(yīng)用于當(dāng)時美國的生物醫(yī)藥、電影特效、機器人等領(lǐng)域。
名校、名師、名人環(huán)繞的他,畢業(yè)之時自然也少不了名企們拋來的橄欖枝。
而后,他在一眾工作offer中翻了愛普生的牌子,領(lǐng)導(dǎo)其美國算法團隊,從事包括醫(yī)療、輔助駕駛、3D打印等領(lǐng)域的算法開發(fā)。
愛普生呆了八年后,如常人一樣,肖京也想體驗下不同的人生,于是跳出來去了微軟,帶領(lǐng)一個團隊負(fù)責(zé)微軟搜索引擎的算法研發(fā)。
微軟期間,他發(fā)覺AI經(jīng)過市場多年教育,落地環(huán)境已經(jīng)比較成熟,有比較多的方案可用于幫助傳統(tǒng)產(chǎn)業(yè)降本增效。
出于對技術(shù)的理解和對產(chǎn)業(yè)的思考,他開始考慮選擇一家大型的傳統(tǒng)公司,以實現(xiàn)技術(shù)抱負(fù)。
2015年3月,他離職微軟,入職平安,任平安集團首席科學(xué)家,集團執(zhí)委。
過去五年多時間,肖京幫助平安集團從無到有,建立起一支兩千余人的人工智能專家團隊,奠定了整個平安集團人工智能底層技術(shù)和應(yīng)用的基石。
同時,他所主持研發(fā)的“平安腦”大數(shù)據(jù)智能引擎,融合了圖計算、對抗神經(jīng)網(wǎng)絡(luò)、弱監(jiān)督學(xué)習(xí)等最新科研成果,在金融、醫(yī)療、智慧城市等領(lǐng)域已廣泛落地。
今天的肖京,像似一個身經(jīng)百戰(zhàn)、擒敵無數(shù)的軍師,深居幕布之后,手握技術(shù)權(quán)杖,指引著平安AI帝國日夜鏖戰(zhàn)、爭打江山。
故事好看,總因為背后人物身上散發(fā)的無限弧光。
多年之后,肖京會如何評價他的兩位人生導(dǎo)師?他又如何管理一支兩千多人的AI研究團隊,并平衡好AI學(xué)術(shù)研究與產(chǎn)業(yè)落地的關(guān)系......太多問題尚還無解。
藉由此,第五屆CCF-GAIR峰會期間,雷鋒網(wǎng)與肖京進行了一次深度對話。本次訪談中,肖京談到了他的求學(xué)歷程、兩位導(dǎo)師,以及對AI的思考,對產(chǎn)業(yè)的洞見。
以下是訪談內(nèi)容:
雷鋒網(wǎng):你是如何走上人工智能研究道路的?你求學(xué)的那個時期,人工智能的研究應(yīng)用應(yīng)該沒有今天這么地蓬勃。
肖京:我在部隊大院里面長大,對于我來說,部隊大院有一個特別好的地方在于,那時候雖然經(jīng)濟不是很發(fā)達,但我們每周都有電影看,甚至包括海外的大片。
我小時候最喜歡也是印象最深的一部電影叫做《未來世界》,它是《西部世界》的續(xù)集,當(dāng)中有非常多機器人的場景。也是從那時候起,我對機器人產(chǎn)生了比較濃厚的興趣。
上了大學(xué)之后,我自然就選擇了中科大自動化專業(yè),因為它是機器人領(lǐng)域非常重要的一個技術(shù)方向。
1995年,我本科即將畢業(yè),已決定保送到中國科學(xué)院讀碩士,因此可以選擇到科學(xué)院做本科畢業(yè)設(shè)計。與時任自動化所模式識別國家重點實驗室主任的馬頌德老師請教后,選擇了計算機視覺、模式識別作為研究方向。
1999年,我碩士畢業(yè)后,去了美國卡耐基梅隆大學(xué)讀博士,在金出武雄(Takeo Kanade)老師教導(dǎo)下做計算機視覺,也就一直做到了現(xiàn)在。
雷鋒網(wǎng):現(xiàn)在想想,興趣、天賦與職業(yè)剛好相匹配,是不是一件特別幸福的事兒?
肖京:也許我別的天賦更好呢,也許我更適合當(dāng)個喜劇演員呢,誰知道呢。(笑)
雷鋒網(wǎng):能否聊聊你的碩士導(dǎo)師馬頌德老師,他是一個什么樣的人?和他一起做AI研究,印象最深的一件事是什么?
肖京:馬頌德老師是那種工作特別嚴(yán)謹(jǐn)、特別細致的人。
我當(dāng)年讀碩士的時候,馬頌德老師已經(jīng)是中科院自動化所所長了,后面很快又到科技部當(dāng)副部長。
那時候他要負(fù)責(zé)的工作其實挺多的,但他帶學(xué)生仍然很細致。我當(dāng)年研究的方向之一是航空圖像中的線性目標(biāo)識別,比如公路、橋梁等。
有次他和我討論一個問題:兩個線段如果隔開了,如何判斷它們屬于同一條路還是不同的路?這看似簡單,實際上是挺復(fù)雜的優(yōu)化問題。
馬老師和我一起推導(dǎo)公式,討論角度應(yīng)該怎么計算,角度放到模型里怎么優(yōu)化等。這件事我印象特別深,很多專事教學(xué)的老師都不一定能夠做到這么細致。
同時,他也是一個特別熱愛學(xué)習(xí)的人。你應(yīng)該想不到,馬老師現(xiàn)在每天還在堅持讀論文,并時常和學(xué)生們討論相關(guān)技術(shù)。他和張正友博士合著的《計算機視覺》已經(jīng)成為視覺領(lǐng)域的經(jīng)典教材。
馬頌德老師對我個人的發(fā)展幫助特別大,他幫我找到了學(xué)習(xí)的路徑和方向,也正是因為他,讓我相信人工智能這個行業(yè)一定會有非常好的發(fā)展前景。
雷鋒網(wǎng):你的博士導(dǎo)師金出武雄老師呢?2017年你在參加雷鋒網(wǎng)第二屆CCF-GAIR的時候,金出武雄老師已經(jīng)在前一天結(jié)束了演講安排,但第二天他還是來到了現(xiàn)場,站在后面看完你的演講,并不時嘴角上揚,看到這一幕我還挺感動的。
肖京:我知道這件事,這也是他一直保持的工作習(xí)慣和生活態(tài)度,他參加任何學(xué)術(shù)論壇,只要時間允許都會多聽聽、多看看。
和馬頌德老師一樣,金出武雄老師也是一個比較細致的人,同時他還是一個非常追求實用性的人。
他不是那種非常傳統(tǒng)的、偏理論研究的科學(xué)家,他會要求你把東西做出來。他經(jīng)常和學(xué)生說,做技術(shù)、做系統(tǒng)一定要實用,發(fā)論文式的研究不可取。
我印象最深的一件事是,我那時候做一個通過三維重建實現(xiàn)人臉跟蹤的課題,但目標(biāo)對象總是跟著跟著就跟丟了,一直都找不到問題的根源,也比較苦惱。
他后面和我說,遇到問題不要緊,沉下心來設(shè)計測試用例,從手工就能計算出結(jié)果的最簡單用例開始,一步步找到問題。之后,他就和我一起設(shè)計用例、看代碼、找漏洞、做測試,熬了一個晚上,終于找到并解決了問題。
問題解決之后,他很開心,那時候辦公室中間有個活動區(qū)域,里面有個臺球桌,他和我打了一局臺球。(作為卡耐基梅隆大學(xué)計算機學(xué)院機器人研究所的創(chuàng)始人兼所長,臺球水平一般,被我險勝了。)
金出武雄老師和我說,很多人可以徹夜玩游戲打牌,但那只是純體力,不算什么。能夠長時間不間斷地思考問題,才是從事科研工作重要的能力,那叫智慧體力。他說他最長連續(xù)72個小時沒睡覺,持續(xù)思考當(dāng)時碰到的一個視覺研究問題。對此我非常佩服。
我讀博士的那幾年,他已經(jīng)50多歲,基本每天早上2點才離開辦公室,6~7點又在辦公室了,午飯都是他妻子送來的,這樣保證科研工作不被打斷。
雷鋒網(wǎng):你覺得金出武雄老師一直這么拼的驅(qū)動力是什么?
肖京:對科學(xué)的熱愛和對生活的態(tài)度。
有一年的圣誕節(jié),我們?nèi)ニk公室開會,旁邊辦公室有個日本訪問學(xué)者在工作。老師夸獎?wù)f每次來辦公室,不管什么時間,都看到他在那里工作。我隨口說了一句,“這樣的人沒有生活了呀?!?/p>
金出武雄老師說,你是科研人員,科研不就是你的生活嗎?
他覺得,你只要選擇了科研這條路,你就更應(yīng)該努力去學(xué)習(xí),你來讀博士肯定是因為有一個問題尚未解決,如果都沒問題了,那就不會再來讀書了,早就畢業(yè)了。
還有一個特別有意思的事情,金出武雄老師還很擅長做木工,他在日本蓋了個房子,里面很多設(shè)計或家具制作都是他參與設(shè)計甚至自己完成的。
雷鋒網(wǎng):馬頌德老師、金出武雄老師身上有什么共性嗎?他們的AI研究方法論對現(xiàn)如今的行業(yè)發(fā)展都具哪些指導(dǎo)意義?
肖京:特別拔尖的人往往有相似的地方。
首先,他們對自己所做的事都非常熱愛,其次做事極其認(rèn)真、分析問題特別縝密,考慮問題也非常全面。
另外,他們都不是那種喜歡講大道理的人,他們都比較追崇實用性和動手能力,不提倡單純?yōu)榱顺稣撐亩隹蒲小?/p>
雷鋒網(wǎng):你跟馬頌德老師和金出武雄老師學(xué)習(xí)的是計算機視覺,但現(xiàn)在從事的AI研究線,覆蓋范疇遠遠超出了視覺,這是怎么做到的?AI研究者如何才能把自己研究的邊界無限擴大?
肖京:我本科學(xué)自動控制,碩士、博士研究計算機視覺模式識別,底層其實都是優(yōu)化算法和機器學(xué)習(xí)相關(guān)的技能。
畢業(yè)后我在愛普生做了8年,領(lǐng)導(dǎo)他們在美國研究院的算法團隊,這是日本一家大型綜合科技企業(yè),相關(guān)業(yè)務(wù)包括打印機、投影儀、精密儀器、傳感器、機器手臂等,所涉及的知識領(lǐng)域包括各種傳感器信號的數(shù)據(jù)分析、檢測、識別、決策、及相關(guān)的應(yīng)用。
之后在微軟Bing做互聯(lián)網(wǎng)廣告搜索,又積累了不少互聯(lián)網(wǎng)大數(shù)據(jù)分析挖掘及應(yīng)用方面的經(jīng)驗。
然后回國到了平安,平安業(yè)務(wù)場景非常多元,從金融到醫(yī)療到智慧城市等,目前我也做了快六年時間。
這么多年下來,基于底層的學(xué)術(shù)底子,我基本在各行各業(yè)都做過,也確實對人工智能技術(shù)在各個場景的應(yīng)用實踐都比較熟悉。
雷鋒網(wǎng):所以一方面是經(jīng)歷足、一方面是天分好,對嗎?畢竟絕大部分人一輩子做好一個領(lǐng)域都比較吃力。
肖京:沒有沒有,主要還是機遇好,遇上了好時代。
雷鋒網(wǎng):對于一些年輕的AI從業(yè)者們來說,你是推薦他們在一行做深做透,還是趁著年輕多看看。
肖京:一開始肯定要做深,基礎(chǔ)打好了、骨架硬實了,后面的事情都是觸類旁通的,基礎(chǔ)理論和發(fā)現(xiàn)、分析、解決問題的方法論都是相通的。
雷鋒網(wǎng):這些年輕的AI從業(yè)者們怎么保持敏銳的技術(shù)嗅覺并堅持下去?有時候方向走錯了,還一直在錯誤地堅持著,是一件比較尷尬的事。
肖京:所以需要靠譜的導(dǎo)師。除了自己的天賦和努力外,還要善于借助外力,善于向別人學(xué)習(xí)。
我經(jīng)常跟年輕同事說,我們老祖宗很多總結(jié)是非常有道理的。比如“三人行必有我?guī)熝伞埃幢氵@個人比你差,也有很多值得學(xué)習(xí)的地方,一定要善于發(fā)現(xiàn)別人的長處并學(xué)習(xí)。再比如”吾日三省吾身“,要定期給自己留一些時間,反思過去這段時間的事情并總結(jié)、沉淀。
至于怎么堅持,除了熱愛之外,有必要在每一個階段都設(shè)定一個學(xué)習(xí)目標(biāo),這個學(xué)習(xí)榜樣會督促引導(dǎo)你成長。
雷鋒網(wǎng):你現(xiàn)在的學(xué)習(xí)榜樣是誰?
肖京:太多了。我現(xiàn)在所做工作的認(rèn)知水平和學(xué)習(xí)熱情,如果能夠達到馬頌德老師、金出武雄老師一半的高度,我就很知足了。
雷鋒網(wǎng):你覺得自己在學(xué)術(shù)造詣或職業(yè)成就方面還沒有超過他們嗎?
肖京:差得太遠,不是一個層級。
雷鋒網(wǎng):有人說,未來AI就像水電一樣無處不在,也有人說它只是一個技術(shù)工具掀不起大風(fēng)浪,你怎么看?
肖京:我不太愛用這類名詞比喻,做技術(shù)還是要務(wù)實,要以結(jié)果為導(dǎo)向。
人工智能未來會無處不在,整個社會肯定會走向數(shù)字化經(jīng)營的大方向,數(shù)字化的底座就是人工智能。
雷鋒網(wǎng):那么未來到底是“AI+”,還是“+AI”?技術(shù)公司好像比較信奉前者,傳統(tǒng)公司比較鐘意后面這種說法。
肖京:其實我一直很好奇為什么有人會去爭論這個。只是不同的說法,實際工作內(nèi)容有什么區(qū)別呢?
雷鋒網(wǎng):在傳統(tǒng)行業(yè)做AI賦能這么多年,金融也好、醫(yī)療也罷,你遇到的最難解決的問題是什么?
肖京:最大的挑戰(zhàn)還是怎么把業(yè)務(wù)和技術(shù)結(jié)合好,怎么把技術(shù)方案變成業(yè)務(wù)方案,真正做進去,重構(gòu)業(yè)務(wù)生產(chǎn)或服務(wù)的流程。
有的問題看上去很簡單,比如業(yè)務(wù)中多年積累的大量寶貴經(jīng)驗和知識,如何能和機器學(xué)習(xí)算法結(jié)合好,并形成規(guī)范標(biāo)準(zhǔn)的機制,實際上還沒有很有效的方法。
雷鋒網(wǎng):為什么會出現(xiàn)這種情況?
肖京:人工智能的發(fā)展可以分為弱人工智能、強人工智能、和超人工智能三個階段。
目前人工智能處在弱人工智能階段,這意味著它只是某些方面比人強,而有些方面還差得很遠,它的能力是有限的。
現(xiàn)階段的人工智能技術(shù)主要是基于聯(lián)結(jié)主義的大數(shù)據(jù)關(guān)聯(lián)分析,在基于符號主義的因果推理方面能力還很弱,這樣就很難將基于知識經(jīng)驗的推理和基于機器學(xué)習(xí)的分析挖掘結(jié)合好。
因此我認(rèn)為,如何將基于大數(shù)據(jù)的機器學(xué)習(xí)關(guān)聯(lián)分析和小數(shù)據(jù)知識經(jīng)驗的表達及推理結(jié)合好,是現(xiàn)階段比較重要的研究方向。
雷鋒網(wǎng):這么多年下來,技術(shù)的陽春白雪和落地的下里巴人好像很難得到較好地平衡,這是個無解命題嗎?
肖京:是有解的,只是需要時間。
金出武雄老師曾經(jīng)和我們講過,學(xué)術(shù)或產(chǎn)業(yè)的科研創(chuàng)新應(yīng)該“像外行一樣思考,像專家一樣實踐”。
針對待解決的問題,不要被自己的專業(yè)思維所束縛,而應(yīng)該跳出盒子去,在充分開放的空間中自由探索思考。一旦發(fā)現(xiàn)并確定了創(chuàng)新的方向,就要像專家一樣通過專業(yè)的分析,制定縝密的落地方案,并高效嚴(yán)謹(jǐn)?shù)貙嵤?/p>
從事AI技術(shù)研發(fā)及創(chuàng)新應(yīng)用多年,越發(fā)覺得這個說法特別正確。
AI落地應(yīng)用,一定要尊重業(yè)務(wù)。技術(shù)人員要到一線去,深入了解業(yè)務(wù)、熟悉場景,明晰技術(shù)的優(yōu)點與不足,讓技術(shù)和業(yè)務(wù)達到最優(yōu)的融合,才能形成行之有效的業(yè)務(wù)解決方案,產(chǎn)生實際業(yè)務(wù)價值。
雷鋒網(wǎng):這個道理其他技術(shù)公司的專家不懂嗎?好像很多人都平衡得不太好。
肖京:一部分是真的不清楚。他們太過高估自己的技術(shù)能力,從而輕視了現(xiàn)實中落地的殘酷性。AI落地方案不止跟技術(shù)能力相關(guān),還涉及到業(yè)務(wù)流程的重構(gòu),往往需要具備良好的完整性。
如果某個業(yè)務(wù)流程的重構(gòu)需要解決100個技術(shù)問題,你的方案覆蓋了其中98個,客戶仍大有可能不用你的方案。因為還有2個問題你無法解決,客戶就必須再找其他供應(yīng)商。與其這么麻煩,倒不如直接找一家能夠解決全部問題的廠商,省錢又省力。
還有一部分是缺乏條件,比如自身沒有業(yè)務(wù),接觸了解業(yè)務(wù)的機會有限,久而久之就成了一家中間技術(shù)模塊提供商,沒有完整的業(yè)務(wù)方案,純技術(shù)產(chǎn)品看上去各項技術(shù)指標(biāo)都很好,但客戶既不能直接用,也不知道如何融入業(yè)務(wù)流程,成為“四不像”產(chǎn)品。
雷鋒網(wǎng):這類中小型AI初創(chuàng)公司的生存空間在哪里?
肖京:我的建議是不要做平臺。做平臺就意味著產(chǎn)品線要拉長,覆蓋面要鋪廣,這樣必然做不深、做不透,對業(yè)務(wù)一知半解、對場景似懂非懂,用戶很難用你的東西。
建議找到一個好的垂直領(lǐng)域,做深做透、做厚做實,提供深入場景的、完整的技術(shù)+業(yè)務(wù)解決方案。
雷鋒網(wǎng):如果不做平臺,企業(yè)成長就相對較慢,這也是一些高估值A(chǔ)I公司比較難取舍的問題。
肖京:那就看他們選擇的垂直領(lǐng)域是不是夠大,能不能擴展、復(fù)制。一步一個腳印來做,更加踏實。
雷鋒網(wǎng):方不方便透露三個你覺得未來商業(yè)潛力較大的場景?
肖京:數(shù)字化經(jīng)營是大勢所趨。金融、醫(yī)療、工業(yè)互聯(lián)網(wǎng)等都是有潛力的方向。
雷鋒網(wǎng):醫(yī)療等領(lǐng)域不少AI公司也在做,但走得好像都挺辛苦的。
肖京:主要還沒有建立合適的商業(yè)模式,和目前醫(yī)療體系業(yè)務(wù)流程的融合做得也還不夠好,大多數(shù)方案還比較孤立,沒有真正成體系地做到診療等業(yè)務(wù)流程中去。
但這個領(lǐng)域發(fā)展很快,在一些需求場景上AI技術(shù)已經(jīng)在發(fā)揮很好的效果,一系列結(jié)合業(yè)務(wù)流程的方案已經(jīng)得到有效的應(yīng)用。
雷鋒網(wǎng):有技術(shù)沒場景、有場景不盈利,這會是未來AI應(yīng)用的通病嗎?
肖京:不能說是通病,但人工智能的落地的確沒有那么容易。
技術(shù)上,數(shù)據(jù)、算法、算力都得到位,需要具備底層信息化能力;業(yè)務(wù)上,落地場景需要熟悉;其次,場景還在不斷迭代,很多有效方案上線之后還會遇到一堆各種各樣的問題,這就要求方案也要能不斷地快速迭代。
另一方面,從技術(shù)到產(chǎn)品,再到平臺,到有用戶流量,到有收入,再到有利潤,本來就有個發(fā)展過程,因此需要時間積累也是正常的。
雷鋒網(wǎng):有人說,2020年AI技術(shù)公司的分水嶺就會出現(xiàn),強者會恒強,弱者會愈弱,你認(rèn)可這個觀點嗎?
肖京:這種現(xiàn)象其實從去年就已經(jīng)開始出現(xiàn)。
今明兩年,如果AI公司還沒有規(guī)?;瘶I(yè)務(wù)落地,還不能產(chǎn)生實際業(yè)務(wù)價值,那么生存空間就會比較有限,市場就不足以支撐目前這么多的AI公司。
AI的發(fā)展歷經(jīng)兩起兩落,目前迎來第三次興起。前兩次夭折的原因就在于期望過高泡沫過大,沒有產(chǎn)生足以支撐行業(yè)發(fā)展的商業(yè)價值。
雷鋒網(wǎng):這一次夭折的概率大嗎?
肖京:這一次與前兩次最大的不同在于:AI已經(jīng)在互聯(lián)網(wǎng)和移動應(yīng)用等領(lǐng)域產(chǎn)生了非常大的商業(yè)價值,并且逐漸深入其它傳統(tǒng)行業(yè),產(chǎn)生越來越重要的業(yè)務(wù)價值。數(shù)字化經(jīng)營已成為市場共識。
目前AI的問題在于,在金融、醫(yī)療、智慧城市、工業(yè)互聯(lián)網(wǎng)等領(lǐng)域,人工智能的應(yīng)用價值能不能產(chǎn)生爆炸性的效果,從而可以支撐行業(yè)繼續(xù)保持高速發(fā)展。做不到的話,行業(yè)降溫是必然的,但不至于死掉。
雷鋒網(wǎng):你在美讀博的那個時期,比較熱門的AI研究方向有哪些?
肖京:當(dāng)時我們卡耐基梅隆大學(xué)計算機學(xué)院下分為好幾個研究所,包括機器人研究所、語言技術(shù)研究所、人機交互研究所、機器學(xué)習(xí)研究所等。
卡耐基梅隆計算機學(xué)院是全美最好的計算機學(xué)院之一,當(dāng)時設(shè)置的所有專業(yè)都是最核心或快速發(fā)展的研究方向。
雷鋒網(wǎng):無論是從深度還是廣度上看,你求學(xué)時期的美國AI研究相較中國都遙遙領(lǐng)先。目前中美在人工智能這塊差距懸殊大嗎?
肖京:人工智能是非常大的領(lǐng)域,是自然科學(xué)和社會科學(xué)的交叉學(xué)科。我們可以從三個方面看人工智能的發(fā)展:科學(xué)(Science)、技術(shù)(Technology)及應(yīng)用(Application)。
Science可以理解為基礎(chǔ)理論部分,比如腦科學(xué)、應(yīng)用數(shù)學(xué)、計算機科學(xué)等。歐美長期保持領(lǐng)先,畢竟大部分工作都是他們發(fā)起并完成的。我國的基礎(chǔ)研究雖仍有差距,但正在努力追趕。
如近期丘成桐老師在北京成立的應(yīng)用數(shù)學(xué)研究所、蒲慕明老師在上海從事的腦科學(xué)研究等,中國的基礎(chǔ)科研未來十年預(yù)期會有很大進展。
Technology包括芯片、底層基礎(chǔ)軟件、及算法和算法框架的研發(fā)。這個領(lǐng)域我國整體上也是落后的,但近些年發(fā)展很快,與領(lǐng)先水平的差距在快速縮小中。
底層硬件和基礎(chǔ)軟件的研發(fā)是系統(tǒng)工程,需要更大規(guī)模的集中投入,一些中國企業(yè)在AI芯片和基礎(chǔ)軟件上努力攻關(guān),取得了不錯的進展,當(dāng)然全面突破取得行業(yè)領(lǐng)先水平尚待時日。
在算法研發(fā)上國內(nèi)進步很快,盡管還缺乏重大突破性的原創(chuàng)成果,改進型的算法創(chuàng)新已經(jīng)具備相當(dāng)大的規(guī)模,比如相關(guān)領(lǐng)域?qū)W術(shù)論文的數(shù)量已經(jīng)達到前列。
Application方面,我們做得非常好,在相當(dāng)一部分業(yè)務(wù)領(lǐng)域,可以說中國在AI應(yīng)用上已經(jīng)名列前茅。人工智能是個賦能的工具,本身不構(gòu)成獨立的產(chǎn)業(yè),需要依托于其他產(chǎn)業(yè)去實現(xiàn)三提兩降,推進這些行業(yè)實現(xiàn)數(shù)字化經(jīng)營,從而產(chǎn)生額外的業(yè)務(wù)價值。這就需要人口、場景、生態(tài)等市場大環(huán)境的支持,而中國在這方面具有較好的優(yōu)勢。
總結(jié)來說:我們開創(chuàng)性的成果還比較欠缺,改進型、應(yīng)用型的工作做得不錯,差距仍然很大,處于努力高速追趕中。
雷鋒網(wǎng):為什么會出現(xiàn)這種現(xiàn)象?AI應(yīng)用方面,中國大膽一些、包容一些,歐美那邊審慎一些嗎?
肖京:我覺得不是審慎,是市場環(huán)境造成的。
西方很多傳統(tǒng)行業(yè)處于相當(dāng)成熟、穩(wěn)定的狀態(tài),市場競爭的壓力不大,因而他們沒有很大的動力來推動變革。而我們國家的市場競爭非常激烈,企業(yè)面臨巨大的壓力與挑戰(zhàn),具備較強的技術(shù)升級意愿,因而對科技賦能有強烈的需求。
以車險續(xù)保為例,北美的頭部保險公司的自然續(xù)保率往往可以達到90%以上,甚至95%以上。也就是說,他們什么也不用做,客戶就會自行一年年續(xù)繳保費。甚至有家公司提到,他們曾經(jīng)嘗試研發(fā)移動應(yīng)用去增強客戶黏度,結(jié)果發(fā)現(xiàn)續(xù)保率還下降了,原因在于客戶線上活躍后會更積極地比較不同公司的同類產(chǎn)品,反而容易受廣告等影響換簽到其它公司。
國內(nèi)市場完全不一樣,市場平均續(xù)保率只有不到50%,競爭極其激烈,必須積極利用科技從服務(wù)質(zhì)量、風(fēng)控水平、營銷能力、運營效率等方面全方位提高市場競爭力。這無形之中驅(qū)動中國企業(yè)不斷嘗試創(chuàng)新和變革,也為科技帶來了機遇。
雷鋒網(wǎng):底層技術(shù)儲備不足、上層應(yīng)用全球領(lǐng)先,未來AI的發(fā)展到底更偏技術(shù)驅(qū)動還是業(yè)務(wù)驅(qū)動?
肖京:兩個都需要。如果未來國際關(guān)系緩和,基本沒有太大問題;如果未來國際關(guān)系趨緊,很多底層技術(shù)、框架用不了了,你的業(yè)務(wù)是難以進行的。
另外說一點,中國AI研發(fā)應(yīng)用的發(fā)展速度之快讓人驚訝,這是全球任何地方都不可比擬的。
1998年我第一次出國參加ICPR(國際模式識別大會),基本沒有中國人,吃飯間隙,旁邊一個日本人問我來自哪里,當(dāng)他知道我是大陸人時,他驚訝不已:“中國大陸也有做這個領(lǐng)域研究的?”
現(xiàn)在再去看ICPR,可能一半以上的參會者都是中國人。
雷鋒網(wǎng):這是好現(xiàn)象嗎?
肖京:不是沒有一點壞處,但一定是個好現(xiàn)象。
說明我們很重視這個領(lǐng)域,發(fā)展速度比人家快,人才培養(yǎng)也多很多。科研環(huán)境也越來越好。比如我在國內(nèi)讀碩士的時候,看論文大多通過訂閱雜志,審稿和出版周期很長,一般看到的時候都已經(jīng)發(fā)表很長時間了。
要知道計算機領(lǐng)域最新的工作一般是通過會議發(fā)表的,那時候國內(nèi)網(wǎng)絡(luò)還不發(fā)達,我們又遠不如國外同行可以參加那么多國際會議,因此對最新進展的了解,我們比國外同行慢很多?,F(xiàn)在這個時間差已經(jīng)不存在了,只要勤奮努力就好,這方面我們不會有任何問題。
雷鋒網(wǎng):中國這些年在人工智能領(lǐng)域的確投入了不少心力,不少高校都開始設(shè)立人工智能學(xué)院了。
肖京:我一直認(rèn)為,中國這些年發(fā)展這么快,一個重要原因在于我們的大學(xué)培養(yǎng)了大量的高素質(zhì)人才,并進入各行各業(yè)使得我國勞動力的整體素質(zhì)和能力水平得到大幅提升,從而推動了相關(guān)產(chǎn)業(yè)快速向前發(fā)展。
人工智能領(lǐng)域也會是這樣。因此對于近期很多高校開始設(shè)立的人工智能學(xué)院,我認(rèn)為是很好的事情。高校培養(yǎng)出來的不一定都是最頂級的精英或科學(xué)家,相反,高校應(yīng)該以教授廣大學(xué)生基礎(chǔ)科學(xué)技術(shù)知識以及培養(yǎng)他們發(fā)現(xiàn)、分析、解決問題的能力為核心目標(biāo)。
這些學(xué)生畢業(yè)后,基于學(xué)到的知識和能力,在各自的崗位上將人工智能技術(shù)應(yīng)用到具體的業(yè)務(wù)中去,夯實各行各業(yè)實現(xiàn)數(shù)字化智能化經(jīng)營的基礎(chǔ),這對整個AI領(lǐng)域的產(chǎn)業(yè)化發(fā)展是多有裨益的。
任何一個技術(shù)領(lǐng)域或產(chǎn)業(yè)的發(fā)展都不是靠幾個科學(xué)家、思想家去演演講就能推動的。
雷鋒網(wǎng):你覺得接下來有哪些重點學(xué)術(shù)理論或?qū)鹑?、醫(yī)療等行業(yè)產(chǎn)生比較大的影響。
肖京:前面提到過人工智能是多個學(xué)科的交叉,很多科學(xué)技術(shù)領(lǐng)域的進展都會對金融、醫(yī)療等行業(yè)的智能化產(chǎn)生影響,比如腦科學(xué)、應(yīng)用數(shù)學(xué)、量子計算、AI算法、AI芯片等。
不過從學(xué)術(shù)理論到產(chǎn)業(yè)應(yīng)用有其必要的發(fā)展歷程,不是簡簡單單就能一蹴而就的。就像設(shè)計師畫出一張設(shè)計圖,還需要轉(zhuǎn)化成適用于施工的施工圖,才能實際落地實施。
比如最近的熱門話題GPT-3,展示了一系列令人興奮的AI技術(shù)能力和應(yīng)用潛力,但還不足以構(gòu)成實際有效的業(yè)務(wù)落地方案。
因此金融醫(yī)療行業(yè)的智能化,也需要技術(shù)人員和業(yè)務(wù)緊密結(jié)合,將學(xué)術(shù)理論上的突破轉(zhuǎn)化成可以實際賦能業(yè)務(wù)的落地方案,才能真正實現(xiàn)價值。
除了AI基礎(chǔ)理論和技術(shù)上的突破,我覺得如何將基于知識經(jīng)驗的表達推理和基于機器學(xué)習(xí)的分析挖掘結(jié)合好,是現(xiàn)階段很重要的研究方向,這方面的技術(shù)突破會對傳統(tǒng)產(chǎn)業(yè)的智能化產(chǎn)生很大的影響。
另一方面,學(xué)術(shù)研究也不是一定要追求爆炸性的產(chǎn)業(yè)應(yīng)用,往往是經(jīng)過長期積累沉淀,水到渠成。
雷鋒網(wǎng):這個觀點還是蠻新穎的,那么對于一些正在學(xué)習(xí)人工智能或者未來想要從事這一塊的年輕人,你有什么經(jīng)驗可以給到他們嗎?
肖京:認(rèn)認(rèn)真真學(xué)習(xí),掌握基礎(chǔ)知識,培養(yǎng)技術(shù)能力;扎扎實實做事,有效積累產(chǎn)業(yè)落地的實戰(zhàn)經(jīng)驗。
行業(yè)發(fā)展已經(jīng)逐漸進入去粗求精的務(wù)實階段,但在人工智能相關(guān)話題仍常被熱炒的情況下,更要保持冷靜清醒認(rèn)真務(wù)實,不急于求成,踏實前行。
雷鋒網(wǎng):你在平安主要負(fù)責(zé)的工作方向有哪些?
肖京:構(gòu)建并完善數(shù)據(jù)平臺、工具平臺、AI模型平臺等中后層平臺;賦能金融、醫(yī)療、智慧城市等集團核心業(yè)務(wù);創(chuàng)新孵化新科技業(yè)務(wù)模式。
雷鋒網(wǎng):目前最大的工作重心放在哪一塊?
肖京:完善中后層平臺和賦能核心業(yè)務(wù)。
雷鋒網(wǎng):平安現(xiàn)在的AI技術(shù)好像還是以服務(wù)內(nèi)部為主?
肖京:平安所有的技術(shù)一開始都會在內(nèi)部場景中孵化、迭代、優(yōu)化,形成標(biāo)準(zhǔn)成熟的方案能力后,也會選擇性地對外輸出。
譬如,我們會通過金融壹賬通,將一些金融科技能力輸出給各級金融機構(gòu),包括歐美東南亞等海外地區(qū);通過智慧城市,將醫(yī)療科技或城市治理技術(shù)等能力輸出給各級政府、企業(yè)、醫(yī)療機構(gòu)等單位。
雷鋒網(wǎng):加入平安也有近六年時間了,這期間你覺得自己做出最自豪的產(chǎn)品是什么?
肖京:我們做了一個系統(tǒng)叫做平安腦智能引擎,它是整個平安智能化核心驅(qū)動引擎,所有的業(yè)務(wù)應(yīng)用都會建立在這個引擎之上。
與絕大部分平臺不同,這是一個整體方案引擎,業(yè)務(wù)與技術(shù)是相互結(jié)合的,包括底層數(shù)據(jù)平臺、算法工具平臺、模型產(chǎn)品平臺、業(yè)務(wù)方案中臺、前端應(yīng)用方案等,形成了語音對話機器人、歐拉圖譜風(fēng)險評估系統(tǒng)、圖像識別車險閃賠系統(tǒng)、多模態(tài)身份認(rèn)證系統(tǒng)、克瑞斯數(shù)字經(jīng)營分析平臺、愛德服務(wù)機器人等一系列智能化產(chǎn)品,全面高效賦能集團各業(yè)務(wù)單位完善智能化建設(shè)。
雷鋒網(wǎng):這個平臺的能力后期會不會對外輸出,還是會一直服務(wù)平安內(nèi)部?
肖京:整個平安腦智能引擎目前應(yīng)該不會對外輸出。主要原因之一在于數(shù)據(jù)平臺是其中一個部分,而平安作為大型綜合金融機構(gòu),保障核心系統(tǒng)及數(shù)據(jù)的安全隱私是首要責(zé)任之一。
但是平安腦的一些能力和產(chǎn)品會通過金融壹賬通、智慧城市等單位對外輸出。同時我們也加入了一些開放開源聯(lián)盟,并且獲批了科技部新一代人工智能開放創(chuàng)新普惠金融平臺,積極向全行業(yè)和社會分享我們的智能化成果。
雷鋒網(wǎng):對于平安腦智能引擎的構(gòu)建,你最上心的部分是哪一塊?
肖京:業(yè)務(wù)方案中臺。這是從技術(shù)研發(fā)成果和業(yè)務(wù)應(yīng)用流程有效融合的眾多方案中抽象濃縮得到的精華。有了它,我們的智能化能力就從小米加步槍升級到了火箭炮,可以規(guī)?;乜焖俑采w海量業(yè)務(wù)場景。
雷鋒網(wǎng):除了平安腦智能引擎,你覺得平安的人工智能研究相較其他科技巨頭有哪些優(yōu)勢?
肖京:首先是數(shù)據(jù)優(yōu)勢。平安是一家全牌照金融機構(gòu),在數(shù)據(jù)廣度和深度上是一般互聯(lián)網(wǎng)或高科技公司無法比擬的;同時,相對互聯(lián)網(wǎng)或高科技企業(yè),平安多年大規(guī)模的實際業(yè)務(wù)積累,形成了高度精準(zhǔn)和真實全面的數(shù)據(jù),繼而能通過AI解決方案推出更符合客戶需求的產(chǎn)品和服務(wù)。
第二是專家優(yōu)勢。平安通過在金融、醫(yī)療領(lǐng)域的31年深耕,在各個領(lǐng)域都積累了大量的業(yè)務(wù)專家,具備獨特的優(yōu)勢。
第三是場景優(yōu)勢。平安作為全牌照的綜合金融服務(wù)集團,擁有全世界最豐富的金融和醫(yī)療應(yīng)用場景。而絕大多數(shù)科技公司不具備這樣的應(yīng)用條件,需要通過第三方合作的模式來促進應(yīng)用落地。
同時,集團執(zhí)行力強,有利于高效迭代快速形成完善的解決方案。而大多數(shù)科技公司并不具備豐富的應(yīng)用場景,要想驗證技術(shù)效果,需要與業(yè)務(wù)公司磋商。從說服他們合作到最后的應(yīng)用,需要經(jīng)歷很復(fù)雜的磨合過程,在得到甜蜜成果之前,這個過程會充滿辛酸,絕不是一件容易的事情。
實際上沒有豐富的類似磨合經(jīng)歷的技術(shù)團隊,最后的落地能力是要打個巨大問號的。
在技術(shù)層面,平安的綜合性優(yōu)勢比較明顯,經(jīng)過多年的建設(shè),平安擁有上萬技術(shù)人才,搭建了強大的金融等級的基礎(chǔ)架構(gòu)及云平臺,包括深度學(xué)習(xí)集群的集團大數(shù)據(jù)管理及分析平臺,及平安腦智能引擎。
當(dāng)然,金融和醫(yī)療是兩塊非常大的蛋糕,有極其眾多的技術(shù)應(yīng)用的機會??萍脊揪劢股罡骋淮怪鳖I(lǐng)域,會有機會形成獨特的差異化優(yōu)勢。
雷鋒網(wǎng):平安的AI業(yè)務(wù)邊界在哪里?還是完全沒有邊界?
肖京:在技術(shù)能力上,盡管人工智能已經(jīng)在很多領(lǐng)域得到應(yīng)用并產(chǎn)生價值,但目前對人腦的功能結(jié)構(gòu)、認(rèn)知機理等方面了解尚淺,在認(rèn)知決策等智能領(lǐng)域能力尚弱,總體上仍處于“弱人工智能”的階段,僅在計算智能上占據(jù)絕對優(yōu)勢,所以業(yè)務(wù)上肯定還是有邊界的,需要找到最符合自己的能力邊界的事情去做。
在智能技術(shù)的應(yīng)用上,更應(yīng)該有邊界,并不是只要技術(shù)能做到的地方就可以應(yīng)用,而是要制定完善的標(biāo)準(zhǔn)規(guī)范,以合理管控人工智能技術(shù)應(yīng)用,避免其誤用、濫用、及惡用。
治理規(guī)范應(yīng)秉持以人為本、人類自治、安全可控、公平公正、和公開透明的倫理準(zhǔn)則。通過研發(fā)可信AI技術(shù),從整體視角解釋AI的決策過程,判斷并糾正可能發(fā)生的錯誤,讓AI技術(shù)變得更加可靠、安全、負(fù)責(zé)。在賦能行業(yè)服務(wù)生態(tài)的過程中,也應(yīng)該避免技術(shù)導(dǎo)致的偏見與歧視。
具體來說,要做到底層管好數(shù)據(jù),充分保護隱私和安全,中層實現(xiàn)算法可靠透明可解釋,前端應(yīng)用遵守遵循人類的價值觀和倫理道德。
雷鋒網(wǎng):目前平安的技術(shù)升級,最缺哪方面的AI人才?
肖京:最缺乏交叉學(xué)科的復(fù)合型人才,即既精通技術(shù)又了解業(yè)務(wù)的人;另外優(yōu)秀的中高層管理人員也比較缺乏。
雷鋒網(wǎng):這樣的人很少嗎?
肖京:特別優(yōu)秀的比較難找。
雷鋒網(wǎng):你怎么評價當(dāng)下的AI圈?
肖京:發(fā)展數(shù)字經(jīng)濟是國家戰(zhàn)略,企業(yè)的數(shù)字化經(jīng)營是大勢所趨,而AI賦能是其成功的關(guān)鍵,相信人工智能技術(shù)的研發(fā)和產(chǎn)業(yè)智能化一定會繼續(xù)保持迅猛發(fā)展的勢頭。
同時,據(jù)統(tǒng)計中國跟人工智能相關(guān)的公司已接近100萬,最近一年就新增了21萬,也存在一些炒作過熱的情況。
相比AI企業(yè)的規(guī)模,市場上真正在業(yè)務(wù)賦能方面看到的實際效果還較為有限。因此我們還是要保持冷靜清醒認(rèn)真務(wù)實,不急于求成盲目冒進,而是踏實前行。
另外,AI賦能業(yè)務(wù),算法、算力、數(shù)據(jù)、場景、業(yè)務(wù)理解都是非常重要的。其中算法能力和水平是核心競爭力,僅依賴開源軟件調(diào)調(diào)參數(shù),難以達到行業(yè)的領(lǐng)先水平。
雷峰網(wǎng)原創(chuàng)文章,未經(jīng)授權(quán)禁止轉(zhuǎn)載。詳情見轉(zhuǎn)載須知。