1
本文作者: 恒亮 | 2016-11-13 15:39 |
11月13日,第二屆萬物互聯(lián)創(chuàng)新大會于杭州正式開幕。來自科大訊飛研究院的胡國平院長為大會帶來了題為《人工智能的頂天與立地》的主題分享。
基于科大訊飛17年來在智能語音和人工智能領(lǐng)域走過的成長歷程,胡國平院長首先從技術(shù)的角度分析了目前我們正在經(jīng)歷的人工智能熱潮的3大幕后推手,即怎樣實現(xiàn)了人工智能的“頂天”:
1.深度學(xué)習(xí);
2.大數(shù)據(jù);
3.云計算。
胡國平坦言:”做人工智能技術(shù)的核心技術(shù)研發(fā),其實需要花費非常多的時間、精力和金錢?!耙虼耍驹趧?chuàng)業(yè)者和投資者的角度,總結(jié)了人工智能技術(shù)的落地優(yōu)勢,即“立地”過程中的5個關(guān)鍵點:
1.在人機(jī)交互的接口方面實現(xiàn)廣泛的落地;
2.與物聯(lián)網(wǎng)和大數(shù)據(jù)深度結(jié)合實現(xiàn)落地;
3.利用人工智能獨有的客觀性、穩(wěn)定可傳承性;
4.人工智能面向海量任務(wù)不知疲憊;
5.在人類學(xué)習(xí)成本高,使用頻率低的領(lǐng)域落地。
隨后胡國平表示,按照上述關(guān)鍵點確定產(chǎn)品的落地方式時,在具體的實踐方向和節(jié)奏把握方面也會遇到一些問題,這時需要注意如下的3個方面:
1.對準(zhǔn)現(xiàn)實生活中存在大量重復(fù)性腦力勞動的領(lǐng)域;
2.想好一個實際的應(yīng)用場景,并集中力量將這個場景攻克;
3.不要總想著顛覆,從人機(jī)結(jié)合的角度入手,或許更容易落地。
胡國平認(rèn)為:做人工智能的公司,一定要有自己的堅守。他說:“就像我們做訊飛輸入法,6年的時間我們每年的相對錯誤率才下降30%,每次都需要在相關(guān)方向做巨大的技術(shù)投入,才最終取得了今天的成績?!?/p>
以下是胡國平院長的演講原文,雷鋒網(wǎng)做了不改變原意的修改:
大家上午好,我是來自科大訊飛的胡國平,非常高興有這樣一個機(jī)會與各位分享,作為人工智能這樣一個研究院一線工作者,在人工智能方面的一些思考和想法。
人工智能走過的60年以來,歷史使命的定義來說,工業(yè)革命,我們把人類從繁重疲勞中解放出來,信息技術(shù)把全世界緊密的聯(lián)系在一起,而人工智能它所定義的歷史使命是一定要把人類從繁重的腦力勞動中解放出來。腦力勞動,某種來說,人工智能是最后一個需要靠人類自身智慧去攻克的革命。如果人工智能取得了重大的突破,超過了人類自身的智能,大家可以想像以后所有飛機(jī)的設(shè)計,去太空,去火星,也許都不需要人類的智慧在其中參與了。所以也是人工智能最后一個需要人類智慧自身攻克的話題,所以人工智能對于整個世界的吸引,對于所有智力團(tuán)隊的誘惑是非常大的。
人工智能,大家都知道60年來經(jīng)歷了三次浪潮,或者說三起三落。但到目前為止,大家又知道我們經(jīng)歷了第三次的人工智能浪潮。也許這一次還可能會有一些波折,但無論如何人類去追求人工智能的夢想會持續(xù)的往前推進(jìn)。大部分人認(rèn)為,包括科大訊飛都認(rèn)為,我們現(xiàn)在正在經(jīng)歷第三次浪潮,已經(jīng)處在真正爆發(fā)的前夜,人工智能技術(shù)會進(jìn)入方方面面的應(yīng)用。
剛才吳軍博士也講了很多,人工智能已經(jīng)改變了我們很多方面?;蛘哒f這一次人工智能真的火了起來,包括機(jī)器下棋攻克了圍棋的最后一個難題,語音合成已經(jīng)超過一般自然人的說話水平。語音識別,大家也看到了右邊這樣一些語音識別效果,已經(jīng)達(dá)到97%的識別率。人臉識別,據(jù)官方報道已經(jīng)超過了人類肉眼所能達(dá)到的水平。自動駕駛,我這個數(shù)據(jù),應(yīng)該安全行駛數(shù)百萬公里。計算機(jī)自動去識別學(xué)生寫的這樣一個紙筆寫的試卷,已經(jīng)超過專家水平。語音評測,機(jī)器翻譯,自動聊天,已經(jīng)達(dá)到了18個輪次,你都無法判斷出來到底是人在和你聊天,還是微軟的機(jī)器在跟你聊天。
我們的知識競賽也是超過了人類冠軍,以及能夠自動做詩,自動寫新聞,以及智慧醫(yī)療,剛才吳軍博士也做了介紹。應(yīng)該說這次確實人工智能真的火了起來,而且人工智能火起來之后另外一個很明顯的特征和跡象,政府也好、巨頭也好、創(chuàng)業(yè)者以及資本,都是大量的涌入。包括美國、中國,都把人工智能定義為國家戰(zhàn)略,以及像Google、Facebook、蘋果、訊飛、百度都進(jìn)入了人工智能前沿領(lǐng)地。特別是最近2016年以來,阿里、華為、騰訊、樂視、聯(lián)想,我前天還看到一個消息,小米也正式宣布要進(jìn)入人工智能領(lǐng)域。
現(xiàn)在也有成百上千的人工智能創(chuàng)業(yè)公司,以及資本,也是大量的涌入。另外多說一個事情,我們普遍認(rèn)為人工智能競爭作為人類自身智慧最后一個需要攻克的技術(shù),它和國際之間的PK和對抗主要是在中國和美國這兩個國家來對抗。剛才兩位老師的數(shù)據(jù)也明顯的看出來,大數(shù)據(jù)和人工智能主要的貢獻(xiàn)或者參與者也是中國和美國的企業(yè),這主要是因為人工智能的技術(shù)依賴于大數(shù)據(jù)、移動互聯(lián)網(wǎng)、云計算,和廣大的用戶群體。在這方面,中國和美國是佼佼者。
我從技術(shù)的角度來說,更想和大家分享的是,這次人工智能技術(shù)火起來背后真正原因。歸結(jié)為三點:一個是深度學(xué)習(xí),一個是大數(shù)據(jù),一個是云計算。
首先深度學(xué)習(xí),或者說深度神經(jīng)網(wǎng)絡(luò)橫空出世,這是在2006年提出來的深度學(xué)習(xí)的方法,取得了歷史性的重大突破。它的最基本原理其實也比較簡單,就是在左邊這樣一個復(fù)雜的網(wǎng)絡(luò)里面,通過有相關(guān)數(shù)據(jù)輸進(jìn)去之后,通過網(wǎng)絡(luò)產(chǎn)生最后的輸出。
如果這個輸出和原來所標(biāo)注的答案不一樣,它通過一個BP的錯誤回饋算法去修正相關(guān)網(wǎng)絡(luò)中的參數(shù),使得它最終對整個訓(xùn)練級而言,它的預(yù)測和建模的準(zhǔn)確度最高。方法其實很簡單,但是最大的一個作用是它這里的網(wǎng)絡(luò)量非常大,自由數(shù)非常多,建模能力非常強(qiáng),使得它有效的抓住類似在圖象識別中,從像素到邊界,到部件,到人臉一系列特征,能夠做出有效的人臉識別。
我們?nèi)绻麖闹庇^去理解,這樣一個深度學(xué)習(xí)最關(guān)鍵的特點,它是更強(qiáng)大,更通用的,能夠更高效地訓(xùn)練數(shù)據(jù)的建模機(jī)器。
我們舉一個具體的例子供大家理解深入學(xué)習(xí)關(guān)鍵突破的點,模式識別。左邊假設(shè)是一張人臉圖像判斷它是男的還是女的,按照經(jīng)典人臉識別套路,可以提取它的特征,頭發(fā)、胡須,訓(xùn)練相關(guān)模型,用各種語言,一系列機(jī)器學(xué)習(xí)的模型,最后來建初模型,做觸摸式識別。但是用了深入學(xué)習(xí)之后一個很關(guān)鍵的特點,提取特征的環(huán)節(jié)已經(jīng)沒有了。對于機(jī)器而言,現(xiàn)在已經(jīng)只需要 ,或者整個模式識別內(nèi)容已經(jīng)簡化為準(zhǔn)備數(shù)據(jù)和訓(xùn)練模型,最簡單的兩個環(huán)節(jié)。
如果大家注意到AlphaGo的算法原理,它也是類似這樣操作的,對圖象識別來說不再需要任何特征的提取,直接把像素值輸進(jìn)去。對于AlphaGo而言,它也是用深度學(xué)習(xí),而且直接把19×19格子上圍棋黑白棋信息輸入神經(jīng)網(wǎng)絡(luò),判斷當(dāng)前棋局下黑棋贏的概率是多少,不再用人工方法告訴AlphaGo應(yīng)該去看什么樣的東西,它輸入的都是最原始的信息。如果把深入學(xué)習(xí)看成一個黑盒子的話,可以理解這次人工智能的變革。就是拿足夠多的有監(jiān)督海量迅速數(shù)據(jù),來直接輸入一個黑盒子,它就可以獲得一個與人類可媲美的人工智能技術(shù)。簡單來說,一萬個小時訓(xùn)練樣本,再去訓(xùn)練10的7次方自由度或者參數(shù)、個數(shù)的神經(jīng)網(wǎng)絡(luò),就可以達(dá)到與人類可媲美的語音識別效果。
當(dāng)然,這個不是黑盒子,用的是包括GPU為主的計算服務(wù)器。所以再抽象的來看,人類可比的人工智能其實是靠大數(shù)據(jù)喂起來的,或者靠大數(shù)據(jù)、大成本、大量計算喂起來的。確實現(xiàn)在我們進(jìn)入了一個深度學(xué)習(xí)的時代,因為深度學(xué)習(xí)的通用性,已經(jīng)不再需要針對任何一個特定任務(wù)去做很多特征提取,或者相應(yīng)的分析和研究工作。所以深度學(xué)習(xí)至少從科大訊飛看來,2013年起已經(jīng)被廣泛應(yīng)用在語音和語言的各個方面。我們現(xiàn)在幾乎用的所有方法都是以深度學(xué)習(xí)為主框架方式來做語音合成、評測,包括語言模型、機(jī)器翻譯與人臉識別所有的方向,全部在深度學(xué)習(xí)框架上。
而且更關(guān)鍵是大家如果做投資也好,做相關(guān)創(chuàng)業(yè)者,一定要記得另外一條。深度學(xué)習(xí)也在不停的往前演進(jìn),2011年主流的DN技術(shù)路線實現(xiàn)了廣泛的應(yīng)用。但是到了2015年提出了有效模擬人類神經(jīng)注意的模型。現(xiàn)在全世界相關(guān)會議論文,50%以上都和深度學(xué)習(xí)相關(guān),或者說全世界所有智力學(xué)者都在研究和改進(jìn)深度學(xué)習(xí)。深度學(xué)習(xí)本身也會持續(xù)改進(jìn),因為持續(xù)改進(jìn),每年都會費掉訊飛研究院30%的代碼。你可以愛上自己的工作,但一定不要愛上自己的工作成果,因為技術(shù)變化非常非常的快。
剛才說的更多是偏語音圖象識別的概念,深度學(xué)習(xí)在2014年左右開始,已經(jīng)站在最經(jīng)典的語言翻譯基礎(chǔ)上,取得了更好的效果,它也是采用最新Atentional技術(shù)。它所用的方法是基于海量中英文句隊,機(jī)器可以有效的實現(xiàn)機(jī)器翻譯。而且現(xiàn)在大家所喜聞樂見的聊天機(jī)器人,自動做詩全是用這個套路所實現(xiàn)的,機(jī)器并不能真正的懂得語義。人工智能還在繼續(xù)往前走,被廣泛認(rèn)為可以替代圖靈測試,來測試機(jī)器智能有沒有像人思考的測試。這個測試是用常識推理的任務(wù),檢驗機(jī)器是否具備這方面的智能。
舉個例子,爸爸沒法舉起他的兒子,因為他很重,是誰很重,所有人都很容易理解是兒子很重。如果爸爸沒法舉起他的兒子,因為他很虛弱,大家都知道是爸爸很虛弱。科大訊飛提出了基于神經(jīng)網(wǎng)絡(luò)主要方法的深度學(xué)習(xí)認(rèn)知智能路線,取得了2016年評測第一名。這里要告訴大家的是,第一名的成績在5選1的選擇里,我們正確率只有58%,所以相對而言和人類接近100%智力相比,還是有相應(yīng)的一些差距。
第三個,剛才說了神經(jīng)網(wǎng)絡(luò),大數(shù)據(jù),第三個推動人工智能在最近這五年內(nèi)取得飛速發(fā)展的就是云計算。因為在云計算的支撐下,人工智能首先擴(kuò)大了整個模型的規(guī)模。剛才說了10的7次方參數(shù)的模型能夠有效被應(yīng)用起來,以及也獲得了大量真實數(shù)據(jù),我們前面所說的人工智能所需要的位進(jìn)學(xué)大數(shù)據(jù)獲得了有效支撐。以及云計算模式,每天更新一個版本,加速了技術(shù)迭代的速度,所以云計算是人工智能進(jìn)步的技術(shù)推手。
整合前面所說的,人工智能專業(yè)技術(shù)公司必須擁有的三大要素。頂尖人工智能算法及團(tuán)隊,為什么要團(tuán)隊,因為算法持續(xù)往前演進(jìn)。同時要有獨特優(yōu)勢的大數(shù)據(jù)積累,以及云計算的能力和服務(wù)。這三個加在一起,它就可以去實現(xiàn)包括科大訊飛在內(nèi)所做到的,每年相對30%-50%的錯誤率下降。這里有一個技術(shù)上概念,錯誤率相對下降,錯誤率相對下降是評價一個人工智能系統(tǒng)往前改進(jìn)難度的概念。簡單來說語音識別錯誤率從20%降到10%的難度,等同于從2%降到1%,因為它們相對下降都是50%。
大家前面也說了,摩爾定律走了幾十年,而人工智能類似的摩爾定律,30%為錯誤率相對下降基線,每年錯誤率相對下降持續(xù)了至少五年以上。而且我們也相信通過算法的演進(jìn),數(shù)據(jù)的積累和云服務(wù)的模式,這個相關(guān)的人工智能摩爾定律還會繼續(xù)往前走至少3-5年。我們要從兩個方面來看這30%到50%的錯誤率相對下降,第一,如果你所從事相關(guān)人工智能算法,年平均錯誤率下降沒有達(dá)到這個值,那就證明你在整個人工智能競爭中是處于相對落后的狀態(tài)?,F(xiàn)在我們在拼人工智能,已經(jīng)不再是拼現(xiàn)在已經(jīng)達(dá)到的水平,而是拼你在人工智能的速度進(jìn)一步加速度。第二,當(dāng)你看到某個技術(shù)現(xiàn)在還不完全好用的時候,比如說現(xiàn)在的視頻監(jiān)控中人臉識別,但是如果我們把前面三件事情做起來的話,它可以保持每年相對錯誤率30%下降幅度。
簡單來說,如果今年錯誤率是20%,那么明年就是14%,再往后可能就到10%的水平。所以創(chuàng)業(yè)也好,投資也好,你可以擁有這樣一個摩爾定律去預(yù)計相關(guān)的技術(shù)在什么時間點,能夠達(dá)到用戶可接受的門檻,這是很關(guān)鍵的一點。當(dāng)然這里可以打一個硬廣告,如果你沒有人工智能頂尖算法和團(tuán)隊,或者沒有云計算、云服務(wù)的能力。但你針對自己的行業(yè),或者相關(guān)認(rèn)識的朋友有很獨特優(yōu)勢的大數(shù)據(jù),那么你可以直接拿著大數(shù)據(jù)去找這樣一些科大訊飛人工智能專家。就像吳軍老師所說的,通過新的技術(shù)去改造原有的相關(guān)算法,或者相關(guān)的系統(tǒng),來達(dá)到人工智能武裝傳統(tǒng)的行業(yè)。
前面講的是真正所理解的人工智能這次浪潮背后的原因,三大推手。下面是創(chuàng)業(yè)者和投資者希望聽到的,對于科大訊飛17年來在智能語音和人工智能走過歷程中總結(jié)出來的一些經(jīng)驗,或者說教訓(xùn)。確實,人工智能是最近五年,或者最近三年才真正火起來,特別2016年是最火的一年。但是對科大訊飛而言,我們99年從科大大學(xué)生創(chuàng)業(yè)以來,一直在追求人工智能的夢想。因為技術(shù)的進(jìn)步,我們打開整個相關(guān)的市場空間,進(jìn)入了更好的發(fā)展機(jī)會。
這里首先要說的一個挑戰(zhàn),大家都知道人工智能是所謂技術(shù),但是人工智能和傳統(tǒng)意義上的技術(shù)在落地方面,在立地方面有很大的不同點。大家也許不能完全理解,我為什么把機(jī)器翻譯和WIFI放在一起來理解。是這樣的,當(dāng)世界上推出一個WIFI技術(shù)的時候,所有人都會欣然接受它,不會說你的WIFI,我不需要,我可以通過自身能力實現(xiàn)手機(jī)和終端設(shè)備聯(lián)網(wǎng)的能力,因為所有的WIFI是人類自身所不具備的技術(shù)范疇。而機(jī)器翻譯不一樣,只要是大學(xué)生,都能找出來現(xiàn)在的機(jī)器翻譯系統(tǒng)所出現(xiàn)的系統(tǒng)。所以當(dāng)你把一個機(jī)器翻譯技術(shù)推出去,或者把語音識別技術(shù)推出去的時候,別人總會質(zhì)疑你,你的技術(shù)和人的能力相比實際上還是有差距的。我未必要用,我可以自己搞定。
簡單來說,人類的智能相對人工智能來說,它的打擊是無處不在的。是的,機(jī)器可以做出一些搬運運貨機(jī)器人,但是搬運工說不用也可以搞得定。自動駕駛和駕駛員的PK,以及速錄員對語音轉(zhuǎn)寫,醫(yī)生對于沃森的系統(tǒng)。雖然說現(xiàn)在智慧醫(yī)療宣傳得非常好,但是要傳統(tǒng)領(lǐng)域醫(yī)療醫(yī)生接受這個新鮮事物還需要一個漫長的過程??拼笥嶏w所獨家在做的自動閱卷技術(shù),拿到老師那邊去的時候,老師始終會以挑剔或者質(zhì)疑的眼光來看待。
應(yīng)該說任何一個方面,人類智能都是人工智能的師傅和競爭對手,所以我們在做人工智能創(chuàng)業(yè)的時候一定要想清楚,你和傳統(tǒng)做一個WIFI的創(chuàng)新,和做一個什么其它人類不具備能力的技術(shù)相比,人工智能的落地會有更多面臨的挑戰(zhàn)和困難。但是,作為人類徒弟的人工智能,其實它有非常多的優(yōu)勢。如果要充分的發(fā)掘,或者說借勢于這樣一些優(yōu)勢,就能夠有效實現(xiàn)人工智能產(chǎn)業(yè)的落地,或者說創(chuàng)業(yè)的成功。我這里總結(jié)了五條,未必是完全,大概可以供各位參考。
第一,人工智能技術(shù)可以作為人機(jī),或者其它系統(tǒng)人機(jī)接口。因為人自身的能力就只能是人自身的,人機(jī)智能可以拓寬交互系統(tǒng)。當(dāng)手寫識別作為發(fā)短信,作為人與人之間信息溝通人機(jī)接口的時候,它就實現(xiàn)了有效大規(guī)模的應(yīng)用落地。我們現(xiàn)在的掃描識別也是為檢索分析做的應(yīng)用,現(xiàn)在車派識別為什么多起來,是因為停車場收費管理里對車派識別應(yīng)用有廣泛的需求。人臉識別很多時候是為了身份認(rèn)證和手機(jī)支付,這樣一種真實的,用戶有明確需求的,人機(jī)接口才可以做廣泛的落地。
第二,隨著現(xiàn)在IOT或者傳感器技術(shù)的進(jìn)步,利用傳感器以及大數(shù)據(jù)來達(dá)到超過人類的智能,這個也是人工智能有效的發(fā)展模式。這里最典型的一個例子就是天氣預(yù)報,以前人還會說夜觀天象,現(xiàn)在人都不會了。你想出差直接打開本地天氣預(yù)報,就能有效知道明天相關(guān)天氣的情況。包括自動駕駛,包括其它的,為了方便都可以用比人類更多的傳感器獲得信息輸入,有效做出人工智能來超越人類智能,達(dá)到更多應(yīng)用推廣落地機(jī)會。
第三,相對客觀性,或者穩(wěn)定可傳承性。包括語音評測,作文評分,以及一系列的技術(shù)。它核心的一條,因為人與人在對同一份試卷閱卷時存在主觀性,機(jī)器在這方面會更加可觀和無感情的。這時候相對機(jī)器對于大量人工閱卷而言就有更多的優(yōu)勢,這樣才會使相關(guān)人工智能技術(shù)被老師和學(xué)校廣泛接受的主要原因。
第四,面向海量任務(wù)的不知疲倦。科大訊飛是從語音合成起家,語音合成就是一個典型的不知疲倦合成任一文本,合成海量文本的概念,這個成為它真正落地的原因。
第五,人類學(xué)習(xí)成本高,使用頻度低的產(chǎn)業(yè)。比如說多語種翻譯,是的,人類可以在多語種翻譯上做出很好的能力,但由于學(xué)習(xí)成本太高,使用頻度太低,這時候相關(guān)人工智能就會有很好的應(yīng)用落地。
最后我再稍微講一下人工智能立地的方向和節(jié)奏把握,這也是非常關(guān)鍵的一點。
第一,很多報道都聽說機(jī)器能夠自動做詩,機(jī)器自動做曲。如果把這樣一種技術(shù)創(chuàng)新或者創(chuàng)業(yè),與機(jī)器自動閱卷技術(shù)相比,其實大家可以直觀去想想,機(jī)器自動閱卷顯然具有更大更廣泛的落地機(jī)會。大家在做相關(guān)人工智能創(chuàng)業(yè)時,一定要優(yōu)先對準(zhǔn)現(xiàn)實生活工作中存在的大量重復(fù)性的腦力勞動,會更加有效的實現(xiàn)廣泛落地和大規(guī)模產(chǎn)業(yè)化。
另外,我們還是要把握好相關(guān)人工智能技術(shù)進(jìn)一步臺階的設(shè)計,不同應(yīng)用場景對同樣語音識別技術(shù)來說,所要求達(dá)到的水平是不一樣的。簡單來說,手機(jī)云輸入現(xiàn)在已經(jīng)達(dá)到97%,已經(jīng)非常好用。相應(yīng)會議語音轉(zhuǎn)寫,因為在會議當(dāng)中人的爭吵,相關(guān)的問題,會議語音轉(zhuǎn)寫的正確率還沒有完全達(dá)到應(yīng)用門檻。當(dāng)然現(xiàn)在這種發(fā)布會,或者這種會議宣講是可以有效達(dá)到語音識別率跨過應(yīng)用門檻,達(dá)到落地機(jī)會。所以當(dāng)你在選擇人工智能方向時,不管是人臉識別還是其它方向,一定要想好第一個應(yīng)用場景是什么,并且集中力量把那個場景攻下來。
最后一個,人工智能和人類智能并不是嚴(yán)格意義上PK和對立的,有很多人機(jī)互助的場合和場景。典型來說就是輔助駕駛和自動駕駛這件事情,其實在自動駕駛沒有真正商業(yè)化的現(xiàn)在,輔助駕駛已經(jīng)廣泛應(yīng)用在很多場合。在人工智能落地的時候,你可以優(yōu)先考慮人機(jī)結(jié)合的落地方式,能夠讓相關(guān)技術(shù)更早達(dá)到可應(yīng)用的門檻。
如果大家認(rèn)真聽了前面部分的介紹,應(yīng)該可以得出一個結(jié)論。做人工智能技術(shù)的核心技術(shù)研發(fā),其實是需要花費非常多的時間、精力和錢的。另外一種方式,這個就是剛才吳軍老師所說的,當(dāng)人工智能技術(shù)有進(jìn)步的時候,有很多飛躍的時候,我們能不能拿著現(xiàn)有人工智能的技術(shù)進(jìn)步,去和傳統(tǒng)行業(yè),去和相關(guān)的產(chǎn)品進(jìn)行有效的結(jié)合和創(chuàng)新,這方面如果從創(chuàng)業(yè)和創(chuàng)新的角度來說,機(jī)會其實會更大,特別是相對于小規(guī)模的公司而言。
所以,如果你要選擇公司做人工智能核心技術(shù)的研發(fā),一定要記得類似于像訊輸入法這樣,一定要有相關(guān)的堅守。訊飛輸入法我們做了六年,每次都是告訴自己,每年識別率錯誤率相對下降30%。每次都是堅持在相關(guān)方向做了很大的技術(shù)投入,才使得最終到了現(xiàn)在這個時點,包括老羅的發(fā)布會上大家認(rèn)可訊飛輸入法,或者訊飛后臺語音識別具有工匠精神。另外一方面,訊飛也不是那么的自私,我們也把相關(guān)核心技術(shù)和人工智能技術(shù)進(jìn)步、進(jìn)展,通過云服務(wù)的方式,語音云的具體載體來給很多創(chuàng)新創(chuàng)業(yè)團(tuán)隊提供更好的人工智能支撐。
整個訊飛云是2010年首次發(fā)布以來,經(jīng)過六年的發(fā)展,已經(jīng)集聚了7億用戶,上面有11萬開發(fā)者,以及30億次日訪問的云計算服務(wù)規(guī)模。我們把所有相關(guān)人工智能技術(shù)都有效的對外開放,大家基于訊飛云可以在人工智能這個大的行業(yè)和領(lǐng)域里實現(xiàn)自己的創(chuàng)新和創(chuàng)業(yè)。
最后想強(qiáng)調(diào)一下人工智能的無窮魅力,剛才說了人工智能是人類智能,自身智能智慧最后一個需要攻關(guān)的。另外一個,即使沒有攻關(guān)搞定人工智能技術(shù)狀態(tài)下,人工智能無成本復(fù)制的能力和持續(xù)向前進(jìn)化的能力也是人類自身所無法比擬。我們都知道相關(guān)人的智能隨著一代大師的離世,新人的都需要重新?lián)炱饋恚匦聦W(xué)起來。即使你是英語大師的兒子,單詞也要自己一個個重新背起來,這就是人類智慧進(jìn)步最大的障礙。而人工智能不一樣,人工智能是一種技術(shù),是一種機(jī)器智能。一旦某一個機(jī)器具備97%的語音識別正確率,那么世界上所有機(jī)器原則上都可以具備這樣的正確率。不管是哪個公司再繼續(xù)研發(fā)下一代語音識別技術(shù),他一定站在97%的指標(biāo)之上,無成本復(fù)制和持續(xù)向前的進(jìn)化能力是人工智能相對人力智能來說非常大的優(yōu)勢,這也是“人工智能威脅論”的主要來源,因為人工智能進(jìn)化的速度超過人類至少1萬倍。
我們也會從現(xiàn)實生活中對未來人工智能越來越習(xí)以為常,我兒子今年8歲,在他的眼里,火車就等于動車,我專門告訴他還有綠皮火車這件事情。或者對于他來說所有蘋果都是觸摸屏,我們現(xiàn)在已經(jīng)不再夜觀天象,直接用天氣預(yù)報這樣有效的人工智能技術(shù)。而我們在以前很多時候還會記憶相關(guān)地址和路線,現(xiàn)在甚至連走路都直接用地圖導(dǎo)航,特別到一個新的地方時。我們原來只是習(xí)慣于拼音輸入法,后來習(xí)慣于手寫輸入法,現(xiàn)在越來越習(xí)慣語音輸入。
我們非常相信在不久的將來,車、家電、家居都是可以通過語音的方式跟它進(jìn)行自然交互。而你說的法語,可能在我這邊聽到的就是通過語音翻譯技術(shù)得到了中文。每個人很肯定會有一個虛擬的助理,也許是街上或者辦公室里到處跑的機(jī)器人。我們會越來越快的,越來越正常的對于人工智能進(jìn)展和相關(guān)習(xí)以為常。所以,人工智能的頂天和立地。頂天立地是科大訊飛成立以來一直所秉持的,我們對人工智能方面的追求。我們要有頂天的核心技術(shù),我們要有立地進(jìn)入億萬家庭人工智能落地的產(chǎn)品。
同時也是我們的方法論,只有人工智能真正落地了,才能真正把人工智能技術(shù)推向世界最高峰。相應(yīng)而言,也認(rèn)為人工智能技術(shù)只有達(dá)到世界領(lǐng)先,才可以有效的推動相關(guān)技術(shù)達(dá)到億萬應(yīng)用的規(guī)模。所以對于我個人而言,或者訊飛也是希望和在座各位一起,帶著頂天的人工智能夢想,知其然,且知其所以然,腳踏實地,樂觀積極的實現(xiàn)人工智能的立地。
讓我們一起用人工智能來建設(shè)美好的世界,謝謝。
雷峰網(wǎng)原創(chuàng)文章,未經(jīng)授權(quán)禁止轉(zhuǎn)載。詳情見轉(zhuǎn)載須知。