1
本文作者: 恒亮 | 2016-11-13 15:39 |
11月13日,第二屆萬物互聯(lián)創(chuàng)新大會(huì)于杭州正式開幕。來自科大訊飛研究院的胡國(guó)平院長(zhǎng)為大會(huì)帶來了題為《人工智能的頂天與立地》的主題分享。
基于科大訊飛17年來在智能語(yǔ)音和人工智能領(lǐng)域走過的成長(zhǎng)歷程,胡國(guó)平院長(zhǎng)首先從技術(shù)的角度分析了目前我們正在經(jīng)歷的人工智能熱潮的3大幕后推手,即怎樣實(shí)現(xiàn)了人工智能的“頂天”:
1.深度學(xué)習(xí);
2.大數(shù)據(jù);
3.云計(jì)算。
胡國(guó)平坦言:”做人工智能技術(shù)的核心技術(shù)研發(fā),其實(shí)需要花費(fèi)非常多的時(shí)間、精力和金錢。“因此,他站在創(chuàng)業(yè)者和投資者的角度,總結(jié)了人工智能技術(shù)的落地優(yōu)勢(shì),即“立地”過程中的5個(gè)關(guān)鍵點(diǎn):
1.在人機(jī)交互的接口方面實(shí)現(xiàn)廣泛的落地;
2.與物聯(lián)網(wǎng)和大數(shù)據(jù)深度結(jié)合實(shí)現(xiàn)落地;
3.利用人工智能獨(dú)有的客觀性、穩(wěn)定可傳承性;
4.人工智能面向海量任務(wù)不知疲憊;
5.在人類學(xué)習(xí)成本高,使用頻率低的領(lǐng)域落地。
隨后胡國(guó)平表示,按照上述關(guān)鍵點(diǎn)確定產(chǎn)品的落地方式時(shí),在具體的實(shí)踐方向和節(jié)奏把握方面也會(huì)遇到一些問題,這時(shí)需要注意如下的3個(gè)方面:
1.對(duì)準(zhǔn)現(xiàn)實(shí)生活中存在大量重復(fù)性腦力勞動(dòng)的領(lǐng)域;
2.想好一個(gè)實(shí)際的應(yīng)用場(chǎng)景,并集中力量將這個(gè)場(chǎng)景攻克;
3.不要總想著顛覆,從人機(jī)結(jié)合的角度入手,或許更容易落地。
胡國(guó)平認(rèn)為:做人工智能的公司,一定要有自己的堅(jiān)守。他說:“就像我們做訊飛輸入法,6年的時(shí)間我們每年的相對(duì)錯(cuò)誤率才下降30%,每次都需要在相關(guān)方向做巨大的技術(shù)投入,才最終取得了今天的成績(jī)。”
以下是胡國(guó)平院長(zhǎng)的演講原文,雷鋒網(wǎng)做了不改變?cè)獾男薷模?/strong>
大家上午好,我是來自科大訊飛的胡國(guó)平,非常高興有這樣一個(gè)機(jī)會(huì)與各位分享,作為人工智能這樣一個(gè)研究院一線工作者,在人工智能方面的一些思考和想法。
人工智能走過的60年以來,歷史使命的定義來說,工業(yè)革命,我們把人類從繁重疲勞中解放出來,信息技術(shù)把全世界緊密的聯(lián)系在一起,而人工智能它所定義的歷史使命是一定要把人類從繁重的腦力勞動(dòng)中解放出來。腦力勞動(dòng),某種來說,人工智能是最后一個(gè)需要靠人類自身智慧去攻克的革命。如果人工智能取得了重大的突破,超過了人類自身的智能,大家可以想像以后所有飛機(jī)的設(shè)計(jì),去太空,去火星,也許都不需要人類的智慧在其中參與了。所以也是人工智能最后一個(gè)需要人類智慧自身攻克的話題,所以人工智能對(duì)于整個(gè)世界的吸引,對(duì)于所有智力團(tuán)隊(duì)的誘惑是非常大的。
人工智能,大家都知道60年來經(jīng)歷了三次浪潮,或者說三起三落。但到目前為止,大家又知道我們經(jīng)歷了第三次的人工智能浪潮。也許這一次還可能會(huì)有一些波折,但無論如何人類去追求人工智能的夢(mèng)想會(huì)持續(xù)的往前推進(jìn)。大部分人認(rèn)為,包括科大訊飛都認(rèn)為,我們現(xiàn)在正在經(jīng)歷第三次浪潮,已經(jīng)處在真正爆發(fā)的前夜,人工智能技術(shù)會(huì)進(jìn)入方方面面的應(yīng)用。
剛才吳軍博士也講了很多,人工智能已經(jīng)改變了我們很多方面?;蛘哒f這一次人工智能真的火了起來,包括機(jī)器下棋攻克了圍棋的最后一個(gè)難題,語(yǔ)音合成已經(jīng)超過一般自然人的說話水平。語(yǔ)音識(shí)別,大家也看到了右邊這樣一些語(yǔ)音識(shí)別效果,已經(jīng)達(dá)到97%的識(shí)別率。人臉識(shí)別,據(jù)官方報(bào)道已經(jīng)超過了人類肉眼所能達(dá)到的水平。自動(dòng)駕駛,我這個(gè)數(shù)據(jù),應(yīng)該安全行駛數(shù)百萬公里。計(jì)算機(jī)自動(dòng)去識(shí)別學(xué)生寫的這樣一個(gè)紙筆寫的試卷,已經(jīng)超過專家水平。語(yǔ)音評(píng)測(cè),機(jī)器翻譯,自動(dòng)聊天,已經(jīng)達(dá)到了18個(gè)輪次,你都無法判斷出來到底是人在和你聊天,還是微軟的機(jī)器在跟你聊天。
我們的知識(shí)競(jìng)賽也是超過了人類冠軍,以及能夠自動(dòng)做詩(shī),自動(dòng)寫新聞,以及智慧醫(yī)療,剛才吳軍博士也做了介紹。應(yīng)該說這次確實(shí)人工智能真的火了起來,而且人工智能火起來之后另外一個(gè)很明顯的特征和跡象,政府也好、巨頭也好、創(chuàng)業(yè)者以及資本,都是大量的涌入。包括美國(guó)、中國(guó),都把人工智能定義為國(guó)家戰(zhàn)略,以及像Google、Facebook、蘋果、訊飛、百度都進(jìn)入了人工智能前沿領(lǐng)地。特別是最近2016年以來,阿里、華為、騰訊、樂視、聯(lián)想,我前天還看到一個(gè)消息,小米也正式宣布要進(jìn)入人工智能領(lǐng)域。
現(xiàn)在也有成百上千的人工智能創(chuàng)業(yè)公司,以及資本,也是大量的涌入。另外多說一個(gè)事情,我們普遍認(rèn)為人工智能競(jìng)爭(zhēng)作為人類自身智慧最后一個(gè)需要攻克的技術(shù),它和國(guó)際之間的PK和對(duì)抗主要是在中國(guó)和美國(guó)這兩個(gè)國(guó)家來對(duì)抗。剛才兩位老師的數(shù)據(jù)也明顯的看出來,大數(shù)據(jù)和人工智能主要的貢獻(xiàn)或者參與者也是中國(guó)和美國(guó)的企業(yè),這主要是因?yàn)槿斯ぶ悄艿募夹g(shù)依賴于大數(shù)據(jù)、移動(dòng)互聯(lián)網(wǎng)、云計(jì)算,和廣大的用戶群體。在這方面,中國(guó)和美國(guó)是佼佼者。
我從技術(shù)的角度來說,更想和大家分享的是,這次人工智能技術(shù)火起來背后真正原因。歸結(jié)為三點(diǎn):一個(gè)是深度學(xué)習(xí),一個(gè)是大數(shù)據(jù),一個(gè)是云計(jì)算。
首先深度學(xué)習(xí),或者說深度神經(jīng)網(wǎng)絡(luò)橫空出世,這是在2006年提出來的深度學(xué)習(xí)的方法,取得了歷史性的重大突破。它的最基本原理其實(shí)也比較簡(jiǎn)單,就是在左邊這樣一個(gè)復(fù)雜的網(wǎng)絡(luò)里面,通過有相關(guān)數(shù)據(jù)輸進(jìn)去之后,通過網(wǎng)絡(luò)產(chǎn)生最后的輸出。
如果這個(gè)輸出和原來所標(biāo)注的答案不一樣,它通過一個(gè)BP的錯(cuò)誤回饋算法去修正相關(guān)網(wǎng)絡(luò)中的參數(shù),使得它最終對(duì)整個(gè)訓(xùn)練級(jí)而言,它的預(yù)測(cè)和建模的準(zhǔn)確度最高。方法其實(shí)很簡(jiǎn)單,但是最大的一個(gè)作用是它這里的網(wǎng)絡(luò)量非常大,自由數(shù)非常多,建模能力非常強(qiáng),使得它有效的抓住類似在圖象識(shí)別中,從像素到邊界,到部件,到人臉一系列特征,能夠做出有效的人臉識(shí)別。
我們?nèi)绻麖闹庇^去理解,這樣一個(gè)深度學(xué)習(xí)最關(guān)鍵的特點(diǎn),它是更強(qiáng)大,更通用的,能夠更高效地訓(xùn)練數(shù)據(jù)的建模機(jī)器。
我們舉一個(gè)具體的例子供大家理解深入學(xué)習(xí)關(guān)鍵突破的點(diǎn),模式識(shí)別。左邊假設(shè)是一張人臉圖像判斷它是男的還是女的,按照經(jīng)典人臉識(shí)別套路,可以提取它的特征,頭發(fā)、胡須,訓(xùn)練相關(guān)模型,用各種語(yǔ)言,一系列機(jī)器學(xué)習(xí)的模型,最后來建初模型,做觸摸式識(shí)別。但是用了深入學(xué)習(xí)之后一個(gè)很關(guān)鍵的特點(diǎn),提取特征的環(huán)節(jié)已經(jīng)沒有了。對(duì)于機(jī)器而言,現(xiàn)在已經(jīng)只需要 ,或者整個(gè)模式識(shí)別內(nèi)容已經(jīng)簡(jiǎn)化為準(zhǔn)備數(shù)據(jù)和訓(xùn)練模型,最簡(jiǎn)單的兩個(gè)環(huán)節(jié)。
如果大家注意到AlphaGo的算法原理,它也是類似這樣操作的,對(duì)圖象識(shí)別來說不再需要任何特征的提取,直接把像素值輸進(jìn)去。對(duì)于AlphaGo而言,它也是用深度學(xué)習(xí),而且直接把19×19格子上圍棋黑白棋信息輸入神經(jīng)網(wǎng)絡(luò),判斷當(dāng)前棋局下黑棋贏的概率是多少,不再用人工方法告訴AlphaGo應(yīng)該去看什么樣的東西,它輸入的都是最原始的信息。如果把深入學(xué)習(xí)看成一個(gè)黑盒子的話,可以理解這次人工智能的變革。就是拿足夠多的有監(jiān)督海量迅速數(shù)據(jù),來直接輸入一個(gè)黑盒子,它就可以獲得一個(gè)與人類可媲美的人工智能技術(shù)。簡(jiǎn)單來說,一萬個(gè)小時(shí)訓(xùn)練樣本,再去訓(xùn)練10的7次方自由度或者參數(shù)、個(gè)數(shù)的神經(jīng)網(wǎng)絡(luò),就可以達(dá)到與人類可媲美的語(yǔ)音識(shí)別效果。
當(dāng)然,這個(gè)不是黑盒子,用的是包括GPU為主的計(jì)算服務(wù)器。所以再抽象的來看,人類可比的人工智能其實(shí)是靠大數(shù)據(jù)喂起來的,或者靠大數(shù)據(jù)、大成本、大量計(jì)算喂起來的。確實(shí)現(xiàn)在我們進(jìn)入了一個(gè)深度學(xué)習(xí)的時(shí)代,因?yàn)樯疃葘W(xué)習(xí)的通用性,已經(jīng)不再需要針對(duì)任何一個(gè)特定任務(wù)去做很多特征提取,或者相應(yīng)的分析和研究工作。所以深度學(xué)習(xí)至少?gòu)目拼笥嶏w看來,2013年起已經(jīng)被廣泛應(yīng)用在語(yǔ)音和語(yǔ)言的各個(gè)方面。我們現(xiàn)在幾乎用的所有方法都是以深度學(xué)習(xí)為主框架方式來做語(yǔ)音合成、評(píng)測(cè),包括語(yǔ)言模型、機(jī)器翻譯與人臉識(shí)別所有的方向,全部在深度學(xué)習(xí)框架上。
而且更關(guān)鍵是大家如果做投資也好,做相關(guān)創(chuàng)業(yè)者,一定要記得另外一條。深度學(xué)習(xí)也在不停的往前演進(jìn),2011年主流的DN技術(shù)路線實(shí)現(xiàn)了廣泛的應(yīng)用。但是到了2015年提出了有效模擬人類神經(jīng)注意的模型?,F(xiàn)在全世界相關(guān)會(huì)議論文,50%以上都和深度學(xué)習(xí)相關(guān),或者說全世界所有智力學(xué)者都在研究和改進(jìn)深度學(xué)習(xí)。深度學(xué)習(xí)本身也會(huì)持續(xù)改進(jìn),因?yàn)槌掷m(xù)改進(jìn),每年都會(huì)費(fèi)掉訊飛研究院30%的代碼。你可以愛上自己的工作,但一定不要愛上自己的工作成果,因?yàn)榧夹g(shù)變化非常非常的快。
剛才說的更多是偏語(yǔ)音圖象識(shí)別的概念,深度學(xué)習(xí)在2014年左右開始,已經(jīng)站在最經(jīng)典的語(yǔ)言翻譯基礎(chǔ)上,取得了更好的效果,它也是采用最新Atentional技術(shù)。它所用的方法是基于海量中英文句隊(duì),機(jī)器可以有效的實(shí)現(xiàn)機(jī)器翻譯。而且現(xiàn)在大家所喜聞樂見的聊天機(jī)器人,自動(dòng)做詩(shī)全是用這個(gè)套路所實(shí)現(xiàn)的,機(jī)器并不能真正的懂得語(yǔ)義。人工智能還在繼續(xù)往前走,被廣泛認(rèn)為可以替代圖靈測(cè)試,來測(cè)試機(jī)器智能有沒有像人思考的測(cè)試。這個(gè)測(cè)試是用常識(shí)推理的任務(wù),檢驗(yàn)機(jī)器是否具備這方面的智能。
舉個(gè)例子,爸爸沒法舉起他的兒子,因?yàn)樗苤?,是誰很重,所有人都很容易理解是兒子很重。如果爸爸沒法舉起他的兒子,因?yàn)樗芴撊?,大家都知道是爸爸很虛弱??拼笥嶏w提出了基于神經(jīng)網(wǎng)絡(luò)主要方法的深度學(xué)習(xí)認(rèn)知智能路線,取得了2016年評(píng)測(cè)第一名。這里要告訴大家的是,第一名的成績(jī)?cè)?選1的選擇里,我們正確率只有58%,所以相對(duì)而言和人類接近100%智力相比,還是有相應(yīng)的一些差距。
第三個(gè),剛才說了神經(jīng)網(wǎng)絡(luò),大數(shù)據(jù),第三個(gè)推動(dòng)人工智能在最近這五年內(nèi)取得飛速發(fā)展的就是云計(jì)算。因?yàn)樵谠朴?jì)算的支撐下,人工智能首先擴(kuò)大了整個(gè)模型的規(guī)模。剛才說了10的7次方參數(shù)的模型能夠有效被應(yīng)用起來,以及也獲得了大量真實(shí)數(shù)據(jù),我們前面所說的人工智能所需要的位進(jìn)學(xué)大數(shù)據(jù)獲得了有效支撐。以及云計(jì)算模式,每天更新一個(gè)版本,加速了技術(shù)迭代的速度,所以云計(jì)算是人工智能進(jìn)步的技術(shù)推手。
整合前面所說的,人工智能專業(yè)技術(shù)公司必須擁有的三大要素。頂尖人工智能算法及團(tuán)隊(duì),為什么要團(tuán)隊(duì),因?yàn)樗惴ǔ掷m(xù)往前演進(jìn)。同時(shí)要有獨(dú)特優(yōu)勢(shì)的大數(shù)據(jù)積累,以及云計(jì)算的能力和服務(wù)。這三個(gè)加在一起,它就可以去實(shí)現(xiàn)包括科大訊飛在內(nèi)所做到的,每年相對(duì)30%-50%的錯(cuò)誤率下降。這里有一個(gè)技術(shù)上概念,錯(cuò)誤率相對(duì)下降,錯(cuò)誤率相對(duì)下降是評(píng)價(jià)一個(gè)人工智能系統(tǒng)往前改進(jìn)難度的概念。簡(jiǎn)單來說語(yǔ)音識(shí)別錯(cuò)誤率從20%降到10%的難度,等同于從2%降到1%,因?yàn)樗鼈兿鄬?duì)下降都是50%。
大家前面也說了,摩爾定律走了幾十年,而人工智能類似的摩爾定律,30%為錯(cuò)誤率相對(duì)下降基線,每年錯(cuò)誤率相對(duì)下降持續(xù)了至少五年以上。而且我們也相信通過算法的演進(jìn),數(shù)據(jù)的積累和云服務(wù)的模式,這個(gè)相關(guān)的人工智能摩爾定律還會(huì)繼續(xù)往前走至少3-5年。我們要從兩個(gè)方面來看這30%到50%的錯(cuò)誤率相對(duì)下降,第一,如果你所從事相關(guān)人工智能算法,年平均錯(cuò)誤率下降沒有達(dá)到這個(gè)值,那就證明你在整個(gè)人工智能競(jìng)爭(zhēng)中是處于相對(duì)落后的狀態(tài)?,F(xiàn)在我們?cè)谄慈斯ぶ悄?,已?jīng)不再是拼現(xiàn)在已經(jīng)達(dá)到的水平,而是拼你在人工智能的速度進(jìn)一步加速度。第二,當(dāng)你看到某個(gè)技術(shù)現(xiàn)在還不完全好用的時(shí)候,比如說現(xiàn)在的視頻監(jiān)控中人臉識(shí)別,但是如果我們把前面三件事情做起來的話,它可以保持每年相對(duì)錯(cuò)誤率30%下降幅度。
簡(jiǎn)單來說,如果今年錯(cuò)誤率是20%,那么明年就是14%,再往后可能就到10%的水平。所以創(chuàng)業(yè)也好,投資也好,你可以擁有這樣一個(gè)摩爾定律去預(yù)計(jì)相關(guān)的技術(shù)在什么時(shí)間點(diǎn),能夠達(dá)到用戶可接受的門檻,這是很關(guān)鍵的一點(diǎn)。當(dāng)然這里可以打一個(gè)硬廣告,如果你沒有人工智能頂尖算法和團(tuán)隊(duì),或者沒有云計(jì)算、云服務(wù)的能力。但你針對(duì)自己的行業(yè),或者相關(guān)認(rèn)識(shí)的朋友有很獨(dú)特優(yōu)勢(shì)的大數(shù)據(jù),那么你可以直接拿著大數(shù)據(jù)去找這樣一些科大訊飛人工智能專家。就像吳軍老師所說的,通過新的技術(shù)去改造原有的相關(guān)算法,或者相關(guān)的系統(tǒng),來達(dá)到人工智能武裝傳統(tǒng)的行業(yè)。
前面講的是真正所理解的人工智能這次浪潮背后的原因,三大推手。下面是創(chuàng)業(yè)者和投資者希望聽到的,對(duì)于科大訊飛17年來在智能語(yǔ)音和人工智能走過歷程中總結(jié)出來的一些經(jīng)驗(yàn),或者說教訓(xùn)。確實(shí),人工智能是最近五年,或者最近三年才真正火起來,特別2016年是最火的一年。但是對(duì)科大訊飛而言,我們99年從科大大學(xué)生創(chuàng)業(yè)以來,一直在追求人工智能的夢(mèng)想。因?yàn)榧夹g(shù)的進(jìn)步,我們打開整個(gè)相關(guān)的市場(chǎng)空間,進(jìn)入了更好的發(fā)展機(jī)會(huì)。
這里首先要說的一個(gè)挑戰(zhàn),大家都知道人工智能是所謂技術(shù),但是人工智能和傳統(tǒng)意義上的技術(shù)在落地方面,在立地方面有很大的不同點(diǎn)。大家也許不能完全理解,我為什么把機(jī)器翻譯和WIFI放在一起來理解。是這樣的,當(dāng)世界上推出一個(gè)WIFI技術(shù)的時(shí)候,所有人都會(huì)欣然接受它,不會(huì)說你的WIFI,我不需要,我可以通過自身能力實(shí)現(xiàn)手機(jī)和終端設(shè)備聯(lián)網(wǎng)的能力,因?yàn)樗械腤IFI是人類自身所不具備的技術(shù)范疇。而機(jī)器翻譯不一樣,只要是大學(xué)生,都能找出來現(xiàn)在的機(jī)器翻譯系統(tǒng)所出現(xiàn)的系統(tǒng)。所以當(dāng)你把一個(gè)機(jī)器翻譯技術(shù)推出去,或者把語(yǔ)音識(shí)別技術(shù)推出去的時(shí)候,別人總會(huì)質(zhì)疑你,你的技術(shù)和人的能力相比實(shí)際上還是有差距的。我未必要用,我可以自己搞定。
簡(jiǎn)單來說,人類的智能相對(duì)人工智能來說,它的打擊是無處不在的。是的,機(jī)器可以做出一些搬運(yùn)運(yùn)貨機(jī)器人,但是搬運(yùn)工說不用也可以搞得定。自動(dòng)駕駛和駕駛員的PK,以及速錄員對(duì)語(yǔ)音轉(zhuǎn)寫,醫(yī)生對(duì)于沃森的系統(tǒng)。雖然說現(xiàn)在智慧醫(yī)療宣傳得非常好,但是要傳統(tǒng)領(lǐng)域醫(yī)療醫(yī)生接受這個(gè)新鮮事物還需要一個(gè)漫長(zhǎng)的過程??拼笥嶏w所獨(dú)家在做的自動(dòng)閱卷技術(shù),拿到老師那邊去的時(shí)候,老師始終會(huì)以挑剔或者質(zhì)疑的眼光來看待。
應(yīng)該說任何一個(gè)方面,人類智能都是人工智能的師傅和競(jìng)爭(zhēng)對(duì)手,所以我們?cè)谧鋈斯ぶ悄軇?chuàng)業(yè)的時(shí)候一定要想清楚,你和傳統(tǒng)做一個(gè)WIFI的創(chuàng)新,和做一個(gè)什么其它人類不具備能力的技術(shù)相比,人工智能的落地會(huì)有更多面臨的挑戰(zhàn)和困難。但是,作為人類徒弟的人工智能,其實(shí)它有非常多的優(yōu)勢(shì)。如果要充分的發(fā)掘,或者說借勢(shì)于這樣一些優(yōu)勢(shì),就能夠有效實(shí)現(xiàn)人工智能產(chǎn)業(yè)的落地,或者說創(chuàng)業(yè)的成功。我這里總結(jié)了五條,未必是完全,大概可以供各位參考。
第一,人工智能技術(shù)可以作為人機(jī),或者其它系統(tǒng)人機(jī)接口。因?yàn)槿俗陨淼哪芰椭荒苁侨俗陨淼?,人機(jī)智能可以拓寬交互系統(tǒng)。當(dāng)手寫識(shí)別作為發(fā)短信,作為人與人之間信息溝通人機(jī)接口的時(shí)候,它就實(shí)現(xiàn)了有效大規(guī)模的應(yīng)用落地。我們現(xiàn)在的掃描識(shí)別也是為檢索分析做的應(yīng)用,現(xiàn)在車派識(shí)別為什么多起來,是因?yàn)橥\噲?chǎng)收費(fèi)管理里對(duì)車派識(shí)別應(yīng)用有廣泛的需求。人臉識(shí)別很多時(shí)候是為了身份認(rèn)證和手機(jī)支付,這樣一種真實(shí)的,用戶有明確需求的,人機(jī)接口才可以做廣泛的落地。
第二,隨著現(xiàn)在IOT或者傳感器技術(shù)的進(jìn)步,利用傳感器以及大數(shù)據(jù)來達(dá)到超過人類的智能,這個(gè)也是人工智能有效的發(fā)展模式。這里最典型的一個(gè)例子就是天氣預(yù)報(bào),以前人還會(huì)說夜觀天象,現(xiàn)在人都不會(huì)了。你想出差直接打開本地天氣預(yù)報(bào),就能有效知道明天相關(guān)天氣的情況。包括自動(dòng)駕駛,包括其它的,為了方便都可以用比人類更多的傳感器獲得信息輸入,有效做出人工智能來超越人類智能,達(dá)到更多應(yīng)用推廣落地機(jī)會(huì)。
第三,相對(duì)客觀性,或者穩(wěn)定可傳承性。包括語(yǔ)音評(píng)測(cè),作文評(píng)分,以及一系列的技術(shù)。它核心的一條,因?yàn)槿伺c人在對(duì)同一份試卷閱卷時(shí)存在主觀性,機(jī)器在這方面會(huì)更加可觀和無感情的。這時(shí)候相對(duì)機(jī)器對(duì)于大量人工閱卷而言就有更多的優(yōu)勢(shì),這樣才會(huì)使相關(guān)人工智能技術(shù)被老師和學(xué)校廣泛接受的主要原因。
第四,面向海量任務(wù)的不知疲倦。科大訊飛是從語(yǔ)音合成起家,語(yǔ)音合成就是一個(gè)典型的不知疲倦合成任一文本,合成海量文本的概念,這個(gè)成為它真正落地的原因。
第五,人類學(xué)習(xí)成本高,使用頻度低的產(chǎn)業(yè)。比如說多語(yǔ)種翻譯,是的,人類可以在多語(yǔ)種翻譯上做出很好的能力,但由于學(xué)習(xí)成本太高,使用頻度太低,這時(shí)候相關(guān)人工智能就會(huì)有很好的應(yīng)用落地。
最后我再稍微講一下人工智能立地的方向和節(jié)奏把握,這也是非常關(guān)鍵的一點(diǎn)。
第一,很多報(bào)道都聽說機(jī)器能夠自動(dòng)做詩(shī),機(jī)器自動(dòng)做曲。如果把這樣一種技術(shù)創(chuàng)新或者創(chuàng)業(yè),與機(jī)器自動(dòng)閱卷技術(shù)相比,其實(shí)大家可以直觀去想想,機(jī)器自動(dòng)閱卷顯然具有更大更廣泛的落地機(jī)會(huì)。大家在做相關(guān)人工智能創(chuàng)業(yè)時(shí),一定要優(yōu)先對(duì)準(zhǔn)現(xiàn)實(shí)生活工作中存在的大量重復(fù)性的腦力勞動(dòng),會(huì)更加有效的實(shí)現(xiàn)廣泛落地和大規(guī)模產(chǎn)業(yè)化。
另外,我們還是要把握好相關(guān)人工智能技術(shù)進(jìn)一步臺(tái)階的設(shè)計(jì),不同應(yīng)用場(chǎng)景對(duì)同樣語(yǔ)音識(shí)別技術(shù)來說,所要求達(dá)到的水平是不一樣的。簡(jiǎn)單來說,手機(jī)云輸入現(xiàn)在已經(jīng)達(dá)到97%,已經(jīng)非常好用。相應(yīng)會(huì)議語(yǔ)音轉(zhuǎn)寫,因?yàn)樵跁?huì)議當(dāng)中人的爭(zhēng)吵,相關(guān)的問題,會(huì)議語(yǔ)音轉(zhuǎn)寫的正確率還沒有完全達(dá)到應(yīng)用門檻。當(dāng)然現(xiàn)在這種發(fā)布會(huì),或者這種會(huì)議宣講是可以有效達(dá)到語(yǔ)音識(shí)別率跨過應(yīng)用門檻,達(dá)到落地機(jī)會(huì)。所以當(dāng)你在選擇人工智能方向時(shí),不管是人臉識(shí)別還是其它方向,一定要想好第一個(gè)應(yīng)用場(chǎng)景是什么,并且集中力量把那個(gè)場(chǎng)景攻下來。
最后一個(gè),人工智能和人類智能并不是嚴(yán)格意義上PK和對(duì)立的,有很多人機(jī)互助的場(chǎng)合和場(chǎng)景。典型來說就是輔助駕駛和自動(dòng)駕駛這件事情,其實(shí)在自動(dòng)駕駛沒有真正商業(yè)化的現(xiàn)在,輔助駕駛已經(jīng)廣泛應(yīng)用在很多場(chǎng)合。在人工智能落地的時(shí)候,你可以優(yōu)先考慮人機(jī)結(jié)合的落地方式,能夠讓相關(guān)技術(shù)更早達(dá)到可應(yīng)用的門檻。
如果大家認(rèn)真聽了前面部分的介紹,應(yīng)該可以得出一個(gè)結(jié)論。做人工智能技術(shù)的核心技術(shù)研發(fā),其實(shí)是需要花費(fèi)非常多的時(shí)間、精力和錢的。另外一種方式,這個(gè)就是剛才吳軍老師所說的,當(dāng)人工智能技術(shù)有進(jìn)步的時(shí)候,有很多飛躍的時(shí)候,我們能不能拿著現(xiàn)有人工智能的技術(shù)進(jìn)步,去和傳統(tǒng)行業(yè),去和相關(guān)的產(chǎn)品進(jìn)行有效的結(jié)合和創(chuàng)新,這方面如果從創(chuàng)業(yè)和創(chuàng)新的角度來說,機(jī)會(huì)其實(shí)會(huì)更大,特別是相對(duì)于小規(guī)模的公司而言。
所以,如果你要選擇公司做人工智能核心技術(shù)的研發(fā),一定要記得類似于像訊輸入法這樣,一定要有相關(guān)的堅(jiān)守。訊飛輸入法我們做了六年,每次都是告訴自己,每年識(shí)別率錯(cuò)誤率相對(duì)下降30%。每次都是堅(jiān)持在相關(guān)方向做了很大的技術(shù)投入,才使得最終到了現(xiàn)在這個(gè)時(shí)點(diǎn),包括老羅的發(fā)布會(huì)上大家認(rèn)可訊飛輸入法,或者訊飛后臺(tái)語(yǔ)音識(shí)別具有工匠精神。另外一方面,訊飛也不是那么的自私,我們也把相關(guān)核心技術(shù)和人工智能技術(shù)進(jìn)步、進(jìn)展,通過云服務(wù)的方式,語(yǔ)音云的具體載體來給很多創(chuàng)新創(chuàng)業(yè)團(tuán)隊(duì)提供更好的人工智能支撐。
整個(gè)訊飛云是2010年首次發(fā)布以來,經(jīng)過六年的發(fā)展,已經(jīng)集聚了7億用戶,上面有11萬開發(fā)者,以及30億次日訪問的云計(jì)算服務(wù)規(guī)模。我們把所有相關(guān)人工智能技術(shù)都有效的對(duì)外開放,大家基于訊飛云可以在人工智能這個(gè)大的行業(yè)和領(lǐng)域里實(shí)現(xiàn)自己的創(chuàng)新和創(chuàng)業(yè)。
最后想強(qiáng)調(diào)一下人工智能的無窮魅力,剛才說了人工智能是人類智能,自身智能智慧最后一個(gè)需要攻關(guān)的。另外一個(gè),即使沒有攻關(guān)搞定人工智能技術(shù)狀態(tài)下,人工智能無成本復(fù)制的能力和持續(xù)向前進(jìn)化的能力也是人類自身所無法比擬。我們都知道相關(guān)人的智能隨著一代大師的離世,新人的都需要重新?lián)炱饋恚匦聦W(xué)起來。即使你是英語(yǔ)大師的兒子,單詞也要自己一個(gè)個(gè)重新背起來,這就是人類智慧進(jìn)步最大的障礙。而人工智能不一樣,人工智能是一種技術(shù),是一種機(jī)器智能。一旦某一個(gè)機(jī)器具備97%的語(yǔ)音識(shí)別正確率,那么世界上所有機(jī)器原則上都可以具備這樣的正確率。不管是哪個(gè)公司再繼續(xù)研發(fā)下一代語(yǔ)音識(shí)別技術(shù),他一定站在97%的指標(biāo)之上,無成本復(fù)制和持續(xù)向前的進(jìn)化能力是人工智能相對(duì)人力智能來說非常大的優(yōu)勢(shì),這也是“人工智能威脅論”的主要來源,因?yàn)槿斯ぶ悄苓M(jìn)化的速度超過人類至少1萬倍。
我們也會(huì)從現(xiàn)實(shí)生活中對(duì)未來人工智能越來越習(xí)以為常,我兒子今年8歲,在他的眼里,火車就等于動(dòng)車,我專門告訴他還有綠皮火車這件事情?;蛘邔?duì)于他來說所有蘋果都是觸摸屏,我們現(xiàn)在已經(jīng)不再夜觀天象,直接用天氣預(yù)報(bào)這樣有效的人工智能技術(shù)。而我們?cè)谝郧昂芏鄷r(shí)候還會(huì)記憶相關(guān)地址和路線,現(xiàn)在甚至連走路都直接用地圖導(dǎo)航,特別到一個(gè)新的地方時(shí)。我們?cè)瓉碇皇橇?xí)慣于拼音輸入法,后來習(xí)慣于手寫輸入法,現(xiàn)在越來越習(xí)慣語(yǔ)音輸入。
我們非常相信在不久的將來,車、家電、家居都是可以通過語(yǔ)音的方式跟它進(jìn)行自然交互。而你說的法語(yǔ),可能在我這邊聽到的就是通過語(yǔ)音翻譯技術(shù)得到了中文。每個(gè)人很肯定會(huì)有一個(gè)虛擬的助理,也許是街上或者辦公室里到處跑的機(jī)器人。我們會(huì)越來越快的,越來越正常的對(duì)于人工智能進(jìn)展和相關(guān)習(xí)以為常。所以,人工智能的頂天和立地。頂天立地是科大訊飛成立以來一直所秉持的,我們對(duì)人工智能方面的追求。我們要有頂天的核心技術(shù),我們要有立地進(jìn)入億萬家庭人工智能落地的產(chǎn)品。
同時(shí)也是我們的方法論,只有人工智能真正落地了,才能真正把人工智能技術(shù)推向世界最高峰。相應(yīng)而言,也認(rèn)為人工智能技術(shù)只有達(dá)到世界領(lǐng)先,才可以有效的推動(dòng)相關(guān)技術(shù)達(dá)到億萬應(yīng)用的規(guī)模。所以對(duì)于我個(gè)人而言,或者訊飛也是希望和在座各位一起,帶著頂天的人工智能夢(mèng)想,知其然,且知其所以然,腳踏實(shí)地,樂觀積極的實(shí)現(xiàn)人工智能的立地。
讓我們一起用人工智能來建設(shè)美好的世界,謝謝。
雷峰網(wǎng)原創(chuàng)文章,未經(jīng)授權(quán)禁止轉(zhuǎn)載。詳情見轉(zhuǎn)載須知。