4
本文作者: 金紅 | 2016-04-10 10:10 |
本文整理自4月8日科大訊飛劉慶峰在深圳會展中心舉辦的《人工智能產(chǎn)業(yè)發(fā)展論壇》上的演講,文字由科大訊飛的語音軟件訊飛聽見現(xiàn)場實時對演講錄音的轉(zhuǎn)化,雷鋒網(wǎng)在此基礎上做了細節(jié)上的優(yōu)化。
尊敬的各位領導,各位企業(yè)家和專家,非常高興今天能夠借這個機會跟大家分享科大訊飛對人工智能產(chǎn)業(yè)發(fā)展當前的狀況以及下一步趨勢的理解。
應該說今天是人工智能,正式提出來的60周年。在1956年達特矛斯會議提出之后人工智能已經(jīng)經(jīng)歷了三次的浪潮,那么第一次浪潮的高峰是在1970年,當時由于機器能夠證明數(shù)學原理中的大部分的原理,自動證明,那么大家認為第一代的人工智能機器甚至可以在5到10年內(nèi)達到人類的智慧水平。當然事實證明,其實由于當時算法的局限性,包括第一代神經(jīng)網(wǎng)絡設計架構(gòu)上的一些問題,導致了到1980年大家發(fā)現(xiàn)出現(xiàn)第一次的冬天。那么隨后,隨著遞歸網(wǎng)絡算法的出現(xiàn),人工智能第二次浪潮到來,甚至提出了雄心勃勃的第五代計算機的概念,那么還是由于算法本身以及計算收斂性的問題,到了2000年第二次人工智能的冬天到來。這一次的人工智能的產(chǎn)業(yè)發(fā)展,其實一個非常重要的標志點是在2006年前后深度學習算法的出來。到了2011年開始,深度學習算法由多個創(chuàng)新的公司和研究院把這些算法在各個應用領域進行算法的突破和應用延伸,終于開始在語音合成、語音識別、圖像識別等越來越多的領域取得了突破。那么今天呢,正處于人工智能大規(guī)模爆發(fā)的前夜。
為什么這么講呢?人工智能一方面大家在進行多角度交叉學科的研究,包括對老科學的研究,希望真的能夠分析清楚人類大腦神經(jīng)元傳遞及思維活動的基本原理,未來用機器來進行模擬,這個路徑還有不確定性,未來到底多長時間能有重大突破,那我們的科學家和產(chǎn)業(yè)界正在探索。但是,即便以當前的深度學習的算法,結(jié)合現(xiàn)代的云計算大數(shù)據(jù),源源不斷地能夠把一線的數(shù)據(jù)匯聚到后臺進行學習和訓練,那再有著我們對深度學習核心算法全面的掌握和不斷地深化,已經(jīng)可以用深度學習來深刻地改變我們每天的生活。
我們可以看到,不久前谷歌的AlphaGo,下圍棋超過了這個人人類的韓國世界冠軍李世石九段,事實上在比賽之前的3月6號科大訊飛就明確預測了,機器一定會贏。因為今天的深度學習,在這樣有規(guī)律可循的圍棋預算而且在給定時間要出結(jié)果上一定會比人強,甚至在3月9號進行比賽的現(xiàn)場前半段所有人都認為機器,肯定要輸,只有科大訊飛說一定會贏,因為有機器運算可以看到40步之外。
圍棋只是一個品類,其實,差不多同樣難度的在語音合成領域,科大訊飛已經(jīng)把它做到了不僅中文發(fā)音也好在英語中也是全世界第一。在語音識別中,在2015年(科大訊飛)也是通過這些算法的突破首次在寶馬的汽車中測試,不僅達到了實用水平,我們還超過全世界第二名十幾個百分點,那是唯一能夠在車載環(huán)境下使用的。
機器翻譯,由于深度網(wǎng)絡的不斷突破,2014年底和2015年的國際比賽中已經(jīng)改寫了國際口語翻譯比賽的結(jié)果,以前漢英翻譯都是日本的研究機構(gòu)全球第一,英漢翻譯是美國人全球第一,可是到2014年和15年也就是最近的兩次國際比賽,科大訊飛都是全球第一,而且把口語翻譯做到了像我們大學六級的水平。
就出國,現(xiàn)在吃飯購物旅游問路等等基本上機器翻譯都能幫你解決。這些就是深度學習的算法,在各個領域的突破創(chuàng)新開始取得全面應用成果。所以我們才說未來5到10年,人工智能一定會深刻地進入到社會生活的每一個領域,即便是老神經(jīng)老科學的研究還沒有突破,現(xiàn)有的算法已經(jīng)可以改變世界。
我們可以看看第三方的各種預測,比如說Gartner就預測到2018年會有300萬員工要向機器人老板匯報工作。那么同樣,麥肯錫做的調(diào)研做人工智能不僅僅是替代我們所認為的簡單重復的低端勞動,各種高端的勞動照樣可以被替代。我們可以看到右邊這張表格,橫坐標是表示每小時的薪酬,縱坐標是表示有多少工作可以被替代,那么,橫坐標越往右表示工作越復雜,可能薪酬越高,但是我們可以看到文檔管理員80%的工作可以被替代,花園匠由于它還有很多機械操控,現(xiàn)場環(huán)境也復雜,只有20%不到是可以被替代,CEO20%以上的工作是可以被替代的,那么理論上45%的當前復雜的技術性工作是可以被自動化的。所以我們才可以看到,科學雜志在2016年預測,說截止到2045年也就是我們很多場合下說的奇點來臨的時候,人工智能將會顛覆全球就業(yè)率50%,甚至在中國會超過77%的勞動人口因為機器人技術的發(fā)展而丟掉工作。當然,因為機器人丟掉的77%,它會創(chuàng)造出更多更新的工作,就跟我們?nèi)祟悮v史一樣,只是這一輪人工智能不像前幾次工業(yè)革命來的相對比較和緩,它可能在5到10年迅速突破,所以我們才在今天上午的深圳宣言中提出來要制定法律體系和相關的倫理道德師德,使得被替代掉77%的工作之后,我們社會還能夠保持和諧。
孫正義提出了一個著名的公式,他說今天GDP美國第一未來是中國,再往后他認為可能是日本,因為機器人日本最多,光他們一家就是3000萬個機器人啊!而機器人三乘八二十四小時不用休息,一個機器人可以代替三個人,機器人每個月的成本現(xiàn)在不到一千塊錢,未來五百塊錢以內(nèi)。所以他說機器人的質(zhì)量、數(shù)量,決定了一個國家未來的產(chǎn)業(yè)競爭力,那我覺得也是很有道理,這充分看到人工智能今天在社會生活各個領域給我們帶來的沖擊。
人工智能事實上通過科大訊飛的研究院,我們在過去這個多年的統(tǒng)計分析進行各種各樣的推演,現(xiàn)在業(yè)界已經(jīng)比較認可我們所提出來的3個階段的分類。很多人說人工智能分強人工智能和弱人工智能,但是界面相對模糊,那么現(xiàn)在其實我們認為可以把它分成3個階段。第一個階段叫運算智能,就是1997年IBM的深藍電腦下象棋超過國際象棋大師,那是機器的運算能力比人強;第二個階段是感知智能,機器今天在視覺上可以看紅外和紫外的,在聽覺上可以超聲波次聲波,越來越多的機器感知是可以達到跟人類一樣,科大訊飛的語音識別,我們現(xiàn)在看到我說話文字在線顯示,以及今天幾個領導講話,文字都同步出來了,我告訴大家機器現(xiàn)在平均準確率可以做到90%甚至95以上,而如果我們找一個速記員,最好的速記員,打字準確力只有70%多,所以說雖然可能機器有錯,但是已經(jīng)超過人工了,語音合成,也已經(jīng)超過了真人說話水平,這是感知智能;但下一步就是要有語音和語言為切入來突破認知智能,就是讓機器具備像人一樣的能理解會思考的能力,那么怎么突破這一條也就是認知智能,現(xiàn)在是全球競爭的頂級的焦點。
那我們回顧看人類的自智能的發(fā)展,其實現(xiàn)在具備類似人類大腦容量的,基本的智慧基礎的的生物是200萬年前就出來了,但是一直到7萬年前,自然的出現(xiàn),人類才一統(tǒng)天下。是什么原因我們在人類簡史這本書上其實已經(jīng)有描述,很多類似的分析也有。那么就是因為,有了語言的廣泛使用。當人類可以通過語言能夠團結(jié)500人以上協(xié)同工作和生活的時候,人類就在地球上一統(tǒng)天下。事實上有了語言,可以描述周圍的環(huán)境可以反饋社會信息甚至還可以有理念傳承,就像我們今天《人工智能深圳宣言》一樣,這個才是我們?nèi)祟愔腔鄄粩嗟乜梢阅郯l(fā)展的前提。因此我們認為人工智能發(fā)展的必由之路,應該是以語音和語言為入口的認知革命,使機器具備真的像人類一樣的智慧。
那么三個方面一個是人機交互,以語音和語言為入口,當然還可以涵蓋其他各類交互技術,使得我們?nèi)祟惖娜粘1憩F(xiàn)各種思維以及最終的動作,能夠源源不斷地匯聚到后臺,也可以是后臺的人工智能源源不斷地在前端展現(xiàn)出來為我們?nèi)祟惙?;第二個就是后臺高效的知識管理,就像我們今天的會議一樣,我想很多我們在座的各位嘉賓如果參加別的論壇,如果你要在用錄音筆記下錄音,99%的人回去不會再聽,因為重新聽一遍太累了,要從頭聽到尾!今天呢我們訊飛的會議結(jié)束,大家如果愿意就可以直接拿到文字,即便有幾個錯誤,你感興趣的這一段,一點文字,視頻和音頻就出來,類似這樣高效的知識管理;讓機器具備推理和學習的能力,這是更難的一條。
如何評判機器智能,就是推理和學習能力到底達到什么程度才算是在全球領先。以前是圖靈測試,讓機器在后臺模仿人跟前端的人員進行交流,如果你以為那個機器是一個人,在跟你對話跟你在網(wǎng)上溝通,圖靈測試它就可以過關。但是今天呢由于大量的人類交互的數(shù)據(jù)在后臺,所以圖靈測試很容易過關的。全世界現(xiàn)在真正評價人工智能的標準靠什么呢?現(xiàn)在大家公認的最有標志意義的就是高考。因為高考的題目都要是新的,是你推理學習和表達能力最集中的展示而且是最公平的跟人類之間的pk,所以說大家都知道圖靈獎嘛,計算機的最高獎,在美國華盛頓大學的圖靈中心定的目標就是未來計算機在高考中在生物學中要考上美國的大學,而日本制定了雄心勃勃的計劃就是2021年要讓機器人考上日本東京大學,今天呢在數(shù)學和物理的選擇題填空題上已經(jīng)達到人類學生的平均水平。但是機器要考大學最難的是什么呢?是語言的理解,所以中國首個人工智能的重大專項就是科大訊飛來牽頭的,也是面向這個高考,叫類人答題機器人,目標是未來3到5年機器要考上一本,100個學生,它考前20名。中間最難的就是語言理解,但是我們非常高興的告訴大家,我們也取得了全球領先的突破,一個突破就是在廣東能夠看得見的,70萬學生的高考,英語口語考試,不僅機器代替老師來測發(fā)語音的標準程度;學生的口語作文,從去年開始,已經(jīng)是機器代替老師來進行評分了。高考每一分都決定你能不能上北大清華科大上好學校,所以非常關鍵,必須機器比人打得準,而全世界范圍只有科大訊飛能夠比人準,教育部也要在全國范圍內(nèi)推廣。還有一個更有意思的進步就是不光是中國學生的口語,對于復雜的語文和英語的作文,機器打分現(xiàn)在也超過了人類,我們在安徽做了驗證在上海也做了驗證,同樣的卷子老師對語文和英語的作文評分以后機器再改,然后對比有誤差的地方由人工專家組去審核,結(jié)果90%機器比人要打得更準,這是人類在語言理解上的重大突破。
通過這些技術我們相信它不光在教育,在我們的社會生活的各個領域,包括呼叫中心,包括我們在銀行系統(tǒng)以及我們在醫(yī)療等等越來越多的領域,都可以把相關技術用進來。今天科大訊飛已經(jīng)把我們的人工智能技術開放給全行業(yè),讓所有創(chuàng)業(yè)者圍繞它做各種應用,目前我們的總用戶數(shù)已經(jīng)達到7個億,每天訪問人數(shù)超過15億人次,一人用一次叫一個人次現(xiàn)在已經(jīng)超過15億人次,圍繞訊飛語音云的開發(fā)伙伴已經(jīng)13萬人,深圳本地就將近1萬人,有將近2000家機器人創(chuàng)業(yè)公司在用我們的技術方案。所以,未來5到10年我們認為人類就將進入智能一切時代,機器人包括人工智能會像水、食物、互聯(lián)網(wǎng)一樣成為我們?nèi)祟惷刻焐钪械臉伺洌磥?0年這是中國產(chǎn)業(yè),尤其是信息產(chǎn)業(yè)在全球我們擺脫現(xiàn)在相對價值鏈低端的格局,真的能夠在全球獲得更有話語權(quán)更有價值鏈主導權(quán)的非常難得的產(chǎn)業(yè)機遇,因此人工智能不僅僅是單個企業(yè)和單個行業(yè)的事情,是國家必爭之地,我們期待著今天的人工智能的高層論壇,我們真的能夠產(chǎn)學研用能夠聯(lián)起手來能夠共同用人工智能在中國來改變世界。
應該說今天這個還是春天哈,我們也做了首詩,那藏頭詩,深圳宣言。我說我最近在學寫詩,但這個寫的我不知道大家能不能看得懂??!但我想告訴大家,其實這是訊飛超腦寫的一首藏頭詩,為了預祝我們在深圳這個地方,真的能夠再去全球,未來的人工智能能夠引領全球浪潮,將來大家提到人工智能真的在第三次浪潮,在改變世界的時候,在一兩顆真正全球的明星中,有中國有美國,我們能夠領先全球,再次感謝大家讓我們共同團結(jié)協(xié)作,用人工智能改變世界謝謝!
雷峰網(wǎng)原創(chuàng)文章,未經(jīng)授權(quán)禁止轉(zhuǎn)載。詳情見轉(zhuǎn)載須知。