5
本文作者: 訾竣喆 | 2016-04-08 18:45 |
4月7日,艾瑞發(fā)布了2015年中國人工智能應用市場研究報告。其中對人工智能的發(fā)展和應用現(xiàn)狀進行了分析,并對行業(yè)前景進行了預測——
5~10年間感知智能將進一步普及,未來的發(fā)展方向是認知智能。
從1955年至今,人工智能的發(fā)展經(jīng)歷了三次潮起,兩次潮落:
1955年.達特茅斯會議標志AI誕生;
1957年,羅森布拉特發(fā)明第一款神經(jīng)網(wǎng)絡,進入第一個高峰;
1970年,受計算能力所限,AI進入第一個低谷;
1982年,霍普菲爾特神經(jīng)網(wǎng)絡提出;
1986年,BP算法實現(xiàn)了神經(jīng)網(wǎng)絡訓練的突破,進入第二個高峰;
1990年,人工智能計算機DAPRA失敗,進入第二個低谷;
2006年,深度學習神經(jīng)網(wǎng)絡被提出;
2013年.深度學習算法在語音和視覺識別率獲得突破性進展,進入第三個高峰。
可見,每一次人工智能的迸發(fā)期都與新的算法有關,而我們恰好趕上了深度學習算法的突破口,進入到了感知智能時代。
“AlphaGo之所以能戰(zhàn)勝李世石,是由于它巧妙地將蒙特卡洛評估法和深度學習神經(jīng)網(wǎng)絡相結(jié)合。正是這些高級算法的出現(xiàn)才能推動人工智能的發(fā)展突破?!薄鸱治鰩?林仁翔
誠然,人工智能的核心突破點在算法上,而計算能力的發(fā)展和數(shù)據(jù)量的積累同樣重要。
計算能力的提高能夠提升算法運算速度,目前人們已經(jīng)開始通過GPU并行計算神經(jīng)網(wǎng)絡來進行計算,量子計算是未來的發(fā)展趨勢;
數(shù)據(jù)量的擴充則能夠提升算法性能,互聯(lián)網(wǎng)的發(fā)展積累了一定的數(shù)據(jù),未來物聯(lián)網(wǎng)的發(fā)展將進一步擴充數(shù)據(jù)渠道源。
從計算機的出現(xiàn)、到互聯(lián)網(wǎng)的發(fā)展、再到物聯(lián)網(wǎng)出現(xiàn),需要人工來完成的工作將越來越少。
艾瑞認為,人工智能的發(fā)展一共可以分為三個階段——計算智能、感知智能、認知智能。
第一個發(fā)展階段是在計算這個環(huán)節(jié),它使得機器能夠像人類一樣進行計算,諸如神經(jīng)網(wǎng)絡和遺傳算法的出現(xiàn),使得機器能夠更高效、快速處理海量的數(shù)據(jù)。
第二個發(fā)展階段就是感知智能,讓機器能聽懂我們的語言、看懂世界萬物。語音和視覺識別就屬于這一范疇,這些技術能夠更好的輔助人類高效完成任務。
第三個發(fā)展階段就是認知智能,在這一階段,機器將能夠主動思考并采取行動,比如無人駕駛汽車,實現(xiàn)全面輔助甚至替代人類工作。
對此,分析師林仁翔表示,目前的人工智能還處于感知智能的發(fā)展階段。
“目前,語音識別和視覺識別成功率已經(jīng)分別達到了95%和99%,這在深度學習出現(xiàn)之前是難以想象的。近年來,由于計算處理能力的突破以及互聯(lián)網(wǎng)大數(shù)據(jù)的爆發(fā),再加上深度學習算法在數(shù)據(jù)訓練上取得的進展,算法、計算、數(shù)據(jù)三者都已成熟,這推動了人工智能在感知智能上實現(xiàn)巨大突破?!?/p>
他認為,雖然感知智能已經(jīng)實現(xiàn)了突破,但這項技術仍然有函待提升的地方。
“比如人臉識別判斷身份這項技術中就存在缺陷,人們用照片就可以欺騙設備實現(xiàn)身份認證。而活體驗證技術就是目前需要研究的技術;再比如味覺和嗅覺的數(shù)據(jù),這也是物聯(lián)網(wǎng)傳感器目前所無法觸及的領域?!?/p>
據(jù)此,艾瑞預測在5到10年間人工智能產(chǎn)業(yè)還有很多的機會可以發(fā)掘,而何時能夠進入到下一階段(認知智能)還不得而知。
“認知計算何時能夠突破還尚未可知。因為目前連‘深度學習神經(jīng)網(wǎng)絡能否真的讓機器學會如何思考’都還不清楚,而且這與生物以及其他一些相關學科的研究突破也息息相關。至于什么時候相關學科能夠獲得突破性進展,我們也無法得知?!?/p>
人工智能的概念很寬泛,那么具體的細分產(chǎn)業(yè)都有哪些呢?在這里,艾瑞提供了幾組數(shù)據(jù):
我國71%的AI相關企業(yè)都在做技術落地應用,這是我國目前的AI行業(yè)現(xiàn)狀;
在應用企業(yè)中,有83%都是在做軟件服務,而諸如機器人等硬件產(chǎn)品相對匱乏;
在算法技術方面,我國55%的AI相關企業(yè)在做計算機視覺,有13%在做自然語言處理,9%進行機器學習。
“我們在獲得Google、Facebook開源的研究技術之后,能夠很快把技術應用落地,這是我國的優(yōu)勢;而對于基層的技術研究,我國的企業(yè)實力目前還無法和國外匹敵,這是劣勢?!?/span>
——分析師 張鳳
在人工智能最為廣泛的應用層面上,則可以分為五大場景:
第一個是智能硬件、機器人的上應用。借助視覺識別技術以及語音識別技術,通過對數(shù)據(jù)的理解、計算、學習實現(xiàn)決策并實行,實現(xiàn)在交互方式的轉(zhuǎn)變,向自主階段發(fā)展;
第二個是虛擬場景服務。借助視覺技術以及語音識別技術,改變視覺呈現(xiàn)方式以及互動方式,模擬真實場景,通過體感或語言互動。
第三個是安防領域。借助人臉識別技術、指紋識別技術,實現(xiàn)智能攝像頭和防盜鎖等的快速識別功能。
第四個是虛擬服務。借助語音識別技術以及后臺數(shù)據(jù)分析技術,建立智能虛擬客服。
第五個是商業(yè)智能服務。借助人工智能的算法和模型,對云數(shù)據(jù)平臺的數(shù)據(jù)進行挖掘和分析,最終實現(xiàn)智能決策。
第五點同時也是未來人工智能應用領域的發(fā)展方向,主要體現(xiàn)在推理并提出決策方面,而這也正是IBM所在做的事情(關于IBM與認知智能,此前雷鋒網(wǎng)有過報道,詳見:深藏不露的IBM,這幾年都在忙著做這些事情)。
那么,如果想要進軍AI產(chǎn)業(yè),可以從哪幾個方面切入呢?目前可以分為三種:
第一種就是自下而上的切入——從人工智能的基礎資源(數(shù)據(jù)以及底層算法技術)切入,再輔以技術研發(fā)來構(gòu)建上層應用,比如百度、Google,依托自己多年積累的數(shù)據(jù)和深度學習技術,向無人駕駛汽車、機器人等應用拓展;
第二種就是從中間技術層來切入——依照自己的核心技術去構(gòu)建應用,去發(fā)展上層應用的產(chǎn)品或者是服務,比如科大訊飛,從語音識別技術切入,向教育和機器人等應用領域拓展;
第三種是自上而下的切入——直接應用領域切入,這也是大部分初創(chuàng)企業(yè)的做法。這種方式相對技術門檻較低,比如出門問問,重點發(fā)展個人助手服務,向醫(yī)療教育等領域拓展。
雷峰網(wǎng)原創(chuàng)文章,未經(jīng)授權禁止轉(zhuǎn)載。詳情見轉(zhuǎn)載須知。