1
本文作者: 李尊 | 2016-10-21 21:16 | 專題:2016中國計算機(jī)大會(CNCC 2016) |
編者注:譚鐵?,F(xiàn)為中國科學(xué)院副院長、中科院自動化所智能感知與計算研究中心主任,他是中國科學(xué)院院士、英國皇家工程院外籍院士、發(fā)展中國家科學(xué)院(TWAS)院士、巴西科學(xué)院通訊院士、中國圖像圖形學(xué)學(xué)會理事長、中國人工智能學(xué)會副理事長。主要從事圖像處理、計算機(jī)視覺和模式識別等相關(guān)領(lǐng)域的研究工作,已出版編著和專著11部,并在主要的國內(nèi)外學(xué)術(shù)期刊和國際學(xué)術(shù)會議上發(fā)表論文500多篇,獲準(zhǔn)和申請發(fā)明專利80多項。曾任中科院自動化所所長、模式識別國家重點(diǎn)實(shí)驗室主任、中國計算機(jī)學(xué)會副理事長、國際模式識別協(xié)會副主席、IEEE生物識別理事會主席,曾獲得國家技術(shù)發(fā)明二等獎、國家自然科學(xué)二等獎和國家科技進(jìn)步二等獎各1項。
本文根據(jù)譚鐵牛副院長今天上午在 CNCC 2016 上所做的大會特邀報告《大數(shù)據(jù)時代的模式識別》編輯整理而來,在未改變原意的基礎(chǔ)上稍作刪減。
各位老師、各位同學(xué)、各位同仁,大家上午好。因為時間有限,今天的報告會盡量簡略一點(diǎn)。另外考慮到大家不都是做模式識別,所以今天的報告不會講的太專業(yè)。
首先我注意到今年不管開什么會、誰組織、在哪里開,只要和人工智能掛上邊,都很火爆。大家都在提今年是人工智能的60周年,其實(shí)今年對整個計算機(jī)科學(xué),同樣值得紀(jì)念的一年。因為
80年以前圖靈機(jī)模式誕生
70年以前計算機(jī)誕生
60年以前才有人工智能
50年以前,計算機(jī)領(lǐng)域的諾貝爾獎——圖靈獎第一次頒發(fā)
所以說今年是整個計算機(jī)科學(xué)非常值得紀(jì)念的一年。
鑒于最近大家人工智能講得比較多,所以我今天要給大家講得是一個更具體的問題,也是我本人多年從事的領(lǐng)域——大數(shù)據(jù)時代下的模式識別。
今天這個報告里我主要講四個問題。它們分別是:
模式識別的基本概念和歷史
模式識別的發(fā)展現(xiàn)狀
大數(shù)據(jù)時代的機(jī)遇與挑戰(zhàn)
值得關(guān)注的研究方向
首先是什么是模式識別?
其實(shí)很好解釋,用我自己的語言來說就是:世上萬物,不管是物質(zhì)的還是精神的,看得見還是看不見的都是一種模式。
所以對這些模式進(jìn)行分析與處理,進(jìn)而實(shí)現(xiàn)描述、辨識、分類、解釋,這就是一種模式識別,后面我還講提到更多的定義。
模式識別為什么重要?在此我要引用Ray Kurzwell的兩句話:
人類思維的真正力量是基于模式識別。
計算機(jī)越擅長模式識別會變得越發(fā)和人一樣。
不管是哪種定義,模式識別基本都可以分為這幾個步驟:信號獲取—預(yù)處理—特征抽取—分類器設(shè)計。
當(dāng)下,與其說人工智能火,不如說是深度學(xué)習(xí)火。而深度學(xué)習(xí)之所以火的原因,是因為要提升模式識別的能力(如語音識別、圖像識別等)。
因為模式識別是作為人類的一個基本能力,同時這也是模式識別起源的一個基本動力。
跟模式最相關(guān)的兩個熱門話題,一個當(dāng)然就是機(jī)器學(xué)習(xí),另一個則是數(shù)據(jù)挖掘。
模式識別目前也不斷引進(jìn)借助于很多其他學(xué)科的基礎(chǔ)理論,推動相關(guān)學(xué)科交叉快速發(fā)展。
模式識別發(fā)展簡史
我到現(xiàn)在為止,也沒查到第一次是誰、在哪里提出了模式識別。但是我知道從18世紀(jì)、19世紀(jì)開始,數(shù)學(xué)領(lǐng)域中特別是統(tǒng)計科學(xué)就涉及到了模式識別,這也為人工智能的誕生奠定了基礎(chǔ)。
模式識別的發(fā)展大概是如上圖所示這么幾個階段,從最開始一直到后來各種基礎(chǔ)領(lǐng)域出現(xiàn),再一直到大數(shù)據(jù)時代。
模式識別發(fā)展到今天,我把它總結(jié)為幾句話。
模式的基礎(chǔ)理念不斷創(chuàng)新
從統(tǒng)計模式識別到階段模式模式識別,還有一直以來都又在研究的神經(jīng)網(wǎng)絡(luò)。大概是這么幾大類:
句法模式識別(規(guī)則學(xué)習(xí))
統(tǒng)計模式識別(人工特征)
深度神經(jīng)網(wǎng)絡(luò)(自動歸檔)
它們相互間的結(jié)合是未來的發(fā)展方向,我一會兒也會講到這個。
模式識別應(yīng)用領(lǐng)域不斷拓展
另外模式識別的應(yīng)用領(lǐng)域一直在不斷拓展,因為能夠應(yīng)用模式識別的地方實(shí)在太多,所以一直在不斷提升。
模式識別系統(tǒng)性能不斷提升
模式識別系統(tǒng)的性能也一直在不斷提升中,比如像ImageNet圖像識別賽上,它的結(jié)果一直在不斷提升中。
模式識別的典型成功應(yīng)用
語言識別、語言合成
人臉識別
虹膜識別
模式識別的成功應(yīng)用很多,在此不展開講了,稍微舉幾個例子大家參看一下。
人臉識別,但雙胞胎人臉識別解決不了。
虹膜識別,下圖展示的是在真實(shí)的煤礦場所,煤礦工人考勤場景。為什么用虹膜對他進(jìn)行識別?因為指紋識別在這種場景下無法使用,人臉識別在上班之前可以,下班的時候就不行了。
另外再舉一個模式識別的例子——步態(tài)識別。為什么要特別提到步態(tài)識別這個例子呢?因為目前相對來說還有一點(diǎn)挑戰(zhàn)。
在你相距幾十米遠(yuǎn)的時候,虹膜也好、人臉也好,你無法進(jìn)行識別。
另外一個挑戰(zhàn)就是,他是從正面走來,還是從側(cè)面走來。最近借助于深度學(xué)習(xí),這個部分也有了一些新的進(jìn)展。
還有一個例子是智能視覺監(jiān)控,在此就不展開詳細(xì)講述了。
現(xiàn)有模式識別的局限性
盡管模式識別在很多領(lǐng)域都成功應(yīng)用,但還是有巨大的挑戰(zhàn)。在此我想再引用Robert M.Haralick和Thomas G.Dletterich的兩句話:
計算機(jī)視覺(模式識別)的根本問題是一個魯棒性問題,如果不考慮魯棒性問題,計算機(jī)視覺幾乎所有問題都解決了。
現(xiàn)階段只能系統(tǒng)需要在開發(fā)環(huán)境下具有自適應(yīng)性,對噪聲具有魯棒性。
核心的意思就是它的局限性受限于魯棒性和自適應(yīng)性。如果這兩個問題解決了,很多問題就能迎難而解。
大數(shù)據(jù)的出現(xiàn)、深度學(xué)習(xí)的性能提升在一定程度上解決了魯棒性、自適應(yīng)性的問題,但是跟人相比還有巨大的差距。
所以這個領(lǐng)域還需要我們繼續(xù)去努力學(xué)習(xí),深度學(xué)習(xí)盡管取得很大成功,但是跟人的相比它的魯棒性、自適應(yīng)性、泛化能力有很大差距。
所以,我把現(xiàn)狀概括這么幾句話:
面向特定任務(wù)的模式識別已取得突破性進(jìn)展,有的性能可與人媲美。
統(tǒng)計與基于神經(jīng)網(wǎng)絡(luò)的模式識別目前占主導(dǎo)地位,深度學(xué)習(xí)開創(chuàng)了新局面。
通用模式識別依然任重道遠(yuǎn)。
魯棒性、自適應(yīng)性和可泛化性是一個進(jìn)一步發(fā)展的三大瓶頸。
我們目前實(shí)實(shí)在在的處在大數(shù)據(jù)時代,大數(shù)據(jù)的價值不在于大數(shù)據(jù)本身,而在于它內(nèi)容的理解與識別,而這里面很多就是模式識別的問題。
所以我覺得第一個機(jī)遇,就是把大數(shù)據(jù)變成知識、變成決策能夠依據(jù)的根據(jù)。而發(fā)掘這個金庫的鑰匙就是模式識別,只有這樣才能實(shí)現(xiàn)“From Data Bonanza to Data Bonus”。
機(jī)遇2:推動理論和方法創(chuàng)新
機(jī)遇3:加速學(xué)科領(lǐng)域交叉和滲透
加速學(xué)科領(lǐng)域交叉和滲透主要分兩個方面:
以數(shù)據(jù)驅(qū)動為代表的分析方法在大數(shù)據(jù)時代具有廣泛用武之地,使得若干傳統(tǒng)學(xué)科(如神經(jīng)科學(xué))等的研究方法也出現(xiàn)了巨大創(chuàng)新,為模式識別方法拓展到其他領(lǐng)域的方法中帶來了重要契機(jī)。
相關(guān)領(lǐng)域在大數(shù)據(jù)時代的原創(chuàng)成功也能夠?qū)δJ阶R別理論與方法帶來影響,進(jìn)而推動模式識別學(xué)科與其他學(xué)科的協(xié)同創(chuàng)新。
機(jī)遇4:引導(dǎo)科技發(fā)展新變革
機(jī)遇和挑戰(zhàn)同在,機(jī)遇抓不住也是挑戰(zhàn)。
挑戰(zhàn)1:復(fù)雜的大數(shù)據(jù)
挑戰(zhàn)2:計算效率和性能
挑戰(zhàn)3:大數(shù)據(jù)的語義計算與理解
語義就是人們根據(jù)自己對現(xiàn)實(shí)世界的理解而賦予信息的解釋。
挑戰(zhàn)4:大數(shù)據(jù)理解需要信息論的創(chuàng)新
還是那句話,在這些機(jī)遇和挑戰(zhàn)面前,盡管我們講機(jī)遇大于挑戰(zhàn),但是機(jī)遇抓不住就是挑戰(zhàn),挑戰(zhàn)解決不了,那就是機(jī)遇。
一、面向大規(guī)模多源異構(gòu)數(shù)據(jù)的魯棒特征表達(dá)
二、結(jié)構(gòu)與統(tǒng)計相結(jié)合的模式識別新理論
三、數(shù)據(jù)與知識相結(jié)合的模式識別
四、具有魯棒性和自適應(yīng)性的生物啟發(fā)模式識別
五、基于跨領(lǐng)域跨模態(tài)知識遷移的模式識別
六、以互聯(lián)網(wǎng)為中心的模式識別
模式識別是人工智能的核心內(nèi)容,是大數(shù)據(jù)時代的關(guān)鍵使能技術(shù)。
大數(shù)據(jù)帶給模式識別諸多新的機(jī)遇與挑戰(zhàn)。
大數(shù)據(jù)時代的模式識別具有十分廣闊的創(chuàng)新空間與發(fā)展前景。
雷峰網(wǎng)原創(chuàng)文章,未經(jīng)授權(quán)禁止轉(zhuǎn)載。詳情見轉(zhuǎn)載須知。
本專題其他文章