2
“深藍(lán)”電腦打敗人了?
“水是最好的”(Water is best),這句話是西方“科學(xué)和哲學(xué)之祖”泰勒斯(Thales,約公元前624年 —— 公元前546年)的名言,無獨有偶,與他同時代的東方圣人老子(約公元前571年-公元前471年之間)也曾說過 “上善若水”。正如東西方的這兩位先賢對水的青睞一樣,人類科技發(fā)展的初始動因也源自對水的利用,因?qū)δ崃_河、兩河、恒河、黃河的開發(fā)治理誕生出了四大古國的燦爛文明,使得數(shù)學(xué)、物理、化學(xué)、天文、地理等科學(xué)技術(shù)知識紛紜而至。面對繁重的勞動量,人們發(fā)明制造出了可以減輕生理負(fù)荷的各種機械裝置(蒸汽機、電動機是它們中的典型代表),隨著科技的飛速發(fā)展,人們勞動中的生理負(fù)荷不斷下降,而認(rèn)知負(fù)荷卻日益上升,如何減輕不斷增加的這些腦力負(fù)荷呢?人們終于發(fā)明出了計算機這一機器,并且在1997年5月11日,名為“深藍(lán)”的電腦毫無懸念地在標(biāo)準(zhǔn)比賽時限內(nèi)擊敗了國際象棋男子世界冠軍卡斯帕羅夫的人腦,從而證明了在有限的時空里“計算”可以戰(zhàn)勝“算計”,進而論證了現(xiàn)代人工智能的基石條件(假設(shè)):物理符號系統(tǒng)具有產(chǎn)生智能行為的充分必要條件(Newell and Simon,1976)是成立的。更有意思的是,2011年2月17日,一臺以IBM創(chuàng)始人托馬斯·沃森名字命名的電腦在智力問答比賽中狂虐兩位最聰明的美國人而奪得冠軍。自此,人機之間卻也衍生出了一種微妙的不服氣:物理符號系統(tǒng)具有產(chǎn)生情感行為的可能嗎?也就是說能產(chǎn)生心理符號系統(tǒng)嗎?
心理與認(rèn)知
心理學(xué)一詞起源于希臘文,由“靈魂”(ψυχ?)和“研究”(λ?γο?)所組成,意思是關(guān)于靈魂的科學(xué)。隨著科學(xué)的發(fā)展,心理學(xué)的對象由主觀的靈魂逐漸變?yōu)榱丝陀^的心靈。德國心理學(xué)家艾賓浩斯(H.Ebbinghaus,1850-1909)曾這樣概括地描述心理學(xué)的發(fā)展歷程:“心理學(xué)有一個漫長的過去,但只有短暫的歷史。”
在這漫長的過去中,群星燦爛,異彩紛呈,其中包括有約翰·洛克(John Locke,1632-1704)、巴克萊主教(Bishop Berkeley,1685-1753)和大衛(wèi)·休謨(David Hume,1711-1776)創(chuàng)立并發(fā)起的聯(lián)想主義心理學(xué)派,其基本理念是:心理事件是由聯(lián)想規(guī)律控制的,在意識中發(fā)生的一切是由心理事件彼此之間的聯(lián)系決定的,我們之所以相信因果關(guān)系并非因為因果關(guān)系是自然的本質(zhì),而是因為我們所養(yǎng)成的心理習(xí)慣和人性所造成的。
然而,聯(lián)想主義秉持的內(nèi)省—觀念范式遭到了許多心理學(xué)家的質(zhì)疑:主觀的意識研究能否被稱為科學(xué)探索呢?接下來,對此的批評和質(zhì)疑直接導(dǎo)致了在20世紀(jì)初的美國和德國分化出了行為主義心理學(xué)派和格式塔心理學(xué)派。以華生(John B. Watson,1878-1958)、斯金納(B. F. Skinner,1904-1990)美國心理學(xué)家為代表的行為主義心理學(xué)學(xué)派主張:“尋求理解特定的環(huán)境刺激如何控制特定類型的行為”。其主張心理學(xué)應(yīng)分析先行的環(huán)境條件,即在行為之前出現(xiàn)、而且為一個機體產(chǎn)生反應(yīng)或抑制反應(yīng)提供活動場所的條件。主張心理學(xué)應(yīng)該研究可以被觀察和直接測量的行為,即刺激-反應(yīng)范式,反對研究沒有科學(xué)根據(jù)的意識。
而德國的格式塔心理學(xué)派是以馬科斯·韋特墨(Max Wertheimer,1880-1943)、沃爾夫?qū)た晾眨╓olfgang K?hler,1887-1967)和科特·考夫卡(Kurt Koffka,1886-1941)三位心理學(xué)家在研究似動現(xiàn)象的基礎(chǔ)上創(chuàng)立。他們不反對研究意識,但認(rèn)為人腦的運作原理是整體的,“整體不同于其部件的總和”。例如,我們對一朵花的感知,并非純粹單單從對花的形狀、顏色、大小等感官資訊而來,還包括我們對花過去的經(jīng)驗和印象,加起來才是我們對一朵花的感知。另外,格式塔派除了研究似動、整體以外,還有一個重要的研究領(lǐng)域:頓悟,也許這些概念都是需要未來人機交互領(lǐng)域仔細(xì)打磨的范疇吧!
格式塔心理學(xué)派著名的猩猩實驗
幾十年來,這些心理學(xué)派眾說紛紜,莫衷一是,各持己見,令很多其他科學(xué)領(lǐng)域的學(xué)者很是困惑:一個無法定量說明刺激-反應(yīng)內(nèi)在規(guī)律的行為主義以及一個只用“似動”、“整體”、“頓悟”等神秘的字眼加以解釋意識(似乎不能滿足理論說明的要求,也無實際指導(dǎo)意義)的格式塔派怎能歸屬經(jīng)得起客觀邏輯驗證的科學(xué)領(lǐng)域呢?
這種質(zhì)疑和否定一直持續(xù)到了20世紀(jì)40年代末,這個時期的數(shù)學(xué)(信息論)和電子學(xué)(計算機)的迅速發(fā)展,使得信息這一神秘的事物不但可以量化存儲而且還可以邏輯計算,在這兩門學(xué)科突變的直接帶動下,20世紀(jì)50年代中期在美國興起了認(rèn)知心理學(xué)思潮,作為人類行為基礎(chǔ)的心理機制,其核心是輸入和輸出之間發(fā)生的內(nèi)部心理過程。它研究人的高級心理過程,主要是認(rèn)知過程,如注意、知覺、表象、記憶、思維和語言等。其主要代表人物是奈瑟爾(Ulric Neisser,1928-2012)、喬姆斯基(Noam Chomsky,1928-)和紐厄爾(Alan Newell, 1927-1992)和西蒙(Herbert Alexander Simon,1916-2001)。
正是由于諸多學(xué)科的不斷融合交叉,形成了探究人腦或心智工作機制的前沿性尖端學(xué)科需求。1975年,由于美國著名的斯隆基金的投入,美國學(xué)者將哲學(xué)、心理學(xué)、語言學(xué)、人類學(xué)、計算機科學(xué)和神經(jīng)科學(xué)6大學(xué)科整合在一起,研究“在認(rèn)識過程中信息是如何傳遞的”,這個研究計劃的結(jié)果產(chǎn)生了一個新興學(xué)科——認(rèn)知科學(xué),并迅速地引起了全世界科學(xué)家們的廣泛關(guān)注。這6個支撐學(xué)科之間互相交叉,又產(chǎn)生出11個新興交叉學(xué)科:1、控制論;2、神經(jīng)語言學(xué);3、神經(jīng)心理學(xué);4、認(rèn)知過程仿真;5、計算語言學(xué);6、心理語言學(xué);7、心理哲學(xué);8、語言哲學(xué);9、人類學(xué)語言學(xué);10、認(rèn)知人類學(xué);11、腦進化。
作為20世紀(jì)世界科學(xué)標(biāo)志性的新興研究門類,認(rèn)知科學(xué)實際上悄悄地指明人與機的未來研究方向,同時,它再一次地證明了科學(xué)其實和社會遵循著相似的發(fā)展規(guī)律:合久必分,分久必合。
自發(fā)秩序與自動控制
1952年弗里德里?!す耍‵riedrich Hayek,1899-1992)發(fā)表了《感覺的秩序》(The Sensory Order)一書,該書主要研究人的各種感覺產(chǎn)生和變化機理,其中有關(guān)聯(lián)結(jié)主義(用神經(jīng)元Hebbian Synaptic的互聯(lián)網(wǎng)絡(luò)描述心理現(xiàn)象)的設(shè)想形成了神經(jīng)網(wǎng)絡(luò)和許多現(xiàn)代神經(jīng)生理學(xué)的基礎(chǔ)。后來他把生物感知器官的作用機理應(yīng)用到了社會、經(jīng)濟、法律、政治等領(lǐng)域,認(rèn)為很多自然情境下人們之間的活動并不是經(jīng)過刻意介入產(chǎn)生的(亦即存在沒有設(shè)計師的設(shè)計),而是由“自發(fā)性秩序”或者稱之為“由人類行為而非人類設(shè)計”產(chǎn)生的秩序所領(lǐng)導(dǎo)。這與其表兄維特根斯坦(Ludwig Wittgenstein,1889-1951)的后期觀點“創(chuàng)造一套嚴(yán)格的可以表述哲學(xué)的語言是不可能的”相似,因為日常生活的語言是生生不息的,這是哲學(xué)的基礎(chǔ)和源泉,所以哲學(xué)的本質(zhì)應(yīng)該在日常生活中解決,在“自發(fā)”中理解“秩序”。哲學(xué)如此,人機交互的基礎(chǔ)亦如此吧。
路德維?!ぞS特根斯坦
實際上,在人類的認(rèn)知領(lǐng)域中感知、意象和感情的自發(fā)性常常表現(xiàn)為bottom-up機制,在不知覺、無意識中被外界的刺激所激發(fā)、喚醒。這與目前人工智能中的機之計算機制很類似,兩者遵循著刺激-操作-反應(yīng)范式;但是人的認(rèn)知過程中還應(yīng)包含著按照經(jīng)驗規(guī)則運行的方式,這種機制常常被稱為top-down機制,非常有意思的是,研究人的心理學(xué)上的這兩種機制正好對應(yīng)于研究機器的控制論上的自動和控制這兩種機制:bottom-up對應(yīng)著“自動”,top-down對應(yīng)著“控制”。自主的個體學(xué)習(xí)可以獎懲計算體系來說明,群體之間的協(xié)同學(xué)習(xí)可能與買賣算計關(guān)系(買者高價不買,賣者低價不賣)有關(guān)。在直接學(xué)習(xí)和間接學(xué)習(xí)中,自發(fā)和控制的上下交替如同市場與組織的調(diào)節(jié)作用,在預(yù)期與實現(xiàn)、理性與感性間達(dá)到某種平衡。作為趨勢分析中的決策機制,top-down(控制、組織)機制優(yōu)于bottom-up機制(自動、市場)的常見原因之一就在于不確定性的消除。
在真實的人機交互領(lǐng)域中,人的情景意識(Situation Awarensss)SA、機器的物理SA、環(huán)境的地理SA等往往同構(gòu)于統(tǒng)一時空中(人的五種感知也應(yīng)是并行的),人注意的切換使之對于人而言發(fā)生著不同的主題與背景感受/體驗,類似基督教中的三位一體。在人的行為環(huán)境與機的物理環(huán)境、地理環(huán)境相互作用的過程中,人的情景意識SA被視為一個開放的系統(tǒng),是一個整體,其行為特征并非由人的元素單獨所決定的,而是取決于人機環(huán)境系統(tǒng)整體的內(nèi)在特征,人的情景意識SA及其行為只不過是這個整體過程中的一部分罷了。
另外,人機環(huán)境中許多個閉環(huán)系統(tǒng)常常是并行或嵌套的,并且特定情境下這些閉環(huán)系統(tǒng)的不同反饋環(huán)節(jié)信息又往往交叉融合在一起,起著或興奮或抑制的作用,不但有類似宗教情感類的柔性反饋(不妨稱之為軟調(diào)節(jié)反饋,人常常會延遲控制不同情感的釋放),也存在著類似法律強制類的剛性反饋(不妨稱之為硬調(diào)節(jié)反饋,常規(guī)意義上的自動控制反饋大都屬于這類反饋)。如何快速化繁為簡、化虛為實是衡量一個人機系統(tǒng)穩(wěn)定性、有效性、可靠性大小的主要標(biāo)志,是用人工智能的快速搜索比對還是運籌學(xué)的優(yōu)化修剪計算,這是一個值得人機領(lǐng)域深究的問題。
不可靠的部件可以組成可靠的系統(tǒng),反之,可靠的部件可以組成不可靠的系統(tǒng)也常常發(fā)生。這也許正是人為什么會犯錯誤(有意或無意)的主要原因吧。機器呢?由于小系統(tǒng)的單純性,錯誤常常是可以在一定程度上減少的,一旦系統(tǒng)復(fù)雜性不斷提高,組成的多系統(tǒng)之間的前/反饋(剛性、柔性)系統(tǒng)往往混在一起,可靠的部分會漸漸變成不可靠的整體。西蒙對此提出了一個聰明的對策:有限的理性,即把無限范圍中的非概念、非結(jié)構(gòu)化可以延伸成有限時空中可以操作的柔性的概念、結(jié)構(gòu)處理,這樣就可把非線性、不確定的系統(tǒng)線性化、滿意化處理。
赫伯特·亞歷山大· 西蒙
語言與信息
1956年9月MIT的一次會議上,喬姆斯基(N.Chomsky)的論文“Three Models for the Description of Language”和紐厄爾(A.Newell)與西蒙(H.A.Simon)的論文“The Logic Theory Machine”(IRE Transactions on Information Theory, IT-2, no.3(September 1956))都是最初提交的,此事標(biāo)志著現(xiàn)代轉(zhuǎn)換語法和信息處理心理學(xué)這兩個理論體系從誕生(自同一母體 —— 即現(xiàn)代數(shù)字計算機的發(fā)展激發(fā)出的思想所組成的母體)起就具有密切的關(guān)系:雖然計算機是用硬件體現(xiàn)出來的,但它的靈魂是程序(機器的語言)。
對于人類而言,兒童的語言或信息學(xué)習(xí)常以模仿為主,詞語或認(rèn)知組塊能力較低,大多通過重復(fù)和比較實現(xiàn),而成人的學(xué)習(xí)常以自主為主,詞語或認(rèn)知組塊能力較高,大多通過檢索、遷移實現(xiàn)。
在特定的情境下,人的信息認(rèn)知是有差異的,正如看同一部電影、聽同一首歌、讀同一首詩、吃同一樣食物、撫摸同一個人的頭發(fā)、聞同一朵花香,評價一個事情等,總體上,這是一一對應(yīng)的,即一一映射關(guān)系,是個體的主觀體驗與客觀現(xiàn)實之間不斷交互修正的結(jié)果,其過程是獨立的;人類的各種語言是有局限性的,用音樂、詩歌、圖、畫、表情、肢體動作等方式可以彌補或完善其準(zhǔn)確性,同時也可能增強抑或是加大其模糊性,簡而言之,生活語言模糊性較大,社會化語言準(zhǔn)確性較高。
語法在語言學(xué)習(xí)中的作用是有局限的,孩子在最初的學(xué)習(xí)語言過程中是沒有太多的語法概念的,他們是根據(jù)外部的客觀刺激進行信息輸出,他們沒有約束地建立起自己的注意和理解方式,當(dāng)咿咿學(xué)語時,最初的也不是規(guī)范的語法指導(dǎo),正常情境下是父母自然性的字詞或短語說明,最后才有生活句子學(xué)習(xí)、建立,當(dāng)在學(xué)校進行系統(tǒng)語法學(xué)習(xí)時,很多語言的自然屬性紛紛被規(guī)范化、程序化、大眾化,而說者意圖表達(dá)的個性、獨立性、準(zhǔn)確性同時在減弱、下降;語法可能是在一般情境下正常交流的規(guī)范,是一種消弱個人意指性的規(guī)則體系,對社會來說,這可能是優(yōu)點,對個人而言,這也是缺點。
在正常生活面對面交流過程中,語言的語調(diào)等可以使人準(zhǔn)確地理解彼此的真實意圖,“討厭”這個詞被賦予不同音調(diào)時,一般都能知道其真實情感表達(dá),而在目前網(wǎng)絡(luò)文字交互表達(dá)中,雖然也可以結(jié)合上下文進行情感判斷,但在較復(fù)雜的連續(xù)的多人干擾的無音調(diào)的實時交流環(huán)境下,這種情感判斷的準(zhǔn)確性往往會大打折扣,常常會演變成更豐富的多維理解,進而增強了非單一映射關(guān)系。
人機相比,人的語言或信息組塊能力強,有限記憶和理性;機器對于語言或信息組塊能力弱,無限記憶和理性,其語言(程序)運行和自我監(jiān)督機制的同時實現(xiàn)應(yīng)是保障機器可靠性的基本原則。人可以在使用母語時以不考慮語法的方式進行交流,并且在很多情境下可以感知語言、圖畫、音樂的多義性,如人的聽覺、視覺、觸覺等具有辨別性的同時還具有情感性,常常能夠知覺到只可意會不可言傳的信息或概念(如對哲學(xué)這種很難通過學(xué)習(xí)得到學(xué)問的思考)。機器盡管可以下棋、回答問題,但對跨領(lǐng)域情境的隨機應(yīng)變能力很弱,對彼此矛盾或含糊不清的信息不能反應(yīng)(缺少必要的競爭冒險選擇機制),主次不分,綜合辨析識別能力不足,不會使用歸納推理演繹等方法形成概念、提出新概念,更奢談產(chǎn)生形而上學(xué)的理論形式。
人與機器在語言及信息的處理差異方面,主要體現(xiàn)在能否把表面上無關(guān)之事物相關(guān)在一起的能力。盡管大數(shù)據(jù)時代可能會有所變化,但對機器而言,抽象表征的提煉亦即基于規(guī)則條件及概率統(tǒng)計的決策方式與基于情感感動及頓悟冥想的判斷(人類特有的)機理之間的鴻溝依然存在。
人機交互是人類發(fā)展到一定階段而必然產(chǎn)生的一門學(xué)科,她既包括人,也包括機和環(huán)境兩部分,所以也可以說是人機環(huán)境系統(tǒng)方面的一種學(xué)問。她同樣“有一個漫長的過去,但只有短暫的歷史。”—— 她的起源可以追溯到舊石器時代類人猿的工具制造,在歷經(jīng)了許多歷史時期之后,她的歷史可以說是在第一、二次工業(yè)革命浪潮中逐漸拉開的序幕。弗雷德里克·泰勒(Frederick Taylor,1856-1915)的《科學(xué)管理原理》誕生了現(xiàn)代意義上的工效學(xué)(Ergonomic,人機工程在歐洲的泛稱),第一、二次世界大戰(zhàn)大大加快了該學(xué)科發(fā)展的進程,劍橋大學(xué)圣約翰學(xué)院的伊萊斯(Gordon Iles,1908-1983) 和克雷克(Kenneth Craik,1914-1945)二人1940年研究的劍橋飛機座艙模擬器(Cambridge Cockpit)基本確定了人機研究的方式和趨勢 —— 人、機、環(huán)境諸多學(xué)科的交叉融合并進,20世紀(jì)50年代興起的認(rèn)知科學(xué),進一步把人機領(lǐng)域的研究范圍擴展到了人類學(xué)習(xí)、生活、工作的方方面面,到目前為止,研究人機的學(xué)科粗粗算來,不但包括生理、心理、物理、數(shù)理、地理等自然科學(xué)技術(shù)領(lǐng)域的知識,而且還應(yīng)涉及到哲理、倫理、法理、藝?yán)?、教理等人文藝術(shù)宗教領(lǐng)域的道理。
總之,人機的研究不僅僅研究脖子以下的部分,更重要的是脖子以上的部分,這是人機研究的前景和趨勢。
【編者按】作者@劉偉 ,北京郵電大學(xué)自動化學(xué)院崗位教授,北京航空航天大學(xué)人機與環(huán)境系統(tǒng)工程工學(xué)博士,劍橋大學(xué)訪問學(xué)者。北京郵電大學(xué)人機交互與認(rèn)知工程實驗室主任。
雷峰網(wǎng)原創(chuàng)文章,未經(jīng)授權(quán)禁止轉(zhuǎn)載。詳情見轉(zhuǎn)載須知。