丁香五月天婷婷久久婷婷色综合91|国产传媒自偷自拍|久久影院亚洲精品|国产欧美VA天堂国产美女自慰视屏|免费黄色av网站|婷婷丁香五月激情四射|日韩AV一区二区中文字幕在线观看|亚洲欧美日本性爱|日日噜噜噜夜夜噜噜噜|中文Av日韩一区二区

您正在使用IE低版瀏覽器,為了您的雷峰網(wǎng)賬號(hào)安全和更好的產(chǎn)品體驗(yàn),強(qiáng)烈建議使用更快更安全的瀏覽器
此為臨時(shí)鏈接,僅用于文章預(yù)覽,將在時(shí)失效
專欄 正文
發(fā)私信給人工智能學(xué)家
發(fā)送

2

圖靈測(cè)試先天不足?解決人工智能威脅論爭(zhēng)論的四個(gè)困難

本文作者: 人工智能學(xué)家 2015-09-28 15:55
導(dǎo)語:圖靈測(cè)試為什么不靠譜?人工智能的水平為什么不好判斷?

【編者按】本文是“人工智能學(xué)家”舉辦2015世界人工智能系統(tǒng)智商測(cè)試排名活動(dòng)的第二篇。文章重點(diǎn)闡述了圖靈測(cè)試的先天不足和解決人工智能超越人類智慧爭(zhēng)議面臨的四個(gè)困難。

圖靈測(cè)試先天不足?解決人工智能威脅論爭(zhēng)論的四個(gè)困難

隨著互聯(lián)網(wǎng)大數(shù)據(jù)的興起,以及深度學(xué)習(xí)等機(jī)器學(xué)習(xí)算法在互聯(lián)網(wǎng)領(lǐng)域的廣泛應(yīng)用,人工智能再次進(jìn)入快速發(fā)展的時(shí)期。但是,不同領(lǐng)域的科學(xué)家、企業(yè)家(如物理學(xué)家霍金,微軟創(chuàng)始人比爾蓋茨等)對(duì)人工智能的未來表達(dá)了擔(dān)心,由于他們的影響力,人工智能威脅論因此得到廣泛傳播。

與之相對(duì)地,人工智能領(lǐng)域科學(xué)家對(duì)人工智能威脅論提出了反駁意見,其中就包括Facebook人工智能實(shí)驗(yàn)室主任、NYU計(jì)算機(jī)科學(xué)教授Yann LeCun,百度首席科學(xué)家、斯坦福大學(xué)計(jì)算機(jī)科學(xué)系和電子工程系副教授吳恩達(dá),以及中國科學(xué)院自動(dòng)化所教授、人工智能領(lǐng)域?qū)<彝躏w躍等。

應(yīng)該說人工智能威脅論引發(fā)爭(zhēng)論背后,本質(zhì)上是人工智能的智力發(fā)展水平能不能定量評(píng)測(cè)的問題。對(duì)于這個(gè)問題,前人研究者已經(jīng)做出大量工作。


圖靈測(cè)試的先天不足

測(cè)試人工智能系統(tǒng)是否具有智能最著名的方法是”圖靈測(cè)試“。1950年,圖靈發(fā)表論文《Computing Machinery and Intelligence》提出了“機(jī)器思維”的概念,提出一位測(cè)試者在與被測(cè)試者相互隔離不能進(jìn)行直接交流的情況下,通過信息傳輸,和被測(cè)試者進(jìn)行一系列的問答,在經(jīng)過一段時(shí)間后,測(cè)試者如果無法根據(jù)獲取的信息判斷對(duì)方是人還是計(jì)算機(jī)系統(tǒng),那么就可以認(rèn)為這個(gè)系統(tǒng)具有同人類相當(dāng)?shù)闹橇δ芰?,也就是說這臺(tái)計(jì)算機(jī)是有思維能力的,這就是著名的“圖靈測(cè)試”(Turing Testing)。

圖靈在論文中這樣定義圖靈測(cè)試:

“我們稱下面這個(gè)問題為“模仿游戲”。游戲參與者包括一個(gè)男人,一個(gè)女人,以及一個(gè)任意性別的詢問者。詢問者與另兩個(gè)人待在不同的房間里,并通過打字的方式與他們交流,以確保詢問者不能通過聲音和筆跡區(qū)分二者。兩位被詢問者分別用X和Y表示,詢問者事先只知道X和Y中有且僅有一位女性,而詢問的目標(biāo)是正確分辨X和Y中哪一位是女性。另一方面,兩位被詢問者X和Y的目標(biāo)都是試圖讓詢問者認(rèn)為自己是女性。也就是說,男性被詢問者需要把自己偽裝成女性,而女性被詢問者需要努力自證。現(xiàn)在我們問:如果我們把“模仿游戲”中的男性被詢問者換成計(jì)算機(jī),結(jié)果會(huì)怎樣?相比人類男性,計(jì)算機(jī)能否使詢問者更容易產(chǎn)生誤判?”。

圖靈測(cè)試并沒有定義智能的范疇,而只能作為一個(gè)人工智能的充分條件,關(guān)于這一點(diǎn),圖靈在論文中寫道:

“機(jī)器能否擁有智能,為了回答這個(gè)問題我們應(yīng)該首先定義‘機(jī)器’和‘智能’。一種可能性是根據(jù)大多數(shù)普通人的日常理解去定義這兩個(gè)概念,但這樣做是危險(xiǎn)的。在這里我并不打算定義這兩個(gè)概念,可能有人會(huì)說這項(xiàng)測(cè)試對(duì)機(jī)器而言過于嚴(yán)格 —— 畢竟人類也無法反過來成功偽裝成機(jī)器,這只需檢查算術(shù)的速度和正確度即可辨別。難道被認(rèn)為擁有智能的機(jī)器就不能表現(xiàn)出和人類不同的行為么?這是一個(gè)很有力的反對(duì)意見,但至少不管怎樣,假如我們有能力制造出一個(gè)可以成功通過測(cè)試的機(jī)器的話,也就無需為這個(gè)反對(duì)意見煩惱了?!?/em>

 圖靈測(cè)試先天不足?解決人工智能威脅論爭(zhēng)論的四個(gè)困難

如上圖所示,圖靈測(cè)試與人工智能的關(guān)系可以用集合的概念進(jìn)行闡述。從圖中可以看到“所有人類行為”對(duì)應(yīng)的集合“和所有智能行為”對(duì)應(yīng)的集合有交集但又互有不同。雖然“在全部智能行為”中有部分能力是人類靠自身力量無法完全實(shí)現(xiàn),但人類可以被認(rèn)為是有智能標(biāo)準(zhǔn)體,因此,能達(dá)到“人類水平”的部分,也就是兩個(gè)集合交集的那個(gè)部分,就應(yīng)該被認(rèn)作是“擁有智能”的特征。而且,人類的所有行為并不總是和智能相關(guān)。圖靈測(cè)試要求機(jī)器全面模擬“所有人類行為”,其中既包括人類“智能”的部分,也包括人類的“非智能”行為,由此可得出結(jié)論:通過圖靈測(cè)試是 “擁有智能”的一個(gè)有效的充分條件,而非必要條件或充要條件。(該內(nèi)容引自微軟研究院)

圖靈測(cè)試經(jīng)常用來檢驗(yàn)機(jī)器是否具備人的智能,但總體看,圖靈測(cè)試的方法受人為因素干擾太多,嚴(yán)重依賴于裁判者和被測(cè)試者的主觀判斷,因此往往有人在沒有得到嚴(yán)格驗(yàn)證的情況下宣稱其程序通過圖靈測(cè)試,例如2014年6月英國雷丁大學(xué)客座教授凱文?沃維克宣稱一款名為“尤金?古特曼(Eugene Goostman)”的計(jì)算機(jī)軟件通過了測(cè)試,但是測(cè)試結(jié)果充滿爭(zhēng)議,例如機(jī)器人只要能夠通過30%的評(píng)判標(biāo)準(zhǔn)即可被判定通過圖靈測(cè)試,另外這個(gè)計(jì)算機(jī)軟件通過扮演一名年僅13歲,且第二外語為英語的男孩讓參與測(cè)試的裁判大幅度降低了測(cè)試難度。

中國科學(xué)院自動(dòng)化所研究員王飛躍在“關(guān)于人工智能九個(gè)問題”中也對(duì)圖靈測(cè)試存在的問題進(jìn)行了討論,他的意見主要有以下兩點(diǎn):

  • 人類的智能并不是一個(gè)單一的對(duì)象,而是有多個(gè)類別組成,同樣人工智能對(duì)應(yīng)也是多類別組成。圖靈測(cè)試究竟測(cè)試的那些類別并不明確,從實(shí)踐上看,目前圖靈測(cè)試僅僅局限在語言智能等特定小領(lǐng)域里,不具備代表性。

  • 圖靈測(cè)試并不是考官對(duì)一臺(tái)計(jì)算機(jī)測(cè)試后就可以宣布其是否擁有智能,圖靈測(cè)試的本意是指一個(gè)廣義的人類做個(gè)為整體的考官,其測(cè)試的時(shí)間段也不是具體的一段時(shí)間而是廣義的時(shí)間段,即所有的人類在所有時(shí)間都分辨不出人與機(jī)器之后,才算其人類智能與人工智能等價(jià)。

從上述討論可以看出,圖靈實(shí)驗(yàn)只對(duì)人工智能系統(tǒng)是否具有人類智能回答“是”或“否”,并不對(duì)人工智能系統(tǒng)的發(fā)展水平進(jìn)行定量分析,而且測(cè)試的智能或智力種類還過于單一;在測(cè)試方法上存在漏洞,容易被測(cè)試者找到漏洞從而產(chǎn)生作弊行為??偟膩碚f,圖靈實(shí)驗(yàn)?zāi)壳斑€無法承擔(dān)定量分析智能系統(tǒng)智力發(fā)展水平的需求。


解決人工智能威脅論爭(zhēng)論的四個(gè)困難

2015年3月,Stuart Geman,Donald Geman等研究在National Acad Sciences發(fā)表論文“Visual Turing test for computer vision systems”,提出的視覺圖靈測(cè)試“Visual Turing test”,目的是測(cè)試計(jì)算機(jī)能否能像人類那樣描述一張圖片。

除此之外,2015年1月,在德克薩斯州召開的美國人工智能大會(huì)(AAAI-15)上,學(xué)者專門組織了研討會(huì)(Beyond Turing Test),對(duì)圖靈測(cè)試進(jìn)行深入的討論,并對(duì)智能的評(píng)測(cè)標(biāo)準(zhǔn)提出了新的建議。但是這些測(cè)試也存在分析范圍單一,或無法定量分析的問題。

總體看,目前包括圖靈測(cè)試在內(nèi)的各種方案對(duì)判斷一個(gè)人工智能系統(tǒng)是否和人一樣擁有同等水平的智力、高低程度如何、發(fā)展速度比率如何,上述中研究沒有涉及到可具體執(zhí)行的思路和方案。我們認(rèn)為這些問題長(zhǎng)時(shí)間存在,主要與下面提到的四點(diǎn)困難有關(guān)。

1、沒有統(tǒng)一的模型和測(cè)試方法對(duì)不同的人工智能系統(tǒng)進(jìn)行測(cè)試。人工智能無論從理論研究還是從應(yīng)用實(shí)踐都存在眾多分支和發(fā)展方向。在理論上人工智能分為三大學(xué)派,如符號(hào)主義(Symbolicism)或計(jì)算機(jī)學(xué)派(Computerism);連結(jié)主義或生理學(xué)派(Physiologism);行為主義(Actionism)或控制論學(xué)派(Cyberneticsism)等。在應(yīng)用實(shí)踐上,人工智能可以應(yīng)用的方向包括符號(hào)計(jì)算、模式識(shí)別、機(jī)器翻譯、機(jī)器學(xué)習(xí)、問題求解、邏輯推理與定理證明、自然語言處理、分布式人工智能、計(jì)算機(jī)視覺、智能信息檢索、專家系統(tǒng)等等。

圖靈測(cè)試先天不足?解決人工智能威脅論爭(zhēng)論的四個(gè)困難

每種具體的人工智能系統(tǒng)往往只具備一個(gè)或若干上述提到的功能。例如IBM的深藍(lán)強(qiáng)于計(jì)算能力,在國際象棋方面可以與人類對(duì)手一決高下;沃森系統(tǒng)擁有龐大知識(shí)庫系統(tǒng),因此可以在常識(shí)問答比賽中擊敗人類選手。因?yàn)闆]有統(tǒng)一的模型可以涵蓋這些人工智能系統(tǒng),就無法形成統(tǒng)一的測(cè)試方法進(jìn)行測(cè)試和比較。如圖1.2所示,人工智能系統(tǒng)A 在計(jì)算能力上得分為100,人工智能系統(tǒng)B 在計(jì)算機(jī)視覺識(shí)別上得分為80,人工智能系統(tǒng)C在機(jī)器翻譯測(cè)試得分為90分,我們?nèi)匀粺o法得出結(jié)論A的智力能力高于C,C的智力能力高于B的結(jié)論。

2、沒有統(tǒng)一的模型和測(cè)試方法能夠同時(shí)對(duì)人工智能系統(tǒng)和人類進(jìn)行測(cè)試,這也是當(dāng)前人工智能威脅論產(chǎn)生最重要的原因之一。因?yàn)闆]有人工智能系統(tǒng)和人類智能水平統(tǒng)一的測(cè)量方法,人工智能威脅論宣揚(yáng)者往往將計(jì)算機(jī)或軟件系統(tǒng)表現(xiàn)強(qiáng)大的領(lǐng)域作為標(biāo)準(zhǔn),例如計(jì)算能力,歷史,地理等常識(shí)的掌握能力等,而忽略諸如圖像識(shí)別能力,創(chuàng)新創(chuàng)造的能力,發(fā)現(xiàn)規(guī)律的能力等,對(duì)于這個(gè)原因產(chǎn)生的問題,人工智能威脅論反駁者往往無法拿出定量的數(shù)字結(jié)果進(jìn)行反駁。

目前雖然針對(duì)人類智力能力的評(píng)測(cè)方法已經(jīng)非常成熟,但過去100多年的發(fā)展和改進(jìn)過程中,這些方法并沒有考慮到人工智能系統(tǒng)的特點(diǎn)和發(fā)展水平,因此很難將人類的智商測(cè)試方法拿來測(cè)試人工智能系統(tǒng)。例如目前絕大多數(shù)人工智能系統(tǒng)就無法完成圖1.3所示題目,因?yàn)闇y(cè)試者需要首先識(shí)別圖像中的問題,并與圖中的各個(gè)圖形特征關(guān)聯(lián)起來。做不到這一點(diǎn),回答問題就無法進(jìn)行下去。

圖靈測(cè)試先天不足?解決人工智能威脅論爭(zhēng)論的四個(gè)困難

圖1.4所示的人類智商測(cè)試的題目需要測(cè)試者運(yùn)用鉛筆,鋼筆等工具繪制圖形。用手操作物體完成任務(wù),解決問題是人類普通的能力,但對(duì)大多數(shù)人工智能系統(tǒng)因?yàn)闆]有相應(yīng)輸出系統(tǒng)或操控設(shè)備,于是無法完成圖1.4所示的測(cè)試。

圖靈測(cè)試先天不足?解決人工智能威脅論爭(zhēng)論的四個(gè)困難

3、人工智能系統(tǒng)沒有形成智力發(fā)展水平測(cè)試的標(biāo)準(zhǔn)輸入輸出接口。例如如圖靈測(cè)試的問題問答,IBM深藍(lán)與國際象棋大師的比賽,沃森系統(tǒng)與人類選手進(jìn)行知識(shí)比賽等時(shí),研究人員就需要研發(fā)不同的輸入輸入接口以滿足測(cè)試需求。對(duì)于更多人工智能系統(tǒng),在設(shè)計(jì)時(shí)往往由于只考慮到滿足工作需求,而沒有設(shè)計(jì)和開發(fā)與測(cè)試系統(tǒng)進(jìn)行完整交互的能力,如圖1.5所示。這個(gè)問題如果沒有得到解決,對(duì)于發(fā)展新的統(tǒng)一的人工智能測(cè)試也將帶來困難。

圖靈測(cè)試先天不足?解決人工智能威脅論爭(zhēng)論的四個(gè)困難

4、沒有關(guān)于人工智能智力發(fā)展水平的歷史測(cè)試統(tǒng)計(jì)數(shù)據(jù)。由于針對(duì)人工智能系統(tǒng)一直沒有產(chǎn)生定量分析方法,這個(gè)問題在今天依然存在。因?yàn)闅v史數(shù)據(jù)的缺失,研究者就無法繪制類似圖1.6所示的人工智能系統(tǒng)智力水平的發(fā)展示意圖,也無法將人工智能系統(tǒng)與人類智力發(fā)展水平進(jìn)行比較。因此很難定量的對(duì)未來發(fā)展趨勢(shì)進(jìn)行預(yù)測(cè)。上文我們提到Facebook人工智能實(shí)驗(yàn)室主任Yann LeCun在反駁人工智能威脅論時(shí)雖然給出了相關(guān)發(fā)展趨勢(shì)圖,但因?yàn)椴皇峭ㄟ^歷史數(shù)據(jù)預(yù)測(cè)得來,因此說服力大打折扣。

圖靈測(cè)試先天不足?解決人工智能威脅論爭(zhēng)論的四個(gè)困難

關(guān)于這些問題如何解決,目前各國的人工智能專家都在進(jìn)行研究。這一問題并不是無法解決的,而一旦能夠有更完善的系統(tǒng)對(duì)人工智能系統(tǒng)與人的智力水平作出客觀真實(shí)的比較和評(píng)價(jià)后,人工智能威脅論的說法也會(huì)產(chǎn)生又會(huì)何去何從呢?我們拭目以待。

雷峰網(wǎng)原創(chuàng)文章,未經(jīng)授權(quán)禁止轉(zhuǎn)載。詳情見轉(zhuǎn)載須知。

圖靈測(cè)試先天不足?解決人工智能威脅論爭(zhēng)論的四個(gè)困難

分享:
相關(guān)文章

AItisis

關(guān)注人工智能科技與產(chǎn)業(yè)前沿進(jìn)展
當(dāng)月熱門文章
最新文章
請(qǐng)?zhí)顚懮暾?qǐng)人資料
姓名
電話
郵箱
微信號(hào)
作品鏈接
個(gè)人簡(jiǎn)介
為了您的賬戶安全,請(qǐng)驗(yàn)證郵箱
您的郵箱還未驗(yàn)證,完成可獲20積分喲!
請(qǐng)驗(yàn)證您的郵箱
完善賬號(hào)信息
您的賬號(hào)已經(jīng)綁定,現(xiàn)在您可以設(shè)置密碼以方便用郵箱登錄