12
按:作者高飛龍,北大研究生畢業(yè),圍棋業(yè)余5段,本文更新于作者知乎。
渴求真理的好奇心,是人類前進的永恒驅(qū)動力。而宇宙的廣袤及世界的龐大,又是人的想象力和行動力所難以企及的。
還記得那個流傳了數(shù)千年的故事嗎?
印度的某位國王要獎賞國際象棋的發(fā)明者,發(fā)明者提要求說:“在國際象棋棋盤的第一格里放一顆麥子,第二格里放兩顆麥子,第三格里放四顆麥子......依此類推,每下一格的麥子數(shù)是上一格的兩倍,放滿全部64個格子,將這么多麥子獎賞給我就行了。”
然而國王卻發(fā)現(xiàn)這是一個他想象不出有多大的數(shù)字,即使將全國的麥子都拿來也擺不滿哪怕半個棋盤。
我們大家應(yīng)該都是在小學(xué)時就知道這個故事了,也知道這個數(shù)字其實是個天文數(shù)字。
實際上,這個數(shù)字大小為:1+2+2^2+2^3+...+2^63=18446744073709551615
這是一個普通的科學(xué)計算器都無法完全顯示的數(shù)字。
而國際象棋的全部合法局面數(shù)(可能對局數(shù)還要更多一些數(shù)量級),量級為:10^46=10000000000000000000000000000000000000000000000,面對這個比剛才那個數(shù)字更長的數(shù)字,請大家體會一下這個全世界最流行的棋種的博大。
但上面那個數(shù)字并不是大家可以借助實物去想象的最大數(shù)字。在現(xiàn)在的天文學(xué)研究中,根據(jù)一定的理論模型,已經(jīng)可以大致估計出宇宙中的總物質(zhì)量。
上世紀初,曾經(jīng)的英國劍橋大學(xué)天文臺臺長、世界級著名天文學(xué)家亞瑟·艾丁頓,估算出了宇宙中質(zhì)子總數(shù)的量級,這個數(shù)字為:136*2^256=15747724136275002577605653961181555468044717914527116709366231425076185631031296。這個數(shù)字也被稱為“艾丁頓數(shù)”。
雖然這個精確數(shù)字只是估算值的展開,與現(xiàn)實情況可能不相等,但量級應(yīng)該大致是一樣的。
想象一下,在我們的宇宙中,一共有著這么多的質(zhì)子,這么多的物質(zhì)。
這就是我們的整個宇宙。
本來就聞名世界,最近更是賺足了全世界人類眼球的美國谷歌公司,其英文名google其實是從googol演化而來的,而后者其實是一個數(shù)字:googol=10^100=1000000000000000000000000000000000000000000000000000000000000000000000000000000000000000000。
這是一個比上面的宇宙全部質(zhì)子數(shù)更大的數(shù)字,我從這個數(shù)字中,體會到了谷歌創(chuàng)始人們對未知世界的好奇心,以及探究未知世界的野心。
而就在距今不久之前,荷蘭國立數(shù)學(xué)和計算科學(xué)研究所的科學(xué)家John Tromp,計算出了一個數(shù)字:208168199381979984699478633344862770286522453884530548425639456820927419612738015378525648451698519643907259916015628128546089888314427129715319317557736620397247064840935≈2.08*10^170
上面那個數(shù)字,就是圍棋在19路棋盤的條件下,全部合法局面數(shù)的精確值(實際可能對局數(shù)還要遠高于這個數(shù)量級)。
大家感覺如何?
我擺出這幾個數(shù)字不是為了嚇唬誰,或者顯示我的數(shù)學(xué)很好,而是因為如果我在沒有對比的情況下直接擺出最后這個數(shù)字,大家很難憑借人類自身的想象力,體會它的巨大。
在數(shù)學(xué)形式上有窮,而在實際操作中等效于無窮,這就是圍棋的變化空間。
說到底,按照上面提過的相關(guān)數(shù)字,宇宙也不過是有窮的,而我們?nèi)祟惏l(fā)明“無窮”這個詞,也不過是為了在我們自身想象力、計算力和行動力都有限的情況下,表達和體會那種我們自身無法企及的幾乎“無限”的巨大。
大家覺得,哪怕耗盡人類在宇宙中存在的全部時長,憑借我們現(xiàn)在還無法想象的未來科技進步,有可能窮盡這個數(shù)字所代表的19*19路棋局數(shù)嗎?
我不知道。
提起圍棋,容易立刻想到的除了它龐大的變化空間之外,就數(shù)其簡單而樸素的規(guī)則了。
圍棋的規(guī)則大致可以簡單歸納為以下三條:
1、黑先白后交替落子于交叉點上,最終占點多者為勝,且黑貼白目以平衡先手優(yōu)勢。
2、與子相鄰的空點為其氣,氣盡則亡,無氣點禁入。
3、禁止全盤同型,即在一局棋中,棋盤上不可出現(xiàn)之前出現(xiàn)過的棋型,以避免棋局陷入循環(huán)。
圍棋就是建立在如上的簡單規(guī)則上的世界,從這幾條規(guī)則開始演化出眼、兩真眼成活、簡單對殺規(guī)則等一系列可以用數(shù)學(xué)語言精確表達出的規(guī)律。
以獲取全盤勝利為最終目的,在這些第一層的規(guī)律之上,又有著更多的規(guī)律,這些規(guī)律形成和解釋了從空白的開局開始直指最終勝利的最優(yōu)解。
而且,不只是從空棋盤開始,對黑白任何一方來說,從任何一個可能局面開始,直達最終的最大期望獲勝目數(shù),都有最優(yōu)解,而且一般都是很多條路。
人類在自身計算力有限的前提下,為了追求獲勝,并進一步在此基礎(chǔ)上追求最優(yōu)解,不得不依據(jù)自身的經(jīng)驗和邏輯總結(jié)和提煉出了無數(shù)的下棋規(guī)律。
這些規(guī)律經(jīng)歷無數(shù)代人的傳承和發(fā)展,不斷地揚棄,并一層一層的迭代起來,形成了現(xiàn)在我們所知的圍棋理論。
看到這里,大家明白了嗎?
從規(guī)則定下來開始,圍棋的規(guī)律就是客觀存在的了,甚至可以說是客觀真理。而人類的圍棋理論,是基于自身經(jīng)驗和邏輯的總結(jié)和推演,是主觀的,未必與客觀真理完全相符的。
一直以來,在人類當中,越是擅長在棋盤上戰(zhàn)勝他人的人,也即棋力越強的人,自然也就是掌握和踐行規(guī)律越多越合理的人。甚至可以說,是離真理越近的人。
讓我們想象一下,有一位能夠窮盡圍棋所有變化的“圍棋上帝”,能夠獲知將所有棋局導(dǎo)向最大期望勝利的全部最優(yōu)途徑,那他也就能在任何局面下下出最優(yōu)解。
這最優(yōu)解,就是我們俗稱的“神之一手”。
無數(shù)代人類所追求的每個局面下的最佳一手,也就是最能導(dǎo)向勝利的一手,就是這個“神之一手”。對“神之一手”的追求,也即單個局面最優(yōu)解的追求,迭代起來也就組合成了對全局最優(yōu)解的追求。人類對“神之一手”的追求,歸根結(jié)底是對棋盤上的真理的追求。
我們?nèi)祟愑袝r候也能下出“神之一手”,雖然我們并不確定那到底是不是“神之一手”。
但我們知道,如果是這位代表客觀真理的“圍棋上帝”來下,它的每一手,都將是“神之一手”。但我們知道,如果是這位代表客觀真理的“圍棋上帝”來下,它的每一手,都將是“神之一手”。
人力有窮,而人的創(chuàng)造力無窮。
有一天,我們創(chuàng)造出了計算力遠大于自身的計算工具,我們可以憑借其更好地追求“神之一手”,更好地追求每個局面下乃至全局的最優(yōu)解,更好地追求棋盤上的客觀真理。那我們會因為自己沒有工具計算得更快更準而放棄對真理的追求嗎?
我們派工具去追求真理,難道最終不是為了自己更好地獲知真理嗎?難道我們只是讓工具自己去追求真理嗎?我們制造天文望遠鏡,難道是為了讓望遠鏡自己接收光線,讓它自己去“看”星空嗎?難道不是為了讓我們自己看的更遠嗎?
我相信,人類渴求真理的好奇心永遠都不會停止前進。而僅就圍棋來說,哪怕只是在19*19路的圍棋盤上,這空間也足夠人類窮盡整個生存歷史時長都無法全部探明。
多元化,不僅是人類社會不斷繁榮的象征,更是整個世界降低存續(xù)風險的有效方式。
我曾在臺北的圓山飯店見過這樣一桌菜:有田園和風活鮑魚、松茸三寶魚翅盅、蒜蓉鮮露蒸大明蝦、壕皇鵝掌燒花膠、澳洲御制牛小排、金華火腿海鮮皇、天麻雪蛤蒸烏雞、原籠櫻花蝦東坡骨米糕等八個菜。
現(xiàn)在,假設(shè)你最喜歡吃的是澳洲御制牛小排,那么你是愿意吃上面那個八個不重樣菜的一桌呢,還是愿意吃只有八份你最喜歡吃的澳洲御制牛小排、而別的什么都沒有的一桌呢?我想正常人類都不會給出第二種答案吧。
其實,這在微觀經(jīng)濟學(xué)的消費者理論中,是一個非常簡單的現(xiàn)象。
如果你對這個理論感到陌生,不妨看看上面的這張圖。圖中橫軸和縱軸分別代表一位消費者小石頭喜歡或者需要的兩種商品。而I1、I2、I3這三條曲線,則代表小石頭個人偏好的無差異曲線,經(jīng)濟學(xué)理論和行為學(xué)研究實踐都指出,絕大多數(shù)這種時候人的無差異曲線都是如圖中這樣下凸的。
這三條曲線從低到高,分別代表了小石頭不斷提升的滿足感。
而直的線段AB,表示他的預(yù)算集,也就是他在能力范圍內(nèi)能夠得著的消費選擇。而A、B、M、N、C等五個點,就是他在能力范圍內(nèi)的五種代表性消費選擇。A點顯然表示小石頭把所有錢都花在X2而一點X1都不買,而B點則完全反之。我們完全看不到這兩個點在什么偏好曲線上,總之肯定是在很低的曲線上。而M和N則分別代表小石頭將絕大部分的錢花在一種商品上,而只選擇很少的另一種商品。我們可以看到這兩個選擇處在曲線I1上,這是小石頭現(xiàn)在的滿足度。
代表最高滿足的度的選擇在哪里?是C,它位于小石頭所能達到的最高偏好曲線I2上,代表小石頭大致均衡的選擇了兩種商品。
這種現(xiàn)象,被大量的消費者行為學(xué)研究實踐所支持,并得到了行為心理學(xué)上的充分解釋。對著一張圖啰嗦地講了這么久,其實不過是這么一個簡單的道理:面對大量自己喜好或需要的東西,人類總是傾向于什么都選擇、什么都留下一點,而不會將所有資源都孤注一擲的投到某一種東西上,而放棄其他的全部。
也即人類偏好多樣性。你以為只有人類才偏好多樣性嗎?其實“上帝”也這樣。
自生命起源以來,從原核生物的時代開始,生命就向著不同的方向進化,不斷的進化出新的形式,品種變得越來越豐富。
經(jīng)歷億萬年直到今天,才成為我們所看到的這個擁有豐富物種的生態(tài)圈。
越是擁有豐富的物種,越是存在多樣化的進化方向,才最能夠在環(huán)境變遷時保證生命不被全部摧毀。
在金融學(xué)上,這是簡單的分散風險,而造物主顯然很擅長“投資”。當很多人談?wù)撈鹌孱愴椖康膹?fù)雜性時,經(jīng)常喜歡將幾大棋類放在一起對比。就現(xiàn)有的世界性智力運動來說,受到公認的有四項棋類運動,而他們的合規(guī)復(fù)雜度排行為:圍棋 > 中國象棋 > 國際象棋 > 國際跳棋
棋類運動作為人類追求智力開發(fā)的產(chǎn)物,既然圍棋的復(fù)雜度最高,那是不是留下圍棋就行了?其他比圍棋簡單的都不要了?盡管我本人可能屬于圍棋的領(lǐng)域,也希望更多的人可以接觸到圍棋,但我絕不希望活在一個只有圍棋,而沒有象棋和跳棋的世界里。甚至連孩童都能懂得這個道理。
隨著科技革命的大爆炸,人類社會中的領(lǐng)域和行業(yè)將愈加豐富。很多人都懼怕著隨著人工智能的發(fā)展,很多領(lǐng)域和項目將被“消滅”。可我認為會被取代的只有舊行業(yè)中的重復(fù)性機械勞動,人工智能的發(fā)展最終是為了將人從這種勞動中解放出來,從而能有更多的時間精力去做那些更有創(chuàng)造性的工作。
人工智能領(lǐng)域的發(fā)展,不是為了“消滅”其他領(lǐng)域,當然也不會“消滅”圍棋。
人工智能相關(guān)的程序員和科學(xué)家們,要做的是創(chuàng)造新事物并改變世界,而不是為了消滅世界或者世界的一部分。甚至像很多新興的交叉領(lǐng)域一樣,隨著人工智能領(lǐng)域的發(fā)展,它和圍棋領(lǐng)域的重疊也會加強,甚至成為一個真正的交叉領(lǐng)域。
Google和Deepmind傾盡全力發(fā)展人工智能圍棋程序,不是僅僅為了在圍棋盤上創(chuàng)造出能擊敗人類的人工智能程序,而是為了借助圍棋為工具來開發(fā)未來的“通用機”。
而面對圍棋,就像曹政老師一直提醒我們的那樣,是“降維打擊”。但“降維打擊”只是事實全貌的一面而已。
最近,已經(jīng)有多位機器學(xué)習領(lǐng)域的朋友主動對我說,將來如果有條件,很愿意參加將深度神經(jīng)網(wǎng)絡(luò)習得的圍棋規(guī)律翻譯給棋手們的項目,同時他們也表示,這對人工智能領(lǐng)域本身也是極其重要的課題。破解DNN的“黑盒”屬性,的確對整個人類都非常重要。這不僅將深刻的影響人工智能領(lǐng)域和圍棋領(lǐng)域,而早晚會影響到其他的領(lǐng)域,直至世界的方方面面。
當我將這些話轉(zhuǎn)述給一些職業(yè)棋手時,他們大多感到非常激動。而其實一小部分圍棋界乃至其他棋界的人士在很早之前,就已經(jīng)意識到了這個交叉領(lǐng)域的重要意義,并親自參與甚至投身到了相應(yīng)的研究和討論中去。比如當年的陳志行教授,曾經(jīng)的俞斌九段、余平六段,近幾年的李喆六段等人,還有大量現(xiàn)在轉(zhuǎn)入程序員領(lǐng)域的曾經(jīng)的沖段少年。
甚至連這次的AlphaGo背后的男人哈薩比斯和黃士杰等,也都有棋手背景,要么是國象大師,要么是圍棋的業(yè)余高段。輿論中的一些表面上的對立只是兩個領(lǐng)域中,少數(shù)有話語權(quán)的偏激人士半當真半炒作地種下的種子,而又經(jīng)過大量媒體誘導(dǎo)宣傳造成的假象。將來,在這個交叉領(lǐng)域,將充滿共識與合作。
人工智能的發(fā)展不會破壞或降低人類社會的多樣性,而只會反之。不斷對內(nèi)追求自我提升的主觀愿望,是人類之所以進化為人類的重要原因。
奧林匹克格言“更快、更高、更強”是這種主觀愿望的一種最為簡單粗暴的表達方式。
而在此之上,其實還有奧林匹克精神所定義的“理解、友誼、團結(jié)和公平競爭”。
簡單粗暴的競爭,為什么還會有后面這種虛化的精神追求呢?
其實這種追求在東方哲學(xué)中,自古至今都是重要的內(nèi)容。儒家對內(nèi)的自我提升和個人修養(yǎng),道家追尋的內(nèi)心寧靜和順法自然,還是墨家恪守的道義、釋家追求的頓悟,都是在不斷地追求個人精神力乃至整個精神境界的提升。
因此人類對自我提升的追求,不但有體力鍛煉的追求,還有智力鍛煉的追求,以及精神力鍛煉的追求。人類互相之間的競爭,最終追求的是戰(zhàn)勝自我。個人的戰(zhàn)勝自我意味著進步,而人類整體的戰(zhàn)勝自我則意味著進化。
為什么我們創(chuàng)造出會下圍棋的人工智能程序,然后又會去跟它比賽?還會努力戰(zhàn)勝它,并為了戰(zhàn)勝它而感到高興?
這并不是說人類是自相矛盾的動物,一邊前進一邊拒絕前進,而是這壓根就是兩個維度的問題。程序員們創(chuàng)造出人工智能,是對不斷提升人類創(chuàng)造力的追求;而棋手乃至運動員們自我鍛煉并參加比賽,是對提升體力、智力和精神力等純?nèi)祟愖晕乙蛩氐淖非蟆?strong>正如我們跳高時越過了自己擺好的桿子,我們難道不會覺得高興嗎?
而當李世石在身心俱疲、壓力如天,同時幾乎所有人對他感到絕望時,他卻仍然以堅韌的意志力和強大的實力不懈的追趕,在絕境的狹縫中覓得生機,用“神之一手”從更強大的對手手中奪得了一盤寶貴的勝利,并在這比賽過程中挑戰(zhàn)了人類自身的極限,這難道不是人類追求自我提升的最好表現(xiàn)嗎?
我們?yōu)榇烁械礁袆?,對此表示崇敬和贊揚,并不意味著對對手的貶低和仇視。我們?yōu)榇烁械礁袆?,對此表示崇敬和贊揚,并不意味著對對手的貶低和仇視。
不急左就急右,認為世界是非黑即白的,所有立場都是對立的,這是幼稚的孩子氣。圍棋除了爭勝之外,代代傳承的棋道規(guī)范也是極為重要的內(nèi)容,而棋道規(guī)范的核心就是尊重。這尊重包括尊重對手、尊重自己,還有尊重圍棋,尊重一切存在。
未來,我們還將不斷的創(chuàng)造出新的更強的人工智能圍棋程序;我們還將繼續(xù)與之比賽,努力地戰(zhàn)勝它,并尋找它的毛病和弱點;我們還將繼續(xù)修正和彌補這些毛病,讓人工智能變得更強;我們還將向人工智能學(xué)習,以讓自己變得更強;更強的我們還與更強的人工智能不斷競爭,以追求更多的自我提升。
以上過程將在未來的歷史中循環(huán)往復(fù),其存在的長期性在于其邏輯是自洽的。因此競技圍棋永不會褪色,人類永遠不會放棄借助圍棋追求自我提升。而人工智能,將成為我們憑借的更好工具。
人工智能,絕不會成為人類追求自我提升的阻礙,而只會給我們帶來新的工具和標桿。人工智能在棋盤上戰(zhàn)勝人類,也絕不會磨滅人類在棋盤上追求將自己變得更強的愿望,而只會成為我們鍛煉的良好工具。
你問我圍棋的未來如何,這就是我的答案。
也有朋友曾提醒過我,你是不是過于樂觀了?可我一向都是這樣樂觀。我堅信所有的愚昧、偏見、傲慢、誤解與疑惑都終將湮沒在歷史的塵埃中,留下的只有人類的進步。
最后,我想要恭喜Google、Deepmind和昨天剛被授予名譽九段的AlphaGo。
AlphaGo“九段”,歡迎來到這個世界并加入我們。
雷峰網(wǎng)原創(chuàng)文章,未經(jīng)授權(quán)禁止轉(zhuǎn)載。詳情見轉(zhuǎn)載須知。