0
本文作者: SebastianYuan | 2016-09-22 11:39 |
Sam Kronick 是一名藝術(shù)家,其在奧克蘭工作室的辦公桌前擺放了一列石頭。他打算在這些石頭上畫點什么,但既不用筆也不用紙。他和他的小伙伴 Tara Shi 打算3D 掃描這些石頭,然后使用人工智能軟件繪制石頭輪廓,讓其逐步建立對石頭的認識。
這個項目乍看之下很簡單:嘗試用人工智能軟件進行自然藝術(shù)的創(chuàng)作。但這不失為一個衡量計算機創(chuàng)新能力的辦法。
Sam Kronick 和 Tara Shi 采用的神經(jīng)網(wǎng)絡(luò)是基于一個類人腦的生物神經(jīng)系統(tǒng)而打造。而這種神經(jīng)網(wǎng)絡(luò)需要用大量的數(shù)據(jù)進行建庫訓(xùn)練,比如不同石頭的形狀、大量的網(wǎng)絡(luò)圖片、成千上萬種不同的搜索術(shù)語。而數(shù)據(jù)庫中需要什么類型的數(shù)據(jù)取決于神經(jīng)網(wǎng)絡(luò)的用途。
神經(jīng)網(wǎng)絡(luò)是以分層思考的方式進行處理,每層都會處理當前網(wǎng)絡(luò)正在分析問題的不同方面。舉個例子,如果神經(jīng)網(wǎng)絡(luò)正在學(xué)習(xí)如果識別石頭,其中一層網(wǎng)絡(luò)會生成一個算法嘗試找到石頭的文本描述,而另一層網(wǎng)絡(luò)則會嘗試找到不同顏色的石頭種類。
這樣一來現(xiàn)在的問題就變得棘手了。因為我們很容易測試一個臉部識別程序是否有效。然而,要讓計算機識別石頭卻是十分復(fù)雜的。Kronick 說:
“電腦會提出一系列問題。什么是石頭?石頭最重要的部分是什么?為什么我們建的模型要有這么多石頭?”
Sam Kronick 和 Tara Shi 之所以十分在意這個問題,是因為他們希望能通過神經(jīng)網(wǎng)絡(luò)創(chuàng)作的藝術(shù)作品來揭開人工神經(jīng)網(wǎng)絡(luò)的神秘面紗。為了加快產(chǎn)品的研發(fā)速度,或者用不太恰當?shù)男g(shù)語是使產(chǎn)品更智能,人工神經(jīng)網(wǎng)絡(luò)不斷為大大小小的技術(shù)公司所運用。而使用人工智能進行藝術(shù)創(chuàng)作的藝術(shù)家遠不止 Kronick 和 Shi 兩位。在這一過程中,這些藝術(shù)家們加強了人們對于這項技術(shù)的理解,它開始逐漸成為人們生活中的一部分,替人們做出更好的決定,讓世界變得更加美好。
AI 識圖:有點像和外星人對話
實際上人們開始逐漸接受神經(jīng)網(wǎng)絡(luò)的藝術(shù)成果。
就在今年早些時候,倫敦的一個團隊利用深度學(xué)習(xí)編寫了一首音樂。
而谷歌也展示了其神經(jīng)網(wǎng)絡(luò)技術(shù) DeepMind,讓它生成了一些光怪陸離(魔性)的圖像,大概長這樣:
神經(jīng)網(wǎng)絡(luò)還被用來制作 MV。
網(wǎng)絡(luò)上關(guān)于如何利用神經(jīng)網(wǎng)絡(luò)進行藝術(shù)創(chuàng)作的教程有很多,我們希望看到更多的藝術(shù)成果。
在沉睡數(shù)十年后,神經(jīng)網(wǎng)絡(luò),亦稱為深度學(xué)習(xí)終于開始廣泛使用起來了。因為以前我們數(shù)據(jù)匱乏,而現(xiàn)在是個大數(shù)據(jù)時代,我們擁有大量的數(shù)據(jù)。神經(jīng)網(wǎng)絡(luò)能利用的數(shù)據(jù)越多,其訓(xùn)練成果便會更加有效。如今我們隨處可見神經(jīng)網(wǎng)絡(luò),甚至你都沒有意識到它的存在:
在谷歌搜索圖片的時候;
使用 Skype 翻譯功能的時候;
在 Facebook 上給自己和朋友的圖片點贊的時候;
甚至是召喚 Siri 或 Cortana 的時候。
這項技術(shù)令人激情澎湃但卻又讓人有點頭疼。它不僅給我們帶來了 DeepDream 這類圖像軟件,但同時亦提供了高精度臉部識別的能力。而這意味著私人隱私的終結(jié)。人們的擔憂遠不止這一個。Motherboard 今年早些時候?qū)懙剑骸爱斎斯ぶ悄苘浖鲥e時,我們根本不知道為什么?!彪m然神經(jīng)網(wǎng)絡(luò)的數(shù)學(xué)算法相對簡單,但仍不少指令只由計算機生成,只有計算機能理解。這也就意味著,神經(jīng)網(wǎng)絡(luò)的技術(shù)人員也不一定明白計算機是如何做出決策的。
谷歌旗下的 DeepMind 公司也使用了神經(jīng)網(wǎng)絡(luò)來進行建庫訓(xùn)練計算機,而訓(xùn)練后的計算機竟在極其復(fù)雜的圍棋比賽中打敗人類頂尖高手。DeepMind 被獲準收集英國大量的醫(yī)患數(shù)據(jù),但這些數(shù)據(jù)將作何用 DeepMind 一直遮遮掩掩。
Facebook 也同樣使用了神經(jīng)網(wǎng)絡(luò)來挖掘用戶發(fā)表成千上萬份帖子。在過去的二十年里,建議向軍隊和警務(wù)部門投入神經(jīng)網(wǎng)絡(luò)使用的文章也層出不窮。而我們從商品中獲得的消費者數(shù)據(jù),對科學(xué)家來說無疑是個巨大的金礦。這便是為什么早些年提出的“大數(shù)據(jù)”在近期又再一次火熱起來。但是,這次人們對于人工智能,也就是神經(jīng)網(wǎng)絡(luò)所屬的這個范疇有所疑問:我們應(yīng)該對神經(jīng)網(wǎng)絡(luò)以及它的信息來源給予多少信任?
Kronick 對于神經(jīng)網(wǎng)絡(luò)的興起表示擔憂。那些研發(fā)人員總是相信“如果給系統(tǒng)輸入的數(shù)據(jù)是好的,設(shè)計系統(tǒng)的意圖也是好的,那么最后系統(tǒng)返回的結(jié)果必定是好的,這對世界的影響將是積極的,也是寶貴的?!彪m然是這么說,但 Kronick 在的使用過程中并沒有出現(xiàn)什么問題,神經(jīng)網(wǎng)絡(luò)一直很酷炫且不斷在進步。
今年三月份,Kronick 和 Shi 發(fā)布了另一個神經(jīng)網(wǎng)絡(luò)項目 AI*Scry --一款 App 。他們戲稱為“外星人思維控制的遠程可視軟件。AI*Scry 使用了斯坦福大學(xué)開發(fā)的“神經(jīng)交談”網(wǎng)絡(luò)和微軟的數(shù)據(jù)庫,它可以分析手機指著的任何物品,并做出相應(yīng)的描述反饋給你。但是據(jù)許多用戶反饋,這款 App 經(jīng)常出錯:它對物品的描述有一定程度的抽象并帶有自己的理解。比如說,此時我正用手機指著身下的這張藍綠色沙發(fā),軟件給出的描述就十分抽象:“一張手腕搭在椅子上的圖像,一列火車駛離的場景,一瓶在用電腦的可口可樂?!?/p>
砧板上放著一份披薩和一把刀;
桌上放著一把剪刀和一把勺子;
一個有著紅色牙刷頭和紅色把手的紅色牙刷;
玩具熊的旁邊有一張床,床上躺著一只貓
一只貓蓋著毯子躺在床上;
一只黑貓?zhí)稍诖策叺拇采希?/em>
一只貓坐在床上的枕頭上;
玩具熊的旁邊有一張床,床上躺著一只貓;
一只貓裹著毯子坐在床上
AI*Scry 對筆者所養(yǎng)之貓的描述
藝術(shù)家 Kyle McDonald 在阿姆斯特丹使用神經(jīng)網(wǎng)絡(luò)進行視頻錄制時也遇到了同樣的問題。神經(jīng)網(wǎng)絡(luò)對某些事情的判斷挺準確,但也經(jīng)常犯一些低級錯誤引得人們哈哈大笑。比如,把一盒甜甜圈認成一盒三明治,把走路的人認成在騎滑板。
這種對真實世界的曲解正是這些藝術(shù)家們想要揭露的事實。這些神經(jīng)網(wǎng)絡(luò)系統(tǒng)產(chǎn)生的曲解源自程序開發(fā)者對事物的偏見,因為神經(jīng)網(wǎng)絡(luò)系統(tǒng)是用開發(fā)者所選的圖像來進行訓(xùn)練的。這就是為什么這個系統(tǒng)在某些場合下能辨認出這個物體,而換了一個場合它就可能辨認不出,甚至鬧笑話了。在現(xiàn)實生活中確實存在這種問題,舉這個例子我沒有任何冒犯的意思:2015年,有人在谷歌圖片搜索大猩猩時出現(xiàn)了黑人的照片,這或許是因為谷歌數(shù)據(jù)庫里沒有足夠的黑人圖像數(shù)據(jù),也有可能因為谷歌的大部分雇員都是白人。
Kronick 告訴筆者:“我們可以利用藝術(shù)來了解事情真相”。
AI*Scry 項目發(fā)起時,Kroncik 告訴 TechCrunch 說:“這個系統(tǒng)的設(shè)計是一個完整的鏈條,我們有設(shè)計師、勞工和白領(lǐng)。他們用經(jīng)驗來告訴系統(tǒng)哪些數(shù)據(jù)有用,哪些數(shù)據(jù)沒用。”
William Gibson 的科幻小說《幽靈國度》里這樣寫道:“通常,一門新技術(shù)的發(fā)展情況應(yīng)該是這樣:最有趣的應(yīng)用不是在戰(zhàn)場上誕生,就是在畫廊中出現(xiàn)。”也正是基于這種情感,Data & Society 研究機構(gòu)的研究員Tim Hwang 在人工智能及其政策上反復(fù)勸告谷歌。Hwang 把機器學(xué)習(xí)藝術(shù)比作軍事研究與計算機圖形研究中產(chǎn)出的早期計算機藝術(shù)。
Hwang 稱機器學(xué)習(xí)的研究員們看到這篇文章會很高興。
“人們對于把人工智能應(yīng)用于文化領(lǐng)域這一想法十分激動,因為長久以來它只是一種技術(shù)生產(chǎn)工具。在研究深層學(xué)習(xí)的這群人里,有這樣一種認知正在逐漸萌芽:不管我們的目的是什么,更重要的是要用恰當?shù)男g(shù)語讓民眾理解它,而且要讓更多的民眾能使用它?!?/p>
實現(xiàn)這一設(shè)想指日可待。不僅藝術(shù)家們也在嘗試著闡明這些系統(tǒng)的工作原理。一些可控的機器學(xué)習(xí)項目,如 Andrej Karpathy 和藝術(shù)家兼程序員的 Gene Kogan 所推廣的項目,也開始面向民眾開放。
“專業(yè)的”文字工作者
圖像只是藝術(shù)家們在神經(jīng)網(wǎng)絡(luò)中主攻的一個小方向。作家,尤其是科幻小說作家可就如魚得水了。六月上旬,一部名為《Sunspring》的短片在 Ars Technica 網(wǎng)站首映。這部短片引起了極大的關(guān)注,因為它是由一個名為 Benjamin 的人工智能所完成的創(chuàng)作,Benjamin 事先一直以科幻小說劇本進行建庫訓(xùn)練。(硅谷的家庭劇明星 Thomas Middleditch 在這部9分鐘的短片中飾演男主。)
在片中,時間設(shè)定在模糊的未來,穿著金色夾克的 Middleditch 和另外兩個角色在房間里講著 Benjamin 所寫的臺詞,時而眉頭緊鎖時而露出輕松愉快的面容。這部短片最引人的地方就在于它的演員和那偶爾語無倫次的對話。這部短片的臺詞對計算機來說有其自己的意思——“在未來,失業(yè)率居高不下,年輕人不得不靠賣血維生。我也只能這么做了?!薄偟膩碚f,這部短片的編劇確實很專業(yè)。如果你不用眼睛看,純靠耳朵聽或從書中讀的話,這部短片的神奇之處也就不復(fù)存在了。
H 從架子上拿下了一本書,邊說邊翻,不一會就翻完了,于是他又把它放了回去。
H 說:“在未來,失業(yè)率居高不下,年輕人不得不靠賣血維生。我也只能這么做了?!?/em>
H2 說:“你應(yīng)該閉上你的嘴,看著這群男孩們。我現(xiàn)在應(yīng)該100歲了才對?!?/em>
H 說:“我又看見他了。你出現(xiàn)的這個方式...確實是一個好主意。我的未來沒有希望?!?/em>
C 說:“好吧,我要到我的腦顱里去一趟。我不知道?!?/em>
他拿起了那個平板,一束綠光照在了他的臉上,好像傳送了一些什么。
Sunspring 的部分劇本
今年早些時候,由神經(jīng)網(wǎng)絡(luò)編寫的一部音樂劇《Beyond the fence》也是一樣,講述的是20世紀80年代的反戰(zhàn)主義者。由于沒有演員,這些臺詞讀起來很乏味,像是一首奇怪的僵尸詩:
我的老婆很偉大
這次謀殺是一個奇跡
這個洞更好有如飛翔
我應(yīng)該來點 carbour 時光
我知道它一直在悲傷中流逝
科幻小說作家 Robin Sloan 對人工智能與人類在劇本寫作能力上的差距十分感興趣。他自己發(fā)起了一個神經(jīng)網(wǎng)絡(luò)的輔助項目:一個基于現(xiàn)有神經(jīng)網(wǎng)絡(luò)的人工智能寫作伙伴。它是一款文字處理軟件的插件,通過大量的科幻小說語料庫的訓(xùn)練后,它能根據(jù)人類編劇寫的上一句自己寫出下一句。Sloan 正在嘗試用它來構(gòu)建新劇里的一個角色。
Sloan 說:“整體來看這個角色的劇本是可讀的,但當你進入這個角色時,感覺就會有點奇怪了。如果人們知道故事的這一部分是用這種奇怪的方式寫出來的話,那將十分有趣。”
純靠這個機器的話,它經(jīng)常會寫出如噩夢般的感恩節(jié)菜譜一類奇怪的臺詞。所以后期還需要人類進行梳理,修改那些奇怪的地方,使情節(jié)合情合理。
家住舊金山灣區(qū)的 Sloan 是在與大學(xué)友人的一次交談后才對神經(jīng)網(wǎng)絡(luò)感興趣的。Sloan 說:“他對這項技術(shù)的潛力十分看好,深信它會是一項劃時代的技術(shù)。不僅僅是因為它很酷炫,是新鮮事物,而且這會是一筆非常非常大的生意。”
起初,在科幻小說之前,Sloan 是用的莎士比亞的作品來訓(xùn)練神經(jīng)網(wǎng)絡(luò)的。訓(xùn)練后就是不斷的做細微的調(diào)整。Sloan 說,系統(tǒng)自己根本不知道應(yīng)該往哪里使力,因為它不知道什么才是“酷炫又有趣”的。所以Sloan 一直在不斷的調(diào)整優(yōu)化系統(tǒng),使它寫的劇本朝著怪異、有趣但仍連貫的方向發(fā)展。
這與谷歌、Facebook 的工程師在神經(jīng)網(wǎng)絡(luò)的發(fā)展方向上形成了鮮明的對比,Sloan 就想要他的神經(jīng)網(wǎng)絡(luò)獨豎一幟。Sloan 和神經(jīng)網(wǎng)絡(luò)一起新劇中構(gòu)建的角色仍能表達出他的思想,仍是一部完整的故事。這個神經(jīng)網(wǎng)絡(luò)插件寫出的劇本有種獨特的韻味,使得其塑造角色的語言不那么像人類。但它獨特的人性化寫作本應(yīng)該如此。Sloan 首次公開寫到神經(jīng)網(wǎng)絡(luò)的時候說:“這種有生氣的思維是一種強化方式、一種伙伴關(guān)系,一種對唱應(yīng)答?!?/p>
我們并沒有否認使用神經(jīng)網(wǎng)絡(luò)進行藝術(shù)創(chuàng)作的可能性。Sloan 提出了一個有意思的觀點:在這些案例中,藝術(shù)本身并不是我們使用這項技術(shù)的目的。
“有些人開始效仿我們。雖然他們的設(shè)計還行,但真正的產(chǎn)品卻很糟糕的。這些系統(tǒng)還并不完善,理所當然產(chǎn)品也不會太好。所以這還只是一種概念性藝術(shù),甚至只是嘩眾取寵的噱頭?!?/p>
深度學(xué)習(xí)確實很令人興奮。它把科幻電影里的人工智能技術(shù)帶到了我們身邊,有了深度學(xué)習(xí)的計算機就有了類人般的智慧。大部分人都沒有注意到的是,深度學(xué)習(xí)讓產(chǎn)品變得更好、更快了。雖然它廣泛應(yīng)用于社會各個領(lǐng)域,從監(jiān)獄到報社,但不得不說深度學(xué)習(xí)仍很難理解,亦如 Kate Crawford 和 Meredith Whitaker 近期所寫一樣“很難被看見”。
藝術(shù)家們使用神經(jīng)網(wǎng)絡(luò)揭開了這項技術(shù)的神秘面紗。雖然他們所用的神經(jīng)網(wǎng)絡(luò)較谷歌、Facebook 的神經(jīng)網(wǎng)絡(luò)相比只是一個精簡版,但他們?nèi)园l(fā)現(xiàn)了一個問題:只有深度學(xué)習(xí)系統(tǒng)單獨工作是不夠的。但就是這樣,他們學(xué)到了另一個經(jīng)驗:一個人陷入循環(huán)時,往往會產(chǎn)出更美麗的東西。
推薦閱讀:
雷峰網(wǎng)原創(chuàng)文章,未經(jīng)授權(quán)禁止轉(zhuǎn)載。詳情見轉(zhuǎn)載須知。