谷歌用 AI 讓自拍一鍵變表情包，斗圖從此立于不敗之地

本文作者：丹丹er

編輯：劉芳平

2017-05-12 17:53

導(dǎo)語(yǔ)：拍照、分享、再查看——自拍已經(jīng)成為很多人的日常習(xí)慣，Google新聊天軟件Allo讓你的“自拍一鍵變表情”

雷鋒網(wǎng)按：為了讓你在聊天斗圖中立于不敗之地，谷歌使用機(jī)器學(xué)習(xí)技術(shù)，最新開(kāi)發(fā)了一個(gè)可以讓你用自拍生成個(gè)人專屬表情包的工具，更新在自家聊天軟件Allo上。

拍照、分享、再查看——自拍已經(jīng)成為很多人的日常習(xí)慣，我們和香車自拍、美裝自拍、旅行自拍，還有“早晨，我醒了~”諸如此類的自拍。自拍已經(jīng)成為人類社會(huì)行為的一部分，長(zhǎng)久以來(lái)被用來(lái)展示自我。對(duì)于一些人，自拍展示的是外貌；另一些人，自拍展示的是他們想要?jiǎng)e人認(rèn)為的樣子。還有一些人，兩方面都想展示。自拍是基于現(xiàn)實(shí)的直觀表達(dá)，而用漫畫(huà)表現(xiàn)自我，相比現(xiàn)實(shí)更加溫馨而輕松。

谷歌用 AI 讓自拍一鍵變表情包，斗圖從此立于不敗之地

機(jī)器學(xué)習(xí)驅(qū)動(dòng)的聊天表情

Google推出的Allo內(nèi)置機(jī)器學(xué)習(xí)驅(qū)動(dòng)聊天程序。是網(wǎng)絡(luò)和藝術(shù)家合作的產(chǎn)品，想象一下，你的表情回復(fù)欄中，有一個(gè)按鍵——“自拍一鍵變表情”，它可以飛速自動(dòng)生成你的“漫畫(huà)版”。觸動(dòng)按鍵，程序會(huì)提示你自拍。接著，谷歌的圖像識(shí)別將會(huì)識(shí)別你的臉，將你的特征掃描到由Lamar Abrams繪制的工具包里，Lamar Abrams是一位故事板畫(huà)家兼作家，代表作是廣受好評(píng)的網(wǎng)絡(luò)卡通Steven Universe系列。該工具包儲(chǔ)存成百上千的眼睛、鼻子、臉型、發(fā)型和眼鏡元素。谷歌稱，工具包可以生成563，000，000億張不同的臉。系統(tǒng)生成最初漫畫(huà)，你還可以做出調(diào)整：換一個(gè)發(fā)型，或者換不同的眼鏡。最后，機(jī)器會(huì)自動(dòng)生成22個(gè)你的表情。

該工具起源于一項(xiàng)內(nèi)部研究項(xiàng)目，目的是想看看機(jī)器學(xué)習(xí)是否能用一張自拍照來(lái)生成一個(gè)即時(shí)的卡通人物。但正如谷歌用戶體驗(yàn)項(xiàng)目的負(fù)責(zé)人，Jason Cornwell所指出的那樣，制作某一個(gè)人的卡通畫(huà)并不是最終的目標(biāo)?！叭绾巫鲆恍┎恢荒鼙憩F(xiàn)你自己的外貌顏值，還能投射你的個(gè)性的東西？”Cornwell談到，“這個(gè)問(wèn)題很有趣。它既能呈現(xiàn)機(jī)器學(xué)習(xí)和電腦的視覺(jué)感，也能表達(dá)人的表情。這就是Jennifer加入的原因，為你提供藝術(shù)的自我表現(xiàn)方式。

Cornwell提到的Jennifer Daniel，著名的藝術(shù)總監(jiān)，她是首位在Richard Turley時(shí)代為《Bloomberg Businessweek》創(chuàng)作出名聲大噪的視圖的設(shè)計(jì)師，后來(lái)她又為《the New York Times》做了一系列視覺(jué)專欄。Daniel指出，“插圖能傳遞自拍不能表達(dá)的情緒狀態(tài)。”自拍是你的理想狀態(tài)。相比之下，表情則是對(duì)你的感受的一種升華和夸張化。因此，表情設(shè)計(jì)得很搞笑滑稽：你可以拿塊披薩，或者變成流著口水的僵尸。Cornwell表示：“我們的目標(biāo)不是一個(gè)確切的東西，我們是為了讓用戶創(chuàng)造出自己喜歡的東西?！币虼?，用戶測(cè)試尊重人們的感受，會(huì)提出問(wèn)題：你在這張圖片中看到自己了嗎?你的朋友能認(rèn)出你嗎?

谷歌用 AI 讓自拍一鍵變表情包，斗圖從此立于不敗之地

谷歌把這個(gè)項(xiàng)目列為長(zhǎng)期運(yùn)作的項(xiàng)目，以期探索出新的方法，讓機(jī)器學(xué)習(xí)越來(lái)越廣泛地應(yīng)用。按谷歌的說(shuō)法，谷歌的機(jī)器學(xué)習(xí)水平領(lǐng)先世界，如果它能讓機(jī)器學(xué)習(xí)成為應(yīng)用程序和網(wǎng)站的必備功能，那么它的產(chǎn)品將碾壓競(jìng)爭(zhēng)對(duì)手。順著Google的計(jì)劃，目前Allo已經(jīng)成為各種新型機(jī)器學(xué)習(xí)應(yīng)用程序的試驗(yàn)臺(tái)。Cornwell稱：“我們?cè)贏llo平臺(tái)的試驗(yàn)，目的是找出機(jī)器學(xué)習(xí)更好地傳遞信息的方法，從在確切時(shí)間表述確切事件，躍升到在確切時(shí)間表達(dá)準(zhǔn)確感情?！?/p>

這聽(tīng)起來(lái)有點(diǎn)嚇人，好像Allo正試圖取代我們本人，成為對(duì)話的必需品?然而在實(shí)踐中，應(yīng)用程序幾乎是不可避免的。當(dāng)有人給你發(fā)信息時(shí)，Allo會(huì)根據(jù)你們的談話記錄給出快速的回復(fù)。例如，如果你的朋友發(fā)給你一張她跳傘的照片，系統(tǒng)就會(huì)回復(fù)：“太棒了！”?；蛘?，你正在群組里聊天，Allo會(huì)使用機(jī)器學(xué)習(xí)彈出一系列定制的搞笑動(dòng)圖來(lái)回復(fù)。這個(gè)想法是，即便你本人不在，也能增強(qiáng)你的表達(dá)能力，像是你本人親臨一樣。Cornwell表示：“我們?cè)诤芏嗥渌矫娑荚谒伎纪粋€(gè)的問(wèn)題，藝術(shù)和機(jī)器學(xué)習(xí)會(huì)以怎樣的方式相遇？”不過(guò)他拒絕透露谷歌的研究方向。于此同時(shí)，Daniel承認(rèn)了會(huì)有新的表情圖符推出，分別由不同的藝術(shù)家來(lái)完成，有著全新的風(fēng)格。雷鋒網(wǎng)覺(jué)得，如果真將有這樣一個(gè)新的表情包，能把自己幻化成一只可愛(ài)的狗狗?拜托，讓這一天早日來(lái)到吧！

Daniel指出，這個(gè)項(xiàng)目代表了藝術(shù)和工程新的交集。畢竟，我們才剛剛開(kāi)始觸及機(jī)器學(xué)習(xí)對(duì)藝術(shù)的作用。如果達(dá)芬奇還活著，我們很難相信蒙娜麗莎會(huì)是怎樣一幅畫(huà)。相反，也許這將是一個(gè)用戶專屬的形象，可以為自己重新塑造出一個(gè)表情神秘的女性形象，還可以跨越不同的文化和時(shí)代。但是目前我們?cè)诨萏啬犭p年展上還沒(méi)有發(fā)現(xiàn)什么酷炫的東西，也許需要由谷歌這樣的公司來(lái)打破僵局。Daniel，作為勝利解決了美國(guó)技術(shù)設(shè)計(jì)場(chǎng)景的人，一向直言不諱。對(duì)于與谷歌的合作，她評(píng)價(jià)道：“我感興趣的是工程與藝術(shù)合作的交集，還有這個(gè)合作平臺(tái)。在這個(gè)平臺(tái)上，我們創(chuàng)造的不僅僅是內(nèi)容，還有產(chǎn)品本身。

谷歌用 AI 讓自拍一鍵變表情包，斗圖從此立于不敗之地

傳統(tǒng)的計(jì)算機(jī)把自拍照藝術(shù)化轉(zhuǎn)換，是通過(guò)分析圖像的像素，通過(guò)算法來(lái)確定屬性值，再通過(guò)像素值來(lái)評(píng)估顏色、形狀或紋理。然而，如今人們的自拍在不同背景光下，有各種姿勢(shì)。雖然人們很容易辨別一些定性特征，比如不管光照如何，都可以辨別出眼睛的顏色。但這對(duì)計(jì)算機(jī)來(lái)說(shuō)是一項(xiàng)非常復(fù)雜的任務(wù)。這是因?yàn)椋?dāng)人們辨別眼睛顏色時(shí)，不僅觀察眼睛的像素值，還會(huì)結(jié)合周圍的環(huán)境考慮。

為了解決這個(gè)問(wèn)題，我們研究了類似人眼選擇特征的算法，而不是傳統(tǒng)的編碼方法，去解釋每種照明條件下眼睛的顏色。同時(shí)我們可以從頭開(kāi)始創(chuàng)造一個(gè)大型神經(jīng)網(wǎng)絡(luò)，也許可以做到這一點(diǎn)。我們想得到更有效的方式達(dá)到目的，因?yàn)橐獙⑷四樲D(zhuǎn)化成漫畫(huà)將是一個(gè)反復(fù)漫長(zhǎng)的過(guò)程。

為了給你的朋友們塑造一個(gè)你所期待的形象，我們和藝術(shù)團(tuán)隊(duì)一起創(chuàng)作了各種各樣的元素。例如，藝術(shù)家最初設(shè)計(jì)的發(fā)型，用于實(shí)驗(yàn)在人工介入下，訓(xùn)練網(wǎng)絡(luò)為自拍匹配相應(yīng)的漫畫(huà)。之后，人工評(píng)判輸出的表情和輸入照片的匹配程度，以了解工具的表現(xiàn)。在某些情況下，評(píng)估者認(rèn)為有些風(fēng)格并沒(méi)有很好的表現(xiàn)，所以藝術(shù)家們創(chuàng)造了更多神經(jīng)網(wǎng)絡(luò)可以識(shí)別的元素。

谷歌用 AI 讓自拍一鍵變表情包，斗圖從此立于不敗之地

評(píng)估者對(duì)發(fā)型進(jìn)行分類，越左邊的圖標(biāo)代表越接近的。達(dá)成共識(shí)之后，常駐藝術(shù)家Lamar Abrams就根據(jù)圖片的共同之處創(chuàng)作出表情。

避開(kāi)恐怖谷效應(yīng)

在美學(xué)研究中，有一個(gè)著名的問(wèn)題 “恐怖谷效應(yīng)”——這一假說(shuō)認(rèn)為，如果人類的復(fù)制品幾乎就像真人一樣，就會(huì)讓人感到厭惡。在機(jī)器學(xué)習(xí)中，如果遇到計(jì)算機(jī)對(duì)你的看法，比對(duì)你對(duì)自己的看法，這可能會(huì)變得更加復(fù)雜。

相比準(zhǔn)確復(fù)制一個(gè)人的外表，得到一個(gè)低分辨率模型，比如表情和貼紙，讓團(tuán)隊(duì)探索通過(guò)返送圖像增強(qiáng)表達(dá)，這與其說(shuō)是重現(xiàn)現(xiàn)實(shí)，更多的是打破規(guī)則。

谷歌用 AI 讓自拍一鍵變表情包，斗圖從此立于不敗之地

團(tuán)隊(duì)與藝術(shù)家Lamar Abrams合作設(shè)計(jì)的組合超過(guò)563，000，000億

將像素轉(zhuǎn)換為藝術(shù)漫畫(huà)

計(jì)算機(jī)如何感知你，和你如何看待你自己以及你想怎么展示自己，協(xié)調(diào)這兩者的關(guān)系是一種藝術(shù)實(shí)踐。這是一個(gè)定制功能，包括不同的發(fā)型、皮膚色調(diào)和鼻子形狀，這是至關(guān)重要的。畢竟，漫畫(huà)的定義是主觀的。美學(xué)是由種族、文化和階級(jí)定義的，它會(huì)引導(dǎo)人們不自覺(jué)地因異排外。因此，我們努力創(chuàng)造的空間擁有不同種族、年齡、男性、女性和雌雄同體。我們的團(tuán)隊(duì)將繼續(xù)對(duì)研究結(jié)果進(jìn)行評(píng)估，以防止在訓(xùn)練系統(tǒng)時(shí)產(chǎn)生偏見(jiàn)。

谷歌用 AI 讓自拍一鍵變表情包，斗圖從此立于不敗之地

為身份和情感創(chuàng)建一個(gè)寬廣的調(diào)色板

沒(méi)有所謂的“普遍的審美”或“單調(diào)的你”。人們與父母交談的方式不同于與朋友交談的方式，也與同事交談的方式不同。當(dāng)你有很多社會(huì)角色的時(shí)候，制作一個(gè)虛擬的化身是不夠的。為了解決這一問(wèn)題，Allo團(tuán)隊(duì)正在研究一系列的藝術(shù)聲音，以幫助其他人擴(kuò)展自己的聲音。目前發(fā)布的第一款風(fēng)格，可能是一種自黑風(fēng)格，下一款用于那些真誠(chéng)時(shí)刻，可能會(huì)更可愛(ài)。在那之后，也許他們會(huì)把你變成一只狗。如果表情符號(hào)擴(kuò)大了交流的世界，最興奮的點(diǎn)不是這種技術(shù)和語(yǔ)言是如何演變的，而是人們對(duì)工具本身功能的看法。

雷鋒網(wǎng)獲知，Allo目前已Android系統(tǒng)中推出，并將很快在iOS系統(tǒng)上推出。

via CO.DESIGN

雷峰網(wǎng)版權(quán)文章，未經(jīng)授權(quán)禁止轉(zhuǎn)載。詳情見(jiàn)轉(zhuǎn)載須知。

5人收藏

相關(guān)文章

丹丹er

知情人士

發(fā)私信

當(dāng)月熱門文章