0
雷鋒網(wǎng)按:為了讓你在聊天斗圖中立于不敗之地,谷歌使用機器學習技術,最新開發(fā)了一個可以讓你用自拍生成個人專屬表情包的工具,更新在自家聊天軟件Allo上。
拍照、分享、再查看——自拍已經(jīng)成為很多人的日常習慣,我們和香車自拍、美裝自拍、旅行自拍,還有“早晨,我醒了~”諸如此類的自拍。自拍已經(jīng)成為人類社會行為的一部分,長久以來被用來展示自我。對于一些人,自拍展示的是外貌;另一些人,自拍展示的是他們想要別人認為的樣子。還有一些人,兩方面都想展示。自拍是基于現(xiàn)實的直觀表達,而用漫畫表現(xiàn)自我,相比現(xiàn)實更加溫馨而輕松。
Google推出的Allo內(nèi)置機器學習驅(qū)動聊天程序。是網(wǎng)絡和藝術家合作的產(chǎn)品,想象一下,你的表情回復欄中,有一個按鍵——“自拍一鍵變表情”,它可以飛速自動生成你的“漫畫版”。觸動按鍵,程序會提示你自拍。接著,谷歌的圖像識別將會識別你的臉,將你的特征掃描到由Lamar Abrams繪制的工具包里,Lamar Abrams是一位故事板畫家兼作家,代表作是廣受好評的網(wǎng)絡卡通Steven Universe系列。該工具包儲存成百上千的眼睛、鼻子、臉型、發(fā)型和眼鏡元素。谷歌稱,工具包可以生成563,000,000億張不同的臉。系統(tǒng)生成最初漫畫,你還可以做出調(diào)整:換一個發(fā)型,或者換不同的眼鏡。最后,機器會自動生成22個你的表情。
該工具起源于一項內(nèi)部研究項目,目的是想看看機器學習是否能用一張自拍照來生成一個即時的卡通人物。但正如谷歌用戶體驗項目的負責人,Jason Cornwell所指出的那樣,制作某一個人的卡通畫并不是最終的目標?!叭绾巫鲆恍┎恢荒鼙憩F(xiàn)你自己的外貌顏值,還能投射你的個性的東西?”Cornwell談到,“這個問題很有趣。它既能呈現(xiàn)機器學習和電腦的視覺感,也能表達人的表情。這就是Jennifer加入的原因,為你提供藝術的自我表現(xiàn)方式。
Cornwell提到的Jennifer Daniel,著名的藝術總監(jiān),她是首位在Richard Turley時代為《Bloomberg Businessweek》創(chuàng)作出名聲大噪的視圖的設計師,后來她又為《the New York Times》做了一系列視覺專欄。Daniel指出,“插圖能傳遞自拍不能表達的情緒狀態(tài)?!弊耘氖悄愕睦硐霠顟B(tài)。相比之下,表情則是對你的感受的一種升華和夸張化。因此,表情設計得很搞笑滑稽:你可以拿塊披薩,或者變成流著口水的僵尸。Cornwell表示:“我們的目標不是一個確切的東西,我們是為了讓用戶創(chuàng)造出自己喜歡的東西。”因此,用戶測試尊重人們的感受,會提出問題:你在這張圖片中看到自己了嗎?你的朋友能認出你嗎?
谷歌把這個項目列為長期運作的項目,以期探索出新的方法,讓機器學習越來越廣泛地應用。按谷歌的說法,谷歌的機器學習水平領先世界,如果它能讓機器學習成為應用程序和網(wǎng)站的必備功能,那么它的產(chǎn)品將碾壓競爭對手。順著Google的計劃,目前Allo已經(jīng)成為各種新型機器學習應用程序的試驗臺。Cornwell稱:“我們在Allo平臺的試驗,目的是找出機器學習更好地傳遞信息的方法,從在確切時間表述確切事件,躍升到在確切時間表達準確感情?!?/p>
這聽起來有點嚇人,好像Allo正試圖取代我們本人,成為對話的必需品?然而在實踐中,應用程序幾乎是不可避免的。當有人給你發(fā)信息時,Allo會根據(jù)你們的談話記錄給出快速的回復。例如,如果你的朋友發(fā)給你一張她跳傘的照片,系統(tǒng)就會回復:“太棒了!”。或者,你正在群組里聊天,Allo會使用機器學習彈出一系列定制的搞笑動圖來回復。這個想法是,即便你本人不在,也能增強你的表達能力,像是你本人親臨一樣。Cornwell表示:“我們在很多其他方面都在思考同一個的問題,藝術和機器學習會以怎樣的方式相遇?”不過他拒絕透露谷歌的研究方向。于此同時,Daniel承認了會有新的表情圖符推出,分別由不同的藝術家來完成,有著全新的風格。雷鋒網(wǎng)覺得,如果真將有這樣一個新的表情包,能把自己幻化成一只可愛的狗狗?拜托,讓這一天早日來到吧!
Daniel指出,這個項目代表了藝術和工程新的交集。畢竟,我們才剛剛開始觸及機器學習對藝術的作用。如果達芬奇還活著,我們很難相信蒙娜麗莎會是怎樣一幅畫。相反,也許這將是一個用戶專屬的形象,可以為自己重新塑造出一個表情神秘的女性形象,還可以跨越不同的文化和時代。但是目前我們在惠特尼雙年展上還沒有發(fā)現(xiàn)什么酷炫的東西,也許需要由谷歌這樣的公司來打破僵局。Daniel,作為勝利解決了美國技術設計場景的人,一向直言不諱。對于與谷歌的合作,她評價道:“我感興趣的是工程與藝術合作的交集,還有這個合作平臺。在這個平臺上,我們創(chuàng)造的不僅僅是內(nèi)容,還有產(chǎn)品本身。
傳統(tǒng)的計算機把自拍照藝術化轉(zhuǎn)換,是通過分析圖像的像素,通過算法來確定屬性值,再通過像素值來評估顏色、形狀或紋理。然而,如今人們的自拍在不同背景光下,有各種姿勢。雖然人們很容易辨別一些定性特征,比如不管光照如何,都可以辨別出眼睛的顏色。但這對計算機來說是一項非常復雜的任務。這是因為,當人們辨別眼睛顏色時,不僅觀察眼睛的像素值,還會結(jié)合周圍的環(huán)境考慮。
為了解決這個問題,我們研究了類似人眼選擇特征的算法,而不是傳統(tǒng)的編碼方法,去解釋每種照明條件下眼睛的顏色。同時我們可以從頭開始創(chuàng)造一個大型神經(jīng)網(wǎng)絡,也許可以做到這一點。我們想得到更有效的方式達到目的,因為要將人臉轉(zhuǎn)化成漫畫將是一個反復漫長的過程。
為了給你的朋友們塑造一個你所期待的形象,我們和藝術團隊一起創(chuàng)作了各種各樣的元素。例如,藝術家最初設計的發(fā)型,用于實驗在人工介入下,訓練網(wǎng)絡為自拍匹配相應的漫畫。之后,人工評判輸出的表情和輸入照片的匹配程度,以了解工具的表現(xiàn)。在某些情況下,評估者認為有些風格并沒有很好的表現(xiàn),所以藝術家們創(chuàng)造了更多神經(jīng)網(wǎng)絡可以識別的元素。
評估者對發(fā)型進行分類,越左邊的圖標代表越接近的。達成共識之后,常駐藝術家Lamar Abrams就根據(jù)圖片的共同之處創(chuàng)作出表情。
在美學研究中,有一個著名的問題 “恐怖谷效應”——這一假說認為,如果人類的復制品幾乎就像真人一樣,就會讓人感到厭惡。在機器學習中,如果遇到計算機對你的看法,比對你對自己的看法,這可能會變得更加復雜。
相比準確復制一個人的外表,得到一個低分辨率模型,比如表情和貼紙,讓團隊探索通過返送圖像增強表達,這與其說是重現(xiàn)現(xiàn)實,更多的是打破規(guī)則。
團隊與藝術家Lamar Abrams合作設計的組合超過563,000,000億
計算機如何感知你,和你如何看待你自己以及你想怎么展示自己,協(xié)調(diào)這兩者的關系是一種藝術實踐。這是一個定制功能,包括不同的發(fā)型、皮膚色調(diào)和鼻子形狀,這是至關重要的。畢竟,漫畫的定義是主觀的。美學是由種族、文化和階級定義的,它會引導人們不自覺地因異排外。因此,我們努力創(chuàng)造的空間擁有不同種族、年齡、男性、女性和雌雄同體。我們的團隊將繼續(xù)對研究結(jié)果進行評估,以防止在訓練系統(tǒng)時產(chǎn)生偏見。
沒有所謂的“普遍的審美”或“單調(diào)的你”。人們與父母交談的方式不同于與朋友交談的方式,也與同事交談的方式不同。當你有很多社會角色的時候,制作一個虛擬的化身是不夠的。為了解決這一問題,Allo團隊正在研究一系列的藝術聲音,以幫助其他人擴展自己的聲音。目前發(fā)布的第一款風格,可能是一種自黑風格,下一款用于那些真誠時刻,可能會更可愛。在那之后,也許他們會把你變成一只狗。如果表情符號擴大了交流的世界,最興奮的點不是這種技術和語言是如何演變的,而是人們對工具本身功能的看法。
雷鋒網(wǎng)獲知,Allo目前已Android系統(tǒng)中推出,并將很快在iOS系統(tǒng)上推出。
via CO.DESIGN
雷峰網(wǎng)版權文章,未經(jīng)授權禁止轉(zhuǎn)載。詳情見轉(zhuǎn)載須知。