0
本文作者: 高婓 | 2016-09-08 18:06 |
編者按:一年前,F(xiàn)acebook發(fā)布了照片分享應用Moments,于前不久關(guān)閉了iOS版Facebook照片同步功能,力推Moments應用,該應用運用了人臉識別技術(shù)。不過,F(xiàn)acebook人工智能實驗室負責人Yann Lecun在為我們通俗易懂地介紹Moments的應用原理時表示,除了簡單的人臉識別技術(shù),F(xiàn)acebook將利用更卓越的計算機視覺技術(shù)和AI技術(shù)為用戶提供更多便利,如嘗試開發(fā)計算機的移情能力,當然,這些便利的應用背后需要強大的算法和繁瑣的訓練過程做支撐。讓我們一起期待未來計算機能夠更好地理解人類,使我們的工作、生活更為便捷。
Facebook強力推行的照片分享應用Moments通過運用圖像識別技術(shù),使用戶可以掃描朋友的照片創(chuàng)建私人群體相冊。當有六個人在活動現(xiàn)場同時拍照時,Moments使所有參與者相互之間能夠更為便捷地分享照片,省去了把快照通過郵件發(fā)送給每一個人,然后再創(chuàng)建相冊的繁瑣過程。當然,這種應用并不像發(fā)現(xiàn)治療癌癥的方法一樣,稱得上是“壯舉”,但是,在這種便捷照片分享應用背后有著令人印象深刻的技術(shù),F(xiàn)acebook花了幾年的時間才開發(fā)出這種技術(shù)。
Moments應用的關(guān)鍵點在于有Facebook的算法作為支撐,使得這種應用能夠在不同的照片中識別出同一個人的面容,如此一來,Moments能夠知道有哪些人在活動現(xiàn)場。這就要求具備計算機視覺專門知識,Google, Microsoft,Baidu及其他公司一直以來都致力于計算機視覺領域的研究,其應用從自動駕駛車輛到傻瓜式網(wǎng)絡產(chǎn)品,如微軟的“我看起來多大年紀”應用,變化不等。
Moments的發(fā)布代表著Facebook正在與全世界分享其在計算機視覺領域研究所取得的成功。Facebook人臉識別精度能夠達到98%,識別速度也是非比尋常,能夠在不到5秒的時間內(nèi),從8億張照片中識別出你的照片。最后,即使不能獲得你的正面鏡頭(或者你的臉根本沒有出現(xiàn)在照片中),Momemts都能夠輕松識別出你的照片,這一切都要歸功于一種機器學習算法,該算法能夠兼顧圖片中與照片數(shù)據(jù)有關(guān)的其他元素內(nèi)容。
Fortune曾經(jīng)采訪過Facebook人工智能實驗室負責人Yann LeCun,采訪過程中了解到他的團隊是如何幫助一臺計算機理解“你是誰”,及下一步Facebook在AI研究領域?qū)⒂泻涡逻M展。在LeCun談論計算機視覺時,也許我們首先要理解:盡管教會軟件識別對象的過程與人看外界事物具有相似之處,我們依然不能將計算機視覺簡單地等同于人看外界事物。
例如,F(xiàn)acebook的人臉識別技術(shù)不能識別出你。只有當兩張照片中的人是同一個人時,這種技術(shù)才能夠識別出被識別對象。人臉識別技術(shù)實際上是一個完全分離的步驟。
由于Facebook主要是為了建立人與人之間的密切聯(lián)系,其計算機視覺技術(shù)以識別人臉為側(cè)重點,不用于識別貓,車輛或其他物理實物。為了實現(xiàn)這一目的,F(xiàn)acebook采用一個被稱為“Labeled Faces in the Wild”的數(shù)據(jù)庫,該數(shù)據(jù)庫由名人和政客的照片組成。數(shù)據(jù)庫中含有13000張照片,照片中人們以不同的發(fā)型,不同的服裝,有時戴眼鏡或其他的裝飾物出現(xiàn)。Facebook使用該圖像集訓練其機器學習算法。其他公司也曾使用該數(shù)據(jù)集,一些大學運用該圖像集訓練系統(tǒng),識別精度達到98%。
因此,Facebook究竟是如何通過給一臺機器一張Angelina Jolie的照片,然后,在這張照片的幫助下,使這臺機器從不同的相冊中識別出你姐姐的呢?LeCun可以為我們解答這一難題。大約20年前,當LeCun在貝爾實驗室工作時,他偶然想到應該如何教會計算機“看”世界,這種想法直到4年前才在學術(shù)界之外得到推廣應用。
計算機視覺所用到的技術(shù)被稱為卷積神經(jīng)網(wǎng)絡,該命名來源于被稱為“回旋”的數(shù)學操作,并從人類大腦的學習原理獲得靈感。人類大腦是通過在神經(jīng)元之間建立聯(lián)系實現(xiàn)學習的,一個信號被傳送給神經(jīng)元的頻率越高,神經(jīng)元之間的聯(lián)系越緊密。同理,當計算機為兩張圖像建立相似度聯(lián)系時,它將為這些相似度分配權(quán)值。在卷積神經(jīng)網(wǎng)絡中,所設定的目標是訓練機器,使之能夠識別所建立聯(lián)系之間權(quán)重的變化,以便于計算機能夠越來越精確地判斷圖像與圖像之間是否匹配。
這種訓練識別過程是相當復雜的,涉及到不同的計算方法,運用這些計算方法能夠判斷一幅圖像中哪些特征對于識別圖像信息是重要的。例如,如果你想要訓練一臺計算機來識別人臉,圖像背景的像素就顯得并不太重要。令人感到不可思議的是,機器能夠自行學習,識別出圖像種哪些特征是最相關(guān)的,然后對這些重要特征進行歸納總結(jié)。不過,還是需要人為地推動計算機識別出合理的方式為相似度賦權(quán)值,一旦建模成功,計算機將具備歸納總結(jié)重要特征的能力。
將會花費幾天的時間在一臺配置很好的計算機上完成這一訓練過程。
當多倫多大學Geoffery Hinton教授帶領其研究團隊使用卷積神經(jīng)網(wǎng)絡在圖像識別算法競賽中獲勝之后,卷積神經(jīng)網(wǎng)絡幾乎成為所有計算機視覺研究的基石。之后,Hinton的研究團隊和其建立的新公司被Google收購,Hinton以測試誤差為15.3%在比賽中獲勝,第二名優(yōu)勝者的成績?yōu)?6.2%。
Facebook的自動人臉識別技術(shù)有助于用戶保護自己的隱私不受侵犯。例如,當自動人臉識別技術(shù)得到廣泛應用時,你每上傳到Facebook一張照片都會及時獲得通知。例如,假如你不經(jīng)意間出現(xiàn)在一個游客在時代廣場拍的照片背景中,你能夠及時獲得通知,有權(quán)選擇將照片中自己的臉變得模糊,無法識別。對于小孩子,如果出現(xiàn)這種情況,F(xiàn)acebook將自動開啟模糊或刪除功能。Lecun表示,F(xiàn)acebook對這類應用工具很感興趣,但是,他同時也強調(diào),F(xiàn)acebook的對機器學習領域的興趣遠遠超過圖像識別技術(shù)。
Facebook的目標是使計算機具備移情能力。很明顯,計算機不能感知到人們的行為,不過,能夠訓練計算機使其具備識別人的情感及人的反應的能力。當計算機的理解能力能夠達到這種水平式時,當你將要上傳自己喝得醉醺醺的照片時,F(xiàn)acebook將會發(fā)出提示,確認你是否真的想要這樣做。
“計算機的移情能力遠遠超過人臉識別技術(shù)”,LeCun表示。“我們不關(guān)注誰在照片中,我們將運用其他類型的圖像識別技術(shù),通過不同手段訓練這些技術(shù), 使計算機能夠識別出——這張照片看起來令人尷尬,提示你是否真的要將照片公之于眾?!?/span>
當然,F(xiàn)acebook現(xiàn)階段還不具備開發(fā)出這種圖像識別技術(shù)的能力,但是LeCun提出這些概念作為實驗構(gòu)想,指明了Facebook人工智能研究未來的發(fā)展方向。當然,這種僅用一種算法便可以達到的圖像識別技術(shù)著實會給人們帶來深深的不安?,F(xiàn)在,由于人們對于個人隱私的關(guān)注,F(xiàn)acebook尚未在加拿大及歐盟等國家推廣這種自動標記應用。要使得一臺計算機能夠在幾秒內(nèi)猜測出你分享照片的意圖,或者使軟件嘗試著分析你的笑話,并理解你所講笑話中的笑點,還要考慮一種潛在變化的影響因素。
“我們的目標是使機器變得更加智能化,能夠理解文本,圖像,視頻及郵件,在數(shù)字化的世界里,我們想要機器理解事物發(fā)生的場景”,LeCun表示。由于每天都能夠接收到如此多的數(shù)據(jù)內(nèi)容,人們不免感到不知所措。LeCun的研究團隊所做出的努力將幫助人們獲取與其興趣密切相關(guān)的內(nèi)容。要實現(xiàn)這一簡單目標可能牽涉到復雜的解決方法:保證你在Facebook上看到自己需要的信息。
“使機器理解人類,這是Facebook一直嘗試完成的一項重大任務”,LeCun表示。
本文由雷鋒網(wǎng)獨家編譯,未經(jīng)允許拒絕轉(zhuǎn)載!·
雷峰網(wǎng)原創(chuàng)文章,未經(jīng)授權(quán)禁止轉(zhuǎn)載。詳情見轉(zhuǎn)載須知。