4
本文作者: 亞萌 | 2016-12-06 22:46 |
今天的Amazon Go刷爆了國內(nèi)外的社交媒體。
Amazon Go令人驚艷的地方,就是你可以徑直走進超市,選好貨品之后立馬離開,不用在收銀臺前排長長的隊伍,等待結賬。
甚至還莫名有一種從商店“搶劫”的快感。
我們說,移動支付顛覆了既有商品交易方式,那么這種“搶劫式”的Amazon Go甚至連“交易感”都消滅了。
總之,人們被這種新奇的似乎隱含了某種黑科技的新型購物方式所吸引。不僅是普通人,就連斯坦福教授李飛飛、著名科技出版公司O'reilly創(chuàng)始人Tim O'Reilly都特地發(fā)推點贊。
李飛飛:計算機視覺十分顯著和絕妙的應用!
Tim O'Reilly:零售業(yè)的未來,我對此已經(jīng)期待很多年了。
用戶進入商店,穿過閘機的時候打開手機讓其識別,這時手機里的系統(tǒng)啟動,并隨時準備更新物品清單。令人驚艷的部分就是,在用戶拿走或放回物品的一瞬間,手機里的系統(tǒng)會自動更新清單。最后,用戶拿著物品滿意地離開,手機自動扣款。
這里面到底有什么黑科技呢?就官方發(fā)布的視頻來看,技術亮點有三個:機器視覺、深度學習算法和傳感器融合。
但僅有這幾個關鍵詞還是不夠的,雷鋒網(wǎng)遂向亞馬遜在職員工進行采訪,但是對方表示Amazon Go還屬于保密項目,公司要求不能對外透露任何細節(jié)。
不過在Quora上,有一位名為Brian Roemmele的網(wǎng)友挖出了幾年前亞馬遜提交的兩份專利文件,里面描繪的系統(tǒng)跟如今的 Amazon Go非常相似。這兩份文件名稱為:“偵測物體互動和移動”(Detecting item interaction and movement)和“物品從置物設備上的轉(zhuǎn)移”(Transitioning items from the materials handling facility),兩文件分別于2013年和2014年申請(感興趣的朋友可以在公眾號回復關鍵詞“專利”,下載2份專利文件)。
這兩份專利文件都描繪了十分龐雜的應用場景,包括:貨倉、船運、零售市場等,所以很多人當初在看到這份文件時,都以為這是亞馬遜為自己的倉儲系統(tǒng)量身定制的,不過今天一切真相大白。
“偵測物體互動和移動”(Detecting item interaction and movement)這份專利的摘要是:
用戶從一個貨架上拿起或放下一個物品,貨物管理系統(tǒng)可以偵測到這個動作,并且更新用戶移動設備里的清單。
“物品從置物設備上的轉(zhuǎn)移”(Transitioning items from the materials handling facility)這份專利的摘要是:
物品被識別,并且當用戶正在拿起物品時,物品自動與用戶發(fā)生關聯(lián)。 當用戶進入或穿過一個“轉(zhuǎn)移區(qū)”(Transition Area),被拿起的物品將自動轉(zhuǎn)移到用戶,而不需要用戶有任何的輸入。
總的來說就是,被識別的物體與用戶發(fā)生關聯(lián),能自動更新清單,并在“轉(zhuǎn)移區(qū)”進行自動交易(“轉(zhuǎn)移區(qū)”在Amazon Go里指的就是商店的出口)。
我們可以從下面一張圖里,一窺 Amazon Go 的基本原型。
圖中代號為208的物體都是攝像頭,大約有10多個(有一些被人體擋住)。208攝像頭分別置于天花板(如圖左右兩邊各有一個比較大的攝像頭)、貨架兩側(cè)和貨架內(nèi)部。文件里描述到,天花板上的208用來采集用戶和貨品的位置、貨架兩側(cè)的208用來捕捉用戶的圖像和周圍的環(huán)境,貨架內(nèi)的208用來確定貨品的位置或用戶手的移動(進入和離開貨架)。
而從視頻里,我們隱約能夠看到安置在貨架內(nèi)部的攝像頭。
另外,專利文件里還補充道:這里的攝像頭可以是多種類型的,可以是RGB攝像頭,或深度感知攝像頭。除了攝像頭之外,也可以有其他輸入設備,比如壓力傳感器、紅外傳感器、體積位移傳感器、光幕等等。壓力傳感器可以偵測物品移出和進入的時間,紅外傳感器可以用來區(qū)分用戶和的手和物品。
我們具體并不清楚Amazon Go到底在多大程度上使用了計算機視覺技術。比如說,當用戶進出商店時,都需要對用戶進行識別,文件里反復提到可以用人臉識別技術實現(xiàn),但是又會繼續(xù)補充說明可以通過手機等移動設備來偵測。
Quora網(wǎng)友Anurag Ranjan是一位機器視覺和深度學習領域的準PhD,他分析稱:
Amazon Go使用商店里的攝像頭識別出了用戶,可能針對用戶拍了幾張照片,依靠一些標準的深度學習網(wǎng)絡形成了一幅特征圖,比如Resnet,、GoogLeNet 或者 VGG 這樣的??傊?,當用戶踏進店里的那一刻起,Amazon Go就知道用戶長什么樣了。
但是根據(jù)專利和既有經(jīng)驗來看,在整個過程中用計算機視覺來追蹤用戶,代價太高了。我們大致可以確定的是,貨架上的一排排攝像頭應該就是對用戶進行“動作識別”,并且識別出物體是否被拿走(這里也或許是傳感器實現(xiàn)的)。
不過整個過程中的難點是,如何將物品與用戶進行唯一綁定?
云從科技高級算法工程師周翔告訴雷鋒網(wǎng),Amazon Go具體用到哪些技術,目前我們只能夠猜測,他提到可能的實現(xiàn)機制是:
通過手機做到了精準定位人,然后物體的具體位置可以大概確定,一旦人附近的物品離開,同時最近的人的ID就會關聯(lián)這個物品ID。
置物架肯定用到了壓力傳感器,一旦物品離開,就會明確知道什么物品在什么地點離開,一旦物品回來,壓力傳感器同樣會感應到。
深度學習可能是學習了人的購物習慣,可能用到計算機視覺做了人的動作識別,然后根據(jù)物品與人的ID進行關聯(lián),也就是二次確認。同時分析一個人的購物喜好,推測他會買的東西,提前做一些預判。
周翔提出,可能Amazon Go根本沒有用到人臉識別的技術,“國外對人臉的隱私權是比較高的,未經(jīng)允許采集他人的人臉會被起訴的”。雷鋒網(wǎng)也關注到,在李飛飛的那篇推文下,有網(wǎng)友對此持抵觸態(tài)度,認為如果是人臉采集,侵犯了自己的隱私。
Amazon Go的出現(xiàn)驚艷了很多人,不過并不是所有人對此表示歡迎,除了上文提到的隱私問題外,有不少人擔憂,如果這種技術大范圍普及(我們知道亞馬遜是多喜歡2B業(yè)務),大量超市收銀員將會失去工作,畢竟亞馬遜在視頻里承諾要在 2017年初,于西雅圖上線第一家Amazon Go。
不過這種技術究竟有多少“實操性”,還是存在很多的疑惑的,例如:
如果好幾個人擠到一起買同一類東西(比如商場打折搶貨,這是經(jīng)常發(fā)生的),那么物品與人的ID關聯(lián)還能保持精準嗎?
如果用戶把商品放回的位置是錯的呢,這樣也會被收費嗎?
如果有人搞怪,將自己家空果汁瓶取代商店里的新鮮果汁,那么Amazon Go識別的出來嗎?
“所以,這里要求購物的人得非常有素質(zhì)才行”,周翔對雷鋒網(wǎng)說道。我們對Amazon Go的諸多疑惑,或許過幾個月就能在西雅圖見分曉。
相關文章:
深度丨 Yoshua Bengio 得意門生詳解機器學習生成對抗網(wǎng)絡(含86頁PPT)
雷峰網(wǎng)原創(chuàng)文章,未經(jīng)授權禁止轉(zhuǎn)載。詳情見轉(zhuǎn)載須知。