0
本文作者: 余快 | 2020-04-22 16:48 |
近日,吳恩達(dá)創(chuàng)立的AI公司Landing AI發(fā)布了一款社交距離檢測(cè)工具,幫助疫情期間不得不工作的人,確保他們?cè)诠ぷ鲌?chǎng)所的社交距離,該工具可以通過(guò)分析攝像頭拍攝的實(shí)時(shí)視頻流來(lái)檢測(cè)人們是否保持安全距離。
例如,在一家生產(chǎn)防護(hù)設(shè)備的工廠,技術(shù)人員可以將該軟件集成到他們的安全攝像系統(tǒng)中,通過(guò)簡(jiǎn)單的校準(zhǔn)步驟來(lái)監(jiān)視工作環(huán)境。如下面的演示所示,探測(cè)器可以用紅色高亮顯示距離低于最小可接受距離的人,并在兩者之間畫(huà)一條線進(jìn)行強(qiáng)調(diào)。該系統(tǒng)還能發(fā)出警報(bào),提醒人們?cè)谶`反協(xié)議時(shí)保持安全距離。
作為人工智能和機(jī)器學(xué)習(xí)領(lǐng)域國(guó)際上最權(quán)威的學(xué)者之一,吳承恩也是原Google Brain項(xiàng)目創(chuàng)始人,關(guān)于他曾轟動(dòng)一時(shí)的事件是,其開(kāi)發(fā)的人工神經(jīng)網(wǎng)絡(luò)通過(guò)觀看一周YouTube視頻,自主學(xué)會(huì)識(shí)別出關(guān)于貓的視頻。這個(gè)案例為人工智能領(lǐng)域發(fā)展翻開(kāi)嶄新一頁(yè)。
2014年,被冠以“谷歌大腦之父”的吳恩達(dá)加入百度,負(fù)責(zé)Baidu Brain計(jì)劃,此次加盟被認(rèn)為是中國(guó)互聯(lián)網(wǎng)公司迄今為止引入的最重要的外援。2017年,吳恩達(dá)離開(kāi)百度,創(chuàng)立了 Landing AI。
Landing AI對(duì)此次開(kāi)發(fā)軟件的技術(shù)方法進(jìn)行了詳細(xì)的介紹,搭配攝像機(jī)的軟件技術(shù)包含三個(gè)主要步驟:校準(zhǔn)、檢測(cè)和測(cè)量。
校準(zhǔn)
由于輸入的視頻由任意的透視角度拍攝,因此視頻輸入的第一步是利用計(jì)算將透視視圖轉(zhuǎn)變?yōu)轼B(niǎo)瞰視圖,即將自上而下視圖轉(zhuǎn)為單應(yīng)性矩陣視圖(計(jì)算機(jī)視覺(jué)中意思是從同一個(gè)源發(fā)出的光而得到的變化圖,即射影變換),這個(gè)過(guò)程被稱(chēng)為校準(zhǔn)。由于輸入幀是從單個(gè)攝像機(jī)獲取的單眼圖像,因此最簡(jiǎn)單的校準(zhǔn)方法是在透視圖中選擇四個(gè)點(diǎn),并將它們映射到鳥(niǎo)瞰視圖中的矩形角,這是假設(shè)每個(gè)人都站在同一平面上。這個(gè)原理可以應(yīng)用于整個(gè)透視圖的轉(zhuǎn)換。這種方法雖然廣為人知,但能在現(xiàn)實(shí)中正確地應(yīng)用卻并不容易。因此,Landing AI開(kāi)發(fā)人員構(gòu)建了一個(gè)輕量級(jí)工具,即使是非技術(shù)用戶(hù)也可以實(shí)時(shí)校準(zhǔn)系統(tǒng)。
在校正步驟中,他們還考慮了鳥(niǎo)瞰圖的比例系數(shù),例如現(xiàn)實(shí)生活中6英尺對(duì)應(yīng)多少像素。
圖片來(lái)自Landing AI 官網(wǎng)
左邊是原始的透視圖,上面覆蓋了一個(gè)校準(zhǔn)網(wǎng)格。右邊是由此產(chǎn)生的鳥(niǎo)瞰圖。街道的兩邊完全平行于綠色網(wǎng)格。
檢測(cè)
視頻輸入的第二步涉及到將行人檢測(cè)器應(yīng)用到透視圖上,以便在每個(gè)行人周?chē)L制邊界框。為了簡(jiǎn)單起見(jiàn),開(kāi)發(fā)者使用了一個(gè)基Faster于R-CNN架構(gòu)的開(kāi)源行人檢測(cè)網(wǎng)絡(luò)。為了清除輸出邊界框,采用最小的后置處理,如非極大值抑制(NMS)和各種基于規(guī)則的啟發(fā)式算法; Landing AI方認(rèn)為,開(kāi)發(fā)者應(yīng)該選擇基于現(xiàn)實(shí)生活假設(shè)來(lái)選擇規(guī)則(例如,識(shí)別人類(lèi)的身高而非寬度),以最大程度降低過(guò)度擬合的風(fēng)險(xiǎn)。
測(cè)量
第三步,給定每個(gè)人邊界框,預(yù)估他們的在鳥(niǎo)瞰圖中的坐標(biāo)位置(x軸, y軸)。由于校準(zhǔn)步驟輸出一個(gè)平面圖的變換,因此開(kāi)發(fā)者將該變換應(yīng)用到每個(gè)人的邊界框的底部中心點(diǎn),從而得到他們?cè)邙B(niǎo)瞰視圖中的位置。最后一步是計(jì)算出每?jī)扇酥g的鳥(niǎo)瞰圖距離,并根據(jù)標(biāo)定得到的比例系數(shù)對(duì)距離進(jìn)行縮放處理。用紅色突出那些距離低于最小可接受距離的人,并在兩者之間劃一條線進(jìn)行強(qiáng)調(diào)。
考慮到計(jì)算機(jī)視覺(jué)的興起帶來(lái)了隱私和個(gè)人權(quán)利問(wèn)題, Landing AI表示,他們目前的系統(tǒng)不會(huì)識(shí)別個(gè)人,也將敦促任何使用此系統(tǒng)的人必須做到公開(kāi)透明且僅在當(dāng)事人知情同意的情況下使用。
Landing AI總部位于美國(guó)硅谷,由前百度首席科學(xué)家、前谷歌大腦創(chuàng)始人之一吳恩達(dá)于2017年底創(chuàng)辦,專(zhuān)注于為傳統(tǒng)企業(yè)提供人工智能轉(zhuǎn)型方案及服務(wù)。截至目前,Landing AI已獲得包括三星、阿里巴巴、聯(lián)想、英特爾、AIFund等多家機(jī)構(gòu)的投資。
據(jù)悉,國(guó)際權(quán)威咨詢(xún)機(jī)構(gòu)Gartner發(fā)布了《2020人工智能核心技術(shù)最酷供應(yīng)商報(bào)告》,Landing AI憑借其助力企業(yè)實(shí)現(xiàn)人工智能落地與規(guī)?;瘧?yīng)用方面的成績(jī)成功入選。雷鋒網(wǎng)雷鋒網(wǎng)雷鋒網(wǎng)
雷峰網(wǎng)原創(chuàng)文章,未經(jīng)授權(quán)禁止轉(zhuǎn)載。詳情見(jiàn)轉(zhuǎn)載須知。