1
本文作者: 三川 | 2017-07-13 16:30 |
雷鋒網(wǎng)消息,微軟發(fā)布了一款基于計(jì)算機(jī)視覺技術(shù)的手機(jī) APP “Seeing AI”(“視覺 AI”) ,能為有視力缺陷的殘障人士描述周圍的世界。
安裝該 APP 之后,用戶若把手機(jī)攝像頭對準(zhǔn)某人,它就會說出這個(gè)人是誰,以及他的情緒(表情)。把手機(jī)攝像頭對準(zhǔn)某個(gè)物體,Seeing AI 會說出這是個(gè)什么東西。這通過在手機(jī)本地運(yùn)行的 AI 算法實(shí)現(xiàn)。
Seeing AI 人臉識別示例:“戴著眼鏡的 28 歲女士,看起來很開心?!?/span>
去年三月的 Build 大會上,微軟展示了這款 APP 的原型。今天,它終于發(fā)布。美國 iOS 用戶已可免費(fèi)下載。至于 Seeing AI 何時(shí)會登陸安卓、進(jìn)入中國市場,雷鋒網(wǎng)尚沒收到任何消息。
作為一款面向殘障人士的生活輔助軟件,微軟把 Seeing AI 設(shè)計(jì)為能滿足一系列不同的生活場景需求。比如上面提到的,進(jìn)行面部識別,猜測對方的年齡和情緒。它還能通過掃描二維碼識別家居物品,讀取、識別文件,識別美元鈔票。識別鈔票的功能是一個(gè)實(shí)用性極強(qiáng)的功能。所有美元紙幣都是相同大小、同樣顏色。對部分殘障人士,區(qū)分不同面值的鈔票可能會十分困難,Seeing AI 這樣的 APP 則能解決該問題。
Seeing AI 文件識別示例
Seeing AI 的物體識別能力基于神經(jīng)網(wǎng)絡(luò)來實(shí)現(xiàn),其基本原理與自動駕駛汽車、無人機(jī)并無不同。它最基本的功能在本地實(shí)現(xiàn)。這有兩個(gè)好處:
網(wǎng)絡(luò)不穩(wěn)定的情況下仍可使用;
反饋速度更快。
但是,Seeing AI 的試驗(yàn)性功能,比如描述整個(gè)周圍環(huán)境,以及識別手寫文字,則需要連接到云端。
Seeing AI 的技術(shù)帶頭人 Saqib Shaikh,向媒體透露了一個(gè)很有意思的細(xì)節(jié):
Seeing AI 能夠指示用戶如何上下左右移動手機(jī)攝像頭,以看清楚目標(biāo)物體。 這是一個(gè)相當(dāng)人性化的功能,尤其考慮到視力有缺陷的殘障用戶,讓它們拿手機(jī)攝像頭“對準(zhǔn)”某個(gè)物體本身就存在相當(dāng)?shù)碾y度。很顯然,對于 Seeing AI 來講,雖然光學(xué)物體識別技術(shù)是根本,但若沒有這類人性化功能設(shè)計(jì),它究竟有多少實(shí)用價(jià)值就變得十分模糊。
Saqib Shaikh
從 Saqib Shaikh 他自己的使用經(jīng)歷來講(他是一名盲人),他最經(jīng)常把 Seeing AI 用來識別符號和菜單。至于 Seeing AI 和其他同類 APP 之間的差異,他表示,最大的區(qū)別神經(jīng)網(wǎng)絡(luò)的運(yùn)行速度:
“我們做到了在本地運(yùn)行人臉識別,幾微秒的時(shí)間內(nèi)你就能聽到結(jié)果。速度就是一切,我們試圖壓榨出在設(shè)備本地所能達(dá)到的極限?!?/p>
via the verge,雷鋒網(wǎng)編譯
相關(guān)文章:
雷峰網(wǎng)版權(quán)文章,未經(jīng)授權(quán)禁止轉(zhuǎn)載。詳情見轉(zhuǎn)載須知。