3
本文作者: 墨痕 | 2015-02-12 18:20 |
深度學(xué)習(xí)在聲頻、圖像、視頻處理上已經(jīng)取得了令人印象深刻的進(jìn)步,但是它通常需要功能強(qiáng)大的電腦才可以進(jìn)行,如果如果它出現(xiàn)在我們的手機(jī)上呢?
那些大致模仿人腦工作的軟件賦予了智能手機(jī)新的智慧,更精確和更復(fù)雜的APP也應(yīng)運(yùn)而生,它們能追蹤人類的行為和情緒。這些軟件利用了一種被稱為深度學(xué)習(xí)的人工智能技術(shù),它模擬神經(jīng)元和突觸來進(jìn)行數(shù)據(jù)處理。給予程序一些視覺刺激,還可以加強(qiáng)某些虛擬神經(jīng)元之間的聯(lián)系,使它能夠識別人臉圖像或者其他該程序未見過的圖像。
深度學(xué)習(xí)技術(shù)在處理圖像和音頻方面已經(jīng)有令人矚目的進(jìn)步:
去年,F(xiàn)acebook的研究人員用它建立了一個系統(tǒng),可以用來確定兩張不同的照片顯示的是否是同一個人;
谷歌采用這種方法創(chuàng)建了一款可以用短句子描述復(fù)雜圖像的軟件。
然而,到目前為止,大部分功能只能在強(qiáng)大的電腦上進(jìn)行過嘗試。智能手機(jī)通過遠(yuǎn)程服務(wù)器,也可以利用深度學(xué)習(xí)技術(shù),但這樣可能會很慢,而且只有在設(shè)備處于良好的網(wǎng)絡(luò)連接環(huán)境下才行。
現(xiàn)在貝爾實(shí)驗(yàn)室的首席科學(xué)家Nic Lane提出,部分智能手機(jī)的功能強(qiáng)大到可以運(yùn)行某些深度學(xué)習(xí)技術(shù),并且他還認(rèn)為,深度學(xué)習(xí)可以改善手機(jī)APP 的性能,例如過濾掉麥克風(fēng)里的雜音,或刪除加速計(jì)采集的數(shù)據(jù)中不必要的信號。
當(dāng)Lane去年還是微軟亞洲研究院的首席研究員時,他和一名劍橋大學(xué)的研究生Petko Georgiev,建立了一個相對簡單的深度學(xué)習(xí)項(xiàng)目模型,可在一款改進(jìn)后的智能手機(jī)上運(yùn)行。
研究者們試圖找出這款模型是否可以提高智能手機(jī)的檢測能力:
從手腕上的加速計(jì)采集數(shù)據(jù),分析某人是否做了譬如喝湯或者刷牙這樣特定的動作;
是否可以從通話錄音中,用手機(jī)來確定使用者的情緒或身份。
在本月的墨西哥圣達(dá)菲HotMobile會議上,他們在一篇報告里詳細(xì)介紹了他們的研究結(jié)果。他們表示這款軟件在識別人類行為上,比別的軟件的精確率高出10%,其神經(jīng)網(wǎng)絡(luò)能夠和其他方法一樣準(zhǔn)確識別說話者身份和說話者的情緒。
他們創(chuàng)建的神經(jīng)網(wǎng)絡(luò)模型相比于Facebook的成果,仍算不上多厲害,但它可以更快更靠譜地完成某些任務(wù)。Lane說:
“我們想將智能灌輸?shù)揭磺性O(shè)備,讓它們理解世界并作出反應(yīng)?!?/span>
也許用上了他們軟件的手機(jī),才是真正的智能手機(jī)吧。
via tr
雷峰網(wǎng)原創(chuàng)文章,未經(jīng)授權(quán)禁止轉(zhuǎn)載。詳情見轉(zhuǎn)載須知。