3
本文作者: 墨痕 | 2015-02-12 18:20 |
深度學習在聲頻、圖像、視頻處理上已經取得了令人印象深刻的進步,但是它通常需要功能強大的電腦才可以進行,如果如果它出現(xiàn)在我們的手機上呢?
那些大致模仿人腦工作的軟件賦予了智能手機新的智慧,更精確和更復雜的APP也應運而生,它們能追蹤人類的行為和情緒。這些軟件利用了一種被稱為深度學習的人工智能技術,它模擬神經元和突觸來進行數(shù)據處理。給予程序一些視覺刺激,還可以加強某些虛擬神經元之間的聯(lián)系,使它能夠識別人臉圖像或者其他該程序未見過的圖像。
深度學習技術在處理圖像和音頻方面已經有令人矚目的進步:
去年,F(xiàn)acebook的研究人員用它建立了一個系統(tǒng),可以用來確定兩張不同的照片顯示的是否是同一個人;
谷歌采用這種方法創(chuàng)建了一款可以用短句子描述復雜圖像的軟件。
然而,到目前為止,大部分功能只能在強大的電腦上進行過嘗試。智能手機通過遠程服務器,也可以利用深度學習技術,但這樣可能會很慢,而且只有在設備處于良好的網絡連接環(huán)境下才行。
現(xiàn)在貝爾實驗室的首席科學家Nic Lane提出,部分智能手機的功能強大到可以運行某些深度學習技術,并且他還認為,深度學習可以改善手機APP 的性能,例如過濾掉麥克風里的雜音,或刪除加速計采集的數(shù)據中不必要的信號。
當Lane去年還是微軟亞洲研究院的首席研究員時,他和一名劍橋大學的研究生Petko Georgiev,建立了一個相對簡單的深度學習項目模型,可在一款改進后的智能手機上運行。
研究者們試圖找出這款模型是否可以提高智能手機的檢測能力:
從手腕上的加速計采集數(shù)據,分析某人是否做了譬如喝湯或者刷牙這樣特定的動作;
是否可以從通話錄音中,用手機來確定使用者的情緒或身份。
在本月的墨西哥圣達菲HotMobile會議上,他們在一篇報告里詳細介紹了他們的研究結果。他們表示這款軟件在識別人類行為上,比別的軟件的精確率高出10%,其神經網絡能夠和其他方法一樣準確識別說話者身份和說話者的情緒。
他們創(chuàng)建的神經網絡模型相比于Facebook的成果,仍算不上多厲害,但它可以更快更靠譜地完成某些任務。Lane說:
“我們想將智能灌輸?shù)揭磺性O備,讓它們理解世界并作出反應。”
也許用上了他們軟件的手機,才是真正的智能手機吧。
via tr
雷峰網原創(chuàng)文章,未經授權禁止轉載。詳情見轉載須知。