丁香五月天婷婷久久婷婷色综合91|国产传媒自偷自拍|久久影院亚洲精品|国产欧美VA天堂国产美女自慰视屏|免费黄色av网站|婷婷丁香五月激情四射|日韩AV一区二区中文字幕在线观看|亚洲欧美日本性爱|日日噜噜噜夜夜噜噜噜|中文Av日韩一区二区

您正在使用IE低版瀏覽器,為了您的雷峰網(wǎng)賬號安全和更好的產(chǎn)品體驗,強烈建議使用更快更安全的瀏覽器
此為臨時鏈接,僅用于文章預覽,將在時失效
政企安全 正文
發(fā)私信給史中
發(fā)送

0

AIR 025 | 360 首席科學家顏水成:有關(guān)機器視覺的六個洞見

導語:在人工智能領(lǐng)域的每一個洞見,都可以讓我們更加接近那個終極的答案。這讓我們感到欣喜。

從飛鳥到飛機,從蝙蝠到雷達。人類對自然界的每一次致敬都能把自己帶入一個新時代。而人工智能,恰恰是向自然界的王者——人類——致敬。

自從有計算機那天開始,人們就從未中斷讓機器擁有智慧的夢想。在這條路上,有一位廣受世界學界尊重的大師,他就是來自 360 的首席科學家、國際知名計算機視覺與深度學習專家顏水成。

他不僅在國際上領(lǐng)域數(shù)次引領(lǐng)了計算機視覺的研究方向,還進行了大量前瞻的實踐,讓計算機模仿嬰兒大腦的運作方式,一步步觀察學習這個世界。

在 2016 CCF-GAIR 全球人工智能與機器人峰會上,顏水成接受了雷鋒網(wǎng)的專訪,分享了他對于人工智能和計算機視覺的洞見。

AIR 025 | 360 首席科學家顏水成:有關(guān)機器視覺的六個洞見

【360 首席科學家,360 人工智能研究院院長 顏水成】

1、端上的智能

目前的人工智能很多都依靠云端的計算,但是有些場景并不適合云端。例如:

  • 特斯拉的自動駕駛技術(shù),對于面前的路況進行圖像采集之后,如果發(fā)送到云端進行處理,會有明顯的延時,這樣等結(jié)果返回本地,往往已經(jīng)錯失了處理的時機,就失去了意義。


  • 直播業(yè)務(wù)中為主播實時加上裝飾的技術(shù),例如為主播加上虛擬的耳環(huán)。這種場景下,如果從服務(wù)器上拉回來計算結(jié)果,會有時延,由于主播在運動,所以沒辦法精確對位,體驗就會很差。


  • 有的智能攝像頭會提供一個功能:查看是否有可疑人員進入監(jiān)控區(qū)域。如果設(shè)備銷量很大,大量用戶同時使用這個功能,這時如果在服務(wù)器端進行計算,就會對服務(wù)器造成很大壓力。


  • 還有很多智能設(shè)備的應(yīng)用環(huán)境是沒有網(wǎng)絡(luò)的,無法和服務(wù)器交互。

AIR 025 | 360 首席科學家顏水成:有關(guān)機器視覺的六個洞見

【特斯拉自動駕駛示意圖】

以上這些場景,如果將運算任務(wù)直接下發(fā)到智能設(shè)備終端上,這些瓶頸就會迎刃而解。

但是,把運算載荷放到設(shè)備上,顯然要克服諸多問題。其中最大的一個就是:終端設(shè)備的運算能力存在天花板。(由于智能設(shè)備成本有限,大多不可能配備頂級運算芯片)

解決這個問題,有兩個方向:

1、降低運算的精度。例如在手機端識別人臉和年齡,精確度必然難以比肩專業(yè)的識別系統(tǒng)。但是這種從95%到85%的精度損失,是人們可以承受的。


2、改進計算模型。當然,最好的情況是能夠開發(fā)出新的更優(yōu)計算模型。但是在現(xiàn)有模型下,也可以通過改進策略實現(xiàn)算法精簡。例如顏水成帶領(lǐng)團隊研究了一些算法調(diào)整,在原有算法基礎(chǔ)上增加了一些判斷那些邏輯不用計算的策略。這樣雖然看起來規(guī)則更復雜了,但是總體來看計算量是減少了。

顏水成認為,這些策略的優(yōu)化是非常有意義的,因為成本往往是實現(xiàn)商業(yè)化的重要因素。

2、人工智能專用計算芯片

目前最主流的人工智能芯片,全部采用 GPU。但是 GPU 的體量大,耗能高,無法在手機等設(shè)備中使用。目前看來,在手機或硬件上智能使用性能稍好的 CPU。

從目前來看,市面上還沒有一款專門為端設(shè)備研發(fā)的深度學習芯片。而中國人也在試圖給出在這個領(lǐng)域的專用芯片。

例如中國科學院計算技術(shù)研究所的“寒武紀”芯片,和由前百度深度學習研究院院長余凱創(chuàng)建的地平線機器人科技,都在試圖制造這樣的專用芯片。

AIR 025 | 360 首席科學家顏水成:有關(guān)機器視覺的六個洞見

【寒武紀芯片】

由于芯片生產(chǎn)是一個非常重的產(chǎn)業(yè)。一款芯片從流片到量產(chǎn)往往需要一年到一年半的時間,耗費數(shù)百萬美元。如果無法大規(guī)模銷售,那么將會造成成本無法控制。

在成熟的芯片可用之前,用各種方法降低端芯片的運算量,不失為一個好的方法。

3、類腦計算

當你看到一個人的照片,有關(guān)他的很多故事就會自動涌現(xiàn)在你的腦海里,這就是人腦的奇妙之處。

類腦研究一直以來都是人工智能領(lǐng)域很超前的研究方向。簡單來說,就是要準確掌握人腦的工作原理,在此基礎(chǔ)之上用相同的原理設(shè)計深度學習網(wǎng)絡(luò)。

但是顏水成說,人腦研究領(lǐng)域的發(fā)展并沒有想象中快。但是他非常欣賞以人腦為啟發(fā)研究出來的計算模型。

例如當一個人看到某個物體時,這個物體是不斷地對視網(wǎng)膜進行沖擊,這個信號就像流水一樣,在神經(jīng)的各個部位達到了一個新的平衡。

AIR 025 | 360 首席科學家顏水成:有關(guān)機器視覺的六個洞見

這就像一個水管網(wǎng)絡(luò),在入口加壓,會層層推導,造成整個網(wǎng)絡(luò)的各個節(jié)點的壓力同時改變。

“對于大腦而言,某個圖像對整個系統(tǒng)加電信號,會導致與之相關(guān)的所有記憶和知識瞬間涌現(xiàn)?!?/p>

這樣的效率會遠遠高于目前人工智能所使用的線性計算。

雖然這種模型聽上去很奇妙,但是在實際的方程求解方面,仍然面臨重重問題。不過顏水成表示,在這個方向上,也許未來能有新的解決方法。

4、無監(jiān)督學習和自學習

目前的深度學習,無一例外需要大量的數(shù)據(jù)。例如要想讓機器可以準確識別出一只狗,需要先讓系統(tǒng)“看”成千上萬只狗。但這顯然和人類的學習方式不同。

一個小孩子,可能只需要看到一兩只狗,就可以認識全世界所有的狗。

AIR 025 | 360 首席科學家顏水成:有關(guān)機器視覺的六個洞見

【無監(jiān)督學習】

從這一點上看,“小樣本”“無監(jiān)督”“自學習”是人類完勝機器的方面。那么機器有沒有可能實現(xiàn)小樣本無監(jiān)督學習和自學習呢?

這也許就要回到每個人最初認識世界的那一刻。

顏水成說:

根據(jù)一些研究,每個小孩子最初的視覺學習都是從運動的物體開始的。嬰兒就像青蛙一樣只能識別運動的物體。因為物體只有運動,才能分割出眼前世界的區(qū)塊。而從這里出發(fā),才有了物體的概念。這以后才是小樣本學習和自學習的過程。

顏水成對這種學說非常感興趣,這實際上展現(xiàn)了機器視覺的新入口:視頻。

從視頻切入,發(fā)現(xiàn)人類和機器學習的密碼。這也是顏水成帶領(lǐng)團隊正在進行的工作之一。

5、人腦的兩套識別系統(tǒng)

你有沒有這樣的經(jīng)歷??吹揭粋€人,你確信認識 Ta,但就是想不起 Ta 的名字?

這個人腦特有的現(xiàn)象,不經(jīng)意間揭示了一個人腦運作的巨大秘密。

AIR 025 | 360 首席科學家顏水成:有關(guān)機器視覺的六個洞見

【經(jīng)常想不起對方的名字】

顏水成向雷鋒網(wǎng)分享了他最近了解到的一個新的假說:

這可能說明人腦分為兩套識別系統(tǒng):參數(shù)模型和非參數(shù)模型。


對于不常見到的人或物體,大腦會選擇把他們放置在非參數(shù)模型中;直到你經(jīng)??吹竭@個對象,大腦才會把它轉(zhuǎn)移到參數(shù)模型中;如果接下來又長時間不見面,這個對象又會被移動回非參數(shù)模型中。

這大概就是動畫片《頭腦特工隊》所描述的規(guī)則。

AIR 025 | 360 首席科學家顏水成:有關(guān)機器視覺的六個洞見

而這個規(guī)則,恰恰可以和人類的學習模型相聯(lián)系。

例如父母剛剛教會了小孩“馬”。這時“馬”就進入到了他大腦的非參數(shù)模型中,直到他有一天到了動物園,觀察到新的“馬”。這些樣本累積到了一定程度,就會使得“馬”進入到了參數(shù)模型。

這種認知模型,對于改進機器學習的架構(gòu)有著重大的意義。機器的無監(jiān)督學習和自學習似乎露出了一絲曙光。但是顏水成說,人類的學習遠遠不是這么簡單,因為人的學習不僅是依靠圖像,還結(jié)合了聲音、語義。而在這些方面,研究空白很大。

6、語義理解

對于 AI 來說,最重要的有四個方向:視覺,語音、語義、大數(shù)據(jù)。

而目前科學家在視覺,語音和大數(shù)據(jù)方面,都實現(xiàn)了可用性比較強的人工智能。唯獨在“語義理解”這個最重要和易感知的方面徘徊不前。

這也是為什么目前的所有人工智能機器人感覺都有些“辭不達意”的原因。

究其原因,仍然是之前提到的:人類現(xiàn)有的語義理解實現(xiàn)技術(shù)和人大腦的工作架構(gòu)完全不同。人對于語義的理解,不僅僅是建立在對方的話語本身之上,還要綜合考慮話語環(huán)境,知識背景、情緒等等因素。這些因素中的任何一個,目前都不能被人類科學家很好地控制。

顏水成坦言,這方面的研究非常困難,已經(jīng)超越了他的能力范圍。但也是正是專注于自己的視覺和大數(shù)據(jù)研究領(lǐng)域,才能專心做出更多的成績。

AI,這兩個字母充滿了神秘和浪漫的氣息。這不僅代表了我們對于未知的渴望,對于創(chuàng)造的期待,也代表了我們對于自身智慧的無上虔誠。

在人工智能領(lǐng)域的每一個洞見,都可以讓我們更加接近那個終極的答案。

這讓我們感到欣喜。

AIR 025 | 360 首席科學家顏水成:有關(guān)機器視覺的六個洞見

顏水成,360 首席科學家,360 人工智能研究院院長。曾在新加坡國立大學領(lǐng)導機器學習與計算機視覺實驗室。顏水成的主要研究領(lǐng)域是計算機視覺,深度學習,與多媒體分析。他的團隊提出的“Network in Network” 對深度學習產(chǎn)生了很大的推動力,他的團隊在五年內(nèi)曾7次問鼎計算機視覺領(lǐng)域“World Cup”競賽 PASCAL VOC 和 ILSVRC的世界冠軍和亞軍獎項。

雷峰網(wǎng)原創(chuàng)文章,未經(jīng)授權(quán)禁止轉(zhuǎn)載。詳情見轉(zhuǎn)載須知。

分享:
相關(guān)文章

編輯

雷鋒網(wǎng)編輯,關(guān)注科技人文,安全、黑客及芯片。
當月熱門文章
最新文章
請?zhí)顚懮暾埲速Y料
姓名
電話
郵箱
微信號
作品鏈接
個人簡介
為了您的賬戶安全,請驗證郵箱
您的郵箱還未驗證,完成可獲20積分喲!
請驗證您的郵箱
立即驗證
完善賬號信息
您的賬號已經(jīng)綁定,現(xiàn)在您可以設(shè)置密碼以方便用郵箱登錄
立即設(shè)置 以后再說