丁香五月天婷婷久久婷婷色综合91|国产传媒自偷自拍|久久影院亚洲精品|国产欧美VA天堂国产美女自慰视屏|免费黄色av网站|婷婷丁香五月激情四射|日韩AV一区二区中文字幕在线观看|亚洲欧美日本性爱|日日噜噜噜夜夜噜噜噜|中文Av日韩一区二区

您正在使用IE低版瀏覽器,為了您的雷峰網(wǎng)賬號(hào)安全和更好的產(chǎn)品體驗(yàn),強(qiáng)烈建議使用更快更安全的瀏覽器
此為臨時(shí)鏈接,僅用于文章預(yù)覽,將在時(shí)失效
政企安全 正文
發(fā)私信給史中
發(fā)送

0

AIR 025 | 360 首席科學(xué)家顏水成:有關(guān)機(jī)器視覺(jué)的六個(gè)洞見(jiàn)

導(dǎo)語(yǔ):在人工智能領(lǐng)域的每一個(gè)洞見(jiàn),都可以讓我們更加接近那個(gè)終極的答案。這讓我們感到欣喜。

從飛鳥(niǎo)到飛機(jī),從蝙蝠到雷達(dá)。人類對(duì)自然界的每一次致敬都能把自己帶入一個(gè)新時(shí)代。而人工智能,恰恰是向自然界的王者——人類——致敬。

自從有計(jì)算機(jī)那天開(kāi)始,人們就從未中斷讓機(jī)器擁有智慧的夢(mèng)想。在這條路上,有一位廣受世界學(xué)界尊重的大師,他就是來(lái)自 360 的首席科學(xué)家、國(guó)際知名計(jì)算機(jī)視覺(jué)與深度學(xué)習(xí)專家顏水成。

他不僅在國(guó)際上領(lǐng)域數(shù)次引領(lǐng)了計(jì)算機(jī)視覺(jué)的研究方向,還進(jìn)行了大量前瞻的實(shí)踐,讓計(jì)算機(jī)模仿嬰兒大腦的運(yùn)作方式,一步步觀察學(xué)習(xí)這個(gè)世界。

在 2016 CCF-GAIR 全球人工智能與機(jī)器人峰會(huì)上,顏水成接受了雷鋒網(wǎng)的專訪,分享了他對(duì)于人工智能和計(jì)算機(jī)視覺(jué)的洞見(jiàn)。

AIR 025 | 360 首席科學(xué)家顏水成:有關(guān)機(jī)器視覺(jué)的六個(gè)洞見(jiàn)

【360 首席科學(xué)家,360 人工智能研究院院長(zhǎng) 顏水成】

1、端上的智能

目前的人工智能很多都依靠云端的計(jì)算,但是有些場(chǎng)景并不適合云端。例如:

  • 特斯拉的自動(dòng)駕駛技術(shù),對(duì)于面前的路況進(jìn)行圖像采集之后,如果發(fā)送到云端進(jìn)行處理,會(huì)有明顯的延時(shí),這樣等結(jié)果返回本地,往往已經(jīng)錯(cuò)失了處理的時(shí)機(jī),就失去了意義。


  • 直播業(yè)務(wù)中為主播實(shí)時(shí)加上裝飾的技術(shù),例如為主播加上虛擬的耳環(huán)。這種場(chǎng)景下,如果從服務(wù)器上拉回來(lái)計(jì)算結(jié)果,會(huì)有時(shí)延,由于主播在運(yùn)動(dòng),所以沒(méi)辦法精確對(duì)位,體驗(yàn)就會(huì)很差。


  • 有的智能攝像頭會(huì)提供一個(gè)功能:查看是否有可疑人員進(jìn)入監(jiān)控區(qū)域。如果設(shè)備銷量很大,大量用戶同時(shí)使用這個(gè)功能,這時(shí)如果在服務(wù)器端進(jìn)行計(jì)算,就會(huì)對(duì)服務(wù)器造成很大壓力。


  • 還有很多智能設(shè)備的應(yīng)用環(huán)境是沒(méi)有網(wǎng)絡(luò)的,無(wú)法和服務(wù)器交互。

AIR 025 | 360 首席科學(xué)家顏水成:有關(guān)機(jī)器視覺(jué)的六個(gè)洞見(jiàn)

【特斯拉自動(dòng)駕駛示意圖】

以上這些場(chǎng)景,如果將運(yùn)算任務(wù)直接下發(fā)到智能設(shè)備終端上,這些瓶頸就會(huì)迎刃而解。

但是,把運(yùn)算載荷放到設(shè)備上,顯然要克服諸多問(wèn)題。其中最大的一個(gè)就是:終端設(shè)備的運(yùn)算能力存在天花板。(由于智能設(shè)備成本有限,大多不可能配備頂級(jí)運(yùn)算芯片)

解決這個(gè)問(wèn)題,有兩個(gè)方向:

1、降低運(yùn)算的精度。例如在手機(jī)端識(shí)別人臉和年齡,精確度必然難以比肩專業(yè)的識(shí)別系統(tǒng)。但是這種從95%到85%的精度損失,是人們可以承受的。


2、改進(jìn)計(jì)算模型。當(dāng)然,最好的情況是能夠開(kāi)發(fā)出新的更優(yōu)計(jì)算模型。但是在現(xiàn)有模型下,也可以通過(guò)改進(jìn)策略實(shí)現(xiàn)算法精簡(jiǎn)。例如顏水成帶領(lǐng)團(tuán)隊(duì)研究了一些算法調(diào)整,在原有算法基礎(chǔ)上增加了一些判斷那些邏輯不用計(jì)算的策略。這樣雖然看起來(lái)規(guī)則更復(fù)雜了,但是總體來(lái)看計(jì)算量是減少了。

顏水成認(rèn)為,這些策略的優(yōu)化是非常有意義的,因?yàn)槌杀就菍?shí)現(xiàn)商業(yè)化的重要因素。

2、人工智能專用計(jì)算芯片

目前最主流的人工智能芯片,全部采用 GPU。但是 GPU 的體量大,耗能高,無(wú)法在手機(jī)等設(shè)備中使用。目前看來(lái),在手機(jī)或硬件上智能使用性能稍好的 CPU。

從目前來(lái)看,市面上還沒(méi)有一款專門(mén)為端設(shè)備研發(fā)的深度學(xué)習(xí)芯片。而中國(guó)人也在試圖給出在這個(gè)領(lǐng)域的專用芯片。

例如中國(guó)科學(xué)院計(jì)算技術(shù)研究所的“寒武紀(jì)”芯片,和由前百度深度學(xué)習(xí)研究院院長(zhǎng)余凱創(chuàng)建的地平線機(jī)器人科技,都在試圖制造這樣的專用芯片。

AIR 025 | 360 首席科學(xué)家顏水成:有關(guān)機(jī)器視覺(jué)的六個(gè)洞見(jiàn)

【寒武紀(jì)芯片】

由于芯片生產(chǎn)是一個(gè)非常重的產(chǎn)業(yè)。一款芯片從流片到量產(chǎn)往往需要一年到一年半的時(shí)間,耗費(fèi)數(shù)百萬(wàn)美元。如果無(wú)法大規(guī)模銷售,那么將會(huì)造成成本無(wú)法控制。

在成熟的芯片可用之前,用各種方法降低端芯片的運(yùn)算量,不失為一個(gè)好的方法。

3、類腦計(jì)算

當(dāng)你看到一個(gè)人的照片,有關(guān)他的很多故事就會(huì)自動(dòng)涌現(xiàn)在你的腦海里,這就是人腦的奇妙之處。

類腦研究一直以來(lái)都是人工智能領(lǐng)域很超前的研究方向。簡(jiǎn)單來(lái)說(shuō),就是要準(zhǔn)確掌握人腦的工作原理,在此基礎(chǔ)之上用相同的原理設(shè)計(jì)深度學(xué)習(xí)網(wǎng)絡(luò)。

但是顏水成說(shuō),人腦研究領(lǐng)域的發(fā)展并沒(méi)有想象中快。但是他非常欣賞以人腦為啟發(fā)研究出來(lái)的計(jì)算模型。

例如當(dāng)一個(gè)人看到某個(gè)物體時(shí),這個(gè)物體是不斷地對(duì)視網(wǎng)膜進(jìn)行沖擊,這個(gè)信號(hào)就像流水一樣,在神經(jīng)的各個(gè)部位達(dá)到了一個(gè)新的平衡。

AIR 025 | 360 首席科學(xué)家顏水成:有關(guān)機(jī)器視覺(jué)的六個(gè)洞見(jiàn)

這就像一個(gè)水管網(wǎng)絡(luò),在入口加壓,會(huì)層層推導(dǎo),造成整個(gè)網(wǎng)絡(luò)的各個(gè)節(jié)點(diǎn)的壓力同時(shí)改變。

“對(duì)于大腦而言,某個(gè)圖像對(duì)整個(gè)系統(tǒng)加電信號(hào),會(huì)導(dǎo)致與之相關(guān)的所有記憶和知識(shí)瞬間涌現(xiàn)。”

這樣的效率會(huì)遠(yuǎn)遠(yuǎn)高于目前人工智能所使用的線性計(jì)算。

雖然這種模型聽(tīng)上去很奇妙,但是在實(shí)際的方程求解方面,仍然面臨重重問(wèn)題。不過(guò)顏水成表示,在這個(gè)方向上,也許未來(lái)能有新的解決方法。

4、無(wú)監(jiān)督學(xué)習(xí)和自學(xué)習(xí)

目前的深度學(xué)習(xí),無(wú)一例外需要大量的數(shù)據(jù)。例如要想讓機(jī)器可以準(zhǔn)確識(shí)別出一只狗,需要先讓系統(tǒng)“看”成千上萬(wàn)只狗。但這顯然和人類的學(xué)習(xí)方式不同。

一個(gè)小孩子,可能只需要看到一兩只狗,就可以認(rèn)識(shí)全世界所有的狗。

AIR 025 | 360 首席科學(xué)家顏水成:有關(guān)機(jī)器視覺(jué)的六個(gè)洞見(jiàn)

【無(wú)監(jiān)督學(xué)習(xí)】

從這一點(diǎn)上看,“小樣本”“無(wú)監(jiān)督”“自學(xué)習(xí)”是人類完勝機(jī)器的方面。那么機(jī)器有沒(méi)有可能實(shí)現(xiàn)小樣本無(wú)監(jiān)督學(xué)習(xí)和自學(xué)習(xí)呢?

這也許就要回到每個(gè)人最初認(rèn)識(shí)世界的那一刻。

顏水成說(shuō):

根據(jù)一些研究,每個(gè)小孩子最初的視覺(jué)學(xué)習(xí)都是從運(yùn)動(dòng)的物體開(kāi)始的。嬰兒就像青蛙一樣只能識(shí)別運(yùn)動(dòng)的物體。因?yàn)槲矬w只有運(yùn)動(dòng),才能分割出眼前世界的區(qū)塊。而從這里出發(fā),才有了物體的概念。這以后才是小樣本學(xué)習(xí)和自學(xué)習(xí)的過(guò)程。

顏水成對(duì)這種學(xué)說(shuō)非常感興趣,這實(shí)際上展現(xiàn)了機(jī)器視覺(jué)的新入口:視頻。

從視頻切入,發(fā)現(xiàn)人類和機(jī)器學(xué)習(xí)的密碼。這也是顏水成帶領(lǐng)團(tuán)隊(duì)正在進(jìn)行的工作之一。

5、人腦的兩套識(shí)別系統(tǒng)

你有沒(méi)有這樣的經(jīng)歷??吹揭粋€(gè)人,你確信認(rèn)識(shí) Ta,但就是想不起 Ta 的名字?

這個(gè)人腦特有的現(xiàn)象,不經(jīng)意間揭示了一個(gè)人腦運(yùn)作的巨大秘密。

AIR 025 | 360 首席科學(xué)家顏水成:有關(guān)機(jī)器視覺(jué)的六個(gè)洞見(jiàn)

【經(jīng)常想不起對(duì)方的名字】

顏水成向雷鋒網(wǎng)分享了他最近了解到的一個(gè)新的假說(shuō):

這可能說(shuō)明人腦分為兩套識(shí)別系統(tǒng):參數(shù)模型和非參數(shù)模型。


對(duì)于不常見(jiàn)到的人或物體,大腦會(huì)選擇把他們放置在非參數(shù)模型中;直到你經(jīng)??吹竭@個(gè)對(duì)象,大腦才會(huì)把它轉(zhuǎn)移到參數(shù)模型中;如果接下來(lái)又長(zhǎng)時(shí)間不見(jiàn)面,這個(gè)對(duì)象又會(huì)被移動(dòng)回非參數(shù)模型中。

這大概就是動(dòng)畫(huà)片《頭腦特工隊(duì)》所描述的規(guī)則。

AIR 025 | 360 首席科學(xué)家顏水成:有關(guān)機(jī)器視覺(jué)的六個(gè)洞見(jiàn)

而這個(gè)規(guī)則,恰恰可以和人類的學(xué)習(xí)模型相聯(lián)系。

例如父母剛剛教會(huì)了小孩“馬”。這時(shí)“馬”就進(jìn)入到了他大腦的非參數(shù)模型中,直到他有一天到了動(dòng)物園,觀察到新的“馬”。這些樣本累積到了一定程度,就會(huì)使得“馬”進(jìn)入到了參數(shù)模型。

這種認(rèn)知模型,對(duì)于改進(jìn)機(jī)器學(xué)習(xí)的架構(gòu)有著重大的意義。機(jī)器的無(wú)監(jiān)督學(xué)習(xí)和自學(xué)習(xí)似乎露出了一絲曙光。但是顏水成說(shuō),人類的學(xué)習(xí)遠(yuǎn)遠(yuǎn)不是這么簡(jiǎn)單,因?yàn)槿说膶W(xué)習(xí)不僅是依靠圖像,還結(jié)合了聲音、語(yǔ)義。而在這些方面,研究空白很大。

6、語(yǔ)義理解

對(duì)于 AI 來(lái)說(shuō),最重要的有四個(gè)方向:視覺(jué),語(yǔ)音、語(yǔ)義、大數(shù)據(jù)。

而目前科學(xué)家在視覺(jué),語(yǔ)音和大數(shù)據(jù)方面,都實(shí)現(xiàn)了可用性比較強(qiáng)的人工智能。唯獨(dú)在“語(yǔ)義理解”這個(gè)最重要和易感知的方面徘徊不前。

這也是為什么目前的所有人工智能機(jī)器人感覺(jué)都有些“辭不達(dá)意”的原因。

究其原因,仍然是之前提到的:人類現(xiàn)有的語(yǔ)義理解實(shí)現(xiàn)技術(shù)和人大腦的工作架構(gòu)完全不同。人對(duì)于語(yǔ)義的理解,不僅僅是建立在對(duì)方的話語(yǔ)本身之上,還要綜合考慮話語(yǔ)環(huán)境,知識(shí)背景、情緒等等因素。這些因素中的任何一個(gè),目前都不能被人類科學(xué)家很好地控制。

顏水成坦言,這方面的研究非常困難,已經(jīng)超越了他的能力范圍。但也是正是專注于自己的視覺(jué)和大數(shù)據(jù)研究領(lǐng)域,才能專心做出更多的成績(jī)。

AI,這兩個(gè)字母充滿了神秘和浪漫的氣息。這不僅代表了我們對(duì)于未知的渴望,對(duì)于創(chuàng)造的期待,也代表了我們對(duì)于自身智慧的無(wú)上虔誠(chéng)。

在人工智能領(lǐng)域的每一個(gè)洞見(jiàn),都可以讓我們更加接近那個(gè)終極的答案。

這讓我們感到欣喜。

AIR 025 | 360 首席科學(xué)家顏水成:有關(guān)機(jī)器視覺(jué)的六個(gè)洞見(jiàn)

顏水成,360 首席科學(xué)家,360 人工智能研究院院長(zhǎng)。曾在新加坡國(guó)立大學(xué)領(lǐng)導(dǎo)機(jī)器學(xué)習(xí)與計(jì)算機(jī)視覺(jué)實(shí)驗(yàn)室。顏水成的主要研究領(lǐng)域是計(jì)算機(jī)視覺(jué),深度學(xué)習(xí),與多媒體分析。他的團(tuán)隊(duì)提出的“Network in Network” 對(duì)深度學(xué)習(xí)產(chǎn)生了很大的推動(dòng)力,他的團(tuán)隊(duì)在五年內(nèi)曾7次問(wèn)鼎計(jì)算機(jī)視覺(jué)領(lǐng)域“World Cup”競(jìng)賽 PASCAL VOC 和 ILSVRC的世界冠軍和亞軍獎(jiǎng)項(xiàng)。

雷峰網(wǎng)原創(chuàng)文章,未經(jīng)授權(quán)禁止轉(zhuǎn)載。詳情見(jiàn)轉(zhuǎn)載須知。

分享:
相關(guān)文章

編輯

雷鋒網(wǎng)編輯,關(guān)注科技人文,安全、黑客及芯片。
當(dāng)月熱門(mén)文章
最新文章
請(qǐng)?zhí)顚?xiě)申請(qǐng)人資料
姓名
電話
郵箱
微信號(hào)
作品鏈接
個(gè)人簡(jiǎn)介
為了您的賬戶安全,請(qǐng)驗(yàn)證郵箱
您的郵箱還未驗(yàn)證,完成可獲20積分喲!
請(qǐng)驗(yàn)證您的郵箱
立即驗(yàn)證
完善賬號(hào)信息
您的賬號(hào)已經(jīng)綁定,現(xiàn)在您可以設(shè)置密碼以方便用郵箱登錄
立即設(shè)置 以后再說(shuō)