2
今天,在浙江余姚舉辦的中國第三屆機器人峰會上,中國工程院李德毅院士分享了他在無人駕駛研究領域的最近進展,明確指出無人駕駛的核心在駕駛腦,跟汽車廠商正在做的東西分工明確,而且這個“腦”的駕駛活動更多的是技巧,記憶和經(jīng)驗,而不是知識、推理和計算。
歷史機遇的又一個崛起可能就是人工智能。我今年72歲了,以一個“70后”的身份,我談談創(chuàng)業(yè)創(chuàng)新四個要素。我問過許多同行,他們認為技術很重要;我又問更年輕的同行,他們告訴我是資金更重要,沒有錢什么都辦不成;還有人告訴我團隊很重要,還有人告訴我思想很重要,那么我想今天報告談一下我的看法。
先講第一個問題,大家都以為在國外留學,然后到FaceBook這樣的國外公司呆一陣子,再到中國創(chuàng)業(yè)就很容易,其實不對,你是有人傲人的經(jīng)歷,是有核心的技術,但是不是可以下海了呢?
我下一張片子是我的觀點,有點嚇人。請大家看看這個話,創(chuàng)業(yè)成員固然有各自傲人的工作經(jīng)歷和核心技術,但整個團隊如果沒有明確的,由核心技術匯聚而成的,獨創(chuàng)獨有的成果載體,沒有耀眼的創(chuàng)新亮點,而只是把公司辦成了攻克難題的研究所,苦苦掙扎,技術長期不孵化不出產品來,這樣的公司必死無疑。比如,10個搞互聯(lián)網(wǎng)+9個人要死,20個人搞人工智能+十幾個要死。
你要搞清楚你要知道你要的是技術,還是核心技術,還是技術的成果?我主張要有技術的成果。
我作為一個“70”后,我今天分享的亮點是什么?駕駛腦,認知腦,且我可以說這跟汽車廠商正在做的事情沒沖突,我模擬的是駕駛員的大腦,他造的是車。
我在講智能的時候講三大智能,我們習慣說計算智能,感知智能和認知智能。剛才我參觀了余姚研究所,我說,機器已經(jīng)超過人的計算,我們現(xiàn)在的重點要搞交互智能, 記憶智能。
我家里用壞三臺掃地機,我覺得現(xiàn)在不用為好。不實惠。你們不相信可以用用看,第一掃不干凈,第二該掃的地方老是不掃。怎么辦?所以,我現(xiàn)在做什么呢?我不做先視后覺,這是常規(guī)的,我做的是視而不覺,邊視邊覺,先覺后視。
我做的是要用已有的認知,借助當前的感知。我的駕駛腦數(shù)據(jù)流程圖,余凱說值一千萬,我把這個送給余姚同志們,看看你們能不能做出來,我的駕駛腦一個 瞬間記憶池,還有態(tài)勢記憶池、還有決策記憶池。
如果我們用到掃地機機器人上,以后它天天這樣掃也是很好的機器人,這是不同的記憶能力不同的認知。駕駛活動更多的是技巧,記憶和經(jīng)驗,而不是知識、推理和計算。駕駛腦的差異,反映是個人的智力和運動協(xié)調能力的差異,世界上沒有兩個完全相同的駕駛腦。
這才叫機器人。我們想將來車上跑的駕駛腦也是一樣的。真正開車的不是汽車本身,而是駕駛員,人的認知,要把腦和機器融合在一起才行。所以我們主張在我們機器人里面,有一個調試總線擴展為自學總線,可以學習人是怎么開車的。然后機器人開車時候扮演的角色,主要是通過學習的東西消化吸收,深入學習,變成了自己的行為。
這張圖也很好,你們拿手機照一照。
人工駕駛的時候,三路機器視覺,圖象一路,GPS一路、雷達一路,這三路視覺形成了現(xiàn)在的駕駛態(tài)勢圖,駕駛員通過生活視覺的認知,形成了對方向盤、油門剎車的控制。把當前駕駛態(tài)勢和一個認知組成一個隊,把這個隊放在深度學習的神經(jīng)網(wǎng)絡里面去,讓它學習,形成駕駛記憶。
如果開十天這個數(shù)據(jù)量也不小,如果整天從辦公室到家,從家到辦公室,到11天可以了,機器人說——我可以開了。當機器人開車的時候,駕駛員不在了,它就可以搜索這個圖,把對應的認知拿出來去開車。駕駛就是這么簡單,這怎么能夠讓車廠做呢?這是駕駛員的事。所以車廠只能做自動駕駛。這個深入學習,可以是長時期的學習,統(tǒng)計學習和進化學習。
人真正的學習在錯誤中學習的,說一我們怎么樣防止駕駛過程當中的事故,同時我們有負學習,讓開車的時候遇到這樣那樣的險情,做出錯誤的動作,我們通過神經(jīng)網(wǎng)絡,生成事故記憶棒,把這個做好了,下一次開車的時候,人沒有了,也可以駕駛,又發(fā)生了錯誤的,又有一個學習過程,這是負學習的。
這跟Alphago的學習機制很類似。因此我們的機器人,整個框圖是雙駕雙控的架構。
這張圖也很值錢,你們也可以照一下。
當因深度學習正站在全球人工智能的分口,普通把卷積神經(jīng)網(wǎng)絡用于點云圖像識別、完成感知階段的自學習,而我們另辟蹊徑,把卷積神經(jīng)網(wǎng)用于形式化之后的、基于可用路權的駕駛態(tài)勢圖和反映駕駛操作全部內容的認知箭頭形成的圖對上,用于認知階段的深度學習,大大減少、簡化了實時處理的數(shù)據(jù)量。
因此之所以在比賽中拿比較好的成績,主要是我們對認知的形勢化,把瞬間記憶大數(shù)據(jù)“縮水”,即在感知理解之后遷移到工作記憶區(qū),進行深度學習。
下面談談創(chuàng)新創(chuàng)業(yè)的四要素這個問題。
第一個問題。我們講技術,就要講這個技術有什么創(chuàng)新的亮點。
第二個問題,講資金,就要講資金的注入點。大家都愁搞不到錢,特別是年輕人,我愁的更好跟你相反,我愁的是有錢怎么花出去,現(xiàn)在最大的困難是錢花不出去,沒有訂單,沒有批量生產,你有錢有什么用?又不能腐敗。所以真的有能耐是把錢花出來的才是真正新的企業(yè)。有人在項目路演的時候說,我給50%股權要一千萬資金投入,我說你這個講得太粗糙了,你應該講細一點,給你一千萬你要怎么花,你有本事花出來就有人給你錢。
第三個問題,講市場就要講賣點。
我覺得我們學者不像人家西方。做一個圍棋賺多少錢,Google升值多快?Alphago以4:1戰(zhàn)勝9段圍棋高手李世石,那個廣告賺翻了。我們中國也干過這樣事,2011年我們用北郵圍棋程序Lingo跟人比賽對余斌,并讓兩個子,在中央電視臺直播一下進行比賽,2:0戰(zhàn)勝了余斌??墒俏覀兪前l(fā)展中國家,沒有什么影響,沒有賺到錢,也沒有賺到廣告費。
當時認為電腦9路盤圍棋兩三年 或可抗衡人類,19路盤圍棋,機器要戰(zhàn)勝人類還看不到希望。5年過去了,發(fā)現(xiàn)這個認知是錯誤的。
所以Alphago勝利后,我提出四個問題讓大家想一想。
我認為人機大戰(zhàn)本身人在前面機器在后面或者機器在前面人在后面無休止的較量,Alphago也好,深度學習也好有很大局限性,我們圍棋手跟機器下棋有上當?shù)母杏X,因為他比我們做了測試。這個時候我們提出深度學習的四大局限性。
其中,第一,太多的學習參數(shù)具有隨意性,該怎么樣就是怎么樣,現(xiàn)在不是了。第二不能保證算法的收斂性,第三缺少反饋機制,第四大量案例也不具有累計性,就是時間累計性沒有。
這樣的情況下,深度學習不是人工智能的重點。我們設想一下,如果我們現(xiàn)在讓不同的Alphago對弈會怎么樣。因此我覺得更有刺激的不應該是Alphago程序,因為做出一個圍棋機器手很難,現(xiàn)在是人抓住這個子在走,做一個圍棋機器人更難,相對地,我認為汽車動作很靈敏了,更有刺激性的是人是機器人和賽車手的比賽,這樣比賽更加激動人心。
自動駕駛的魅力在哪里呢?我們覺得不是跟市場爭時間?我們希望它的車子更加敏捷、靈活,但是我們要做的是駕駛腦。我們賣點是駕照,我們駕駛腦賣駕照!賣的是駕齡,賣的是路熟。駕齡駕照替代不了,路熟,地圖替代不了,所以駕駛腦將來場景很可觀。
最后用一張圖結束,它的市場第一桶金在哪里?
李德毅專注的無人駕駛版塊,正好趕上最近這個領域產業(yè)化的熱潮,無獨有偶,我們從他的演講中也能看到很重的強調“落地” “務實”的新學術風格。他明確指出無人駕駛的核心在機器腦,而機器腦的駕駛活動更多的是技巧,記憶和經(jīng)驗,而不是知識、推理和計算。這個點從目前谷歌無人車大力收集數(shù)據(jù),特斯拉自動駕駛積極收集車主數(shù)據(jù)也可以得到佐證。
值得反思的是,做為一個70多歲還活躍在學術界的人士,他對學術成果能否落地有著格外的關注,甚至犀利的認為只搞技術,苦苦鉆研問題的研究所風格創(chuàng)業(yè)是“必死無疑”的,顯然這是他多年學術研究經(jīng)歷后的一個深刻反思,對于正在這條路上和正在這條路上迷茫的人,是不是也應該思考下這個問題?
雷峰網(wǎng)原創(chuàng)文章,未經(jīng)授權禁止轉載。詳情見轉載須知。