0
雷鋒網按:本文作者宋繼強,英特爾中國研究院院長。
宋繼強
今天,我們正在擁抱一個萬物智能互聯(lián)的新世界。越來越多的物和設備通過網絡實現(xiàn)互聯(lián)互通,讓數(shù)據(jù)呈現(xiàn)爆發(fā)之勢。數(shù)據(jù)洪流洶涌而至,數(shù)據(jù)正在成為技術領域最重要的驅動力。人工智能、自動駕駛、5G 和VR/MR 等一系列前瞻性技術的出現(xiàn),令我們有機會充分釋放這些數(shù)據(jù)的潛能,不斷升級人類生活體驗。
非常高興從今天開始,我們在雷鋒網開設英特爾中國研究院專欄。借助這個平臺,我們希望與大家分享并交流英特爾對于前瞻技術趨勢的觀察,探討萬物智能互聯(lián)的當下與未來。作為專欄系列文章的開篇,讓我們先從機器人、人工智能的視角切入,探究數(shù)據(jù)洪流時代的產業(yè)機遇。
融合 AI 與 SI 推進智能機器人產業(yè)
機器人作為人工智能最重要的應用領域,一直飽受關注。好萊塢大片中經常出現(xiàn)的智能機器人為大眾設置了很高的預期,而現(xiàn)實的服務機器人的智能能力遠未達標。伴隨著近來深度學習催熱的這一波人工智能大潮,智能機器人產業(yè)如何破局是一個很重要的問題。我認為兩個方面非常關鍵:一個是人工智能(AI: Artificial Intelligence)與智能交互(SI: Smart Interaction)深度融合;另一個是智能機器人的安全性。關于安全性我們留到以后再談,今天重點探討AI與SI的融合。
AI 在學術界有一個比較常用的定義,就是要了解智能的實質,并且要能夠生產出一種像人一樣,以智慧的方式對外界輸入作出反應的智能機器。這個學科的最終目的是讓機器具有智能的反應能力,所以智能機器人可以看做是人工智能的終極目標。
了解智能的實質有兩種辦法:
一種是通過哲學或者心理學的方法,從外部觀察人的行為來推測人是以怎樣的智能方式在思考;
另外一種是把人腦切開看看神經解剖結構,并且通過腦活動檢測技術和精心設計的實驗來發(fā)現(xiàn)智能活動的規(guī)律。
當我們對智能有了一個認識(未必正確、但至少有了模型),那怎樣把機器變得智能就需要數(shù)學家、計算機科學家、自動化專家去鉆研。所以,人工智能相關的學科很多,除了軟的理論、模型和算法,還需要依賴硬件落地,比如說需要芯片去給它提供強有力的計算和存儲。對于機器人這種智能體,還需要有復雜的系統(tǒng)控制技術支撐。
現(xiàn)在這一波人工智能的熱潮,實際上也是受益于目前最新的計算和存儲的改進。神經網絡技術來自于腦的神經元結構啟發(fā),但它跟腦的處理過程完全不一樣。它是通過大規(guī)模的數(shù)據(jù)去訓練,然后機器從數(shù)據(jù)中學習一些內在的規(guī)律,形成一個模型,再用這個模型去推測新的數(shù)據(jù)。這稱為一個機器學習的過程,它需要很多的存儲和計算能力,而我們現(xiàn)在正處于一個非常適合它大發(fā)展的時代。
為什么非常合適呢?因為受益于摩爾定律,過去20年硬件的能力獲得大幅發(fā)展,其中單位成本的計算能力提高1.5萬倍、存儲能力提高3萬倍。通訊技術從有線發(fā)展到無線,現(xiàn)在正向5G邁進。這意味著我們不僅可以讓智能機器具有強大的大腦,在需要的時候還可以靈活利用云端的能力。云、端結合釋放持續(xù)學習和改善的能力。
而 AI 的算法像深度學習,通過統(tǒng)計和大數(shù)據(jù)迎來一個非常大的飛躍,它在圖像識別還有語音識別上已經超越了人類的能力。而且我們看到更大的數(shù)據(jù)也成為了可能,例如一輛無人駕駛汽車一天就產生4TB 的數(shù)據(jù),而且是不同源的、異構的數(shù)據(jù)。有了這些數(shù)據(jù)以后就要考慮怎樣去處理它來產生實時的價值,提供可靠、高質量的服務。
現(xiàn)在深度學習一枝獨秀,但是處理這么多種數(shù)據(jù)完成目標任務只靠這一類算法是不夠的。所以,NN+X 就代表要讓神經網絡加各種新的技術,并且要正視人工智能算法的局限性。引用一下機器人界也是人工智能學界的大牛 Rodney Brooks 教授(人工智能專家,行為學派杰出代表,美國國家工程院院士,iRobot、Rethink Robotics 創(chuàng)始人,Baxter 之父,MIT CSAIL前主任)的觀點,他主張先不去管用什么樣的邏輯模型或者什么樣的神經網絡模型去模擬人的思維過程,而要通過實際的智能體去感知,然后去研究怎樣通過全系統(tǒng)優(yōu)化去做出正確的反應。他認為特別是產業(yè)界不要沉迷于某一種技術,重要的是根據(jù)實際需要去使用技術,為人類提供價值。他認為第一輪AI可以提供的價值是在五年左右,在輔助駕駛和自動駕駛這個領域,第二輪就是十年左右,可以在助老機器人領域提供很大的社會價值。
關于在機器中加入智能能力,整個產業(yè)界是在分三步走。
首先是把一些不聯(lián)網的設備連了網,連網以后設備就有了信息傳遞和更新的能力,同時它也可以結合社交服務提供客戶價值。但這個還不算多么智能,只算把設備互聯(lián)了。
第二步就是我們現(xiàn)在所處的智能設備這個級別,其實就是手機上能夠提供的這些智能服務,把視覺、聽覺識別的能力加進去,再結合數(shù)據(jù)挖掘技術和知識庫提供服務。這些智能機器能夠聽和看,但還不是聽懂和看懂。
終極目標是第三步,就是自主機器。
現(xiàn)在我們基本上已經跨越了第二步,正在向第三步邁進。但這個發(fā)展過程不是線性的,因為從第二步到第三步會越來越復雜,不僅要理解環(huán)境和行為,還要能理解人的情緒。因為機器人服務的是人,如果不能理解人的情緒、達到交流共識的話,就沒法提供很好的服務。
從CT到RT,需要人工智能技術與其它技術緊密合作完成“感知-認知-執(zhí)行”的人機交互閉環(huán)
智能機器人就是典型的自主系統(tǒng)。如上圖所示,從現(xiàn)在的計算機技術(CT: Computer Technology)到未來的機器人技術(RT: Robot Technology),需要人工智能技術與其它技術緊密合作完成“感知-認知-執(zhí)行”的人機交互閉環(huán)。機器人工作在一個開放的環(huán)境里,服務的是不愿遵守刻板交互規(guī)則的普通消費者。從整個交互過程來講有很多不確定性,沒有AI算法能夠保證不出問題,因此必須結合其它技術來滿足消費者對智能機器人的預期。我認為智能交互(SI)是最佳選擇,因為它可以充分通過機器人的移動性和主動交互能力來利用人這個通用智能體去補足人工智能。
舉兩個例子來說明智能交互的威力。我們知道在視覺識別物體的時候,角度和遮擋都會影響識別效果。對于機器人來講,它可以利用移動性主動選擇一個好的角度、避開遮擋來準確識別物體。再進一步,在場景理解的時候,對于能夠準確分割的物體,如果不能確信是什么的話(例如凳子還是茶幾),機器人可以主動組織一個問句來詢問人。由此我們可以看出,靈活利用機器人的主動移動和交互能力可以顯著提升整體服務能力,促進智能機器人的產業(yè)化。
簡而言之,我認為在智能機器人的商業(yè)化迭代方面,首先要保證服務能力達標,然后在這個能力要求下選擇合適的人工智能算法,配合靈活的智能交互的方案一起去達成這個能力。隨著算法能力和硬件技術的提高,在保持服務能力的前提下,逐步擴大 AI 的比重,是通過商業(yè)化發(fā)展推動AI技術發(fā)展的正循環(huán)之路。
雷峰網特約稿件,未經授權禁止轉載。詳情見轉載須知。