丁香五月天婷婷久久婷婷色综合91|国产传媒自偷自拍|久久影院亚洲精品|国产欧美VA天堂国产美女自慰视屏|免费黄色av网站|婷婷丁香五月激情四射|日韩AV一区二区中文字幕在线观看|亚洲欧美日本性爱|日日噜噜噜夜夜噜噜噜|中文Av日韩一区二区

您正在使用IE低版瀏覽器,為了您的雷峰網(wǎng)賬號(hào)安全和更好的產(chǎn)品體驗(yàn),強(qiáng)烈建議使用更快更安全的瀏覽器
此為臨時(shí)鏈接,僅用于文章預(yù)覽,將在時(shí)失效
專欄 正文
發(fā)私信給小芹菜
發(fā)送

3

擬腦吳義堅(jiān) : 機(jī)器人這個(gè)行業(yè)還很初級(jí),AlphaGo還只是弱人工智能

本文作者: 小芹菜 2016-03-18 13:46
導(dǎo)語:機(jī)器人是一個(gè)筐,什么東西都可以往里裝。幼教擬腦機(jī)器人是如何找到市場(chǎng)點(diǎn)的?

【觀點(diǎn)導(dǎo)讀】機(jī)器人是一個(gè)框,什么都能往里裝。但是我覺得真正意義上的機(jī)器人首先是能像人一樣具備智能,或者能完成一些原來必須要人才能完成的一些任務(wù)。有些服務(wù)機(jī)器人至少推出了有三年以上,但是為什么沒有火起來?最大的問題就是它們沒有真正意義上解決目標(biāo)用戶核心的需求,沒有像智能手機(jī)一樣真正滿足了目標(biāo)人群。

整個(gè)機(jī)器人行業(yè)的發(fā)展目前還處于一個(gè)很初級(jí)的階段,機(jī)器人的功能和定位沒有一個(gè)標(biāo)準(zhǔn),業(yè)內(nèi)人士和用戶也有不同的期望值。我覺得短期之內(nèi)的突破點(diǎn)一個(gè)是細(xì)分市場(chǎng)痛點(diǎn)的需求,一個(gè)是在細(xì)分市場(chǎng)上做非常深度的定制優(yōu)化。

谷歌的AlphaGo,從人工智能角度來講還屬于弱人工智能。AlphaGo離我們真正的人工智能或者智能學(xué)習(xí)還是很遙遠(yuǎn)的,它只是一個(gè)非常初級(jí)的階段。

注:以下來自上海元趣創(chuàng)始人吳義堅(jiān)的分享。

擬腦吳義堅(jiān) : 機(jī)器人這個(gè)行業(yè)還很初級(jí),AlphaGo還只是弱人工智能

( via 61gequ.com

| 機(jī)器人是一個(gè)筐,什么東西都可以往里裝。

 1、人工智能和機(jī)器人行業(yè)的大背景

我先講一下大環(huán)境,人工智能和機(jī)器人相關(guān)的行業(yè)報(bào)告都說,從這兩年開始,(這個(gè)行業(yè))在接下來的五到十年都會(huì)高速增長甚至市場(chǎng)爆發(fā)。

關(guān)于機(jī)器人的新聞很多,比如上個(gè)月谷歌發(fā)布了叫逆天的行走機(jī)器人。而關(guān)于機(jī)器人也有一些偏負(fù)面的新聞,比如你只要在網(wǎng)上搜索一下機(jī)器人殺人,排在前面的是一個(gè)德國機(jī)器人殺人事件;人工智能方面最近最火的就是AlphaGo和李世石的圍棋人機(jī)大戰(zhàn),在很多人看來這一天總會(huì)來臨,但是沒想到來臨得這么快。

人工智能也有負(fù)面新聞,霍金、馬斯克等人開始擔(dān)心人工智能將來有一天會(huì)威脅人類。其實(shí)我作為業(yè)內(nèi)人士看這些機(jī)器人、人工智能可能威脅人類的新聞時(shí)是有兩個(gè)心態(tài):

正面的就是,通過這些新聞吸引眼球有助于大家關(guān)注這個(gè)行業(yè)。另一方面也覺得這個(gè)炒作有點(diǎn)過了,其實(shí)從行業(yè)的角度來講人工智能或者機(jī)器人威脅人類這類聽起來危言聳聽的東西,理論上應(yīng)該是存在的,只是我們只能是無限地逼近它,其實(shí)是很難做到那一點(diǎn)的,至少在我的有生之年。

回到今天的主題機(jī)器人與人工智能。

2、機(jī)器人包含哪些?市場(chǎng)有多大?

機(jī)器人是一個(gè)筐,什么東西都可以往里裝。

只要是一個(gè)機(jī)器,加了一點(diǎn)點(diǎn)跟智能相關(guān)的東西之后,甚至說只要加上wifi模塊,它就可以叫智能機(jī)器人了。比方說有一種煮蛋機(jī)器人,其實(shí)本質(zhì)就是一個(gè)電飯煲。其實(shí)這地方有一些東西所謂的概念和真正意義上的機(jī)器人還是不一樣的。

第二個(gè)就是人工智能,人工智能字面意思看起來很簡單,但是到底包含哪些東西?這里面還是有很多認(rèn)不是很清楚的,我后面也會(huì)稍微講一下,包括我們現(xiàn)在的技術(shù)水平。

機(jī)器人,在百度百科上的嚴(yán)格的定義是自動(dòng)執(zhí)行工作的機(jī)械裝置,也是可以受人類指揮,或者以人工智能的方式運(yùn)行,任務(wù)是協(xié)助和取代人類工作

所以從這個(gè)定義上講,某些自動(dòng)執(zhí)行工作的確實(shí)也可以叫機(jī)器人,雖然它和我們期待的機(jī)器人不一樣,但從這個(gè)定義上講,或者從比較早期的寬泛定義上講確實(shí)可以。盡管如此,我覺得真正意義上的機(jī)器人首先是能像人一樣具備智能,或者能完成一些原來必須要人才能完成的一些任務(wù)。

機(jī)器人具體分為這幾大類:工業(yè)機(jī)器人,專業(yè)機(jī)器人,服務(wù)機(jī)器人。

工業(yè)機(jī)器人,理論上講是指所有在產(chǎn)線上可以自動(dòng)化執(zhí)行任務(wù),或者加一些感應(yīng)裝置,可以做一些隨機(jī)應(yīng)變的機(jī)器,這些寬泛地講都是工業(yè)機(jī)器人,我本人在這方面不擅長,今天就不講了。


第二大類是專業(yè)機(jī)器人,包括軍用、醫(yī)療、潛水等機(jī)器人。


第三大塊,也是我今天主要講的是服務(wù)機(jī)器人,包含商用和家庭用兩種。

3、服務(wù)機(jī)器人有哪些類別?

另外,我認(rèn)為的機(jī)器人一定涉及到人機(jī)交互,尤其是這種服務(wù)機(jī)器人類。人的交互方式很簡單了,語音,觸摸,還有體感,所以涉及到聽覺、視覺、觸摸、按鍵,包括遙控,都屬于人機(jī)交互的模式。

  • 第一大類就是商業(yè)用的服務(wù)機(jī)器人

看這張圖片,是銀行客服的機(jī)器人,第二個(gè)是餐廳的機(jī)器人,切菜,做刀削面的機(jī)器人。

擬腦吳義堅(jiān) : 機(jī)器人這個(gè)行業(yè)還很初級(jí),AlphaGo還只是弱人工智能

(銀行客服機(jī)器人 via sinaimg.cn

擬腦吳義堅(jiān) : 機(jī)器人這個(gè)行業(yè)還很初級(jí),AlphaGo還只是弱人工智能

(刀削面機(jī)器人 via tintucimg.vnanet.vn

這些機(jī)器人的特點(diǎn),一是外形擬人,在行業(yè)里提供一些特定功能或者信息服務(wù)。這地方其實(shí)有兩大類功能,一是替代人工,比如刀削面機(jī)器人;還有一個(gè)重要的功能是吸引眼球,這是一個(gè)商用機(jī)器人或者展覽用機(jī)器人最大的一個(gè)功能點(diǎn),因?yàn)槲矍蚓湍軐?dǎo)流,這一點(diǎn)從目前的商用服務(wù)機(jī)器人整個(gè)來說還是比較初級(jí)的階段。

  • 另外就是家用服務(wù)機(jī)器人

這里面我想先提一下掃地機(jī)和無人機(jī),其實(shí)以我個(gè)人的定義我不太傾向于把它們叫做機(jī)器人,它們更多是機(jī)器智能化,也就是機(jī)器加功能再加智能。我今天要講的機(jī)器人定位是擬人的,在機(jī)器人的基礎(chǔ)上加交互體驗(yàn),再體現(xiàn)它的功能。

家用服務(wù)機(jī)器人和商用服務(wù)機(jī)器人不一樣的呢?它更多屬于消費(fèi)類電子產(chǎn)品,不管是掃地機(jī)也好,無人機(jī)也好,一定要在某一方面滿足終端消費(fèi)者需求,甚至是個(gè)性化的需求。它不像B端,沒有實(shí)用功能或者實(shí)用功能不是那么強(qiáng)的時(shí)候還可以通過吸引眼球?qū)崿F(xiàn)導(dǎo)流功能。

我先給大家看一下國際上的一些比較知名的家庭機(jī)器人。

Pepper目前的定位是商用信息服務(wù)機(jī)器人,阿里巴巴也投資了,我還是把它放在家庭機(jī)器人范疇,因?yàn)樗奈磥戆l(fā)展目標(biāo)還是定位在家庭,它的交互性能做得還可以,形態(tài)、品質(zhì)在整個(gè)家庭機(jī)器人里面也是比較好的,尤其是已經(jīng)量產(chǎn)了,家庭機(jī)器人里面很多比如說阿西莫機(jī)器人還只是概念產(chǎn)品。

擬腦吳義堅(jiān) : 機(jī)器人這個(gè)行業(yè)還很初級(jí),AlphaGo還只是弱人工智能

Pepper

另外一個(gè)是叫Nao的機(jī)器人,這個(gè)機(jī)器人四五年前就有了,是法國的一家公司做的,目前主要的應(yīng)用場(chǎng)景是在家庭里面比如說小孩子的教育。

擬腦吳義堅(jiān) : 機(jī)器人這個(gè)行業(yè)還很初級(jí),AlphaGo還只是弱人工智能

Nao

前面這兩個(gè)機(jī)器人長遠(yuǎn)的目標(biāo)是想做成家庭機(jī)器人,但是它們的實(shí)用化功能還沒有達(dá)到終端消費(fèi)品的期望值,目前更多的應(yīng)用場(chǎng)景是在商用場(chǎng)所。

第三個(gè)是前年年底左右在國際上做眾籌的Jibo機(jī)器人,它一開始定位就是家用的,可以拍照,輔助人做一些事情(比如回復(fù)一些信息,跟小孩子互動(dòng)等)。但是大家都知道眾籌的很多產(chǎn)品都會(huì)跳票,Jibo到目前為止還沒有發(fā)送,國內(nèi)應(yīng)該在年內(nèi)上市。

擬腦吳義堅(jiān) : 機(jī)器人這個(gè)行業(yè)還很初級(jí),AlphaGo還只是弱人工智能

Jibo

還有一個(gè)機(jī)器人是Buddy,法國的一家公司做的,它更多的側(cè)重于家庭的監(jiān)控和安防,你可以遠(yuǎn)程控制這個(gè)機(jī)器人,也可以進(jìn)行遠(yuǎn)程溝通,目前應(yīng)該也還沒有正式量產(chǎn)。

擬腦吳義堅(jiān) : 機(jī)器人這個(gè)行業(yè)還很初級(jí),AlphaGo還只是弱人工智能

Buddy

另外說一下Amazon  Echo,它其實(shí)不是機(jī)器人而是更像siri,你可以跟它語音互動(dòng),聽新聞之類,雖然外形跟機(jī)器人不一樣,但它提供了人機(jī)互動(dòng)和助手服務(wù)等家庭服務(wù)機(jī)器人的功能。

擬腦吳義堅(jiān) : 機(jī)器人這個(gè)行業(yè)還很初級(jí),AlphaGo還只是弱人工智能

Amazon  Echo

  • 國內(nèi)現(xiàn)在家庭機(jī)器人很多,寬泛地講有上千種

小魚在家機(jī)器人主打的是遠(yuǎn)程陪伴,就是你可以像微信或者蘋果的facetime一樣跟家人進(jìn)行遠(yuǎn)程雙向視頻互動(dòng),它里面也有類似Siri一樣的語音助手功能。

公子小白的機(jī)器人主打是陪伴家人,或者年輕情侶的機(jī)器人,它分男孩版和女孩版,可以語音交互,聊天調(diào)侃,講講笑話什么的。

這里面我稍微提一下,現(xiàn)在國內(nèi)絕大部分,應(yīng)該是95%以上的機(jī)器人里面用的人工智能核心技術(shù)都是集成類似科大訊飛的第三方技術(shù)。大家也在問,我們機(jī)器人用的是哪一家的技術(shù)?我這里說明一下,我們的語音交互技術(shù)也是自主研發(fā)的,在這點(diǎn)上Rokid機(jī)器人和我們是類似的,它的語音技術(shù)也是自己研發(fā)的,Rokid的外形其實(shí)是一個(gè)非??犰诺囊繇懀憧梢愿Z音互動(dòng),它會(huì)有一些比較擬人的反應(yīng)。

為什么我要提自己研發(fā)語音技術(shù)這一點(diǎn)?因?yàn)槿斯ぶ悄苤姓Z音交互這個(gè)技術(shù)大家見到最多的就是Siri, Siri的體驗(yàn)離期望值的差距還是非常大的,這也是為什么需要持續(xù)對(duì)這些技術(shù)進(jìn)行性能迭代優(yōu)化。而第三方提供的技術(shù)是通用的,通用的技術(shù)很難達(dá)到客戶的實(shí)用化需求,更不要說個(gè)性化需求。叮咚音響是科大訊飛推出的一個(gè)產(chǎn)品,訊飛做人工智能和語音交互是非常領(lǐng)先的,他們以前更多的是提供技術(shù)給第三方,現(xiàn)在也推出一個(gè)音響類的語音交互及個(gè)人助手類產(chǎn)品。

類似這樣的機(jī)器人還有很多:做一個(gè)機(jī)器人的外形,外加集成一些語音交互以及人臉,物體識(shí)別功能。

  • 兒童機(jī)器人主要是兩大類產(chǎn)品:玩具和學(xué)習(xí)機(jī)

玩具類機(jī)器人有上春晚的這個(gè)跳舞機(jī)器人,你可以在很多展會(huì)上看到,小孩子可以跟它玩,就跟遙控車一樣。但是所有的玩具會(huì)涉及到一個(gè)問題,小孩子基本上都是一陣子的新鮮感,家長一般不太愿意花非常多的錢,因此單件的玩具價(jià)格很難上去。學(xué)習(xí)機(jī)是不一樣的,包括步步高點(diǎn)讀機(jī)、小天才學(xué)習(xí)機(jī),中國的家長還是愿意在小孩子學(xué)習(xí)、早教上面花錢的,大家都知道各種各樣的早教班花費(fèi)是非常多的。

小優(yōu)機(jī)器人是學(xué)習(xí)類機(jī)器人里面比較有代表性的,已經(jīng)迭代了有三代了,外形一直沒有變過:機(jī)器人的外形,胸前是一個(gè)PAD觸摸平板,相當(dāng)于既是一個(gè)機(jī)器人也是一個(gè)學(xué)習(xí)機(jī)。另外現(xiàn)在還有很多幼教機(jī)器人,就是把手機(jī)或者平板套一個(gè)殼,然后裝一個(gè)迅飛或者其他家的語音助手就可以作為一個(gè)機(jī)器人去賣了,這類機(jī)器人價(jià)格很便宜基本上就是山寨機(jī)的做法。

4、服務(wù)機(jī)器人之前怎么就火不起來?

這上面這些機(jī)器人,不管是小優(yōu)機(jī)器人、阿爾法機(jī)器人,至少推出了有三年以上,但是到目前來說還沒有火起來,最大的問題就是它們沒有真正意義上解決一個(gè)目標(biāo)用戶核心的需求,沒有像我們的智能手機(jī)一樣真正滿足了目標(biāo)人群的核心需求。

我們需要思考這些家庭機(jī)器人到底解決了什么問題?到底是一個(gè)痛點(diǎn)問題還是一個(gè)癢點(diǎn),到底有沒有實(shí)用價(jià)值還是只是一個(gè)噱頭?家庭機(jī)器人也有要特別考慮的問題,到底是服務(wù)這個(gè)家庭某一個(gè)特定人群,還是所有成員,就像家用冰箱一樣。

家庭機(jī)器人大多強(qiáng)調(diào)智能家居入口概念,但是現(xiàn)在基本上除了小孩子每個(gè)人都有智能手機(jī),現(xiàn)在很多智能硬件產(chǎn)品都要結(jié)合手機(jī),家庭機(jī)器人PK智能手機(jī)到底有什么突出優(yōu)勢(shì)?掃地機(jī)器人目前在家庭機(jī)器人里已經(jīng)算做得不錯(cuò)很普及了,滿足了用戶的剛需和痛點(diǎn),但還是有掃不干凈的問題,就這么一個(gè)簡單的事情都沒有完美解決,更別說其他功能的家庭機(jī)器人。

比如說主打陪伴功能的,真的能做到像科幻電影里面的那種效果是很難,因?yàn)橹皇亲鲆粋€(gè)語音互動(dòng)都難稱滿意,更別說人機(jī)交互,大家都知道Siri那個(gè)聲音聽起來是怎么樣的,包括微軟的小冰,看看文字還可以,一聽聲音效果立馬大打折扣。客戶對(duì)主打陪伴產(chǎn)品的人機(jī)交互情感效果期望值是很高的,這點(diǎn)目前技術(shù)還差得很遠(yuǎn)。

兒童機(jī)器人是有剛需的,看你是不是真的能很好地滿足用戶的剛需。做成多功能型的,還是主打一個(gè)功能?還有最大的問題就是小孩子的新鮮感與長期使用的黏性問題,小孩子到底愿意使用它多長時(shí)間?最后一點(diǎn)就是這個(gè)兒童機(jī)要同時(shí)做到小孩子喜歡和家長放心,屏幕可能傷眼睛,游戲可能造成沉迷,就像平板電腦小孩子都喜歡玩但是家長不放心,這個(gè)市場(chǎng)是家長掏錢給小孩子使用,因此兩個(gè)方面都要滿足到。

關(guān)于屏幕傷眼睛這個(gè)問題,我自己做這個(gè)產(chǎn)品的時(shí)候也會(huì)涉及到這個(gè)問題,稍微澄清一下,理論上講所有的屏幕都會(huì)傷眼睛,不管是大還是小,甚至你長時(shí)間看書也會(huì)傷眼睛。對(duì)于保護(hù)眼睛,其實(shí)主要是兩點(diǎn),一是距離多遠(yuǎn),二是看多長時(shí)間,這才是最關(guān)鍵的。

整個(gè)機(jī)器人行業(yè)的發(fā)展目前還是很初級(jí)的一個(gè)階段,機(jī)器人的功能和定位沒有一個(gè)標(biāo)準(zhǔn),業(yè)內(nèi)人士和用戶也有不同的期望值。我覺得短期之內(nèi)的突破點(diǎn)一個(gè)是細(xì)分市場(chǎng)痛點(diǎn)的需求。一個(gè)是在細(xì)分市場(chǎng)上做非常深度的定制優(yōu)化。當(dāng)然長期趨勢(shì)來看機(jī)器人行業(yè)還是非常清晰的,就像人手一個(gè)手機(jī)一樣,未來肯定是每個(gè)人都會(huì)有機(jī)器人,但是這個(gè)機(jī)器人是滿足單一的需求還是滿足多樣化的需求,滿足特定一個(gè)人的需求還是滿足一個(gè)家庭的需求,這個(gè)地方目前來說還不是特別的清晰。

如何定義人工智能?

我講一下第二大塊的人工智能部分。

人工智能的基本定義就是研究、開發(fā)用于模擬、延伸和擴(kuò)展人的智能的理論、方法、技術(shù)的應(yīng)用?;旧暇褪悄M人的思考問題和反應(yīng)方式。

我把人工智能分成三個(gè)階段:弱人工智能,強(qiáng)人工智能和超人工智能。

比如谷歌的AlphaGo,從人工智能角度來講屬于弱人工智能,它只是擅長某一個(gè)方面,某一個(gè)特定領(lǐng)域的某一小點(diǎn),利用機(jī)器擅長的運(yùn)算能力做到了極致甚至超過了人類,但是在某一個(gè)領(lǐng)域真正的理解方面,它的人工智能還是屬于非常弱的。

強(qiáng)人工智能是什么呢?它不是單一功能,而是能做很多像人一樣的智能水平的事情,就是人類能干的腦力活它應(yīng)該大部分能干,甚至跟人相當(dāng)于同一個(gè)水平。

最后是超人工智能,人工智能跨過強(qiáng)人工智能往超人工智能轉(zhuǎn)化,可能就是一瞬間的事情,從理論上講確實(shí)是有這種可能性的。因?yàn)槿祟愡M(jìn)化就是一個(gè)緩慢的過程,而機(jī)器的特點(diǎn)是運(yùn)算比人強(qiáng),存儲(chǔ)比人強(qiáng),進(jìn)化速度比人強(qiáng)。

AlphaGO可以在幾天之內(nèi)運(yùn)行幾千萬盤棋譜,但人也有擅長的地方,比如概念認(rèn)知是人類天生的,這個(gè)東西目前為止現(xiàn)在還沒有任何的基礎(chǔ)理論能讓機(jī)器自己認(rèn)知一個(gè)概念,更別說一些自動(dòng)推理、規(guī)劃、決策,機(jī)器只能在人定義的范圍之內(nèi)做規(guī)劃和決策。

認(rèn)知上面比如說語音識(shí)別,現(xiàn)在機(jī)器做得還不錯(cuò),通用的語言理解基本上現(xiàn)在都做不到。現(xiàn)在真正的人工智能涉及的主要領(lǐng)域就是這些地方:類人智能感知、聽覺、視覺、嗅覺這些基本上都能做到了,當(dāng)然機(jī)器擅長和不擅長的地方跟人不一樣。比如說觸覺,現(xiàn)在機(jī)器還不能像人一樣感知那么細(xì)膩,但是在聽覺和視覺方面,機(jī)器在某些方面甚至比人還要強(qiáng),比如說在基礎(chǔ)視覺方面機(jī)器在黑暗的環(huán)境下看的比人要清楚,但是涉及到一些抽象視覺感知現(xiàn)在機(jī)器還是接近于0。另外在信息反饋方面機(jī)器在性格、感情表達(dá)方面還做不到。

1、語音技術(shù)的發(fā)展

我本人做語音交互做了十幾年,接下來我會(huì)側(cè)重講這個(gè)方面,涉及一些基礎(chǔ)的東西包括深入學(xué)習(xí),也會(huì)順帶講一下計(jì)算機(jī)視覺。

語音技術(shù)研究從五十年代就開始了,一直到九十年代都是在做很多基礎(chǔ)的研發(fā),深度學(xué)習(xí)大概在距今10年左右得到了非常大的突破。整個(gè)語音技術(shù)的發(fā)展是這樣的:基礎(chǔ)研究從簡單的任務(wù)開始,比如一開始是識(shí)別十個(gè)數(shù)字,到后面的孤立詞,然后到連續(xù)語流,從最早的特定說話人到現(xiàn)在的所有的說話人,從早期的安靜環(huán)境、受限環(huán)境到現(xiàn)在的復(fù)雜環(huán)境,這是整個(gè)語音技術(shù)發(fā)展的歷史?,F(xiàn)在很多場(chǎng)景下大家都能夠看到一些語音識(shí)別的成熟應(yīng)用了。

所有的語音識(shí)別和模式識(shí)別都是一樣的,首先要把一個(gè)語音信號(hào)做特征提取,然后再做一個(gè)模型匹配。我們這里有兩個(gè)模型,一個(gè)是聲學(xué)模型,還有一個(gè)語言模型,聲學(xué)模型就是人的聲音是怎么發(fā)出來,語言模型有點(diǎn)像拼音輸入法,把聽出來的聲音對(duì)應(yīng)到某一個(gè)字。

2、深度學(xué)習(xí)如何應(yīng)用到語音中?

深度網(wǎng)絡(luò)學(xué)習(xí)算法DNN是怎么應(yīng)用到語音的?其實(shí)用的就是在聲學(xué)模型里面的。在過去的十年之內(nèi),任何一個(gè)語音的單項(xiàng)技術(shù)能做到10%準(zhǔn)確率的提升,都是很了不得的,但是DNN能做到30%以上提升,是非常大的一個(gè)突破。DNN是替代了以前的HMM或者GMM,大家稍微有點(diǎn)基礎(chǔ)的就知道概率分布, GMM就是高斯分布,就是你最有可能出現(xiàn)在什么地方可以算一個(gè)概率,這個(gè)是傳統(tǒng)的概率論。DNN不是這樣的,其實(shí)神經(jīng)網(wǎng)絡(luò)在七十年代就已經(jīng)出現(xiàn)了,但是它為什么一直沒有很大規(guī)模使用呢?就是因?yàn)橐郧皞鹘y(tǒng)的神經(jīng)網(wǎng)絡(luò)雖然理論都有很多層,但是實(shí)際上應(yīng)用只有一層,一個(gè)原因是那時(shí)候沒有很好的訓(xùn)練算法,第二個(gè)是運(yùn)算量巨大,當(dāng)時(shí)的計(jì)算機(jī)根本沒有辦法算。大家都知道AlphaGO的機(jī)器配了很多的GPU,這個(gè)也是近這幾年GPU運(yùn)算能力的擴(kuò)張才使得這個(gè)算法得以實(shí)現(xiàn)。

傳統(tǒng)單層的神經(jīng)網(wǎng)絡(luò)就很簡單,左邊這個(gè)是輸入的信號(hào),比如語音信號(hào)提取的數(shù)據(jù)輸入到這個(gè)里面去,所有的連接都是一些參數(shù),需要提前訓(xùn)練好,然后輸入就是說這個(gè)參數(shù)對(duì)應(yīng)到這個(gè)模型是什么。現(xiàn)在DNN發(fā)展到十層甚至到十幾層,而且每一層有一千個(gè)甚至幾千個(gè)節(jié)點(diǎn),這里面參數(shù)有幾百萬甚至上千萬,傳統(tǒng)的訓(xùn)練算法根本做不了這個(gè)事情。

擬腦吳義堅(jiān) : 機(jī)器人這個(gè)行業(yè)還很初級(jí),AlphaGo還只是弱人工智能

我們現(xiàn)在用的聲學(xué)模型基本上有四五層以上,每一層都有1024×1024個(gè)節(jié)點(diǎn),輸出的音有幾千個(gè),甚至上萬個(gè)。這么多的參數(shù)怎么在系統(tǒng)中做好,我通過這個(gè)圖講一下基本的原理:你看我輸了這個(gè)語音數(shù),輸入這些參數(shù)之后它自動(dòng)往后擴(kuò)張,所有的參數(shù)乘以這個(gè)系數(shù),然后在這里得出一個(gè)得分,然后這地方就算出一系列的值來,這一系列的值再往后擴(kuò)張,一直到最后這個(gè)就是我們的聲音的得分。比如這個(gè)節(jié)點(diǎn)是a,你這一組節(jié)點(diǎn)進(jìn)去得到a的概率是多少。我們?cè)僬f一下人臉識(shí)別,人臉圖像也是一組參數(shù)輸入進(jìn)來,通過這個(gè)網(wǎng)絡(luò)往后走,在一千個(gè)或者一萬個(gè)人臉庫中,每個(gè)人臉匹配的概率值中找一個(gè)最大的。DNN訓(xùn)練就是你已經(jīng)有大量的數(shù)據(jù),你已經(jīng)知道輸入是什么,輸出是什么,通過這里面所有的樣本去調(diào)這幾百萬個(gè)參數(shù)。具體算法就不講了,是非常非常復(fù)雜、運(yùn)算量非常大的,這就是為什么要靠GPU來計(jì)算,如果要靠CPU,上萬臺(tái)服務(wù)器可能都不夠。

3、谷歌的AlphaGO強(qiáng)在哪里?

下面我具體講一下谷歌的AlphaGO,比賽我相信大家都看了,相關(guān)的論文和報(bào)道在網(wǎng)上都有了。我再簡單地講一下它的原理,里面涉及到兩塊,左邊這一塊就是傳統(tǒng)的機(jī)器學(xué)習(xí),已經(jīng)有大量高手對(duì)決棋譜樣本在那兒了,就像我們大量的語音和圖像數(shù)據(jù)。還有一個(gè)部分就是它學(xué)成模型后自己跟自己對(duì)弈,然后可以調(diào)一組參數(shù),對(duì)弈完之后如果發(fā)現(xiàn)這個(gè)更好,就去加強(qiáng),往這個(gè)方向去調(diào)整。就像你每天自己練,可以發(fā)現(xiàn)某一招更好。機(jī)器的學(xué)習(xí)速度是很快的,這個(gè)就是它比人類強(qiáng)的地方,因?yàn)槿祟惛呤制遄V幾萬或者幾十萬就不得了,但是他自己跟自己對(duì)弈可能有上億盤那么多。

擬腦吳義堅(jiān) : 機(jī)器人這個(gè)行業(yè)還很初級(jí),AlphaGo還只是弱人工智能

大家知道為什么圍棋難下呢?中國象棋是比較容易用人工智能模擬的,因?yàn)樗哪繕?biāo)比較清晰吃掉帥就算贏了,而且象棋落子的可能性也少很多。但是在圍棋上面是不行的,圍棋的變化可能比地球上所有沙子的數(shù)目加起來還多。其實(shí)業(yè)界拿圍棋做一個(gè)實(shí)驗(yàn)場(chǎng)地優(yōu)化人工智能算法已經(jīng)有五到十年了,原理比較簡單,就是局部分析和全局分析。局部分析就是下棋的時(shí)候可以算一個(gè)局部最優(yōu),因?yàn)榫植康目臻g比較小。另一方面下圍棋時(shí)全局觀非常重要,所以谷歌用DNN做了另外一個(gè)事情,可以評(píng)估出當(dāng)前做法在全局上的獲勝概率是多少。通過這兩種方式,就兼顧了局部最優(yōu)和全局最優(yōu)。

圍棋每一個(gè)點(diǎn)可能對(duì)應(yīng)的是兩百種可能,兩百種以內(nèi)選一種下法的意思是在輸入端相當(dāng)于下法,輸出點(diǎn)是每一種下法對(duì)應(yīng)來做一個(gè)最優(yōu)的選擇。在這個(gè)系統(tǒng)里面,每一個(gè)可能的落子點(diǎn)都算過得分。

  • AlphaGo的人工智能和別家有什么樣的區(qū)別?

我們的語音數(shù)據(jù)一般要幾千個(gè)小時(shí),甚至要上萬個(gè)小時(shí)才能訓(xùn)練出一個(gè)性能還不錯(cuò)的神經(jīng)網(wǎng)絡(luò)。圍棋方面我覺得高手的棋局沒有那么多,AlphaGo應(yīng)該更多的是通過后面自學(xué)習(xí)的方式提高的。當(dāng)然前提是先通過已有棋局訓(xùn)練出一個(gè)不錯(cuò)的系統(tǒng)。

  • AlphaGo的訓(xùn)練具體是指什么?

訓(xùn)練的是所有神經(jīng)網(wǎng)絡(luò)的參數(shù)。

首先調(diào)參數(shù)并不是人在調(diào),人調(diào)整的只是策略,比如定義多少層網(wǎng)絡(luò),用什么樣的訓(xùn)練策略。但是具體神經(jīng)網(wǎng)絡(luò)里面的參數(shù),現(xiàn)在沒有人能解釋幾百萬上千萬個(gè)參數(shù)具體有什么意義,它有點(diǎn)像一個(gè)黑盒子。在傳統(tǒng)的統(tǒng)計(jì)模型里面,概率分布是很好解釋的,比如說老人跟小孩子的聲音為什么不一樣,因?yàn)樗l譜這邊有一個(gè)共振峰,在那個(gè)位置有一個(gè)高低分布,都有一個(gè)物理解釋。

DNN里面的參數(shù)是沒辦法解釋的,但是它確實(shí)很強(qiáng)大,這就像我們無法解釋人腦一樣的。

宏博說他一開始低估了AlphaGo,覺得它肯定下不過李世石,因?yàn)檠邪l(fā)團(tuán)隊(duì)里并沒有頂級(jí)圍棋高手給它做策略指導(dǎo),雖然可以借鑒大量的歷史棋局,但是單純地模仿高手下法或許可以達(dá)到職業(yè)初段選手的水平,真正面對(duì)頂尖職業(yè)高手時(shí)必然會(huì)出現(xiàn)應(yīng)變不足的情況,因?yàn)閲宓淖兓瘜?shí)在是天量的,運(yùn)算能力再強(qiáng)也無法窮盡,對(duì)目前依靠機(jī)器深度自我學(xué)習(xí)是否能達(dá)到頂尖職業(yè)棋手水平還抱懷疑態(tài)度。

實(shí)際從第一局棋看來,AlphaGo有一些下法我們國內(nèi)的一些頂尖的高手都沒有想到,賽后谷歌的工程師也說到AlphaGo現(xiàn)在已經(jīng)不再依賴棋譜,它已經(jīng)把圍棋游戲規(guī)則和基本套路完全吃透,實(shí)現(xiàn)了以獲勝為目標(biāo)嚴(yán)格按照策略和價(jià)值模型自我學(xué)習(xí)自我優(yōu)化,即人工智能的增強(qiáng)學(xué)習(xí)概念,這個(gè)是AlphaGo真正可怕的地方,后面隨著模型不斷優(yōu)化進(jìn)步人類選手將越來越難以戰(zhàn)勝它了。

  • 谷歌強(qiáng)就強(qiáng)在使機(jī)器可以做基礎(chǔ)的學(xué)習(xí)。

AlphaGo可以自我對(duì)弈,然后找到更好的策略,而且它的進(jìn)化速度遠(yuǎn)比我們?nèi)丝?。但是這里我要稍微說明一下,深度學(xué)習(xí)更多的是一種抽象的概念,就是不要學(xué)表面的,而是學(xué)深層的。深度神經(jīng)網(wǎng)絡(luò)也是深度學(xué)習(xí)的一種體現(xiàn),也是目前大家都在用的。其實(shí)反過來說,雖然AlphaGo在圍棋上面很可怕,但其實(shí)它離真正人類的學(xué)習(xí)還是差很遠(yuǎn)的,或者說它還是在做模式識(shí)別或者模式訓(xùn)練,雖然它有一些自我學(xué)習(xí)的概念,但只是一個(gè)很小的單一目標(biāo)任務(wù)上的訓(xùn)練,或者說參數(shù)的優(yōu)化。這個(gè)還不是真正意義上說的概念認(rèn)知,甚至說AlphaGo都不知道下棋這個(gè)概念,對(duì)它而言下棋只是一個(gè)任務(wù)、一個(gè)目標(biāo)。我覺得AlphaGo離我們真正的人工智能或者智能學(xué)習(xí)還是很遙遠(yuǎn)的,它只是一個(gè)非常初級(jí)的階段。

回到語音這一塊,大家可以看到整個(gè)語音的發(fā)展歷史是很慢的,前后差不多有30年都是徘徊在識(shí)別率突破不了90%的水平,而人類在各種環(huán)境的識(shí)別率達(dá)到98%或99%以上。目前的語音識(shí)別差不多在安靜環(huán)境下面識(shí)別率可以接近95%,其實(shí)更多的是在各種環(huán)境下面。在復(fù)雜的環(huán)境下面,現(xiàn)在的語音識(shí)別準(zhǔn)確率還不高,不管是噪聲環(huán)境,或者有口音,甚至語速過快的情況,在更復(fù)雜的環(huán)境更不要說了。

另外說一下語音合成,它是把輸入文字變成聲音,科大訊飛最早就是做語音合成出來的。語音合成大家感覺在某種場(chǎng)合下可以用,比如播天氣預(yù)報(bào)或者播語音導(dǎo)航,這些都是合成技術(shù),聽著沒有什么問題。再往后,比如朗讀小說等絕大部分也還可以接受。但是到對(duì)話聊天,比如陪伴機(jī)器人,聲音傳遞的信息除了文字以外還有情感、情緒、個(gè)性,目前來看語音合成還很難滿足需要。

語義分析就更難了,只是從技術(shù)層面上講,分析一些特定領(lǐng)域的東西是可以的,比如打電話給某某,不管原來傳統(tǒng)的基于規(guī)則的,還是基于統(tǒng)計(jì)的,基本上都可以做得很好。但是開放式的語義理解就會(huì)非常困難,尤其是一些新的概念。目前大家看到的語義分析也好,包括AlphaGo的理解,機(jī)器還是屬于非常初級(jí)的階段,都是人預(yù)先設(shè)定告訴它這是什么東西,而不是它自身能自我從這里面能學(xué)習(xí)到的,所以更多的是訓(xùn)練而不是叫學(xué)習(xí)。

目前的語義理解技術(shù)分為兩大塊,一個(gè)是在通用領(lǐng)域,它基于一個(gè)海量知識(shí)庫去匹配的回答出來。比如說查今天的天氣,這種任務(wù)他是理解的,但是如果真的聊天調(diào)侃,表面上好像理解了,但是其實(shí)從技術(shù)層面上它并不存在理解,這只是一個(gè)知識(shí)庫的匹配,或者統(tǒng)計(jì)的分類。在特定領(lǐng)域這種語音技術(shù)雖然說還不夠好,但是其實(shí)只要做到足夠多的深度定制,基本上是可以達(dá)到實(shí)用的。比如IBM的Watson,它對(duì)一般的醫(yī)療問題甚至可以給出比普通醫(yī)生還要好的建議。

  • 再簡單介紹一下計(jì)算機(jī)視覺。

它從人工智能或者機(jī)器學(xué)習(xí)的角度上和語音識(shí)別原理是一樣的,因?yàn)檎Z音信號(hào)是一個(gè)一維的模型,圖像是一個(gè)二維的,而視頻相當(dāng)于一個(gè)二維圖像的時(shí)間序列。剛才已經(jīng)給大家看過了語音的識(shí)別過程,深度學(xué)習(xí)的框架是一樣的,唯獨(dú)不同的是特征提取,你要把特定領(lǐng)域的東西找到一定的信號(hào)輸入進(jìn)去。

現(xiàn)在計(jì)算機(jī)視覺在人臉識(shí)別,包括一些物體的檢測(cè)都可以號(hào)稱在國際上有一個(gè)專門的測(cè)試上面可以做到99%了,但是實(shí)驗(yàn)室的測(cè)試和實(shí)際環(huán)境是不一樣的,化妝、光線、角度等因素對(duì)人類識(shí)別能力影響不大,但是對(duì)機(jī)器而言就很難了,因?yàn)樗鼘W(xué)習(xí)的這套機(jī)制跟人腦的機(jī)制理解是完全不一樣的。

人工智能的產(chǎn)業(yè)格局跟機(jī)器人不一樣,因?yàn)闄C(jī)器人這個(gè)行業(yè)里面還沒有什么巨頭,市場(chǎng)還沒有起來。人工智能基本上都是國際、國內(nèi)的巨頭在做——

谷歌、facebook、蘋果、微軟、Amazon,可以看到全球互聯(lián)網(wǎng)、終端類大公司基本上都在做。


國內(nèi)最強(qiáng)的應(yīng)該是百度,也是以技術(shù)擅長的一家公司,百度擁有語音圖像、深度學(xué)習(xí)實(shí)驗(yàn)室,在AI上面的投入水平確實(shí)在國際上是排得上的。阿里、騰訊相對(duì)弱一些。阿里做了一些語音技術(shù)和人工智能的布局,也投資了Pepper。騰訊這方面更多的是應(yīng)用,他們目前的技術(shù)儲(chǔ)備還是不夠的??拼笥嶏w本身是做人工智能出身,包括傳統(tǒng)的語音識(shí)別和合成,還有現(xiàn)在的超腦計(jì)劃,訊飛也聯(lián)合了很多國內(nèi)外的研發(fā)機(jī)構(gòu),我認(rèn)為現(xiàn)在國內(nèi)在整個(gè)人工智能行業(yè)布局上除了百度、科大訊飛是排在前面的,這包括技術(shù)水平還有整個(gè)未來的發(fā)展前景。

人工智能產(chǎn)業(yè)還可以大致分為三塊:

首先是通用平臺(tái),像谷歌、BAT,除了提供技術(shù)還提供產(chǎn)品和服務(wù)。

其次是技術(shù)平臺(tái),科大訊飛是國內(nèi)最全面的,facc++也是比較熱的技術(shù)平臺(tái)。

第三塊細(xì)分產(chǎn)品就比較多了,包括我前面提到的擬腦機(jī)器人,還有Jibo等。

人工智能的技術(shù)還是處在一個(gè)相對(duì)比較早期的階段,大規(guī)模的應(yīng)用或者達(dá)到或者接近用戶的期望值還有很長的路要走,所以在短期之內(nèi)細(xì)分產(chǎn)品也是有蠻大的市場(chǎng)的。

編者注:以下是活動(dòng)現(xiàn)場(chǎng)的交流問答,為不影響閱讀,雷鋒網(wǎng)節(jié)選其中幾個(gè)精彩問題與讀者分享——

(按:高宏博系華泰證券計(jì)算機(jī)行業(yè)首席)

1、圍棋的下法里面是否已經(jīng)開始體現(xiàn)出個(gè)性?

吳義堅(jiān)那并不是個(gè)性,只是我們覺得它有個(gè)性。比如說新的下法,是因?yàn)槿祟悰]有那樣嘗試過?;蛘哒f所有的高手一開始學(xué)的時(shí)候,他認(rèn)為那種下法是不可能贏的。而機(jī)器會(huì)在跟自己博弈,它后來發(fā)現(xiàn)這樣也能贏,這不叫個(gè)性,它就是在預(yù)設(shè)目標(biāo)和規(guī)律下通過增強(qiáng)學(xué)習(xí)發(fā)現(xiàn)了一些新的可行路徑。因?yàn)槿祟愐惨粯樱瑖逶缙诘南路ㄒ彩遣灰粯拥?,但是有一些人通過實(shí)踐和總結(jié)演變新的布局和招法甚至圍棋理論,只是機(jī)器演變的速度比人類快,這個(gè)是它強(qiáng)的地方。

其實(shí)個(gè)人覺得人類后天學(xué)習(xí)的一些東西,而且是能單一化的東西真的會(huì)被機(jī)器取代,機(jī)器慢慢都能做到。但是人所謂的天生就會(huì)的一些能力,就像人只要看過一次貓后面就可以自己定義并識(shí)別貓,這種天生的能力人類自己也搞不清楚原理和邏輯,就沒辦法告訴機(jī)器怎么做。現(xiàn)在機(jī)器就是人要告訴它怎么做之后,它會(huì)做得比人類更好。

高宏博:其實(shí)圍棋還是一個(gè)有單一目標(biāo)固定規(guī)則的任務(wù)。工網(wǎng)絡(luò)算法分很多層,其實(shí)它也是模擬人腦的神經(jīng)源之間的相互原理,我們現(xiàn)在只是簡單的,其實(shí)他的基礎(chǔ)也是數(shù)學(xué),這塊原來我跟訊飛的龔總提過這個(gè)問題,其實(shí)他有兩種算法:一個(gè)是計(jì)算機(jī)算法模擬,這個(gè)到最后一些簡單的可以處理,但是到最后高級(jí)的一些情感化模擬是不是能完全做到,像吳總這種科學(xué)家級(jí)別的也還在探索;另外一個(gè)從完全的生物學(xué)的角度去研究,現(xiàn)在還完全摸不到什么門道,現(xiàn)在一些生物公司,也是在碰,如果正好碰到一個(gè)療效就可以開發(fā)這個(gè)藥了。它還不如計(jì)算機(jī)有用,計(jì)算機(jī)至少還有一定的邏輯,而生物完全就是在碰了。但是能不能靠模擬能達(dá)到生物學(xué)的效果,這個(gè)確實(shí)還需再探索。

2、基于語音,基于視頻和基于圖象的這三種不同的深度識(shí)別,哪一種技術(shù)門檻會(huì)高一點(diǎn)?

吳義堅(jiān):通用的技術(shù)大家其實(shí)是差不多的,這里面有幾個(gè)東西不一樣:

一個(gè)就是特征提取,當(dāng)然也是有技巧的,就是基于哪些特征更有效的描述你的目標(biāo);

而深度學(xué)習(xí)里面,不一樣的地方就是語音現(xiàn)在可能我們做到五層八層足夠了,而可能對(duì)于圖象,它可能要做到十層二十層,甚至幾十層,還是不一樣的。這不是哪一個(gè)門檻高的問題,是大家的側(cè)重點(diǎn)不一樣;

語音可能要解決的問題跟其他也不一樣,圖象有它的難點(diǎn),比如它是孤立的,但是它對(duì)于圖象的理解,它更多的像是一個(gè)固定序列,并沒有真正理解,并不涉及到語言或者概念理解,它只是檢測(cè)里面的某一個(gè)東西。而這個(gè)語音識(shí)別加理解,其實(shí)更多的是要理解里面的概念。視頻理解,現(xiàn)在的視頻理解,現(xiàn)在的視頻理解更多的是基于圖象的技術(shù),檢測(cè)好這些東西再把它做一個(gè)序列化之后然后抽取一些關(guān)鍵之后就叫理解。視頻理解應(yīng)該建立在圖象的理解基礎(chǔ)之上,視頻理解并沒有單獨(dú)的一個(gè),更多的是在圖象基礎(chǔ)之上做的。

3、是否做語音的深度學(xué)習(xí)技術(shù)門檻更高一點(diǎn)?

吳義堅(jiān):不是的,語音現(xiàn)在它的難度其實(shí)要比圖象低,但是現(xiàn)在圖象的任務(wù)要比語音簡單。就像我語音識(shí)別只做十個(gè)數(shù)字的漢語識(shí)別,早就做到很高了。你看現(xiàn)在的人臉識(shí)別,并不是你做圖象識(shí)別的時(shí)候,你要識(shí)別你看到的所有的東西,現(xiàn)在就是這樣的,如果你要識(shí)別所有的東西肯定是圖象識(shí)別難,但是你如果只做人臉識(shí)別,這個(gè)比語音識(shí)別要容易,所以它可以做到99%,甚至更高。因?yàn)榇蠹业娜蝿?wù)難度不一樣的。

高宏博:前提是你這個(gè)臉要清晰。如果這個(gè)人只是類似于一個(gè)身份證照片,就比較容易一點(diǎn)。其實(shí)現(xiàn)在光線暗一點(diǎn)也不怕,因?yàn)樗麄儸F(xiàn)在也有相關(guān)的技術(shù),對(duì)機(jī)器來說你光線暗沒有關(guān)系,只要相對(duì)正面一點(diǎn),他基本上能保證99%的,光從身份證的角度來講,你幾個(gè)相結(jié)合的話,基本上達(dá)到100%了。

跟訊飛的江總探討了一下,他其實(shí)也是這個(gè)觀點(diǎn):不管圖象也好,語音識(shí)別也好,其實(shí)區(qū)別不大, DNN算法都是拆成一系列的數(shù)據(jù),然后在里面過濾一遍,然后得出一個(gè)結(jié)果。而且它相當(dāng)于把非常復(fù)雜的信息拆算然后最后得到一個(gè)結(jié)論。但是反過來如果只給一個(gè)有限的信息,比如像看到一個(gè)人或者看到景色,就能寫出一首詩出來,這個(gè)機(jī)器是很難做的,這個(gè)其實(shí)就是情感認(rèn)知的東西,確實(shí)現(xiàn)在也找不到一個(gè)好的算法。

4、比如像語音識(shí)別,不同的廠商之間,體現(xiàn)出差別優(yōu)勢(shì)和區(qū)分呢?是否還有算法的精度?

吳義堅(jiān)核心技術(shù),包括谷歌,包括我們做的,核心技術(shù)大家在一個(gè)量級(jí)上,差別并不大,但是也要落實(shí)到具體的產(chǎn)品應(yīng)用,每一個(gè)應(yīng)用的場(chǎng)景都不一樣的,會(huì)帶來不一樣的難度。因?yàn)橐龅氖虑槎家芟薅l件的信息或者目標(biāo)。數(shù)據(jù)是一個(gè)重要的基礎(chǔ),沒有數(shù)據(jù)是很難做好的。

算法一定要有一定的水平,但是現(xiàn)在的深度學(xué)習(xí)框架的門檻沒有那么高(當(dāng)然也不是隨便一個(gè)人就能用),現(xiàn)在一些大一點(diǎn)的廠商應(yīng)該都有這個(gè)能力把這個(gè)東西做了。主要還是在樣本和行業(yè)的應(yīng)用上面。

高宏博:網(wǎng)力就是很有優(yōu)勢(shì),雖然它做這塊還不是很早,但是它的邏輯就是很強(qiáng),而且公安都是很強(qiáng)勢(shì),需要的必須要提供。所以網(wǎng)力雖然不是從人工智能的角度很傳統(tǒng)的一個(gè)廠商,但是對(duì)他還是很看好。

5、現(xiàn)在很多廠商用GPU做深度學(xué)習(xí)嘛,但是很多廠家用FPGA做,你怎么看這兩個(gè)呢?

吳義堅(jiān):我覺得GPU是現(xiàn)在用的比較成熟的,F(xiàn)PGA也有一定的應(yīng)用,很難說哪一個(gè)更好,因?yàn)镕PGA還在一個(gè)初級(jí)階段。GPU目前基本上都有,像我們內(nèi)部做的運(yùn)算全部用GPU,我相信百度肯定也全部是GPU,但是GPU已經(jīng)不叫通用了。針對(duì)DNN,因?yàn)镕PGA可以針對(duì)深對(duì)的神經(jīng)網(wǎng)絡(luò)的定制,他肯定是有潛力的。

6、從做企業(yè)的角度看,中國企業(yè)比較有優(yōu)勢(shì)的會(huì)在什么產(chǎn)品?選怎么樣的企業(yè)可能更有潛力?

吳義堅(jiān):比如說訊飛他在語音評(píng)測(cè)上面,他在考試上面就是做得比較好,因?yàn)樗谶@方面做了很多的人力去做嘛,確實(shí)圍棋上面不行。甭管你通用平臺(tái)還是技術(shù)平臺(tái),如果大家做得不一樣,其實(shí)各有優(yōu)劣勢(shì)的。

所以我覺得要做投資,谷歌百度這種本來人工智能只是他的一小塊的未來的發(fā)展方向,我不好評(píng)估。但是對(duì)這種技術(shù)平臺(tái),肯定是未來的一個(gè)趨勢(shì)。但是技術(shù)平臺(tái)不會(huì)有那么多的家的,最后肯定是一家兩家出來,肯定不會(huì)超過三家。但是細(xì)分行業(yè)里面會(huì)有很多家,這就要看你細(xì)分行業(yè)里面,我后面沒有講,就是我對(duì)這個(gè)機(jī)器人細(xì)分行業(yè),現(xiàn)在做機(jī)器人有幾百家了,但是要看細(xì)分行業(yè)里面你的核心競(jìng)爭(zhēng)力,因?yàn)槟壳暗暮诵募夹g(shù)這一塊還不足以滿足用戶或者達(dá)到用戶的期望值。

我們現(xiàn)在做這個(gè)小孩的,目前只是離用戶的期望接近但還沒有達(dá)到。通用平臺(tái)會(huì)更遠(yuǎn),你沒有這個(gè)技術(shù)的先進(jìn),一個(gè)真正的產(chǎn)品要市場(chǎng)起來,你的產(chǎn)品不僅要滿足而且要逐步超出用戶的期望。我覺得這類東西細(xì)分行業(yè)里面他有能力去優(yōu)化他的產(chǎn)品,即便短期不行,長期他是有能力優(yōu)化他的產(chǎn)品,在未來三、五年類能做到甚至超出用戶需求的。而不是短期地看他的銷量多少,因?yàn)槟壳罢麄€(gè)市場(chǎng)都還是很小的,無論是整個(gè)人工智能或者機(jī)器人市場(chǎng)。

7、像訊飛還有百度,是不是一個(gè)人工智能SDK,是一個(gè)凌駕在各種操作系統(tǒng)上面的SDK?

吳義堅(jiān):當(dāng)然其實(shí)一樣的,它還有一個(gè)重要的東西,誰占有最大的市場(chǎng)和誰領(lǐng)跑,這個(gè)也是非常重要的,因?yàn)樗械臇|西都涉及到一個(gè)切換,因?yàn)槟壳斑€是一個(gè)比較初級(jí)的階段,現(xiàn)在訊飛也好,還有百度也好,其實(shí)還有很多家提供這個(gè)技術(shù)平臺(tái),科大訊飛目前來說還是非常大的,但是目前也不好說,這個(gè)應(yīng)該是他們比較重要的,但是是不是唯一的,這個(gè)很難說。他們不僅做SDK,也會(huì)做一些上層的。

高宏博:我理解訊飛是這樣的,因?yàn)镈NN出來之后,門檻在下降,所以對(duì)訊飛來說不得不去做。訊飛通過這個(gè),相當(dāng)于無論從技術(shù)上包括從數(shù)據(jù)上把大家都綁定了,最后可能也就是百度做的。

之前大家站隊(duì)嘛,可能有兩三個(gè)大平臺(tái)來站隊(duì)。我覺得百度的優(yōu)勢(shì)更大,因?yàn)樗幸粋€(gè)搜索,一個(gè)互聯(lián)網(wǎng)平臺(tái),它是人工智能最好的。因?yàn)槲覀冏钤缛ス韫?,谷歌的工程師說過,其實(shí)你都不需要看到一個(gè)實(shí)體的產(chǎn)品,對(duì)我們來說只要搜索的準(zhǔn)確率提高1%,我們就是幾十億美金收入。但是對(duì)訊飛來說,他現(xiàn)在主要搞的是教育。這次可能做完教育,我估計(jì)他后面兩三年之后教育成熟了可能會(huì)找大的行業(yè)應(yīng)用,我猜想可能是醫(yī)療。但是像搜索引擎這種,百度已經(jīng)占了市場(chǎng)了。

【作者介紹】吳義堅(jiān),上海元趣信息技術(shù)有限公司創(chuàng)始人兼CEO、科學(xué)家、連續(xù)創(chuàng)業(yè)者。15歲進(jìn)入中國科學(xué)技術(shù)大學(xué)少年班,獲博士學(xué)位,游歷東瀛,獲日本名古屋工業(yè)大學(xué)博士后。曾就職于科大訊飛、微軟亞洲研究院、擔(dān)任盛大語音創(chuàng)新院院長。從事和領(lǐng)導(dǎo)智能語音交互技術(shù)和產(chǎn)品研發(fā)近15年,在國際會(huì)議和期刊上發(fā)表40余篇學(xué)術(shù)論文,并擁有多項(xiàng)國內(nèi)和國際專利。作為一名80后的父親,吳義堅(jiān)在繁忙的工作之余發(fā)現(xiàn)了孩子陪伴和早教成長的痛點(diǎn)。他于2013年在上海的張江高科技園區(qū)創(chuàng)立了上海元趣信息技術(shù)有限公司,和自己中科大少年班的同學(xué)一起,用世界領(lǐng)先的技術(shù),進(jìn)行人工智能在幼童早教陪伴領(lǐng)域的產(chǎn)品和應(yīng)用研發(fā)。

雷峰網(wǎng)原創(chuàng)文章,未經(jīng)授權(quán)禁止轉(zhuǎn)載。詳情見轉(zhuǎn)載須知。

擬腦吳義堅(jiān) : 機(jī)器人這個(gè)行業(yè)還很初級(jí),AlphaGo還只是弱人工智能

分享:
相關(guān)文章

編輯

雷鋒網(wǎng)編輯,AI慕課學(xué)院負(fù)責(zé)人。關(guān)注智能駕駛與金融科技,歡迎來撩:www.mooc.ai。
當(dāng)月熱門文章
最新文章
請(qǐng)?zhí)顚懮暾?qǐng)人資料
姓名
電話
郵箱
微信號(hào)
作品鏈接
個(gè)人簡介
為了您的賬戶安全,請(qǐng)驗(yàn)證郵箱
您的郵箱還未驗(yàn)證,完成可獲20積分喲!
請(qǐng)驗(yàn)證您的郵箱
立即驗(yàn)證
完善賬號(hào)信息
您的賬號(hào)已經(jīng)綁定,現(xiàn)在您可以設(shè)置密碼以方便用郵箱登錄
立即設(shè)置 以后再說