11
本文作者: 宗仁 | 2015-12-22 15:20 |
“人類從早期的猿人能變成現(xiàn)在這樣,很大程度上歸功于‘語言’的廣泛使用,因?yàn)?,我們?jiān)信人工智能發(fā)展的必由之路,是語音和語言為入口的‘認(rèn)知革命’”。
科大訊飛昨天在國(guó)家會(huì)議中心舉辦了它們的年度發(fā)布大會(huì),從早期猿人講到現(xiàn)代超人,從語言的誕生講到認(rèn)知革命的起因,從1980年第一次AI寒冬講到現(xiàn)在的第三次AI浪潮,在大家都開始犯困的時(shí)候,終于宣告他們推出全新人機(jī)交互界面AIUI,以及錄音寶、錄音筆、訊飛聽見等一系列2C產(chǎn)品,很多去了現(xiàn)場(chǎng)的朋友都一頭霧水,科大訊飛繞了這么大關(guān)子到底在推銷啥?
如果你都覺得科大訊飛此會(huì)開地醉翁不在酒,那不妨看看記者對(duì)科大訊飛的會(huì)后專訪,或許你會(huì)明白點(diǎn)什么。
確實(shí)有投資,但是具體金額沒超過這個(gè),具體信息,要等我們雙方確定后才能對(duì)外披露,我們目前還是參股,涉及到的股權(quán)并不多。
(為什么要投優(yōu)必選?)
這里解釋一下,早前我們對(duì)智能機(jī)器人行業(yè)基本的想法是兩塊。
一塊就是我們希望為所有機(jī)器人公司提供我們今天講的基于語音和語言的人機(jī)交互的方案。像為他們提供軟硬件一體化,端和云端整個(gè)服務(wù)和定制的能力,這是我們第一步要做的工作。
第二塊是在機(jī)器人行業(yè)中我們會(huì)選一些優(yōu)秀公司,給他更多的專門的定制支持和參股和投資。
還有一塊是在我們所熟悉的領(lǐng)域,擅長(zhǎng)的市場(chǎng)領(lǐng)域會(huì)自己牽頭主導(dǎo)做未來的機(jī)器人。
相對(duì)于人來說,就是扮演了一個(gè)能聽會(huì)說的嘴巴和耳朵,譬如人光有軀體沒有大腦完成不了工作, 就像一個(gè)聾啞的孩子,你很難教他去上課、學(xué)習(xí)和智力提高,可當(dāng)他能夠通過跟外界交流獲得更多信息了,獲得認(rèn)知、發(fā)展和持續(xù)進(jìn)步的能力,今天我們把這個(gè)口子(AIUI)給打開了。
(具體應(yīng)用在哪些領(lǐng)域?)
在我們公司的實(shí)際業(yè)務(wù)運(yùn)用中,我們超腦中在客服領(lǐng)域,實(shí)實(shí)在在已經(jīng)代替30%的員工。另外除了教育之外,我們?cè)谝砸粋€(gè)一個(gè)具體產(chǎn)品的形式推出來,包括今天推的錄音筆。
其實(shí)想說的是,我們的超腦計(jì)劃是成體系的,現(xiàn)在很多人在說超腦或者說在人工智能,比如說人臉識(shí)別、指紋識(shí)別,其實(shí)瞄準(zhǔn)的目標(biāo)就是萬物互聯(lián),我們也一樣。
硬件如果只是一個(gè)概念上的聯(lián)網(wǎng),解決不了真正的交互問題,那一定會(huì)不景氣的,其核心是智能硬件能真正解決你的問題。
從京東音響的嘗試來看,人工智能也好,智能家居也好,有些時(shí)候是需要新的突破來帶動(dòng)整個(gè)產(chǎn)業(yè)上大臺(tái)階。
但從另外一個(gè)角度看,它的前景是很好的,這是一個(gè)必然,但在這個(gè)必然中,我們要經(jīng)歷很多地嘗試和失敗,才有后面的成功。
坦白講,我們現(xiàn)在從智能硬件上賺的錢跟我們其它業(yè)務(wù)是沒法比的,但將來的所有多有具有智能的屬性是我們的目標(biāo),在這個(gè)方面我們會(huì)持續(xù)地、真正地去干,而不是等別人做好了我們來用。
而訊飛準(zhǔn)備做一件事情,通常的積累期都是5-10年,有些做智能硬件地根本等不了那么久,只能忍受半年至多一年半,但我們做的是核心技術(shù)系統(tǒng)創(chuàng)新,必須堅(jiān)持。
我覺得做對(duì)了三件事情:
第一件事情,是我們選準(zhǔn)了方向和切入點(diǎn),如果說人工智能今天貿(mào)然介入是很有可能失敗的。早期神經(jīng)網(wǎng)絡(luò)算法都是從美國(guó)開始起步,有些在加拿大、多倫多那些頂級(jí)科學(xué)家。
我們做了中文語音合成,后來做了多語種語音合成,做完了開始做語音識(shí)別,現(xiàn)在開始做自然語言理解,就是超腦。這么些年我們一直堅(jiān)持遵循產(chǎn)業(yè)發(fā)展,死磕核心技術(shù),推進(jìn)大規(guī)模產(chǎn)業(yè)化,形成自我造血和迭代,這是關(guān)鍵。
第二件事情就是我們真的把一些有報(bào)復(fù)和夢(mèng)想的人專注在語音和人工智能領(lǐng)域,這些科學(xué)家在全球受到過最好的專業(yè)訓(xùn)練,但他們回到了中國(guó)。
第三件事我們選擇了很好的產(chǎn)業(yè)化的路徑,只做語音的合成技術(shù)不停往前走的時(shí)候,我們?cè)谧钋‘?dāng)?shù)募夹g(shù)推出語音云平臺(tái),積累十億人次的訪問,快速迭代。后面基于云平臺(tái)的基礎(chǔ)上,又開始切入到教育,雖然大家都說BAT把各個(gè)入口都霸占了,但未來在行業(yè)中最有可能形成BAT。而現(xiàn)在,我們又走到了人工智能平臺(tái)。
他們作為戰(zhàn)略股東,不參與公司管理,這個(gè)對(duì)我們來說是比較開明的。
當(dāng)然作為國(guó)有體制,有些決策機(jī)制相對(duì)比較長(zhǎng),好在移動(dòng)的業(yè)務(wù)只占到了我們的10%,但我們還是把它當(dāng)做一個(gè)好的股東,一個(gè)可以做示范性合作的伙伴來看。
我覺得提到的那個(gè)詞,最重要是構(gòu)型。在我們搞研發(fā)的看來,深入神經(jīng)網(wǎng)絡(luò),不管是遞歸神經(jīng)網(wǎng)絡(luò)還是卷積神經(jīng)網(wǎng)絡(luò),都是一種辦法。
我們具備這樣的能力。你找出這種構(gòu)型,找到這種解決方案是不是最好,能不能達(dá)到最好的效果,這個(gè)最好還會(huì)不斷變化,我們會(huì)一直改進(jìn)。
我要解釋一下,現(xiàn)在超腦我們用的既不是仿生學(xué),也不是空氣動(dòng)力學(xué),我們現(xiàn)在用智能動(dòng)力學(xué)這個(gè)詞(是我們內(nèi)部的說法啊,不是術(shù)語哈)。
早前工業(yè)界里面用的三大法寶。深度神經(jīng)網(wǎng)絡(luò)和大數(shù)據(jù)和漣漪效應(yīng)——這種辦法有一個(gè)很大的障礙,只能實(shí)現(xiàn)什么樣的智能,看上去像人一樣聰明的智能,并不一定能夠讓機(jī)器真正的思考。
如果你想要真正的思考,有兩種辦法,有一些人相信把每一個(gè)人腦的分子結(jié)構(gòu)和動(dòng)態(tài)過程搞清楚,超級(jí)計(jì)算及模擬他,就可以得到人工智能。有一些人相信,不需要了解核心機(jī)理是什么,我插上羽毛也可以飛,其實(shí)鳥能飛是空氣動(dòng)力學(xué)。
但現(xiàn)在我們相信,在神經(jīng)拓?fù)浣Y(jié)構(gòu)方面,只要我們做的有可能比人腦還要好。我把這個(gè)詞歸納成為智能動(dòng)力學(xué),也可以實(shí)現(xiàn)超腦的程度。
科大訊飛是技術(shù)出身的大家都知道,2008年與中國(guó)移動(dòng)為首的運(yùn)營(yíng)商達(dá)成戰(zhàn)略合作后,在傳統(tǒng)IT業(yè)務(wù)的收益越來越可觀,但這么大一家上市公司,在移動(dòng)互聯(lián)網(wǎng)乃至物聯(lián)網(wǎng)到來的時(shí)候,必須考慮轉(zhuǎn)型的態(tài)勢(shì),不說過去兩年,單就2015,科大訊飛就在家居、車載、機(jī)器人領(lǐng)域迅速發(fā)力,努力擴(kuò)充它的C端產(chǎn)品線。
但從從外界的角度來看,一家習(xí)慣2B的公司怎么2C,一開始都還會(huì)有2B的影子,不然一口氣發(fā)布那么多產(chǎn)品,不是把消費(fèi)者當(dāng)行業(yè)客戶在搞么?
就好比一家本來做芯片的公司,突然推了部手機(jī),它會(huì)在推廣營(yíng)銷上下多大決心還真不好說,同樣,訊飛會(huì)在這幾款C端產(chǎn)品花多少心思還不好說。
但我們只要牢牢記住,訊飛發(fā)布所有產(chǎn)品的背后,都有個(gè)一致的東西,就是那顆叫做“超腦”的東西,它的高度就決定了所有產(chǎn)品的制高點(diǎn),它的質(zhì)量就決定了產(chǎn)品的最佳質(zhì)量,這樣你就知道訊飛發(fā)的到底是個(gè)什么東西,以及它講了那么多到底是在推銷它的什么了。
雷峰網(wǎng)原創(chuàng)文章,未經(jīng)授權(quán)禁止轉(zhuǎn)載。詳情見轉(zhuǎn)載須知。