1
本文作者: 張馳 | 2017-02-22 17:26 |
雷鋒網(wǎng)消息,2月21日下午,還未上市的搜狗在北京舉辦了一場財報媒體溝通會。在會上,這位CEO保持了他一貫敢講敢說的風(fēng)格,除了介紹公司過去所做的事,以及對人工智能和業(yè)務(wù)方向的理解,還對其他公司作了近乎不留情面的點評。
雷鋒網(wǎng)了解到,在王小川看來,以搜索起家的搜狗本身就是一家AI公司,不存在轉(zhuǎn)型的說法。“中國現(xiàn)在有兩家是在AI上最努力做報道的自媒體,其中一家問,搜狗要轉(zhuǎn)型做AI了,我聽了一肚子火。因為搜索其實就是AI,它就是讓機(jī)器像人一樣去思考,搜索引擎變得很聰明,能夠幫我們選擇出更好的頁面來?!?/p>
他認(rèn)為,AI里面最難的地方是人的思想和知識的學(xué)習(xí),不僅是圖像的識別,語音的識別,因為人的難點也在于知識的理解和推理能力。而搜狗在AI場景里細(xì)的分類,是在自然語言里,這是人工智能最難的一塊。公司將通過語言將搜索升級到對話系統(tǒng)、問答系統(tǒng)以及翻譯系統(tǒng),這是他們核心能力的三部分。
那在AI領(lǐng)域,搜狗做得怎么樣了呢?王小川認(rèn)為,如果論排名的話,搜狗搜索在國內(nèi)排名第二,AI方面應(yīng)該在前三的位置。
不過面對一些世界級公司,他還是比較謹(jǐn)慎,稱“我們沒有Google或者DeepMind那種能力里面,屬于開創(chuàng)出新的算法出來,但基于上面的算法去改良的能力是足夠的。”
百度同樣是一家搜索公司,也同樣將AI放到了核心地點,所以兩家公司的對比也是王小川繞不開的話題。談到百度,他表示,“2015年,我們發(fā)布了微信搜索和知乎搜索;2016年,我們發(fā)布了明醫(yī)搜索和英文搜索,慢慢開始和百度走向不同的道路?!?/p>
他說到,“我認(rèn)為百度是沒戰(zhàn)略的公司?!痹卺t(yī)療上,他則說到,“ 我會認(rèn)為百度會變得更難,因為百度現(xiàn)在畢竟市場份額大,他會把廣告模式轉(zhuǎn)成免費為用戶提供多種咨詢的模式,收入會下滑”。
不過王小川對百度新上任的COO陸奇十分尊重,稱陸奇有兩個很大的優(yōu)點,“一是技術(shù)理想主義,和他聊天能看到他一談到新的算法就兩眼放光,半夜兩三點去讀論文,是個很好的技術(shù)人。二是也不官僚,跟他談東西,也不會擺在全球華人最高職位上,而是非常平易和我們?nèi)フ劦摹!?/p>
對于無人駕駛,王小川認(rèn)為有兩個事,一個是無人駕駛里的輔助系統(tǒng)、導(dǎo)航系統(tǒng);但開車目前還無法完全實現(xiàn)。他表示,在車載這塊,搜狗會在里面做一些東西,但不是無人駕駛這個事情,“開車這事兒不是搜索公司該干的”,公司會聚焦在“自然交互和實時計算,導(dǎo)航在這個范圍里”。
或許上面就是他認(rèn)為百度沒有戰(zhàn)略的原因。
對另一家AI公司科大訊飛,王小川顯得“仁慈”得多。
他認(rèn)為,科大訊飛是to B的公司,基因是做企業(yè)的事情;搜狗是做toC的公司,是和消費者、網(wǎng)民能產(chǎn)生一種連接,基礎(chǔ)的技術(shù)競爭力方向是不一樣的。
不過在競爭性的產(chǎn)品上,“貶”一下也是不可避免的。
“目前語音識別里,用戶使用量最大的是搜狗,遠(yuǎn)遠(yuǎn)大于科大訊飛,在輸入法里已經(jīng)用到了。做技術(shù)現(xiàn)在需要兩件事兒,一是有數(shù)據(jù),二是有研發(fā)AI的能力。數(shù)據(jù)能力上,我們是有優(yōu)勢的,研發(fā)能力我覺得搜狗也沒有弱的地方。從應(yīng)用場景到數(shù)據(jù)積累、技術(shù)能力,我自己評估一下我們都占優(yōu)勢的位置?!?/p>
在語音加翻譯上,他表示“和訊飛的比較里已經(jīng)不是關(guān)鍵問題,我們現(xiàn)在明確和兩家公司作對比,一家百度,一家Google,我們有信心比他們要好,直接線上能看的。無論是語音識別還是在線的翻譯,我們都比他們好?!?/p>
以下是雷鋒網(wǎng)得到的溝通會王小川自述部分,全文請看這里。
挺高興有機(jī)會和大家面對面談,有段時間我們和媒體沒有親密的接受任何一個這樣的訪問。回顧從2013年到2016年,13年搜狗與搜搜合并,到現(xiàn)在已經(jīng)三年的時間。
我第一個感慨是,搜狗搜索活下來了,2013年合并時,360的一些言論,說中國搜索市場只能容納兩家,沒有第三家的事情,表達(dá)第二家是他,現(xiàn)在看起來,在中國百度依然還是很大,此外搜狗是唯一一家既有PC搜索也有無線搜索,市場份額、收入利潤在上升的公司。這也是我們活下來,而且不斷地有更多競爭力的原因。2016年利潤是6.4億人民幣,其中投入到很多領(lǐng)域去,在搜索行業(yè)算是活下來的。
具體看量,我們可以號稱叫全球第三大搜索引擎,雖然只做中國市場,因為Google最大,百度第二,我們第三,從搜索量排是在第四,后面才是其他家引擎,想說量上中國市場是最大的,在國內(nèi)第二,在全球排第三的位置。2015年,我們發(fā)布了微信搜索和知乎搜索,2016年,我們發(fā)布了明醫(yī)搜索和英文搜索,慢慢開始和百度走向不同的道路。大家用微信會用一些。我認(rèn)為,醫(yī)療搜索和英文搜索是通向未來兩個很重要,可以展開無限想象力的事情,通過微信搜索和知乎搜索基本固定了形態(tài),在醫(yī)療往下出現(xiàn)自助診斷甚至分診,能夠讓用戶真正明明白白看醫(yī)生。現(xiàn)在大家拿著化驗單可能不知道什么意思,給你個診斷方向你不知道怎么辦,或者發(fā)生頭痛感冒不知道怎么辦。這是借助大數(shù)據(jù)下,在AI分析里逐步走向輔助醫(yī)生或者讓用戶和醫(yī)生之間建立更多信任的工具。我們知道,國內(nèi)之前有很多做醫(yī)療的創(chuàng)業(yè)公司,基本覺得把這個市場做壞了,把醫(yī)院醫(yī)生搞得很疲憊,因為大多數(shù)邏輯,是希望醫(yī)生脫離醫(yī)院出來在線做診斷,他要形成對用戶的吸引力,也要建立后面的商業(yè)模式,這是原來的一點。
但是我們沒有這個需求,因為我們本身有用戶,用戶需要解決診斷的問題。我看到一些醫(yī)療機(jī)構(gòu),大部分來講,上不接用戶,下不接醫(yī)院,就是醫(yī)院不是他的,用戶也不是他的,在中間是沒有競爭力,他想把醫(yī)院拉到自己這邊,吸引用戶,醫(yī)生是沒有辦法獨立于醫(yī)院的,這是之前創(chuàng)業(yè)者出現(xiàn)的問題。但是我們有用戶,我們代表用戶找到醫(yī)院,找到醫(yī)生,這樣的模式能夠真正有機(jī)會成立。而且我們在醫(yī)療上也沒有創(chuàng)業(yè)公司賺錢的壓力,因為對我們而言,只要用戶認(rèn)可搜狗搜索,有足夠大的搜索量,搜狗搜索有良好的商業(yè)模式,只要量大,給用戶搜索產(chǎn)品就行了,而其他創(chuàng)業(yè)公司會面臨壓力,第一是沒用戶,第二是基于資本壓力創(chuàng)造賺錢的模式,這也使得搜索引擎公司在醫(yī)療服務(wù)里能找到自己更好的位置。
我會認(rèn)為百度會變得更難,因為百度現(xiàn)在畢竟市場份額大,他會把廣告模式轉(zhuǎn)成免費為用戶提供多種咨詢的模式,收入會下滑,我們沒有這方面的壓力,這是關(guān)于醫(yī)療上的思考。
另外,我們從英文搜索走向海外搜索,這周內(nèi)我們會有兩個升級,一是英文搜索升級成海外搜索,最后搜索的結(jié)果也是用中文呈現(xiàn),以前我們大家談到的事情是,去年有幾十個院士跑去給習(xí)近平寫聯(lián)名信,希望能對谷歌網(wǎng)開一面,如果科技工作人員不能用谷歌搜索海外科技信息,中國和世界是脫節(jié)的,國內(nèi)的科技發(fā)展就會受制約,我們可以不看國外的美劇、韓劇,但在國外科技、信息層面不能落后。但我認(rèn)為不夠,即便開放的Google,但大部分人是用中文的,而世界上非常多有益的信息,包括醫(yī)療信息、科技信息,甚至大家言論上的討論都發(fā)生在英語世界里。
在這種情況下,把英文變成中文以后,我相信,98%的中國人才能更好享受全球的內(nèi)容,因為我們最強的是語言部分。正好這個時代到了,去年在AI爆發(fā)一年到年底時,翻譯技術(shù)是突飛猛進(jìn)的,比原來的翻譯有快速的發(fā)展,就像語音和圖像突破,翻譯技術(shù)突破了。因此,我們有機(jī)會把翻譯和搜索做一個聯(lián)動,因此我們說搜索全世界。一個中文輸進(jìn)去我們現(xiàn)在開始搜索的是全球的英文,然后我們未來考慮把全球的日文或其他文字的信息都搜索到,這樣會構(gòu)成一個獨有的競爭力,這是Google并不care的東西,因為英文是他們的母語。這種情況下,在翻譯上更多是秀研究的肌肉,Google秀8國語言的互譯,秀的是如果沒有語料,沒有中文到德文的,只有中文到英文,英文到德文,我是不是能做中文到德文的翻譯,他們是在做這樣的事情,和我們的目標(biāo)不一樣。我們是實實在在希望通過翻譯技術(shù)把搜索做得更好,海外搜索也會成為搜索競爭中的差異化。
第一次從微信內(nèi)容開始,我們開始和百度不一樣,開始有了知乎、明醫(yī)和海外,這周升級完之后就可以完全用中文完全瀏覽世界的網(wǎng)頁,不僅是搜索的詞用中文搜索,結(jié)果也用中文呈現(xiàn),點出去的鏈接也全用中文來看,在一些場景里應(yīng)用也更加方便。我們內(nèi)心對這個事情有蠻高的理想,先不說賺錢的問題,因為地球上中國人是最多的,但是我們很不幸,在200年來發(fā)生的變化,英語成為世界主要溝通的語言。這么大的人群和世界主要語言有隔閡,使得用中文搜索世界,我認(rèn)為,對中國整個大的復(fù)興、成為世界主旋律的一部分是有歷史意義的,我們內(nèi)部叫重寫《通天塔》的故事?!锻ㄌ焖肪褪侵v語言不通,使得各個國家的人沒法聯(lián)合起來做事情,語言通暢了之后會帶來一個新文明,就像發(fā)明火、發(fā)明電一樣,所以我們2016年在搜索做了很多的工作,從AI也是武裝到牙齒。
去年有個很著名的AI媒體負(fù)責(zé)人跟我聊,中國現(xiàn)在有兩家是在AI上最努力做報道的自媒體,其中一家問,搜狗要轉(zhuǎn)型做AI了,我聽了一肚子火。因為搜索其實就是AI,它就是讓機(jī)器像人一樣去思考,搜索引擎變得很聰明,能夠幫我們選擇出更好的頁面來。陸奇剛剛?cè)グ俣龋懦鲆痪湓?,說搜索是AI最好的場景,搜索和AI是天生在一塊兒的。今天在做AI的很多公司,大規(guī)模做機(jī)器學(xué)習(xí)、深度學(xué)習(xí)方面,人才方面也都是找搜索公司去要人。因為有了深度學(xué)習(xí)之后,會使得搜索場景有更好的武器來滿足,甚至升級這樣的能力,而我們內(nèi)部的員工大部分受過正統(tǒng)的訓(xùn)練,怎么用這種數(shù)據(jù)和方法,大家都知道怎么讀論文去提升,我們沒有Google或者DeepMind那種能力里面,屬于開創(chuàng)出新的算法出來,但基于上面的算法去改良的能力是足夠的。
AI里,我們在翻譯里面是往前在走,輸入法之前也是很容易地開始做語音輸入、圖像輸入,我們現(xiàn)在語音輸入量是全中國最大的,而且比其他家加起來還要多的份額,1天2億多次語音識別請求。在AI時代里,大家的理解不只是語音和圖像,AI里面最難的地方是人的思想和知識的學(xué)習(xí),不僅是圖像的識別,語音的識別,人最寶貴的不是圖像和聲音,人的難點在于知識的理解和推理能力,而這種能力是靠語言體系來支撐的,靠語言來支撐對知識和思考的表達(dá)。搜狗在這里面天生是兩個場景,一是輸入場景,讓大家用語言表達(dá),二是用語言獲取信息。因此,我們在AI場景里細(xì)的分類是分在自然語言里,自然語言代表了對知識和思想在這里面的人工智能,這里面是人工智能最難的一塊。
往下的思考是幾個事兒,通過語言將搜索升級到對話系統(tǒng)、問答系統(tǒng)以及翻譯系統(tǒng),這是我們核心能力的三部分。包括《一站到底》,可以認(rèn)為是搜索對未來的模式,就是提問題,不是給你10條鏈接,而是給你1個答案,實際上《一站到底》的場景相對比較窄,我們在問答處理能力上是比較寬泛的,不僅能找到實體,能在里面做更多的運算,《一站到底》是演示下一代技術(shù)中間的場景。對話系統(tǒng)也是今年的一個重心,翻譯系統(tǒng),我們會把這種能力不僅用到移動互聯(lián)網(wǎng),未來在智能硬件里也會大量地使用我們的一些能力。以自然語言為核心,我們做語音也是把它翻譯成語言,語音識別是從語音到語言,合成是從語言回到語音,但處理的核心是語言,我們要把語言的能力,結(jié)合語音、圖像和其他方式放到手機(jī)之外的硬件里。所以,我們AI的邏輯不僅是放在輸入法和搜索里,產(chǎn)品形態(tài)里有幾個關(guān)鍵詞:輸入法,搜索,自然語言的計算,自然的交互。他們支撐的地方是對話的問題,問答的問題以及翻譯的問題。我們希望在這幾個場景里,大家都能看到搜狗的聲音,尤其硬件、IoT到來的時代,無處不在會有交互和機(jī)器智能,這是對未來的判斷。
以上是搜狗過去所做的事情,以及往下對人工智能和業(yè)務(wù)發(fā)展方向的理解。
雷峰網(wǎng)版權(quán)文章,未經(jīng)授權(quán)禁止轉(zhuǎn)載。詳情見轉(zhuǎn)載須知。