丁香五月天婷婷久久婷婷色综合91|国产传媒自偷自拍|久久影院亚洲精品|国产欧美VA天堂国产美女自慰视屏|免费黄色av网站|婷婷丁香五月激情四射|日韩AV一区二区中文字幕在线观看|亚洲欧美日本性爱|日日噜噜噜夜夜噜噜噜|中文Av日韩一区二区

您正在使用IE低版瀏覽器,為了您的雷峰網(wǎng)賬號安全和更好的產(chǎn)品體驗,強烈建議使用更快更安全的瀏覽器
此為臨時鏈接,僅用于文章預(yù)覽,將在時失效
業(yè)界 正文
發(fā)私信給溫曉樺
發(fā)送

0

AIR 018|搜狗CTO楊洪濤:搜索即人工智能

導(dǎo)語:搜索引擎=計算力+數(shù)據(jù)+應(yīng)用

AIR 018|搜狗CTO楊洪濤:搜索即人工智能

人工智能的研究理論講了這么多,那么它如何才能夠落地,形成能給人類帶來價值的產(chǎn)品或服務(wù)呢?關(guān)于人工智能應(yīng)用產(chǎn)品化,搜狗CTO楊洪濤以搜索引擎為例,介紹了如何利用AI技術(shù)做出好產(chǎn)品。

當(dāng)下企業(yè)做AI應(yīng)用化的思路或有誤

我從網(wǎng)上找到一些數(shù)據(jù),美國的數(shù)據(jù)說全球人工智能領(lǐng)域的企業(yè)和創(chuàng)業(yè)企業(yè)達到一千家,以及40多億美元的投資規(guī)模。國內(nèi)艾瑞1月份也有個數(shù)據(jù),說國內(nèi)有100家企業(yè)拿到了投資金額。這代表這個領(lǐng)域極受關(guān)注。但今天我想談的話題是,

這些企業(yè)容易從產(chǎn)品角度去思考他們做的很多事情,這有可能是有問題的,這個后面去探討。我們談到的很多領(lǐng)域,比如說機器學(xué)習(xí)、機器視覺,機器人、推薦引擎、個人助手、語音相關(guān)的技術(shù)等等,我們從產(chǎn)品角度思考的時候,發(fā)現(xiàn)跟技術(shù)角度思考不一樣。

此外,今年圍棋大戰(zhàn)導(dǎo)致一個焦慮:機器人到底會不會戰(zhàn)勝人。我們當(dāng)然希望機器在有限的時間內(nèi)能戰(zhàn)勝人,但我們希望從技術(shù)角度思考可以發(fā)現(xiàn),很多問題是解決不了的——比如說我們知道深度學(xué)習(xí)現(xiàn)在不可解釋,我們很難從數(shù)學(xué)角度去推理,它是不可解釋的。也因為這些不可解釋,它在一些工業(yè)應(yīng)用上就會有比較大的問題,比如,如果出了車禍的時候不能解釋,那百姓對它的信任程度就會下降。

另一方面,現(xiàn)在人工智能對語言能力的理解,現(xiàn)在很難做到真實地理解人的語言能力。此外,大數(shù)據(jù)的產(chǎn)生、訓(xùn)練都需要很大的成本和用戶入口,才能夠在訓(xùn)練當(dāng)中去使用,現(xiàn)在也是一個不算有效的領(lǐng)域。

如果從產(chǎn)品角度來看這個問題,我覺得從這兩個角度來看:

  • 第一個是,做談?wù)摍C器能不能戰(zhàn)勝人的時候,我們想想:什么叫戰(zhàn)勝?如果說機器跑得比人快,算得比人快,這樣的一個回答的話,其實發(fā)現(xiàn)機器早已經(jīng)戰(zhàn)勝人了,今天我們說機器能不能戰(zhàn)勝人的時候,指的是直接瞄向了人的大腦部分,能不能替代你的大腦和思考決策。

  • 第二點是,產(chǎn)品能不能做出一個輔助人做決策的產(chǎn)品形態(tài)來?很重要一點是說我們能不能生產(chǎn)出足夠多的數(shù)據(jù)。

搜索引擎即人工智能

首先第一個是Siri,2011年的時候蘋果發(fā)布了Siri,引起了關(guān)于語音識別的極大討論和熱潮;還有Echo智能家居的產(chǎn)品,在美國賣得非常好;還有AlphaGo,它雖然不是一個產(chǎn)品,但引起了普通網(wǎng)民的關(guān)注,對技術(shù)進步貢獻非常大;然后是特斯拉的自動駕駛,包括消費者關(guān)心的一個領(lǐng)域,不斷地出現(xiàn)事故,也引起了很多探討。

但是允許我老王賣瓜一下,從搜索引擎產(chǎn)品的從業(yè)者來講,我們認為搜索引擎其實是人工智能最大的一個場景。

為什么這么說呢?第一個原因從產(chǎn)品角度看,搜索引擎在過去這么多年當(dāng)中,它起到的作用,就是人的大腦外延,它增強了你解決問題的能力,我們?nèi)粘I?、工作?dāng)中很多問題其實是通過搜索引擎去實現(xiàn)的。

我記得谷歌的創(chuàng)始人之一很早的時候說過,“我們的目標(biāo)就是要成為人類的第三塊大腦?!边@描述了搜索引擎產(chǎn)品的單位。但今天的搜索引擎是基于關(guān)健詞和搜索結(jié)果的產(chǎn)品形態(tài),用戶要自己去思考,出來這十套結(jié)果是否滿足自己的東西。

其實搜索引擎下一步要解決的問題,或者說人工智能技術(shù)在搜索引擎里有巨大應(yīng)用的場景就是說能不能不要用這樣的一個用戶自己思考的方式,而是我能夠直接知道你想要的東西,這是大家都想要去解決的一個工作的方向。

最后一個是,對話機器人仍不可能替代搜索引擎。聊天機器人剛上線的時候只有幾十個,現(xiàn)在做到一千個了,它是開平帶的方式,大量合作伙伴給它增強系統(tǒng)的功能。Siri就是個例子,2011年就上線服務(wù),蘋果公司自己研發(fā)siri的對話功能和給用戶提供的服務(wù),到今年它發(fā)現(xiàn)這個功能終于不行了,沒辦法運轉(zhuǎn)下去。因為大量的用戶發(fā)現(xiàn)它很難解決實際問題,用戶實際用Siri的時候是:我要給誰打電話,我要給誰發(fā)短信這樣簡單的服務(wù)。今年開發(fā)者希望給它提供很多功能的研發(fā),但實際上它都無法替代搜索引擎海量的用戶帶來的問題的解答。

搜索引擎=計算力+數(shù)據(jù)+應(yīng)用

關(guān)于搜索引擎和AI的關(guān)系,我們知道,近十年來人工智能的發(fā)展,更明確的說是深度學(xué)習(xí)的發(fā)展取決于這三個元素。今天因為互聯(lián)網(wǎng)的進展,或者網(wǎng)絡(luò)的進展,足夠的應(yīng)用、足夠的信息和足夠的用戶能上網(wǎng),最后產(chǎn)生足夠多的數(shù)據(jù)——這些數(shù)據(jù)使得我們能研究出更好的算法,以及讓我們有了很好的計算力,有了大量低成本把計算力連接起來的方式。

這三個角度上看,誰擁有最好的三個元素?還是看搜索引擎界的老大。谷歌雖然沒有公開過自己的服務(wù)器數(shù)量的數(shù)據(jù),但根據(jù)它的能耗來估計,以及它擁有幾百萬臺服務(wù)器的數(shù)量,可見搜索引擎公司就有這樣巨大的計算力。上午張老師就提到“找貓的圖象識別”,程序能夠很容易的就把16000個CPU連接起來做這個訓(xùn)練。

再看數(shù)據(jù),搜索引擎公司有足夠大的網(wǎng)頁,去作為數(shù)據(jù)的基礎(chǔ),它們還能做很多怎么去促進數(shù)據(jù)的收集工作,谷歌為什么要去發(fā)射,用來聯(lián)網(wǎng)的切球,谷歌為什么要免費拉光纖。大家知道谷歌的母公司它里面有兩個關(guān)于醫(yī)療的子公司,一個做的方式是用傳感器放到眼睛里的隱形眼鏡,要把一個得了病的人的數(shù)據(jù)進行搜集,然后分析,他們有這種條件去獲得這樣的數(shù)據(jù)的能力。

未來工作方向:自然交互和知識計算

自然交互

怎么能夠讓用戶以很自然的方式跟產(chǎn)品去互動?讓搜索引擎懂你想要的是什么東西,而不是一個用關(guān)健詞去表達的——是一個自然語言的句子,像人與人對話一樣,描述我有什么樣的問題。這當(dāng)中不僅僅是語言和對話,還包括視覺,能看到你的表情、樣貌,讀懂你的情緒。

知識計算

怎么能夠?qū)χR有足夠好的獲取計算或者推理的方式?在這個領(lǐng)域上目前我們能夠獲得的進展是非常有限的。

在這兩個方向上,目前的搜索引擎產(chǎn)品也好,或者同類的對話系統(tǒng)、服務(wù)系統(tǒng)也好,還解決得不夠好。那么,從產(chǎn)品上怎么解決這個問題?

解決不了的時候就攢數(shù)據(jù)

當(dāng)一個產(chǎn)品體驗不好的時候,我們怎么辦?我們攢數(shù)據(jù)。

舉一個我們自己做產(chǎn)品做技術(shù)時候的真實的例子:

大家知道搜狗輸入法做了很長時間,我們很早也意識到用戶通過語音與機器交互的方式非常重要,那時候我們還沒有語音識別的技術(shù),我們還找了一些做語音交互的公司去合作,但沒有找到比較好的合作方式。于是逼得我們自己去做研發(fā)。

當(dāng)時我們想了一個辦法,直接調(diào)用谷歌在國外提供的語音識別接口,雖然很慢,但可以用。它的自錯率43%,意思就是說如果你輸入一段話100個字40個字是錯的。但因為一個產(chǎn)品里面功能的入口,大量用戶就開始用,用了之后我們開始迭代數(shù)據(jù),積攢了足夠多的用戶錄語音的數(shù)據(jù)。2012年11月份的時候,不到半年的時間我們把自己的數(shù)據(jù)做出來了,一上線了就獲得了跟谷歌接近而且比它好的結(jié)果。隨著后面用戶使用越來越多,以及新技術(shù)在過程中的使用,錯誤率直線下降,今年4%左右的錯誤率,最近還在繼續(xù)下降。

所以當(dāng)打不過的時候,攢數(shù)據(jù)是價值提升的作用。值得一提的事,我們掌握這么多數(shù)據(jù)之后怎么辦?

這需要找一些數(shù)據(jù)標(biāo)注公司去標(biāo)注這些數(shù)據(jù),每一句話說的是什么,后來因為把這樣一個功能用到產(chǎn)品里之后,用戶沒有選擇語音識別的句子實際上是輔助標(biāo)注的過程。如果用戶沒有選說明是錯的,錯的數(shù)據(jù)我們就拿給數(shù)據(jù)標(biāo)注公司去標(biāo)注。

面包與葡萄干:人工智能做出好產(chǎn)品才創(chuàng)造價值

使用AI技術(shù)的好產(chǎn)品才創(chuàng)造價值,這個價值有兩方面:一個是給用戶提供一個好的辦法,第二個是真正能生產(chǎn)數(shù)據(jù),從而使自己迭代。

好產(chǎn)品:叫好+賣座+賺錢

好的產(chǎn)品能得到媒體和用戶的關(guān)注,能得到資源,賣座的產(chǎn)品能獲得用戶,用戶能生產(chǎn)數(shù)據(jù),以及能不斷迭代。賺錢更不用說,一個好產(chǎn)品能賺錢才能使企業(yè)研發(fā)不斷滾動。

不足夠好的產(chǎn)品的例子,我們做個自我批評。搜狗前兩年出了一個己的云助手產(chǎn)品,當(dāng)時覺得這樣一種對話形態(tài)可能是未來新一代的互動方式和解決問題的方式,于是我們做了跟Siri基礎(chǔ)一樣的產(chǎn)品架構(gòu)和問答式的技術(shù)架構(gòu)。但是這個產(chǎn)品上線之后,我們發(fā)現(xiàn)用戶的使用率并不高,開始幾天覺得好玩用了一段時間,后來就不用了,為什么?我覺得原因有很多,其中關(guān)鍵原因就是它沒有足夠好的解決用戶新的需求。

討論

鄭宇:兩個例子里面我覺得第二個例子可能更加有意義,因為搜索空間有限,而且字比較短,第一個發(fā)微信的例子可能不是最好的,有點鼓勵大家開車發(fā)微信的意思?,F(xiàn)在給大家提個問題:搜狗投資和布局了很多人工智能項目,目前有什么樣的收獲?最大的成果是什么?

楊洪濤:我的答案有點像剛剛KK(小米聯(lián)合創(chuàng)始人黃江吉)的答案,我覺得現(xiàn)在還沒有讓我們覺得足夠滿意的產(chǎn)品,或者叫做真正讓產(chǎn)品幫人做決策,或者幫人做出好的選擇的這樣一個功能上還沒有完全做得到。但我們的產(chǎn)品確實要去解決這樣的問題,然后我們還要去投入。你剛才說到投入我覺得非常好,給我一個打廣告的機會,我們今年跟清華大學(xué)投入了大概1.8億人民幣建一個人工智能研究院,推動技術(shù)的進步,有了技術(shù)的進步,有了產(chǎn)品應(yīng)用的進步,我們在這個領(lǐng)域的關(guān)注都是為了做一個好的產(chǎn)品體驗出來。然后去積攢數(shù)據(jù),現(xiàn)在還只能做到積攢數(shù)據(jù)的地步。下一步真的是能夠去主動地給人提供輔助,我覺得還沒有做到。

雷峰網(wǎng)原創(chuàng)文章,未經(jīng)授權(quán)禁止轉(zhuǎn)載。詳情見轉(zhuǎn)載須知。

分享:
相關(guān)文章
最新文章
請?zhí)顚懮暾埲速Y料
姓名
電話
郵箱
微信號
作品鏈接
個人簡介
為了您的賬戶安全,請驗證郵箱
您的郵箱還未驗證,完成可獲20積分喲!
請驗證您的郵箱
立即驗證
完善賬號信息
您的賬號已經(jīng)綁定,現(xiàn)在您可以設(shè)置密碼以方便用郵箱登錄
立即設(shè)置 以后再說