丁香五月天婷婷久久婷婷色综合91|国产传媒自偷自拍|久久影院亚洲精品|国产欧美VA天堂国产美女自慰视屏|免费黄色av网站|婷婷丁香五月激情四射|日韩AV一区二区中文字幕在线观看|亚洲欧美日本性爱|日日噜噜噜夜夜噜噜噜|中文Av日韩一区二区

您正在使用IE低版瀏覽器,為了您的雷峰網(wǎng)賬號(hào)安全和更好的產(chǎn)品體驗(yàn),強(qiáng)烈建議使用更快更安全的瀏覽器
此為臨時(shí)鏈接,僅用于文章預(yù)覽,將在時(shí)失效
業(yè)界 正文
發(fā)私信給溫曉樺
發(fā)送

0

AIR 018|搜狗CTO楊洪濤:搜索即人工智能

導(dǎo)語(yǔ):搜索引擎=計(jì)算力+數(shù)據(jù)+應(yīng)用

AIR 018|搜狗CTO楊洪濤:搜索即人工智能

人工智能的研究理論講了這么多,那么它如何才能夠落地,形成能給人類帶來(lái)價(jià)值的產(chǎn)品或服務(wù)呢?關(guān)于人工智能應(yīng)用產(chǎn)品化,搜狗CTO楊洪濤以搜索引擎為例,介紹了如何利用AI技術(shù)做出好產(chǎn)品。

當(dāng)下企業(yè)做AI應(yīng)用化的思路或有誤

我從網(wǎng)上找到一些數(shù)據(jù),美國(guó)的數(shù)據(jù)說(shuō)全球人工智能領(lǐng)域的企業(yè)和創(chuàng)業(yè)企業(yè)達(dá)到一千家,以及40多億美元的投資規(guī)模。國(guó)內(nèi)艾瑞1月份也有個(gè)數(shù)據(jù),說(shuō)國(guó)內(nèi)有100家企業(yè)拿到了投資金額。這代表這個(gè)領(lǐng)域極受關(guān)注。但今天我想談的話題是,

這些企業(yè)容易從產(chǎn)品角度去思考他們做的很多事情,這有可能是有問(wèn)題的,這個(gè)后面去探討。我們談到的很多領(lǐng)域,比如說(shuō)機(jī)器學(xué)習(xí)、機(jī)器視覺(jué),機(jī)器人、推薦引擎、個(gè)人助手、語(yǔ)音相關(guān)的技術(shù)等等,我們從產(chǎn)品角度思考的時(shí)候,發(fā)現(xiàn)跟技術(shù)角度思考不一樣。

此外,今年圍棋大戰(zhàn)導(dǎo)致一個(gè)焦慮:機(jī)器人到底會(huì)不會(huì)戰(zhàn)勝人。我們當(dāng)然希望機(jī)器在有限的時(shí)間內(nèi)能戰(zhàn)勝人,但我們希望從技術(shù)角度思考可以發(fā)現(xiàn),很多問(wèn)題是解決不了的——比如說(shuō)我們知道深度學(xué)習(xí)現(xiàn)在不可解釋,我們很難從數(shù)學(xué)角度去推理,它是不可解釋的。也因?yàn)檫@些不可解釋,它在一些工業(yè)應(yīng)用上就會(huì)有比較大的問(wèn)題,比如,如果出了車禍的時(shí)候不能解釋,那百姓對(duì)它的信任程度就會(huì)下降。

另一方面,現(xiàn)在人工智能對(duì)語(yǔ)言能力的理解,現(xiàn)在很難做到真實(shí)地理解人的語(yǔ)言能力。此外,大數(shù)據(jù)的產(chǎn)生、訓(xùn)練都需要很大的成本和用戶入口,才能夠在訓(xùn)練當(dāng)中去使用,現(xiàn)在也是一個(gè)不算有效的領(lǐng)域。

如果從產(chǎn)品角度來(lái)看這個(gè)問(wèn)題,我覺(jué)得從這兩個(gè)角度來(lái)看:

  • 第一個(gè)是,做談?wù)摍C(jī)器能不能戰(zhàn)勝人的時(shí)候,我們想想:什么叫戰(zhàn)勝?如果說(shuō)機(jī)器跑得比人快,算得比人快,這樣的一個(gè)回答的話,其實(shí)發(fā)現(xiàn)機(jī)器早已經(jīng)戰(zhàn)勝人了,今天我們說(shuō)機(jī)器能不能戰(zhàn)勝人的時(shí)候,指的是直接瞄向了人的大腦部分,能不能替代你的大腦和思考決策。

  • 第二點(diǎn)是,產(chǎn)品能不能做出一個(gè)輔助人做決策的產(chǎn)品形態(tài)來(lái)?很重要一點(diǎn)是說(shuō)我們能不能生產(chǎn)出足夠多的數(shù)據(jù)。

搜索引擎即人工智能

首先第一個(gè)是Siri,2011年的時(shí)候蘋果發(fā)布了Siri,引起了關(guān)于語(yǔ)音識(shí)別的極大討論和熱潮;還有Echo智能家居的產(chǎn)品,在美國(guó)賣得非常好;還有AlphaGo,它雖然不是一個(gè)產(chǎn)品,但引起了普通網(wǎng)民的關(guān)注,對(duì)技術(shù)進(jìn)步貢獻(xiàn)非常大;然后是特斯拉的自動(dòng)駕駛,包括消費(fèi)者關(guān)心的一個(gè)領(lǐng)域,不斷地出現(xiàn)事故,也引起了很多探討。

但是允許我老王賣瓜一下,從搜索引擎產(chǎn)品的從業(yè)者來(lái)講,我們認(rèn)為搜索引擎其實(shí)是人工智能最大的一個(gè)場(chǎng)景。

為什么這么說(shuō)呢?第一個(gè)原因從產(chǎn)品角度看,搜索引擎在過(guò)去這么多年當(dāng)中,它起到的作用,就是人的大腦外延,它增強(qiáng)了你解決問(wèn)題的能力,我們?nèi)粘I睢⒐ぷ鳟?dāng)中很多問(wèn)題其實(shí)是通過(guò)搜索引擎去實(shí)現(xiàn)的。

我記得谷歌的創(chuàng)始人之一很早的時(shí)候說(shuō)過(guò),“我們的目標(biāo)就是要成為人類的第三塊大腦?!边@描述了搜索引擎產(chǎn)品的單位。但今天的搜索引擎是基于關(guān)健詞和搜索結(jié)果的產(chǎn)品形態(tài),用戶要自己去思考,出來(lái)這十套結(jié)果是否滿足自己的東西。

其實(shí)搜索引擎下一步要解決的問(wèn)題,或者說(shuō)人工智能技術(shù)在搜索引擎里有巨大應(yīng)用的場(chǎng)景就是說(shuō)能不能不要用這樣的一個(gè)用戶自己思考的方式,而是我能夠直接知道你想要的東西,這是大家都想要去解決的一個(gè)工作的方向。

最后一個(gè)是,對(duì)話機(jī)器人仍不可能替代搜索引擎。聊天機(jī)器人剛上線的時(shí)候只有幾十個(gè),現(xiàn)在做到一千個(gè)了,它是開(kāi)平帶的方式,大量合作伙伴給它增強(qiáng)系統(tǒng)的功能。Siri就是個(gè)例子,2011年就上線服務(wù),蘋果公司自己研發(fā)siri的對(duì)話功能和給用戶提供的服務(wù),到今年它發(fā)現(xiàn)這個(gè)功能終于不行了,沒(méi)辦法運(yùn)轉(zhuǎn)下去。因?yàn)榇罅康挠脩舭l(fā)現(xiàn)它很難解決實(shí)際問(wèn)題,用戶實(shí)際用Siri的時(shí)候是:我要給誰(shuí)打電話,我要給誰(shuí)發(fā)短信這樣簡(jiǎn)單的服務(wù)。今年開(kāi)發(fā)者希望給它提供很多功能的研發(fā),但實(shí)際上它都無(wú)法替代搜索引擎海量的用戶帶來(lái)的問(wèn)題的解答。

搜索引擎=計(jì)算力+數(shù)據(jù)+應(yīng)用

關(guān)于搜索引擎和AI的關(guān)系,我們知道,近十年來(lái)人工智能的發(fā)展,更明確的說(shuō)是深度學(xué)習(xí)的發(fā)展取決于這三個(gè)元素。今天因?yàn)榛ヂ?lián)網(wǎng)的進(jìn)展,或者網(wǎng)絡(luò)的進(jìn)展,足夠的應(yīng)用、足夠的信息和足夠的用戶能上網(wǎng),最后產(chǎn)生足夠多的數(shù)據(jù)——這些數(shù)據(jù)使得我們能研究出更好的算法,以及讓我們有了很好的計(jì)算力,有了大量低成本把計(jì)算力連接起來(lái)的方式。

這三個(gè)角度上看,誰(shuí)擁有最好的三個(gè)元素?還是看搜索引擎界的老大。谷歌雖然沒(méi)有公開(kāi)過(guò)自己的服務(wù)器數(shù)量的數(shù)據(jù),但根據(jù)它的能耗來(lái)估計(jì),以及它擁有幾百萬(wàn)臺(tái)服務(wù)器的數(shù)量,可見(jiàn)搜索引擎公司就有這樣巨大的計(jì)算力。上午張老師就提到“找貓的圖象識(shí)別”,程序能夠很容易的就把16000個(gè)CPU連接起來(lái)做這個(gè)訓(xùn)練。

再看數(shù)據(jù),搜索引擎公司有足夠大的網(wǎng)頁(yè),去作為數(shù)據(jù)的基礎(chǔ),它們還能做很多怎么去促進(jìn)數(shù)據(jù)的收集工作,谷歌為什么要去發(fā)射,用來(lái)聯(lián)網(wǎng)的切球,谷歌為什么要免費(fèi)拉光纖。大家知道谷歌的母公司它里面有兩個(gè)關(guān)于醫(yī)療的子公司,一個(gè)做的方式是用傳感器放到眼睛里的隱形眼鏡,要把一個(gè)得了病的人的數(shù)據(jù)進(jìn)行搜集,然后分析,他們有這種條件去獲得這樣的數(shù)據(jù)的能力。

未來(lái)工作方向:自然交互和知識(shí)計(jì)算

自然交互

怎么能夠讓用戶以很自然的方式跟產(chǎn)品去互動(dòng)?讓搜索引擎懂你想要的是什么東西,而不是一個(gè)用關(guān)健詞去表達(dá)的——是一個(gè)自然語(yǔ)言的句子,像人與人對(duì)話一樣,描述我有什么樣的問(wèn)題。這當(dāng)中不僅僅是語(yǔ)言和對(duì)話,還包括視覺(jué),能看到你的表情、樣貌,讀懂你的情緒。

知識(shí)計(jì)算

怎么能夠?qū)χR(shí)有足夠好的獲取計(jì)算或者推理的方式?在這個(gè)領(lǐng)域上目前我們能夠獲得的進(jìn)展是非常有限的。

在這兩個(gè)方向上,目前的搜索引擎產(chǎn)品也好,或者同類的對(duì)話系統(tǒng)、服務(wù)系統(tǒng)也好,還解決得不夠好。那么,從產(chǎn)品上怎么解決這個(gè)問(wèn)題?

解決不了的時(shí)候就攢數(shù)據(jù)

當(dāng)一個(gè)產(chǎn)品體驗(yàn)不好的時(shí)候,我們?cè)趺崔k?我們攢數(shù)據(jù)。

舉一個(gè)我們自己做產(chǎn)品做技術(shù)時(shí)候的真實(shí)的例子:

大家知道搜狗輸入法做了很長(zhǎng)時(shí)間,我們很早也意識(shí)到用戶通過(guò)語(yǔ)音與機(jī)器交互的方式非常重要,那時(shí)候我們還沒(méi)有語(yǔ)音識(shí)別的技術(shù),我們還找了一些做語(yǔ)音交互的公司去合作,但沒(méi)有找到比較好的合作方式。于是逼得我們自己去做研發(fā)。

當(dāng)時(shí)我們想了一個(gè)辦法,直接調(diào)用谷歌在國(guó)外提供的語(yǔ)音識(shí)別接口,雖然很慢,但可以用。它的自錯(cuò)率43%,意思就是說(shuō)如果你輸入一段話100個(gè)字40個(gè)字是錯(cuò)的。但因?yàn)橐粋€(gè)產(chǎn)品里面功能的入口,大量用戶就開(kāi)始用,用了之后我們開(kāi)始迭代數(shù)據(jù),積攢了足夠多的用戶錄語(yǔ)音的數(shù)據(jù)。2012年11月份的時(shí)候,不到半年的時(shí)間我們把自己的數(shù)據(jù)做出來(lái)了,一上線了就獲得了跟谷歌接近而且比它好的結(jié)果。隨著后面用戶使用越來(lái)越多,以及新技術(shù)在過(guò)程中的使用,錯(cuò)誤率直線下降,今年4%左右的錯(cuò)誤率,最近還在繼續(xù)下降。

所以當(dāng)打不過(guò)的時(shí)候,攢數(shù)據(jù)是價(jià)值提升的作用。值得一提的事,我們掌握這么多數(shù)據(jù)之后怎么辦?

這需要找一些數(shù)據(jù)標(biāo)注公司去標(biāo)注這些數(shù)據(jù),每一句話說(shuō)的是什么,后來(lái)因?yàn)榘堰@樣一個(gè)功能用到產(chǎn)品里之后,用戶沒(méi)有選擇語(yǔ)音識(shí)別的句子實(shí)際上是輔助標(biāo)注的過(guò)程。如果用戶沒(méi)有選說(shuō)明是錯(cuò)的,錯(cuò)的數(shù)據(jù)我們就拿給數(shù)據(jù)標(biāo)注公司去標(biāo)注。

面包與葡萄干:人工智能做出好產(chǎn)品才創(chuàng)造價(jià)值

使用AI技術(shù)的好產(chǎn)品才創(chuàng)造價(jià)值,這個(gè)價(jià)值有兩方面:一個(gè)是給用戶提供一個(gè)好的辦法,第二個(gè)是真正能生產(chǎn)數(shù)據(jù),從而使自己迭代。

好產(chǎn)品:叫好+賣座+賺錢

好的產(chǎn)品能得到媒體和用戶的關(guān)注,能得到資源,賣座的產(chǎn)品能獲得用戶,用戶能生產(chǎn)數(shù)據(jù),以及能不斷迭代。賺錢更不用說(shuō),一個(gè)好產(chǎn)品能賺錢才能使企業(yè)研發(fā)不斷滾動(dòng)。

不足夠好的產(chǎn)品的例子,我們做個(gè)自我批評(píng)。搜狗前兩年出了一個(gè)己的云助手產(chǎn)品,當(dāng)時(shí)覺(jué)得這樣一種對(duì)話形態(tài)可能是未來(lái)新一代的互動(dòng)方式和解決問(wèn)題的方式,于是我們做了跟Siri基礎(chǔ)一樣的產(chǎn)品架構(gòu)和問(wèn)答式的技術(shù)架構(gòu)。但是這個(gè)產(chǎn)品上線之后,我們發(fā)現(xiàn)用戶的使用率并不高,開(kāi)始幾天覺(jué)得好玩用了一段時(shí)間,后來(lái)就不用了,為什么?我覺(jué)得原因有很多,其中關(guān)鍵原因就是它沒(méi)有足夠好的解決用戶新的需求。

討論

鄭宇:兩個(gè)例子里面我覺(jué)得第二個(gè)例子可能更加有意義,因?yàn)樗阉骺臻g有限,而且字比較短,第一個(gè)發(fā)微信的例子可能不是最好的,有點(diǎn)鼓勵(lì)大家開(kāi)車發(fā)微信的意思?,F(xiàn)在給大家提個(gè)問(wèn)題:搜狗投資和布局了很多人工智能項(xiàng)目,目前有什么樣的收獲?最大的成果是什么?

楊洪濤:我的答案有點(diǎn)像剛剛KK(小米聯(lián)合創(chuàng)始人黃江吉)的答案,我覺(jué)得現(xiàn)在還沒(méi)有讓我們覺(jué)得足夠滿意的產(chǎn)品,或者叫做真正讓產(chǎn)品幫人做決策,或者幫人做出好的選擇的這樣一個(gè)功能上還沒(méi)有完全做得到。但我們的產(chǎn)品確實(shí)要去解決這樣的問(wèn)題,然后我們還要去投入。你剛才說(shuō)到投入我覺(jué)得非常好,給我一個(gè)打廣告的機(jī)會(huì),我們今年跟清華大學(xué)投入了大概1.8億人民幣建一個(gè)人工智能研究院,推動(dòng)技術(shù)的進(jìn)步,有了技術(shù)的進(jìn)步,有了產(chǎn)品應(yīng)用的進(jìn)步,我們?cè)谶@個(gè)領(lǐng)域的關(guān)注都是為了做一個(gè)好的產(chǎn)品體驗(yàn)出來(lái)。然后去積攢數(shù)據(jù),現(xiàn)在還只能做到積攢數(shù)據(jù)的地步。下一步真的是能夠去主動(dòng)地給人提供輔助,我覺(jué)得還沒(méi)有做到。

雷峰網(wǎng)原創(chuàng)文章,未經(jīng)授權(quán)禁止轉(zhuǎn)載。詳情見(jiàn)轉(zhuǎn)載須知。

分享:
相關(guān)文章
最新文章
請(qǐng)?zhí)顚?xiě)申請(qǐng)人資料
姓名
電話
郵箱
微信號(hào)
作品鏈接
個(gè)人簡(jiǎn)介
為了您的賬戶安全,請(qǐng)驗(yàn)證郵箱
您的郵箱還未驗(yàn)證,完成可獲20積分喲!
請(qǐng)驗(yàn)證您的郵箱
立即驗(yàn)證
完善賬號(hào)信息
您的賬號(hào)已經(jīng)綁定,現(xiàn)在您可以設(shè)置密碼以方便用郵箱登錄
立即設(shè)置 以后再說(shuō)