丁香五月天婷婷久久婷婷色综合91|国产传媒自偷自拍|久久影院亚洲精品|国产欧美VA天堂国产美女自慰视屏|免费黄色av网站|婷婷丁香五月激情四射|日韩AV一区二区中文字幕在线观看|亚洲欧美日本性爱|日日噜噜噜夜夜噜噜噜|中文Av日韩一区二区

您正在使用IE低版瀏覽器,為了您的雷峰網(wǎng)賬號(hào)安全和更好的產(chǎn)品體驗(yàn),強(qiáng)烈建議使用更快更安全的瀏覽器
此為臨時(shí)鏈接,僅用于文章預(yù)覽,將在時(shí)失效
專欄 正文
發(fā)私信給陳村
發(fā)送

10

OK,Google Now 背后的科技有多黑?

本文作者: 陳村 2015-09-02 15:30
導(dǎo)語:傳出集體辭職的Google Now,到底是什么呢?

【編者注】本文作者@陳村,劍橋大學(xué)自然語言處理(NLP)組碩士?,F(xiàn)從事機(jī)器學(xué)習(xí)語義分析工程師。

OK,Google Now 背后的科技有多黑?

不久前,Google 宣布進(jìn)行架構(gòu)重組,原安卓業(yè)務(wù)主管、Google 高級(jí)副總裁桑達(dá)爾·皮查伊成為了 Google 新任的CEO。這個(gè)變動(dòng)似乎引起了一些 Google  Now 開發(fā)團(tuán)隊(duì)的不滿,引發(fā)全員離職(亦說骨干成員離職),Google Now并入大 Search 組。Google Now 是安卓平臺(tái)用以對(duì)抗蘋果Siri、微軟Cortana的語音助手。那么,Google Now是什么?它包含了哪些 Google 的黑科技?

Google Now 是什么

雖然本文談的廣義 Google Now 是集成了語音搜索的一整套 App,但更精確地定義狹義的 Google Now,就是手機(jī)上 Google Now 應(yīng)用打開之后,出現(xiàn)在首屏的那些智能推薦卡片,在合適的時(shí)間推送給你合適的信息,比如天氣、新聞。相對(duì)于人們?cè)贕oogle搜索輸入框主動(dòng)輸入自己想找的東西,Google Now會(huì)“智能”地把你所需要的信息推送到你面前。

所以,大家經(jīng)常把 Google Now 稱之為 Google 的智能推送技術(shù)。

比如筆者在國外的時(shí)候,能享受到 Google Now 的便利。比如通過Booking.com(類似攜程)定了酒店,或者 kayak.com(類似去哪兒)定了機(jī)票,確認(rèn)郵件都會(huì)發(fā)到筆者的Gmail郵箱。Google會(huì)很“智能”地分析(偷窺)這些行程郵件,并在航班即將起飛前幾小時(shí)提醒你航班的具體信息及航站樓甚至登機(jī)口信息。在你到達(dá)新的城市的時(shí)候,自動(dòng)彈出你即將下榻酒店的導(dǎo)航路線以及聯(lián)系電話等信息。出國旅行的時(shí)候,Google Now會(huì)自動(dòng)彈出當(dāng)?shù)氐呢泿艆R率,以及祖國的時(shí)間。它也會(huì)細(xì)心地記住你家和公司的位置,在下班時(shí)間準(zhǔn)時(shí)提醒你回家的交通狀況,雖然還并不能那么智能地了解到你今晚又要加班! 

這里再說說Google Now 的誕生

Google Now,也是傳說中的 Google 20% Project 的產(chǎn)物。Google工程師 Baris Gultekin 在2010年的時(shí)候,因?yàn)閭€(gè)人興趣想利用手機(jī)上豐富的傳感器來做一些有趣的事情,這個(gè)想法跟時(shí)任Google Map負(fù)責(zé)人的 Andrew Kirmse 不謀而合。兩人在業(yè)余時(shí)間里面搭建了一個(gè)原型,并展示給當(dāng)時(shí)還在 Google 的梅姐 Marissa Mayer。

OK,Google Now 背后的科技有多黑?

在梅姐的支持下,隊(duì)伍漸漸壯大,并且也加入了用戶通勤的時(shí)間預(yù)測(cè)和對(duì) Google Calendar 事件的整合。碰巧的是,在2012年初,Larry Page正好要求 Android 和 Search 團(tuán)隊(duì)搭建一個(gè)類似的東西。于是在Android 老大 Andy Rubin 的支持下,兩人加入了 Android 團(tuán)隊(duì),得到了大量的設(shè)計(jì)方面的資源,并且在2012年 Google IO上第一次發(fā)布Google Now。

發(fā)展了這么多年,現(xiàn)在 Google Now 已經(jīng)被整合進(jìn) Google 搜索的 App 中。

最近某國外科技網(wǎng)站也傳出了Google Now團(tuán)隊(duì)解散的謠言,說是成員全數(shù)離職,還聯(lián)系到最近Google架構(gòu)變動(dòng),頗有陰謀論的意思。部分骨干成員離職確有其事,但這早在幾個(gè)月前就發(fā)生了,非常正常的人事變動(dòng)。

Google Now本身作為一個(gè)出色的產(chǎn)品,從Android組移入Search組,從技術(shù)角度來講,能得到大Search組更多的技術(shù)資源,對(duì)早日完成智能Google這一偉大目標(biāo)是大有好處的,這明顯是個(gè)好消息!

別看這個(gè)App界面簡單,就一個(gè)搜索框和一排卡片,里面的技術(shù)可不簡單。

介紹完狹義的Google Now推薦卡片,我們一起來看看Google Now這個(gè)小app里面,蘊(yùn)含了很多Google的黑科技:智能推薦(Google Now card),熱詞喚醒(OK Google),語音識(shí)別和語義分析。

首先說下智能推薦

推薦的原則是“Just right information at right time”,即合適的時(shí)間推薦合適的信息。那么如何知道哪些信息是用戶真正想要的,而不是機(jī)器自作主張,這個(gè)度需要拿捏。雖然現(xiàn)在統(tǒng)計(jì)機(jī)器學(xué)習(xí)方面這幾年已經(jīng)大規(guī)模地應(yīng)用在工業(yè)界,但是巧婦難為無米之炊,在無法得知用戶生活方方面面信息的前提之下,算機(jī)器學(xué)習(xí)算法再高級(jí),也無法做出太智能的推薦,所以一般公司都會(huì)采用規(guī)則+機(jī)器學(xué)習(xí)相結(jié)合的策略。

從現(xiàn)有產(chǎn)品看來,Google Now推薦的東西也相當(dāng)保守。

Google 能夠通過你在某個(gè)地點(diǎn)待的頻率,猜測(cè)你家和工作單位的位置,并且在每天指定時(shí)間自動(dòng)提醒你回家的交通情況。 

前面也提到過,行程郵件卡片、酒店預(yù)訂卡片、出國旅游的匯率和祖國時(shí)間卡片等等。難點(diǎn)不在有多高深的推薦算法,而在于Google能盡量收集用戶的生活信息的點(diǎn)點(diǎn)滴滴,并且通過深思熟慮的規(guī)則,盡量不打擾地推薦給你。在國外,由于郵件普及率高,Google 坐擁 Gmail(順便說一下,Gmail 當(dāng)年出生跟 Google Now很像,也是誕生于傳說中的20% project),做出 Google now,Google占了天時(shí)地利人和。

熱詞喚醒

在 Google Now 軟件主界面,對(duì)著手機(jī)喊一聲“OK Google”,則自動(dòng)觸發(fā)語音識(shí)別接受用戶語音查詢。

OK,Google Now 背后的科技有多黑?

熱詞喚醒作為啟動(dòng)語音識(shí)別的鑰匙,目的是以盡可能低的功耗來接受用戶的喚醒。

因?yàn)樾枰掷m(xù)開著麥克風(fēng),對(duì)輸入的音頻進(jìn)行運(yùn)算,使得CPU一直無法得到休眠,會(huì)嚴(yán)重影響已經(jīng)很緊張的手機(jī)電池續(xù)航。

所以手機(jī)上熱詞喚醒要維持高水準(zhǔn),需要考慮的重點(diǎn),除了準(zhǔn)確率(用戶叫你的時(shí)候能馬上響應(yīng),用戶不在叫你的時(shí)候不要聽錯(cuò)),還有能耗。熱詞喚醒不需要像通用語音識(shí)別一樣識(shí)別千變?nèi)f化的自然語言,它只要識(shí)別“OK Google”這個(gè)固定的詞,所以在算法方面也不必要采用復(fù)雜的傳統(tǒng)語音識(shí)別,拋棄高大上的各種 HMM、語言模型,用簡單直接的分類的方法在用戶輸入語音流中尋找“OK Google”這幾個(gè)字,簡單但好用。

當(dāng)然,這也有個(gè)例外,幾年前 Moto X剛出來,就是主打24小時(shí)全程語音喚醒待命,人家可是有2顆低功耗芯片,專門等待著用戶隨時(shí)輸入語音命令。

語音識(shí)別就不用說了,Google的強(qiáng)項(xiàng)

幾年前微軟研究院的一篇基于深度學(xué)習(xí)應(yīng)用于語音識(shí)別的論文,定義的算法準(zhǔn)確率超越了傳統(tǒng)的基于 HMM-GMM 的語音識(shí)別。但 Google 領(lǐng)先將其工業(yè)化,并應(yīng)用到當(dāng)年的語音搜索產(chǎn)品中。DNN 直接在最原始的音頻數(shù)據(jù)上進(jìn)行語音識(shí)別,并且需要大量的訓(xùn)練數(shù)據(jù),來訓(xùn)練大量的神經(jīng)網(wǎng)絡(luò)參數(shù),因此對(duì)硬件要求也很高,這正好是 Google 的強(qiáng)項(xiàng)。

經(jīng)過幾年的積累,Google 的語音識(shí)別已經(jīng)初具規(guī)模。值得注意的是,作為 Google Now 的競(jìng)爭(zhēng)對(duì)手的Siri,Siri 的語音識(shí)別一直用的是 nuance 家的技術(shù)(nuance是世界最大的語音識(shí)別提供商,可以理解為訊飛在中國的地位),雖然前段時(shí)間也傳出過蘋果在組建自己的語音識(shí)別團(tuán)隊(duì)的消息。 

語義識(shí)別

通過 Google Now 上面的應(yīng)用搜索框,你可以問一些看起來非常炫酷的問題。

一些日常生活類信息查詢,比如紐約到舊金山的航班,比如未來3天北京的天氣,現(xiàn)在東京時(shí)間幾點(diǎn)。這種問答系統(tǒng)涉及到自然語言處理的方方面面,難度極大。

雖然在學(xué)術(shù)上,NLP(自然語言處理)在各種領(lǐng)域,比如語法分析、實(shí)體識(shí)別,經(jīng)過幾十年的努力,都取得了90%以上的準(zhǔn)確率。但在實(shí)際產(chǎn)品情境下,用戶口語化表述更加多樣,會(huì)產(chǎn)生歧義,和學(xué)術(shù)界經(jīng)常用于評(píng)測(cè)系統(tǒng)的語言測(cè)試集差別很大。

并且,問答系統(tǒng)是多個(gè)子NLP系統(tǒng)串聯(lián)成流水線的產(chǎn)物,比如詞性分析的輸出可能作為語法分析的輸入,語法分析的輸出可能作為實(shí)體識(shí)別的輸入。在這么一個(gè)流水線系統(tǒng)中,早期的錯(cuò)誤會(huì)被傳播到流水線之后的步驟,并被放大。

OK,Google Now 背后的科技有多黑?

因此單個(gè)子系統(tǒng)上很小的錯(cuò)誤,在最終都會(huì)被放大,嚴(yán)重影響最終對(duì)用戶查詢的理解。

一般的問答系統(tǒng),都會(huì)針對(duì)當(dāng)前領(lǐng)域進(jìn)行專門優(yōu)化,研究用戶問得最多的是哪些問題,并盡量倚重規(guī)則(甚至正則表達(dá)式),并加強(qiáng)用戶引導(dǎo),減少用戶自然語言的歧義。

Google Now 語音搜索還支持一些百科類問題,比如現(xiàn)在的美國總統(tǒng)是誰,喜馬拉雅山的高度是多少,或者中國的人口是多少。

Google 畢竟是搜索出身,坐擁整個(gè)互聯(lián)網(wǎng)的信息,千千萬萬的網(wǎng)頁中已經(jīng)包含了“奧巴馬是美國總統(tǒng)”,“中國的人口是13億”這樣的陳述,對(duì)于 Google 來說,問題會(huì)簡化成如何匹配用戶的問題到千千萬萬網(wǎng)頁中的某一句話,而不僅僅是給出 Top 幾十的匹配網(wǎng)頁,這在屏幕小的手機(jī)上、甚至手表上對(duì)用戶體驗(yàn)的影響至關(guān)重要。

學(xué)術(shù)界的一般做法,是首先識(shí)別用戶是問哪個(gè)類型的問題(What? When? Which? Where? etc.),然后利用信息檢索的策略先在千萬網(wǎng)頁中篩選出一些和用戶問題最相關(guān)的候選網(wǎng)頁,之后根據(jù)問題類型,去這些候選網(wǎng)頁中摘出最能直接回答用戶提問的語句。贏了Jeopardy!(可以理解為老美的開心辭典這樣的知識(shí)問答類節(jié)目)人類冠軍的 IBM Watson 系統(tǒng),也采用了類似的設(shè)計(jì)思路。這樣的方法可以確保以自動(dòng)化而非人力的方法提高問題的覆蓋率,而不用像某果需要招聘很多問題編輯來應(yīng)對(duì)越來越多熱心群眾對(duì)Siri的無情調(diào)戲。

Google 近幾年來,在語義分析、知識(shí)圖譜方面都投入了大力氣,大家也漸漸能在Google Now以及普通搜索中看到對(duì)這類技術(shù)的整合。

所以,Google Now 并入大 Search 組,得到更多的技術(shù)支持,絕對(duì)是一件大大的好事呢!




如果你是一名創(chuàng)客,可以填寫以下表格,配合雷鋒網(wǎng)進(jìn)行一次小小的從業(yè)方向調(diào)查;

如果你是一名資深創(chuàng)客,可以掃描表格下方二維碼參與一個(gè)通關(guān)小游戲,雷哥為大家準(zhǔn)備了華為P8、開發(fā)板等禮物。

少年,夠膽就來一戰(zhàn)吧!

 

雷峰網(wǎng)原創(chuàng)文章,未經(jīng)授權(quán)禁止轉(zhuǎn)載。詳情見轉(zhuǎn)載須知。

OK,Google Now 背后的科技有多黑?

分享:
相關(guān)文章

專欄作者

語義分析,創(chuàng)業(yè),畢業(yè)于劍橋大學(xué)自然語言組
當(dāng)月熱門文章
最新文章
請(qǐng)?zhí)顚懮暾?qǐng)人資料
姓名
電話
郵箱
微信號(hào)
作品鏈接
個(gè)人簡介
為了您的賬戶安全,請(qǐng)驗(yàn)證郵箱
您的郵箱還未驗(yàn)證,完成可獲20積分喲!
請(qǐng)驗(yàn)證您的郵箱
立即驗(yàn)證
完善賬號(hào)信息
您的賬號(hào)已經(jīng)綁定,現(xiàn)在您可以設(shè)置密碼以方便用郵箱登錄
立即設(shè)置 以后再說