0
本文作者: 亞萌 | 2017-03-24 23:06 |
雷鋒網(wǎng)按:近日吳恩達(dá)發(fā)文將在4月底離職百度。幾乎在同一時(shí)間,百度也宣布進(jìn)一步深度整合,將包括NLP、KG、IDL、Speech、Big Data等在內(nèi)的百度核心技術(shù),組成百度AI技術(shù)平臺(tái)體系(AIG),并任命百度副總裁王海峰為AI技術(shù)平臺(tái)體系(AIG)總負(fù)責(zé)人,同時(shí)晉升為Estaff成員,轉(zhuǎn)向百度集團(tuán)總裁和首席運(yùn)營官陸奇匯報(bào)。
王海峰是自然語言處理領(lǐng)域的權(quán)威科學(xué)家,是該領(lǐng)域最具影響力的國際學(xué)術(shù)組織ACL 50多年歷史上唯一出任主席(President)的華人,同時(shí)也是截至目前最年輕的ACL Fellow,也是唯一來自中國大陸的ACL Fellow。此外,王海峰博士還是中文信息學(xué)會(huì)理事、中文信息學(xué)報(bào)編委、中國計(jì)算機(jī)學(xué)會(huì)(CCF)高級會(huì)員、國家自然科學(xué)基金委員項(xiàng)目評審會(huì)評審專家組成員。此前,雷鋒網(wǎng)也整理過王海峰博士在AAAI2017上的演講《深度 | 百度副總裁王海峰:百度在NLP領(lǐng)域都做了什么?》。
王海峰博士出席的媒體活動(dòng)不多,但在Quora上比較活躍。雷鋒網(wǎng)根據(jù)王海峰博士在Quora上的五個(gè)精華問答整理成本文。
我對技術(shù)感到著迷,并樂于沉浸在研究工作里。我始終相信,科技能夠改變世界。百度為我提供了一個(gè)理想的平臺(tái),在這里我從事的技術(shù)工作可以快速直接地讓用戶受益。這就是我一開始加入百度的原因。在百度最初的幾年時(shí)間里,我領(lǐng)導(dǎo)了NLP、語音、圖像、數(shù)據(jù)挖掘、知識圖譜、機(jī)器學(xué)習(xí)、深度學(xué)習(xí)等多個(gè)團(tuán)隊(duì)。后來,我意識到偉大的產(chǎn)品將會(huì)連接技術(shù)與廣大用戶,反過來也會(huì)更加促進(jìn)技術(shù)進(jìn)步。偉大的產(chǎn)品,不僅需要先進(jìn)的技術(shù),還需要杰出的設(shè)計(jì)、優(yōu)秀的營銷和高效管理。因此我漸漸改變了自身的角色,從一個(gè)單純的研發(fā)團(tuán)隊(duì)負(fù)責(zé)人,轉(zhuǎn)變?yōu)楣芾韺拥囊粏T。我如今領(lǐng)導(dǎo)的團(tuán)隊(duì)有3000多人,包括技術(shù)、產(chǎn)品和營銷成員,他們都很年輕、精力充沛、富有激情。我們擁有著一個(gè)共同目標(biāo):用技術(shù)和產(chǎn)品改變大眾日常生活。
當(dāng)掌管一個(gè)大型商業(yè)團(tuán)隊(duì)的時(shí)候,我需要首先制定策略和目標(biāo),然后建立一個(gè)合適的執(zhí)行團(tuán)隊(duì)。對于一個(gè)大型團(tuán)隊(duì)來說,良好的規(guī)則和文化,開始成為支撐和保證業(yè)務(wù)運(yùn)行的重要因素。與此同時(shí),對于科技領(lǐng)域的重大突破、用戶需求的演變,以及整個(gè)社會(huì)的發(fā)展趨勢,我都保持極大的關(guān)注。
機(jī)器翻譯、語義理解、問答和對話技術(shù)將會(huì)有重大突破。這些技術(shù)將會(huì)被廣泛應(yīng)用,并最終改變?nèi)伺c計(jì)算機(jī)、人與各種硬件設(shè)備、以及人與人之間的溝通方式。
這些技術(shù)的發(fā)展將得益于以下四個(gè)領(lǐng)域的發(fā)展:大數(shù)據(jù)、學(xué)習(xí)機(jī)制、知識圖譜、推理和規(guī)劃。
大數(shù)據(jù)。隨著互聯(lián)網(wǎng)的繁榮,數(shù)據(jù)量和種類都在高速增長。即便是非常傳統(tǒng)的商業(yè)領(lǐng)域,都在開始把數(shù)據(jù)放到網(wǎng)上。一切都在網(wǎng)上進(jìn)行,一切都在互聯(lián)。大數(shù)據(jù)的價(jià)值將繼續(xù)在物聯(lián)網(wǎng)領(lǐng)域增長。
學(xué)習(xí)機(jī)制。學(xué)習(xí)機(jī)制的發(fā)展將會(huì)持續(xù)進(jìn)行,這使得我們能從大數(shù)據(jù)中學(xué)習(xí)更多的東西。
知識圖譜。通過大數(shù)據(jù)和更多強(qiáng)大的學(xué)習(xí)機(jī)制,我們可以打造更大的知識圖譜,來對整個(gè)世界進(jìn)行建模。
推理和規(guī)劃。通過大型知識圖譜,我們可以在推理和規(guī)劃領(lǐng)域取得突破。推理和規(guī)劃的能力將會(huì)把更多智能注入NLP系統(tǒng)中。
從語言學(xué)上來說, 中文與英文有很大不同。中文書面文本單詞之間是沒有空間的,中文的語法關(guān)系是通過單詞的順序來表達(dá)的。這些因素增加了中文在詞匯、語法和語義層次上的模糊性,因?yàn)楝F(xiàn)代語言概念和原則更適用于英文,而非中文。
目前,主流NLP方法都是語言無關(guān)性(language-independent)的。這些統(tǒng)計(jì)學(xué)或神經(jīng)網(wǎng)絡(luò)算法,根據(jù)不同的應(yīng)用,都更進(jìn)一步優(yōu)化了特定語言 。
比如,在2015年5月,百度發(fā)布了第一個(gè)大型在線神經(jīng)機(jī)器翻譯系統(tǒng)?;A(chǔ)的NMT模型就是語言無關(guān)的,并輸出了非常好的翻譯結(jié)果。為了進(jìn)一步改善翻譯性能,我們使用特定語言特征優(yōu)化了翻譯系統(tǒng)。
在百度,我們開發(fā)出很多NLP技術(shù),包括知識圖譜、語義理解、內(nèi)容標(biāo)注、情感分析、生成、摘要、問答、機(jī)器翻譯和對話系統(tǒng)等等。這些技術(shù)已經(jīng)應(yīng)用于許多百度的產(chǎn)品里,比如搜索、新聞流(news feed)和智能助理,每天為數(shù)億用戶服務(wù)。我們將以上這些技術(shù)通通整合進(jìn)一個(gè)名為NLP Cloud的平臺(tái)中。
NLP Cloud提供20多種NLP模塊和方案,服務(wù)于百度產(chǎn)品。我們的NLP Cloud服務(wù)每天被調(diào)用1千多億次。
以搜索為例,典型的NLP模塊,比如切詞、命名實(shí)體識別、語法分析、釋義都是基本特征。這些模塊一直在持續(xù)優(yōu)化并取得突破。另一個(gè)典型的NLP技術(shù)應(yīng)用案例就是問答系統(tǒng)。一個(gè)高性能的問答系統(tǒng)需要對查詢語句進(jìn)行精準(zhǔn)的語義分析,構(gòu)建覆蓋面廣的知識圖譜,同時(shí)對網(wǎng)頁搜索結(jié)果進(jìn)行全面分析。當(dāng)用戶在搜索框輸入查詢語句時(shí),搜索引擎能夠立馬提供答案。很多用戶也使用搜索引擎來查詢相關(guān)性高的信息,幫助做決策。這種情況下,情感分析(也稱觀點(diǎn)挖掘)技術(shù)可以幫助提取多種備選觀點(diǎn),并將聚合的信息提供給用戶。
另一個(gè)案例就是新聞流,這個(gè)領(lǐng)域文章質(zhì)量是極其重要的。NLP技術(shù)可以幫助檢測各種垃圾文章,比如謠言、抄襲等等;而文本分析技術(shù)可以幫助識別高質(zhì)量文章,并生成最能夠描述該文章的標(biāo)簽。此外,從不同維度描述用戶偏好的“用戶模型”也十分依賴于NLP技術(shù)。
總而言之,在所有跟自然語言相關(guān)的產(chǎn)品里,NLP技術(shù)都是不可或缺的。
今天當(dāng)我們談及搜索引擎的時(shí)候,首先想到的就是搜索框和搜索結(jié)果。而未來的搜索引擎將會(huì)是什么樣子呢?我們并沒有確切答案。但是我們樂于擁有更強(qiáng)大的搜索引擎,讓我們在不同的場景、不同的產(chǎn)品或不同的交互界面里,能夠看見、聽見和感受到。搜索,將會(huì)無處不在。
第一點(diǎn),更深入理解用戶的意圖、更深入理解內(nèi)容,并將兩者更精準(zhǔn)地進(jìn)行匹配,這將會(huì)使搜索引擎更為強(qiáng)大。用戶的意圖理解并不是依賴于單一查詢語句,也還依賴于更廣泛的搜索語境,包括查詢session、時(shí)間、地點(diǎn)、設(shè)備以及用戶性格特征。另一方面,內(nèi)容理解涉及的范圍也非常廣,需要更好地理解每一部分內(nèi)容的語義、語境、觀點(diǎn),以及從內(nèi)容中提取的知識。意圖與內(nèi)容的匹配,將會(huì)涉及到以上提到的所有因素,使得在任何一個(gè)特定語境下,為每一個(gè)查詢提供最好的結(jié)果。此外,搜索引擎將會(huì)變得更像一個(gè)“回答引擎”和“執(zhí)行引擎”。大部分用戶的查詢,將會(huì)得到直接的回答或執(zhí)行。
第二點(diǎn),搜索交互界面將會(huì)發(fā)生很多新變化。除了鍵盤以外,其它輸入方式,比如聲音和圖像,將會(huì)越來越廣泛地使用。伴隨更實(shí)際的語音和圖像等技術(shù),用戶會(huì)十分青睞高效和便利的多模式搜索。特別地,自然語言交互將會(huì)成為搜索引擎的主流交互方式。用戶可以跟搜索引擎“對話”,告訴它自己想要什么,這絕對比現(xiàn)有的鍵盤輸入文字查詢要方便和自然的多。用戶也可以跟搜索引擎進(jìn)行多輪對話交互。百度搜索已經(jīng)率先應(yīng)用了這類新型交互方式,提升用戶體驗(yàn)。
第三點(diǎn),搜索將會(huì)超越現(xiàn)有的搜索引擎的范圍。搜索會(huì)嵌入各種產(chǎn)品當(dāng)中。比如,搜索會(huì)是AI硬件產(chǎn)品的基本特征之一。未來,搜索將會(huì)包圍在我們身邊,無處無在。相應(yīng)地, 我們也將重新定義什么是可以被搜索的。除了現(xiàn)有的被索引的內(nèi)容,在未來,服務(wù)、物品、設(shè)備和數(shù)據(jù)都可以被索引,變得可搜索。
很長時(shí)間以來,搜索引擎在人們?nèi)粘I钪邪缪葜陵P(guān)重要的角色。人們的需求決定了搜索引擎演變的方向,而技術(shù)進(jìn)步則決定了這種演變將走向多遠(yuǎn)。
雷峰網(wǎng)版權(quán)文章,未經(jīng)授權(quán)禁止轉(zhuǎn)載。詳情見轉(zhuǎn)載須知。