丁香五月天婷婷久久婷婷色综合91|国产传媒自偷自拍|久久影院亚洲精品|国产欧美VA天堂国产美女自慰视屏|免费黄色av网站|婷婷丁香五月激情四射|日韩AV一区二区中文字幕在线观看|亚洲欧美日本性爱|日日噜噜噜夜夜噜噜噜|中文Av日韩一区二区

您正在使用IE低版瀏覽器,為了您的雷峰網(wǎng)賬號安全和更好的產(chǎn)品體驗(yàn),強(qiáng)烈建議使用更快更安全的瀏覽器
此為臨時(shí)鏈接,僅用于文章預(yù)覽,將在時(shí)失效
人工智能 正文
發(fā)私信給奕欣
發(fā)送

0

阿里巴巴司羅暢談自然語言智能技術(shù),兩平臺四應(yīng)用助力商業(yè)落地

本文作者: 奕欣 2018-06-25 15:38
導(dǎo)語:在感知智能、認(rèn)知智能和創(chuàng)造智能之下,我們一定要解決「更好地理解知識,更好地分析語義」的工作,這就是自然語言處理所肩負(fù)的重要技術(shù)使命。

在 5 月召開的第二屆世界智能大會上,由新一代人工智能產(chǎn)業(yè)技術(shù)創(chuàng)新戰(zhàn)略聯(lián)盟承辦的新一代人工智能核心技術(shù)論壇在天津舉行。

新一代人工智能產(chǎn)業(yè)技術(shù)創(chuàng)新戰(zhàn)略聯(lián)盟由科技部指導(dǎo)成立,潘云鶴院士擔(dān)任聯(lián)盟名譽(yù)理事長和專家委員會主任,高文院士擔(dān)任聯(lián)盟理事長,北京大學(xué)黃鐵軍教授擔(dān)任聯(lián)盟秘書長,AVS 產(chǎn)業(yè)聯(lián)盟秘書長張偉民和科大訊飛副總裁兼訊飛 AI 研究院聯(lián)席院長李世鵬任聯(lián)合秘書長。旨在推動(dòng)新一代人工智能技術(shù)在各行業(yè)的研發(fā)應(yīng)用。阿里巴巴達(dá)摩院機(jī)器智能自然語言首席科學(xué)家司羅博士在會上做了演講,本次報(bào)告主要專注于 NLP 領(lǐng)域的相關(guān)技術(shù)。

阿里巴巴司羅暢談自然語言智能技術(shù),兩平臺四應(yīng)用助力商業(yè)落地

目前阿里巴巴在自然語言智能方面主要研究方向包括自然語言智能基礎(chǔ)技術(shù)、機(jī)器翻譯、文本挖掘、語義計(jì)算、文本搜索和推薦等,司羅表示電子商務(wù)是阿里巴巴發(fā)展的主動(dòng)脈,其他客戶對產(chǎn)品的評價(jià)是刺激用戶消費(fèi)的最好手段,通過阿里巴巴自然語言智能,用戶可以最快的找到自己想要的商品,以及對該商品最符合預(yù)期的評價(jià)。做好自然語言智能的開發(fā),是電子商務(wù)行業(yè)的核心競爭力。

司羅在卡內(nèi)基梅隆大學(xué)獲得博士學(xué)位,美國普渡大學(xué)計(jì)算機(jī)系終身教授。專注于自然語言處理、機(jī)器學(xué)習(xí)、深度學(xué)習(xí)等人工智能基礎(chǔ)技術(shù)的研究。

阿里巴巴達(dá)摩院機(jī)器智能技術(shù)實(shí)驗(yàn)室在自然語言處理領(lǐng)域也有著突出表現(xiàn)。在雷鋒網(wǎng)學(xué)術(shù)頻道 AI 科技評論旗下數(shù)據(jù)庫項(xiàng)目「AI影響因子」中,阿里巴巴達(dá)摩院機(jī)器智能技術(shù)實(shí)驗(yàn)室憑借刷新 SQuAD 紀(jì)錄獲得加分。

達(dá)摩院機(jī)器智能技術(shù)實(shí)驗(yàn)室

以下為司羅的演講全文,雷鋒網(wǎng) AI 科技評論做了不改動(dòng)原意的編輯,略有刪改。

今天非常榮幸有這個(gè)機(jī)會和大家交流一下我們所做的工作,希望借今天這個(gè)機(jī)會向大家介紹一下阿里巴巴在自然語言智能方面的工作,得到大家的建議和指正。

首先,什么是自然語言智能?自然語言智能是研究實(shí)現(xiàn)人與計(jì)算機(jī)之間用語言進(jìn)行的有效通信手段,是綜合了語言學(xué)、心理學(xué)、計(jì)算機(jī)科學(xué)、數(shù)學(xué)和統(tǒng)計(jì)學(xué)于一體的綜合性學(xué)科。它涉及到自然語言和形式化語言的抽取、分析、理解、產(chǎn)生和轉(zhuǎn)化。自然語言技術(shù)從計(jì)算機(jī)誕生的 20 世紀(jì) 40 至 50 年代開始就被科學(xué)家所涉獵。計(jì)算機(jī)處理跟人相關(guān)文本的信息,最開始的技術(shù)是用簡單的規(guī)則來實(shí)現(xiàn);而隨著時(shí)代不斷的進(jìn)展,自然語言智能也取得了突飛猛進(jìn)的發(fā)展。

智能的四個(gè)層次

從我個(gè)人的角度和一些同行的角度,我把智能分為四個(gè)層面,計(jì)算智能、感知智能、認(rèn)知智能和創(chuàng)造智能。

計(jì)算智能指的是計(jì)算機(jī)可以利用大量的計(jì)算的能力,遠(yuǎn)遠(yuǎn)超過人類的計(jì)算能力來幫我們做很多計(jì)算上復(fù)雜度很高的事情,比如說這兩年非常流行的 AlphaGo,它做的工作實(shí)際上是用計(jì)算機(jī)超強(qiáng)的計(jì)算能力在圍棋領(lǐng)域優(yōu)化空間中做有效的搜索,來產(chǎn)生出超越人類圍棋競技能力的智能。但是,我認(rèn)為它本身還是屬于計(jì)算智能層面,是屬于比較基本的智能。

下一個(gè)層面是感知智能。計(jì)算機(jī)能夠在復(fù)雜的世界當(dāng)中抽象出具體的實(shí)體。比如說,在自然語言理解方面,我們能不能把文本當(dāng)中的人名、地名、時(shí)間、地點(diǎn)等重要信息抽???又比如說在視覺里面,我們能不能鑒別出有沒有人臉、室內(nèi)、室外等等場景?這是感知智能的范疇。

進(jìn)一步,是認(rèn)知智能的層面。我們不僅能夠抽象出實(shí)體,而且能發(fā)現(xiàn)它們之間的關(guān)系,從而在實(shí)體和關(guān)系之間進(jìn)行推理,從而找出更多有價(jià)值的信息。比如在自然語言處理上,我們可不可以把很多信息報(bào)道所提到的人物和事件串聯(lián)起來,能夠抽象出事件的發(fā)生、發(fā)展、高潮的過程?又比如在視覺的自動(dòng)監(jiān)控,我們能不能把不同場景中相同的人的軌跡抽取出來?這些屬于更深層的認(rèn)知層面。

建立在復(fù)雜的認(rèn)知能力上,我們希望能夠?qū)崿F(xiàn)創(chuàng)造智能,比如由計(jì)算機(jī)自動(dòng)產(chǎn)生邏輯自恰的長篇小說,甚至有一天自然語言智能能自動(dòng)產(chǎn)生出我今天演講的內(nèi)容,這屬于更高層面的創(chuàng)造智能的范疇。

自然語言智能的技術(shù)使命

在感知智能、認(rèn)知智能和創(chuàng)造智能之下,我們一定要解決「更好地理解知識,更好地分析語義」的工作,這就是自然語言處理所肩負(fù)的重要技術(shù)使命,阿里巴巴是一家技術(shù)公司,有遠(yuǎn)大的技術(shù)抱負(fù)和期望,阿里巴巴很早就認(rèn)識到自然語言智能的重要性,在自然語言智能研發(fā)方面有很大的投入,我們的使命是:

第一,構(gòu)建阿里巴巴的自然語言技術(shù)體系,支撐整個(gè)阿里經(jīng)濟(jì)體,關(guān)于自然語言的需求和應(yīng)用,我們的目標(biāo)是讓商業(yè)沒有語言障礙。

第二,我們的技術(shù)是開放的,不是封閉的,所以我們希望能夠發(fā)展普惠的自然語言技術(shù),能夠賦能阿里巴巴的合作者。

第三,我們的目標(biāo)是仰望星空,希望能夠做開拓性的技術(shù)的工作,我們非常希望能夠和業(yè)界的同事、學(xué)術(shù)界的朋友一起創(chuàng)新自然語言技術(shù),探索未來智能。

我們阿里巴巴組成的自然語言智能團(tuán)隊(duì),是一個(gè)國際化的團(tuán)隊(duì),我們有近百名研究者分布在中國、美國、新加坡、俄羅斯等地,30% 以上有博士學(xué)歷,包括清華、北大、Berkeley、CMU、Princeton 等等。多位國際著名院校的終身教授,研究院研究員,所從事的工作也是非常豐富多樣,從基礎(chǔ)的自然語言技術(shù),到機(jī)器翻譯、文本挖掘語義計(jì)算、文本搜索和推薦等。所以我們有遠(yuǎn)大的目標(biāo),仰望星空,同時(shí)我們也希望腳踏實(shí)地。

AliNLP 技術(shù)平臺

我們這個(gè)團(tuán)隊(duì)最近一年多所做的幾件事情,主要是圍繞搭建和創(chuàng)建阿里巴巴自然語言技術(shù)平臺、技術(shù)體系,創(chuàng)建了阿里巴巴的 NLP 技術(shù)平臺,自然語言處理平臺,叫 AliNLP。它是服務(wù)于整個(gè)阿里巴巴生態(tài)系統(tǒng)的大規(guī)模自然語言技術(shù)平臺,包含了從數(shù)據(jù)抽取、數(shù)據(jù)處理到語義、語法、篇章、分析、文本表示等多項(xiàng)技術(shù)。

我們從 2016 年底開始研發(fā)技術(shù)平臺,中間經(jīng)歷了多次版本優(yōu)化和迭代,到今天它已經(jīng)在阿里巴巴內(nèi)部發(fā)生了巨大的作用,每天有超過 240 個(gè)活躍的業(yè)務(wù)方使用這個(gè)平臺,每天的活躍的調(diào)動(dòng)量超過 3000 億次,產(chǎn)生很大的價(jià)值和影響力。

這個(gè)平臺不僅有非常大的規(guī)模應(yīng)用,同時(shí)有很鮮明的技術(shù)特點(diǎn)。

首先從事自然語言研究的同行們一定知道,傳統(tǒng)的自然語言技術(shù)都是需要大量的人工標(biāo)定的語料數(shù)據(jù),基于此之上再開發(fā)相應(yīng)的自然語言算法。但是在阿里巴巴極其復(fù)雜和多變的場景下,這往往是不現(xiàn)實(shí)的。比如我們每天都有新的商家、商品、品牌這些實(shí)體不斷的浮現(xiàn)出來,不可能經(jīng)常用人工的成本來進(jìn)行數(shù)據(jù)標(biāo)定,所以我們采用的解決方案是借用用戶的行為數(shù)據(jù)來代替?zhèn)鹘y(tǒng)的人工標(biāo)定數(shù)據(jù),設(shè)定我們的自然語言算法,當(dāng)然,這是在保護(hù)用戶隱私前提之下的。

第二,阿里巴巴這么復(fù)雜的生態(tài)系統(tǒng),涉及到成百上千上萬的各種復(fù)雜的任務(wù),我們把這個(gè)看作既是挑戰(zhàn)又是機(jī)遇,我們希望能夠同時(shí)對多個(gè)相關(guān)的任務(wù)進(jìn)行建模,同時(shí)提高每一個(gè)單獨(dú)任務(wù)的本身的效果和效應(yīng)。

AliNLP 平臺的整體框架,包括從底層的數(shù)據(jù)到 NLP 基礎(chǔ)的算法,到 NLP 垂直的技術(shù),如問答、文本理解,反垃圾情感分析等等,支撐了阿里內(nèi)部所有重要的新零售、電商、廣告、金融、客服等等領(lǐng)域的工作。

阿里巴巴機(jī)器翻譯平臺

第二個(gè)平臺是阿里巴巴機(jī)器翻譯平臺,坦誠地講,我認(rèn)為阿里巴巴機(jī)器翻譯平臺是世界上最有價(jià)值的機(jī)器翻譯平臺。為什么這么說呢?我們很多互聯(lián)網(wǎng)平臺同事們都做了非常優(yōu)秀的技術(shù)工作,但是阿里巴巴的技術(shù)平臺是整個(gè)阿里國際化戰(zhàn)略的技術(shù)生命線,會直接在國際化電商的場景產(chǎn)生巨大的價(jià)值和影響力,它本身產(chǎn)生的價(jià)值非常巨大,在這個(gè)平臺上有非常非常多的問題需要我們?nèi)ソ鉀Q。

去年一年,我們?nèi)嬷С至税⒗锇桶偷乃儋u通,B2B,阿里巴巴.com,LAZADA 是東南亞的平臺,關(guān)于機(jī)器翻譯的需求非常大,全年有幾千億次的調(diào)用量,這些調(diào)用量不僅產(chǎn)生了很大的價(jià)值,同時(shí)對我們的數(shù)據(jù)和算法進(jìn)行優(yōu)化,極大地提升了用戶的體驗(yàn),也對整體的電商技術(shù)平臺的升級起到了很大的作用。

語料是機(jī)器翻譯非常重要的環(huán)節(jié),在這個(gè)環(huán)節(jié)上我們做了大量工作,包括用技術(shù)的手段減少語料的需求量,包括用眾包的方式尋找語料等等,有效地達(dá)到高效取得語料的效果。

接下來是機(jī)器學(xué)習(xí)訓(xùn)練的框架到核心的機(jī)器翻譯模型。這既包括了現(xiàn)在流行的 NMT 神經(jīng)翻譯、機(jī)器翻譯模型,也包括了 SMT 等比較傳統(tǒng)的統(tǒng)計(jì)機(jī)器翻譯模型。我們所做的創(chuàng)新工作是把這些模型結(jié)合起來能夠產(chǎn)生更有效的效果。

一個(gè)比較具體的例子是阿里巴巴比較獨(dú)特的場景,即 B2B 買賣加溝通的場景。我們很多供貨方是中方的供貨方,母語是中文,我們要做到全球買全球賣,而世界上的需求往往是說英語或者其他語言的需求方來完成交易、購買交易的,兩者之間是需要大量的交流工作來確定交易中支付、物流、賠款等等重要的環(huán)節(jié),所以提供實(shí)時(shí)溝通翻譯支持買賣家實(shí)時(shí)溝通是至關(guān)重要的。

今年在美國的 CES 消費(fèi)展上,我們第一次展示了買賣家實(shí)時(shí)溝通的系統(tǒng),現(xiàn)在也已經(jīng)在阿里巴巴的平臺上大規(guī)模應(yīng)用,我們相信這是非常有價(jià)值的手段,能幫助我們更好地突破商業(yè)的語言障礙。

以上是兩個(gè)阿里巴巴內(nèi)部關(guān)于自然語言智能的主要平臺技術(shù),接下來我花一點(diǎn)點(diǎn)時(shí)間向大家介紹一下我們所做的具體的技術(shù)工作。希望能夠傳遞出我們所設(shè)想的一些場景,或者設(shè)計(jì)算法的一些初衷。

應(yīng)用一:利用用戶搜索意志改進(jìn)商品標(biāo)題壓縮

首先一個(gè)具體的問題是,如何利用用戶搜索意志改進(jìn)商品標(biāo)題壓縮。我們都知道,現(xiàn)在電商場景下,大家越來越多地用 APP 來購買而不是用 PC 來購買,所以這就存在一個(gè)問題,即如何把商家原來輸入的非常冗長的標(biāo)題進(jìn)行壓縮,從而能夠在移動(dòng)端屏幕上展現(xiàn)出來的問題。如何進(jìn)行有效的標(biāo)題改寫和壓縮,這是一個(gè)很重要的、有很大價(jià)值的技術(shù)手段。

傳統(tǒng)的方法有基于規(guī)則的方法和基于序列學(xué)習(xí)的方法,但是它們都有一個(gè)非常大的缺點(diǎn),就是他們并沒有考慮生成的短標(biāo)題對于轉(zhuǎn)化率的影響。由于用戶體驗(yàn)和轉(zhuǎn)化率對于一個(gè)電商平臺是至關(guān)重要的指標(biāo),所以我們必須能夠想出新的辦法,能夠把這兩者加入到商品標(biāo)題改寫的這項(xiàng)任務(wù)中。

所以我們所做的工作在于,通過多任務(wù)學(xué)習(xí)的方式在序列學(xué)習(xí)的過程中加入對轉(zhuǎn)化率的影響。

一方面,我們用傳統(tǒng)的序列學(xué)習(xí)的方式來學(xué)習(xí)人工產(chǎn)生的短標(biāo)題;

第二方面,我們用最終引導(dǎo)成交的用戶搜索進(jìn)行過渡。

如果用戶有一個(gè)查詢,這個(gè)查詢產(chǎn)生了點(diǎn)擊或者購買的行為,我們可以想象到用戶比較短的查詢和商品的長標(biāo)題實(shí)際上形成了很好的商品標(biāo)題的壓縮,也標(biāo)志著這個(gè)用戶的查詢可以看作是商品標(biāo)題比較好的改寫。

所以基于這樣的想法,我們設(shè)計(jì)了多任務(wù)學(xué)習(xí)的方式。第一用比較傳統(tǒng)的標(biāo)題改寫的方式,序列改寫的方式來實(shí)現(xiàn)標(biāo)題改寫。同時(shí)我們也加入了用戶查詢、用戶生成的模型,這個(gè)模型就是把用戶本身的轉(zhuǎn)化率、用戶的投票加入到我們模型的考慮情況之中。

最終將這兩個(gè)任務(wù)一起進(jìn)行訓(xùn)練,就能更好地實(shí)現(xiàn)商品短標(biāo)題重新的改寫。這一工作發(fā)表在 AAAI 2018 上。

我們也做了大量的研究和線上線下的檢測,無論在線下的關(guān)于可讀性、準(zhǔn)確和信息完整性的檢測,還是在線上能夠提高點(diǎn)擊率,提高轉(zhuǎn)化率,也就是直接提升商業(yè)價(jià)值方面都有很大的提升。這是我們商品短標(biāo)題方面的工作,我們可以看到它利用了大量用戶行為的數(shù)據(jù),同時(shí)也利用相關(guān)的任務(wù)綜合起來,以提升每個(gè)單獨(dú)任務(wù)的效率。

應(yīng)用二:問答文本的情感分析

第二個(gè)問題我想介紹的是關(guān)于面對問答文本的情感分析。評價(jià)情感分析是電商平臺的生命線,很多用戶在購買之前都會看評價(jià),評價(jià)本身傳統(tǒng)的情感分析是句子情感分析,也就是單獨(dú)看這句話所代表的正面或負(fù)面的情感,但是在現(xiàn)在的電商平臺之中,往往已經(jīng)不是這么簡單,因?yàn)橛泻芏嚓P(guān)于問答、用戶之間問答的信息,比如說在阿里巴巴平臺上,我們是允許一個(gè)消費(fèi)者向已經(jīng)購買某個(gè)產(chǎn)品的其他消費(fèi)者發(fā)出問題,根據(jù)這些反饋來做自己購買的決策,這里面就涉及到問答的問題。

比如說一個(gè)消費(fèi)者可能會問這款筆記本的鍵盤怎么樣?回答是鍵盤不錯(cuò)但是耗電太快了。如果我們仔細(xì)分析問答對的話,我們可以看到,其實(shí)對于問題來講用戶是正面的,但是耗電太快是負(fù)面的,我們要分析問題和答案關(guān)系從而作出對于問題的情感分析。

基于這個(gè)新的問題我們提出了一種新的深度學(xué)習(xí)的的方式,從四個(gè)角度對于這個(gè)問題進(jìn)行建模,包括從單字的角度、句子的角度、問題和答案之間的關(guān)系等角度,最終產(chǎn)生情感分析的結(jié)果。

這是我們的機(jī)器深度學(xué)習(xí)框架,其中一個(gè)重要的環(huán)節(jié)就是用來匹配問題和答案之間子句的相應(yīng)的匹配程度。我們也做了比較全面的測試,來看我們整個(gè) 4D Approach 的結(jié)果,最終的結(jié)果相對于傳統(tǒng)的情感分析方式有著非常大的優(yōu)勢,它的優(yōu)點(diǎn)就來自于它能夠精確地分析問題和答案之間的語義關(guān)系從而產(chǎn)生結(jié)果。

應(yīng)用三:機(jī)器閱讀理解

接下來要介紹的是機(jī)器閱讀理解。機(jī)器閱讀理解是近一、兩年自然語言處理信息搜索等領(lǐng)域一個(gè)非?;鸨恼n題。機(jī)器閱讀理解屬于智能問答的范疇。智能問答我們大家都知道,在自動(dòng)客服等等場景有著廣泛的巨大的商業(yè)應(yīng)用和價(jià)值。傳統(tǒng)的智能問答一般由兩種方式解決,一種是常見問答對的方式,一種叫做知識庫構(gòu)建的方式。

  • 常見問答對的方式是指,對于某一個(gè)領(lǐng)域,我們事先要收集大量這個(gè)領(lǐng)域典型的問題和相應(yīng)的答案,然后如果有一個(gè)用戶提了一個(gè)新的問題,我們需要把這個(gè)新的問題和問答數(shù)據(jù)庫中已有的問題進(jìn)行語義匹配,再把相應(yīng)的答案展現(xiàn)給用戶。

  • 基于知識庫的方式是需要做更多預(yù)處理的工作,它要把這個(gè)領(lǐng)域之中的實(shí)體和它們的關(guān)系都抽取出來,對于用戶所提出的問題也要進(jìn)行相應(yīng)的處理,在這個(gè)基礎(chǔ)之上才能夠進(jìn)行回答。

這兩個(gè)方法如果有充分的人工標(biāo)定的數(shù)據(jù),是可以取得比較好的效果的,但是在復(fù)雜多變的場景下,它們數(shù)據(jù)準(zhǔn)備的成本都非常高,冷啟動(dòng)的成本非常高,維護(hù)的成本和語義的開創(chuàng)程度都有相對的缺點(diǎn)和弱點(diǎn)的。

基于這樣的觀察,機(jī)器閱讀理解最近一兩年內(nèi)成為智能問答領(lǐng)域內(nèi)最重要的新穎的創(chuàng)新技術(shù),機(jī)器閱讀理解是針對用戶的問題,我們不需要產(chǎn)生預(yù)先收集某個(gè)領(lǐng)域的典型問題,我們只需要把相關(guān)的文本比如說產(chǎn)品說明書,比如說活動(dòng)說明書有關(guān)的文本收集起來,有了用戶的問題,我們再把用戶的問題和文檔當(dāng)中的信息進(jìn)行比對、進(jìn)行抽取和理解,就可以回答客戶的問題,我們可以看到,它不需要準(zhǔn)備事先大量的某典型領(lǐng)域的問題。這樣一來,數(shù)據(jù)在冷啟動(dòng)維護(hù)成本和領(lǐng)域開放方面都有比較大的優(yōu)勢。

另外一方面,我們沒有很多事先收集的用戶數(shù)據(jù),這對于自然語言算法設(shè)計(jì)的挑戰(zhàn)是非常大的,我們必須精準(zhǔn)地理解這些文字背后所代表的意義。

我們的一些相關(guān)工作已經(jīng)發(fā)表在 ACL 上。就本身的技術(shù)效果來看,我們在 2018 年 1 月份在斯坦福大學(xué)機(jī)器閱讀理解領(lǐng)域頂級賽事 SQuAD 比賽中,我們歷史上第一次用計(jì)算機(jī)算法的實(shí)現(xiàn)超越了人類的成績,這應(yīng)該看作是機(jī)器閱讀理解史上里程碑式的成果。但是 SQUAD 數(shù)據(jù)級跟實(shí)際應(yīng)用有很大的偏差,因?yàn)?SQuAD 有很強(qiáng)的假設(shè),比如首先,所有的問題文案中都有答案;第二,文案都比較短,這跟實(shí)際的應(yīng)用場景是不一樣的。

所以我們把我們的重心轉(zhuǎn)換到更實(shí)際的場景,比如這個(gè)名為 TriviaQA 的數(shù)據(jù)集,集中于信息抽取、信息搜索和機(jī)器閱讀理解,是一個(gè)綜合性的更接近于實(shí)際應(yīng)用場景的數(shù)據(jù)集,我們在數(shù)據(jù)集上取得了比較好的效果。我們真正的研究重點(diǎn)是在廣闊的實(shí)際應(yīng)用場景中。

在阿里巴巴內(nèi)部問答場景中,我們支持了非常多的活動(dòng)和規(guī)則方面的支持,節(jié)省大量的人力、產(chǎn)生了大量的價(jià)值。同時(shí)我們現(xiàn)在正在服務(wù)賦能阿里巴巴的商戶、店家,我們希望把機(jī)器閱讀理解的功能開放給商家,比如說商家的客服往往要回答關(guān)于他們商品、關(guān)于他們付款、關(guān)于他們活動(dòng)的問題,如果這些商家能夠提供給我們他們相關(guān)的文檔,我們就可以幫助他們做自動(dòng)的客服。這個(gè)叫店小秘場景,阿里巴巴店鋪上的客服笑咪場景已經(jīng)開始支持很多著名的廠商,比如 Playboy 和森馬等等。

同時(shí)在新零售和電商以外的場景,我們也開始支持稅務(wù)法規(guī)、醫(yī)藥等等更多的行業(yè)。當(dāng)然機(jī)器閱讀理解不止限于中文,我們在英文電商場景中也有很廣闊的應(yīng)用。

應(yīng)用四:電商搜索

最后我想講一下關(guān)于電商搜索方面的課題,我們都知道亞馬遜、淘寶是非常大的電商搜索引擎,有的幾億級的商品目錄,在這些大的電商平臺進(jìn)行搜索,我們既需要提供好的用戶體驗(yàn),同時(shí)我們也希望盡可能地提高效能減少計(jì)算資源的消耗。

我們提出的解決方案叫級聯(lián)式電商搜索方式,想法非常簡單,我們在不同的階段有不同的模型,在初始階段,用簡單的模型能夠過濾到大量不相關(guān)的內(nèi)容,在后面的階段用更復(fù)雜的模型,來產(chǎn)生更精準(zhǔn)的排序,我們所做的工作主要在于能夠把多項(xiàng)用戶體驗(yàn)的指標(biāo)如搜索的延時(shí),搜索是否產(chǎn)生足夠的結(jié)果和計(jì)算資源聯(lián)合建模能夠產(chǎn)生整體的既有效率又能產(chǎn)生用戶體驗(yàn)的解決方案。

同時(shí)我們也分析了多種用戶行為比如說點(diǎn)擊購買等等來構(gòu)建更有效的電商搜索。這也是一些具體的實(shí)現(xiàn),具體的工作在 KDD 2018 的論文中。

我們做了大量的實(shí)驗(yàn)證明它的效果,包括離線的和在線的,特別是在 2016 年雙 11 的應(yīng)用,這個(gè)層級式的搜索方案節(jié)省計(jì)算機(jī)消耗達(dá)到 45%,節(jié)省出來的資源更有效地實(shí)現(xiàn)新的實(shí)時(shí)特征,取得了 22% 的定級率的提升,這個(gè)產(chǎn)生的價(jià)值是幾億、幾十億的量級。

上面是我們所介紹一些具體的應(yīng)用案例,最后我也想交流一下自然語言智能理解的廣闊的應(yīng)用場景。

廣闊應(yīng)用場景

在新零售電商領(lǐng)域,比如說情感和輿情分析,這對于電商是至關(guān)重要的,我們提供的情感分析每天服務(wù)百萬級的商家,近億級的 DAU,每天阿里系有超過一億人關(guān)注商品的評價(jià)幫助他們進(jìn)行商品的決策。

智能消費(fèi)、信息流是最近流行的手段,和今日頭條不同的是我們產(chǎn)生的頻道叫淘寶頭條,不只是關(guān)于資訊的推薦,更多的是消費(fèi)資訊的推薦,更好地幫助人們做商業(yè)的決策。我們把用戶內(nèi)容的相關(guān)性和商業(yè)的轉(zhuǎn)化率更好地結(jié)合起來,提供更好的用戶體驗(yàn)。

還有智能無線推送,我們的目標(biāo)是能夠在正確的人在正確的地點(diǎn)、在正確的時(shí)間推送正確的內(nèi)容,每天為淘寶阿里系電商進(jìn)行大量的引流,產(chǎn)生億級以上的 GMV。

最終,自然語言智能的應(yīng)用遠(yuǎn)遠(yuǎn)超越新零售電商這一領(lǐng)域。我們在醫(yī)療信息管理、在地址信息管理、文本信息等等方面都和我們的合作伙伴有著廣泛、大量的合作,如果在座哪位有對這些方向感興趣的,我們也非常希望歡迎大家和我們線下交流。謝謝。

更多資訊敬請關(guān)注雷鋒網(wǎng)AI科技評論。

雷峰網(wǎng)原創(chuàng)文章,未經(jīng)授權(quán)禁止轉(zhuǎn)載。詳情見轉(zhuǎn)載須知

阿里巴巴司羅暢談自然語言智能技術(shù),兩平臺四應(yīng)用助力商業(yè)落地

分享:
相關(guān)文章
當(dāng)月熱門文章
最新文章
請?zhí)顚懮暾埲速Y料
姓名
電話
郵箱
微信號
作品鏈接
個(gè)人簡介
為了您的賬戶安全,請驗(yàn)證郵箱
您的郵箱還未驗(yàn)證,完成可獲20積分喲!
請驗(yàn)證您的郵箱
立即驗(yàn)證
完善賬號信息
您的賬號已經(jīng)綁定,現(xiàn)在您可以設(shè)置密碼以方便用郵箱登錄
立即設(shè)置 以后再說