丁香五月天婷婷久久婷婷色综合91|国产传媒自偷自拍|久久影院亚洲精品|国产欧美VA天堂国产美女自慰视屏|免费黄色av网站|婷婷丁香五月激情四射|日韩AV一区二区中文字幕在线观看|亚洲欧美日本性爱|日日噜噜噜夜夜噜噜噜|中文Av日韩一区二区

您正在使用IE低版瀏覽器,為了您的雷峰網(wǎng)賬號(hào)安全和更好的產(chǎn)品體驗(yàn),強(qiáng)烈建議使用更快更安全的瀏覽器
此為臨時(shí)鏈接,僅用于文章預(yù)覽,將在時(shí)失效
人工智能開發(fā)者 正文
發(fā)私信給恒亮
發(fā)送

0

NLP 從入門到實(shí)戰(zhàn),阿里 iDST 9 大名師即將開講

本文作者: 恒亮 2017-03-22 09:39
導(dǎo)語:對(duì)自然語言處理(NLP)感興趣?加入我們吧!

在大數(shù)據(jù)計(jì)算和深度神經(jīng)網(wǎng)絡(luò)等技術(shù)的推動(dòng)下,NLP 正在不斷趨于成熟,并在人們的生產(chǎn)生活中發(fā)揮著越來越重要的作用:從搜索引擎、拼寫檢查、關(guān)鍵詞提取,到文本分類、情感分析、機(jī)器翻譯和對(duì)話機(jī)器人等,幾乎隨處都能看到 NLP,隨時(shí)都能享受 NLP 帶來的便捷。

但在誕生之初,NLP 的發(fā)展其實(shí)并不順利。

業(yè)內(nèi)普遍認(rèn)可的 NLP 起源大約可以追溯到 1954 年。當(dāng)時(shí),IBM 和喬治城大學(xué)(Georgetown University)聯(lián)合發(fā)起了一次著名試驗(yàn):Georgetown–IBM Experiment,科學(xué)家們想通過計(jì)算機(jī)自動(dòng)將 60 個(gè)俄語文本翻譯成英語。當(dāng)時(shí)一個(gè)普遍認(rèn)知是:機(jī)器翻譯只是簡單的詞匯列表遍歷問題,在三到五年之內(nèi)就能完美解決。于是各研發(fā)機(jī)構(gòu)投入了大量的研發(fā)資源。

然而,事情的進(jìn)展并不順利。在此后長達(dá) 30 多年的時(shí)間里,NLP 的研究成果幾乎乏善可陳。唯一值得一提的可能就是 1972 年美國麻省理工學(xué)院開發(fā)的一個(gè)用自然語言指揮機(jī)器人的人機(jī)對(duì)話系統(tǒng) SHRDLU,以及 1964-1966 年間開發(fā)的世界上第一個(gè)真正意義上的聊天機(jī)器人系統(tǒng):ELIZA。但在當(dāng)時(shí),SHRDLU 和 ELIZA 的語言處理能力都非常簡單,例如 SHRDLU 只存儲(chǔ)了 200 個(gè)單詞,而 ELIZA 所做的也僅僅是用符合語法的方式將問題復(fù)述一遍,毫無“智能”可言。

這一時(shí)期的研究者們進(jìn)行自然語言處理的主要思路是按照短語結(jié)構(gòu)語法(Phrase Structure Grammar,PSG)的理論進(jìn)行分析,他們認(rèn)為語法規(guī)則的數(shù)目是有限的,但據(jù)此生成的語句的數(shù)目卻是無限的,試圖通過語言學(xué)家窮舉的方法列出所有語法規(guī)則,再根據(jù)這些語法規(guī)則展開計(jì)算機(jī)的模式化分析。

這種思路有兩大致命缺陷:

● 忽略了自然語言的歧義性。例如同樣是動(dòng)詞加名詞的組合,“打擊力度”就是名詞短語,但“打擊盜版”就是動(dòng)詞短語;

● 語法規(guī)則實(shí)際上是無法窮舉的。人們發(fā)現(xiàn),雖然日常對(duì)話中最長使用的語法規(guī)則只有幾十條,它們出現(xiàn)的頻率也的確很高,但隨著語料庫規(guī)模的擴(kuò)大,新的規(guī)則仍然不斷出現(xiàn)。

直到 1980 年代以后,開始有學(xué)者將機(jī)器學(xué)習(xí)算法引入 NLP,從此引發(fā)了一場(chǎng) NLP 的革命。

人們開始認(rèn)識(shí)到 PSG 分析法的缺陷,認(rèn)識(shí)到依靠人類語言學(xué)家人工歸納總結(jié)所有語法規(guī)則的方法走不下去。于是逐漸出現(xiàn)了依靠復(fù)雜特征集(Complex Feature Set)描述的語法約束,出現(xiàn)了依靠大數(shù)據(jù)和數(shù)理統(tǒng)計(jì)的統(tǒng)計(jì)學(xué) NLP 分析模型,以及針對(duì)統(tǒng)計(jì)模型無法處理的歧義現(xiàn)象出現(xiàn)的“詞匯主義”(Lexicalism)。研究者們認(rèn)識(shí)到在詞匯層采用顆粒度更小的語言描述單元的必要性,于是開始將自然語言描述的主體從語法規(guī)則層轉(zhuǎn)移到了詞匯層。目前,詞匯知識(shí)庫的構(gòu)建已經(jīng)成為了業(yè)界普遍關(guān)注的問題。美國的 WordNet、FrameNet 以及我國的各種語法知識(shí)庫和語義知識(shí)庫,都反映了這種強(qiáng)烈的“詞匯主義”的傾向。

隨著技術(shù)的不斷進(jìn)步,NLP 通過不斷地從數(shù)學(xué)、生物神經(jīng)科學(xué)以及統(tǒng)計(jì)語言學(xué)等交叉學(xué)科中吸收營養(yǎng)來豐富自己,目前已經(jīng)取得了長足的進(jìn)步。雖然在自然對(duì)話等一般場(chǎng)景中的表現(xiàn)還不盡如人意,但在一些特定領(lǐng)域,例如語音識(shí)別(微軟 / IBM 語音識(shí)別)和機(jī)器翻譯(谷歌 GNMT 機(jī)器翻譯)等細(xì)分場(chǎng)景中,最新的 NLP 技術(shù)已經(jīng)超越了許多普通人類的表現(xiàn)。

在這種情況下,作為一名 AI 相關(guān)領(lǐng)域的研發(fā)從業(yè)者,更有必要對(duì) NLP 技術(shù)有一個(gè)全面的認(rèn)識(shí)和了解。為此,雷鋒網(wǎng)聯(lián)合國內(nèi)頂級(jí) AI 培訓(xùn)平臺(tái)“1024 MOOC 學(xué)院”,有幸邀請(qǐng)到 9 位來自阿里巴巴 iDST 數(shù)據(jù)科學(xué)與技術(shù)實(shí)驗(yàn)室的頂級(jí)專家,利用 4 月 8-9 日一個(gè)周末的時(shí)間,為大家奉上一期“NLP快速入門實(shí)戰(zhàn)特訓(xùn)班”。

NLP 從入門到實(shí)戰(zhàn),阿里 iDST  9 大名師即將開講

如果你對(duì)人工智能了充滿熱情,如果你對(duì) NLP 充滿了好奇心和求知欲,如果你是一個(gè)不甘心被機(jī)器超越的 AI 開發(fā)者,那么請(qǐng)不要猶豫,加入我們。本課程將系統(tǒng)涵蓋 NLP 技術(shù)中的分詞算法、語義理解、對(duì)話系統(tǒng)以及機(jī)器翻譯等四大版塊,重點(diǎn)介紹基礎(chǔ)理論與實(shí)戰(zhàn)應(yīng)用,幫助大家解決實(shí)戰(zhàn)過程中會(huì)遇到的技術(shù)難題。

  課程內(nèi)容(10個(gè)課時(shí)):

1. 詞法分析

1、中文詞法分析的基本概念和核心問題

2、基于馬爾科夫模型的中文詞法分析

3、基于序列標(biāo)注模型(CRF、LSTM)的中文詞法分析

4、詞法分析之工業(yè)界實(shí)踐

2. 意圖理解

意圖理解的基本概念

意圖理解的難點(diǎn)和基本方法

深度學(xué)習(xí)在意圖理解中的應(yīng)用

意圖理解在阿里產(chǎn)品中的具體實(shí)現(xiàn)

3. Slot 抽取

屬性抽取的基本概念

屬性抽取的難點(diǎn)和基本方法

深度學(xué)習(xí)在屬性抽取中的應(yīng)用

屬性抽取在阿里產(chǎn)品中的具體實(shí)現(xiàn)

4. 對(duì)話引擎

對(duì)話引擎的基本概念

對(duì)話的建模方法

應(yīng)用場(chǎng)景下對(duì)話引擎面臨的問題

對(duì)話引擎問題的一些解決思路

5. 智能問答

智能問答的基本概念和應(yīng)用場(chǎng)景介紹

智能問答系統(tǒng)的工作原理、系統(tǒng)框架和關(guān)鍵技術(shù)

如何搭建一套智能問答系統(tǒng)

6. 聊天引擎

聊天引擎概念和demo演示

基于檢索和基于生成的兩種聊天引擎構(gòu)建方法

工業(yè)應(yīng)用中涉及的數(shù)據(jù)、在線架構(gòu)問題以及解決思路

7. 語言模型

語言模型的基本概念

N元文法語言模型

語言模型的評(píng)價(jià)指標(biāo)

基于神經(jīng)網(wǎng)絡(luò)的語言模型建模

8. 機(jī)器翻譯

機(jī)器翻譯的基本概念

統(tǒng)計(jì)機(jī)器翻譯和神經(jīng)網(wǎng)絡(luò)機(jī)器翻譯的原理和工作機(jī)制

主要開源機(jī)器翻譯系統(tǒng)

工業(yè)級(jí)機(jī)器翻譯系統(tǒng)的主要架構(gòu)、常見問題和解決方案

9. 搜索引擎數(shù)據(jù)在NLP中的應(yīng)用

搜索引擎的基本概念。

搜索引擎數(shù)據(jù)的分類

每種數(shù)據(jù),我們會(huì)舉例說明在NLP相關(guān)領(lǐng)域中的作用

10. 句法分析

句法分析的基本概念

依存句法分析的基本原理和方法

常見的開源句法分析系統(tǒng)介紹

句法分析在電商場(chǎng)景工業(yè)級(jí)應(yīng)用介紹

  講師信息(排名不分先后):

NLP 從入門到實(shí)戰(zhàn),阿里 iDST  9 大名師即將開講

千訣
iDST資深算法專家
陳一寧
iDST高級(jí)專家
李永彬
iDST高級(jí)算法專家
郎皓
iDST算法專家
黎檳華
iDST高級(jí)算法工程師
鮑光勝
iDST算法專家
駱衛(wèi)華
iDST資深技術(shù)專家
鄭昊
iDST高級(jí)算法工程師
吳勝蘭
iDST資深算法工程師

  開課安排:

時(shí)間:4月1日-2日,周六周末開課;

授課形式:線上視頻直播授課;

售價(jià):1299元;

  報(bào)名鏈接:

http://m.leiphone.com/special/mooc03 

雷鋒網(wǎng)(公眾號(hào):雷鋒網(wǎng))相關(guān)閱讀:

深度 | 百度副總裁王海峰:百度在NLP領(lǐng)域都做了什么?

清華大學(xué)朱小燕教授做客雷鋒網(wǎng)沙龍,分享 NLP 和人工智能的那些事兒| AAAI 2017

罹患乳腺癌的這位MIT教授,用NLP甄別患者胸前的“定時(shí)炸彈”

雷峰網(wǎng)版權(quán)文章,未經(jīng)授權(quán)禁止轉(zhuǎn)載。詳情見轉(zhuǎn)載須知。

NLP 從入門到實(shí)戰(zhàn),阿里 iDST  9 大名師即將開講

分享:
相關(guān)文章

編輯

歡迎交流,微信:whl123465
當(dāng)月熱門文章
最新文章
請(qǐng)?zhí)顚懮暾?qǐng)人資料
姓名
電話
郵箱
微信號(hào)
作品鏈接
個(gè)人簡介
為了您的賬戶安全,請(qǐng)驗(yàn)證郵箱
您的郵箱還未驗(yàn)證,完成可獲20積分喲!
請(qǐng)驗(yàn)證您的郵箱
立即驗(yàn)證
完善賬號(hào)信息
您的賬號(hào)已經(jīng)綁定,現(xiàn)在您可以設(shè)置密碼以方便用郵箱登錄
立即設(shè)置 以后再說