3
Siraj Raval 作為深度學(xué)習(xí)領(lǐng)域的自媒體人在歐美可以說是無人不知、無人不曉。
憑借在 Youtube 上的指導(dǎo)視頻,Siraj Raval 在全世界吸粉無數(shù),堪稱是機器學(xué)習(xí)界的網(wǎng)紅。說他是全球范圍內(nèi)影響力最大的 ML 自媒體人,怕也無異議。
因此,雷鋒網(wǎng) AI 研習(xí)社聯(lián)系到了Siraj 本人,并獲得授權(quán)將他最精華的 Youtube 視頻進行字幕漢化,免費推送給大家。我們將不定期更新,敬請關(guān)注!
今天 Siraj 就帶領(lǐng)大家做一個自己的 Chatbot!
(建議在Wi-Fi環(huán)境下觀看視頻,土豪隨意~)
為了方便流量不足的小伙伴們在路上看,我們特意整理出了文字版和動圖~
微信、Skype、Messager以及其他主流通信軟件如今都已經(jīng)搭建了聊天機器人,許多科技巨頭紛紛推出各自的聊天助手,各大電商也越來越多地使用聊天機器人參與客服工作。
不過Chatbot可以為你做些什么實實在在的事情呢?你可以和CNN機器人聊天來獲取實時新聞,也可以讓機器人訂花送給女票... ...等等,沒有女票?沒關(guān)系,說出你的要求,讓婚戀機器人給你介紹。
看來學(xué)會搭建一個Chatbot還是很有必要的。Siraj會帶你用TensorFlow建一個聊天機器人,使用遞歸神經(jīng)網(wǎng)絡(luò)算法(RNN),步驟是下載數(shù)據(jù)集,創(chuàng)建模型,訓(xùn)練模型,聊天測試。
Step1 下載數(shù)據(jù)集
這里會用到來自康奈爾大學(xué)的電影對話數(shù)據(jù)集。包含了超過600部的好萊塢電影的對話。(恩,可以和女票秀一下深厚的臺詞功力了。)首先要下載數(shù)據(jù)集到數(shù)據(jù)文檔中,然后將其切分為兩個不同的訓(xùn)練數(shù)據(jù)集(分別為問和答)進行預(yù)處理。
Step2 創(chuàng)建模型
這里用到的模型是 seq2seq,它包含兩個 LSTM 遞歸神經(jīng)網(wǎng)絡(luò),第一個是 encoder 負責處理 input,第二個是 decoder 負責生成 output。使用encoder和decoder作為輸入?yún)?shù),把詞匯轉(zhuǎn)為向量形式。
Step3 訓(xùn)練模型
這是很小的數(shù)據(jù)集,完成整個訓(xùn)練可能也就幾個小時。
Step4 聊天測試
隨著訓(xùn)練進行,回答會越來越有邏輯。你投入的數(shù)據(jù)越多,聊得會越開心。
完整代碼和數(shù)據(jù)集請參考Github(鏈接)。
------------------------------------------------
Siraj Raval 何許人也?
Siraj Raval是YouTube極客網(wǎng)紅,曾任職于Twilio和Meetup,客戶包括Elon Mask和Google,教大家如何使用機器學(xué)習(xí)開發(fā)聊天機器人、無人駕駛車、AI藝術(shù)家等視頻點擊量累計數(shù)百萬。
Siraj Raval 為什么這么火?
首先,當然是這位哥倫比亞大學(xué)高材生活兒好技術(shù)好,用自己特有的方式三言兩語就能拋出一個原本晦澀的 ML、DL 概念,讓聽眾細細咀嚼。再者,這家伙幽默逗比、口才便給。興之所至常手舞足蹈,瞳仁奇光掩映,口吐智慧蓮華。深度學(xué)習(xí)講師不少,但這么風趣可親的卻不多。
雷鋒網(wǎng)按:視頻已獲得Siraj授權(quán),字幕來自雷鋒網(wǎng)字幕組,為雷鋒網(wǎng)原創(chuàng)。
雷峰網(wǎng)原創(chuàng)文章,未經(jīng)授權(quán)禁止轉(zhuǎn)載。詳情見轉(zhuǎn)載須知。