3
Siraj Raval 作為深度學(xué)習(xí)領(lǐng)域的自媒體人在歐美可以說(shuō)是無(wú)人不知、無(wú)人不曉。
憑借在 Youtube 上的指導(dǎo)視頻,Siraj Raval 在全世界吸粉無(wú)數(shù),堪稱是機(jī)器學(xué)習(xí)界的網(wǎng)紅。說(shuō)他是全球范圍內(nèi)影響力最大的 ML 自媒體人,怕也無(wú)異議。
因此,雷鋒網(wǎng) AI 研習(xí)社聯(lián)系到了Siraj 本人,并獲得授權(quán)將他最精華的 Youtube 視頻進(jìn)行字幕漢化,免費(fèi)推送給大家。我們將不定期更新,敬請(qǐng)關(guān)注!
今天 Siraj 就帶領(lǐng)大家做一個(gè)自己的 Chatbot!
(建議在Wi-Fi環(huán)境下觀看視頻,土豪隨意~)
為了方便流量不足的小伙伴們?cè)诼飞峡矗覀兲匾庹沓隽宋淖职婧蛣?dòng)圖~
微信、Skype、Messager以及其他主流通信軟件如今都已經(jīng)搭建了聊天機(jī)器人,許多科技巨頭紛紛推出各自的聊天助手,各大電商也越來(lái)越多地使用聊天機(jī)器人參與客服工作。
不過(guò)Chatbot可以為你做些什么實(shí)實(shí)在在的事情呢?你可以和CNN機(jī)器人聊天來(lái)獲取實(shí)時(shí)新聞,也可以讓機(jī)器人訂花送給女票... ...等等,沒有女票?沒關(guān)系,說(shuō)出你的要求,讓婚戀機(jī)器人給你介紹。
看來(lái)學(xué)會(huì)搭建一個(gè)Chatbot還是很有必要的。Siraj會(huì)帶你用TensorFlow建一個(gè)聊天機(jī)器人,使用遞歸神經(jīng)網(wǎng)絡(luò)算法(RNN),步驟是下載數(shù)據(jù)集,創(chuàng)建模型,訓(xùn)練模型,聊天測(cè)試。
Step1 下載數(shù)據(jù)集
這里會(huì)用到來(lái)自康奈爾大學(xué)的電影對(duì)話數(shù)據(jù)集。包含了超過(guò)600部的好萊塢電影的對(duì)話。(恩,可以和女票秀一下深厚的臺(tái)詞功力了。)首先要下載數(shù)據(jù)集到數(shù)據(jù)文檔中,然后將其切分為兩個(gè)不同的訓(xùn)練數(shù)據(jù)集(分別為問和答)進(jìn)行預(yù)處理。
Step2 創(chuàng)建模型
這里用到的模型是 seq2seq,它包含兩個(gè) LSTM 遞歸神經(jīng)網(wǎng)絡(luò),第一個(gè)是 encoder 負(fù)責(zé)處理 input,第二個(gè)是 decoder 負(fù)責(zé)生成 output。使用encoder和decoder作為輸入?yún)?shù),把詞匯轉(zhuǎn)為向量形式。
Step3 訓(xùn)練模型
這是很小的數(shù)據(jù)集,完成整個(gè)訓(xùn)練可能也就幾個(gè)小時(shí)。
Step4 聊天測(cè)試
隨著訓(xùn)練進(jìn)行,回答會(huì)越來(lái)越有邏輯。你投入的數(shù)據(jù)越多,聊得會(huì)越開心。
完整代碼和數(shù)據(jù)集請(qǐng)參考Github(鏈接)。
------------------------------------------------
Siraj Raval 何許人也?
Siraj Raval是YouTube極客網(wǎng)紅,曾任職于Twilio和Meetup,客戶包括Elon Mask和Google,教大家如何使用機(jī)器學(xué)習(xí)開發(fā)聊天機(jī)器人、無(wú)人駕駛車、AI藝術(shù)家等視頻點(diǎn)擊量累計(jì)數(shù)百萬(wàn)。
Siraj Raval 為什么這么火?
首先,當(dāng)然是這位哥倫比亞大學(xué)高材生活兒好技術(shù)好,用自己特有的方式三言兩語(yǔ)就能拋出一個(gè)原本晦澀的 ML、DL 概念,讓聽眾細(xì)細(xì)咀嚼。再者,這家伙幽默逗比、口才便給。興之所至常手舞足蹈,瞳仁奇光掩映,口吐智慧蓮華。深度學(xué)習(xí)講師不少,但這么風(fēng)趣可親的卻不多。
雷鋒網(wǎng)按:視頻已獲得Siraj授權(quán),字幕來(lái)自雷鋒網(wǎng)字幕組,為雷鋒網(wǎng)原創(chuàng)。
雷峰網(wǎng)原創(chuàng)文章,未經(jīng)授權(quán)禁止轉(zhuǎn)載。詳情見轉(zhuǎn)載須知。