3
Siraj Raval 作為深度學習領域的自媒體人在歐美可以說是無人不知、無人不曉。
憑借在 Youtube 上的指導視頻,Siraj Raval 在全世界吸粉無數,堪稱是機器學習界的網紅。說他是全球范圍內影響力最大的 ML 自媒體人,怕也無異議。
因此,雷鋒網 AI 研習社聯系到了Siraj 本人,并獲得授權將他最精華的 Youtube 視頻進行字幕漢化,免費推送給大家。我們將不定期更新,敬請關注!
今天 Siraj 就帶領大家做一個自己的 Chatbot!
(建議在Wi-Fi環境下觀看視頻,土豪隨意~)
為了方便流量不足的小伙伴們在路上看,我們特意整理出了文字版和動圖~
微信、Skype、Messager以及其他主流通信軟件如今都已經搭建了聊天機器人,許多科技巨頭紛紛推出各自的聊天助手,各大電商也越來越多地使用聊天機器人參與客服工作。

不過Chatbot可以為你做些什么實實在在的事情呢?你可以和CNN機器人聊天來獲取實時新聞,也可以讓機器人訂花送給女票... ...等等,沒有女票?沒關系,說出你的要求,讓婚戀機器人給你介紹。
看來學會搭建一個Chatbot還是很有必要的。Siraj會帶你用TensorFlow建一個聊天機器人,使用遞歸神經網絡算法(RNN),步驟是下載數據集,創建模型,訓練模型,聊天測試。

Step1 下載數據集
這里會用到來自康奈爾大學的電影對話數據集。包含了超過600部的好萊塢電影的對話。(恩,可以和女票秀一下深厚的臺詞功力了。)首先要下載數據集到數據文檔中,然后將其切分為兩個不同的訓練數據集(分別為問和答)進行預處理。

Step2 創建模型
這里用到的模型是 seq2seq,它包含兩個 LSTM 遞歸神經網絡,第一個是 encoder 負責處理 input,第二個是 decoder 負責生成 output。使用encoder和decoder作為輸入參數,把詞匯轉為向量形式。

Step3 訓練模型
這是很小的數據集,完成整個訓練可能也就幾個小時。

Step4 聊天測試
隨著訓練進行,回答會越來越有邏輯。你投入的數據越多,聊得會越開心。

完整代碼和數據集請參考Github(鏈接)。
------------------------------------------------
Siraj Raval 何許人也?
Siraj Raval是YouTube極客網紅,曾任職于Twilio和Meetup,客戶包括Elon Mask和Google,教大家如何使用機器學習開發聊天機器人、無人駕駛車、AI藝術家等視頻點擊量累計數百萬。
Siraj Raval 為什么這么火?
首先,當然是這位哥倫比亞大學高材生活兒好技術好,用自己特有的方式三言兩語就能拋出一個原本晦澀的 ML、DL 概念,讓聽眾細細咀嚼。再者,這家伙幽默逗比、口才便給。興之所至常手舞足蹈,瞳仁奇光掩映,口吐智慧蓮華。深度學習講師不少,但這么風趣可親的卻不多。
雷鋒網按:視頻已獲得Siraj授權,字幕來自雷鋒網字幕組,為雷鋒網原創。
雷峰網原創文章,未經授權禁止轉載。詳情見轉載須知。