3
本文作者: AI研習(xí)社-譯站 | 2018-03-20 17:31 |
雷鋒網(wǎng)按:這里是,油管Artificial Intelligence Education專欄,原作者Siraj Raval授權(quán)雷鋒字幕組編譯。
原標(biāo)題 Learn Machine Learning in 3 Months
翻譯 | 楊麗 廖穎 字幕 | 凡江 整理 | 廖穎 編輯 | 吳璇
到目前為止,我收到最多的問題,就是怎樣入門機(jī)器學(xué)習(xí)。為此,我制定了一個(gè)三個(gè)月的學(xué)習(xí)指南來幫助你們,更好地從入門級(jí)新手變成機(jī)器學(xué)習(xí)的精通者。
同時(shí),為了那些僅能利用閑余時(shí)間來學(xué)習(xí)的人——不管是工作黨,還是學(xué)生黨,我都會(huì)用視頻進(jìn)行講解。如果你能全心全意投入學(xué)習(xí),就可以事半功倍地達(dá)成效果。
首先,我們先來看看 DeepMind 招聘頁面。每每提到發(fā)布的人工智能算法, DeepMind 都稱得上是世界領(lǐng)先的機(jī)構(gòu)。我們來看一下研究工程師職位。這個(gè)職位描述所需要負(fù)責(zé)的是團(tuán)隊(duì)的一部分,需要負(fù)責(zé)AlphaGo,Deep Q Network 和 WaveNet。它們每一個(gè)在 AI 領(lǐng)域都具有革命性。
AI 的最低要求是具有計(jì)算機(jī)科學(xué)學(xué)士學(xué)位,或是精通 Python,機(jī)器學(xué)習(xí)和算法設(shè)計(jì)相關(guān)領(lǐng)域的人才。在符合以上優(yōu)先條件者中,不需要具備博士學(xué)位或發(fā)表一大堆論文。
如果我們要?jiǎng)?chuàng)建一個(gè)餅圖來理解機(jī)器學(xué)習(xí)的必要性,它是這樣分布的:其中35%是線性代數(shù),25%是概率論和統(tǒng)計(jì)學(xué),15%是微積分,另外的15%是算法及其復(fù)雜性,最后的10%就是數(shù)據(jù)預(yù)處理知識(shí)。
根據(jù)這些要求,我們可以圍繞著這張圖建立我們自己的課程。我將這門課程劃分為三個(gè)月。第1個(gè)月主要講數(shù)學(xué)和算法復(fù)雜性,第2個(gè)月講機(jī)器學(xué)習(xí),第3個(gè)月講最受歡迎的深度學(xué)習(xí)。
在開始之前我想說的是,你每天的任務(wù)之一就是跟上節(jié)奏。
這里是我推薦一些學(xué)習(xí)資源:
第一個(gè)推薦的,就是我的YouTube頻道,我會(huì)把AI方面的內(nèi)容發(fā)布在這里。每周不間斷,點(diǎn)擊訂閱按鈕,可以通知你發(fā)布了新的內(nèi)容。
如果你還沒有沒關(guān)注,還有一個(gè)選擇,就是下一個(gè)是 MachineLearning。無論是致力于機(jī)器學(xué)習(xí)的學(xué)者,還是企業(yè)人才,都會(huì)在這里分享他們的發(fā)現(xiàn)。
另外,Twitter也是一個(gè)未被充分利用的資源。Twitter就像一個(gè)學(xué)習(xí)養(yǎng)料,如果你使用得當(dāng),就可以向厲害的人學(xué)習(xí)。滾動(dòng)Twitter頁面,它不像大多數(shù)社交平臺(tái)那樣魚龍混雜。事實(shí)上它可以豐富你的知識(shí),機(jī)器學(xué)習(xí)研究員喜歡使用這個(gè)平臺(tái)來進(jìn)行一些非常好的學(xué)術(shù)爭(zhēng)論。我關(guān)注的研究員有 Ilya Sutskever,Trent Mcconaghy Andrej Kappathy,Andrew Trask,Pieter Abeel,Chirs Olah,Nando De Freitas等。
而Hacker News 是另一個(gè)必備的網(wǎng)站,網(wǎng)站對(duì)新聞選擇很謹(jǐn)慎,只有最好的觀點(diǎn)和論據(jù)才能置頂。
以上所有的資源都是基于視頻的,通過使用視頻和簡(jiǎn)短的網(wǎng)絡(luò)文本形式可以學(xué)得更好。而僅僅使用純文本的方式,記錄下一個(gè)個(gè)的公式,卻沒有實(shí)際應(yīng)用,效果不佳。
第一個(gè)月:數(shù)學(xué)
現(xiàn)在開始,進(jìn)入第一個(gè)月的學(xué)習(xí)——數(shù)學(xué)。我們將從大多數(shù)機(jī)器學(xué)習(xí)的組成——線性代數(shù)開始。麻省理工公開課中最受歡迎的課程就是Gillbert Strang教授的線性代數(shù)課程。在YouTube的播放列表中有35個(gè)視頻可以進(jìn)行觀看,如果時(shí)間緊張,可以2倍速觀看每一個(gè)視頻,甚至3倍速。
觀看的時(shí)候要做筆記,記錄并不是必要的,只是為了鞏固所學(xué)。這樣可以使學(xué)習(xí)更有效率。研究表明,通過手寫筆記,可以提高大腦保存所學(xué)概念的能力。
然后就是微積分。 3Blue1Brown 頻道有一個(gè)很棒的播放列表叫做微積分的本質(zhì),他教你微積分的方式會(huì)讓你覺得微積分就像自己發(fā)明的一樣。
學(xué)習(xí)概率和統(tǒng)計(jì)時(shí),edX(麻省理工和哈佛大學(xué)聯(lián)手創(chuàng)建的開放在線課堂平臺(tái))有一門很好的課程叫做“科學(xué)的不確定性”,你也可以在edX上找到一門很好的算法設(shè)計(jì)和分析課程。由U penn教授執(zhí)教,每一門課程發(fā)布一周。
我們還得練習(xí)加速學(xué)習(xí)。所謂的加速學(xué)習(xí)就是每天不間斷學(xué)習(xí)2到3小時(shí),要像海綿一樣,以更快的速度觀看視頻,看視頻的同時(shí)做筆記。在每個(gè)星期結(jié)束時(shí),完成一個(gè)項(xiàng)目,最好是比較難的項(xiàng)目,這樣有利于提升完善自己。 這些項(xiàng)目都有一頁簡(jiǎn)介,可以在網(wǎng)上找到。學(xué)習(xí)僅僅是把數(shù)據(jù)下載到你的大腦中,你可以使用工具來加速這一過程。
第一周 線性代數(shù):https://ocw.mit.edu/courses/mathematics/18-06-linear-algebra-spring-2010/
第二周 微積分:https://www.youtube.com/playlist?list=PLZHQObOWTQDMsr9K-rj53DwVRMYO3t5Yr
第三周:https://www.edx.org/course/introduction-probability-science-mitx-6-041x-2
第四周 算法:https://www.coursera.org/courses?languages=en&query=Algorithm%20design%20and%20analysis
第二個(gè)月:機(jī)器學(xué)習(xí)
到第二個(gè)月的機(jī)器學(xué)習(xí),有3個(gè)播放列表可以觀看學(xué)習(xí)——數(shù)據(jù)科學(xué)中的 python,智能數(shù)學(xué) 和 Tensorflow 的介紹??匆幌耈dacity機(jī)器學(xué)習(xí)課程的免費(fèi)介紹,制作得相當(dāng)好。接下來的兩個(gè)星期,你可以選擇一些很棒的機(jī)器學(xué)習(xí)項(xiàng)目去完成,利用python編寫自己的代碼。有了好的編譯思想就可以用github鏈接的形式來幫助大家。這個(gè)會(huì)幫助你了解何時(shí)使用特定的機(jī)器學(xué)習(xí)模型以及它是如何在特定的使用案例應(yīng)用中工作的。
另外,我也建議參加一個(gè)非正式的比賽——這是一個(gè)好的方法去學(xué)習(xí),同時(shí)還可以掙錢。通常需要進(jìn)行分類,能分類出某種類型的問題,某種機(jī)器學(xué)習(xí)模型,這種模型一般是顧問提供給公司的高薪機(jī)器學(xué)習(xí)模型。通過自己建立模型,可以學(xué)得更好。
我建議一周選擇兩個(gè)項(xiàng)目從頭開始學(xué)習(xí),這會(huì)為你提供機(jī)器學(xué)習(xí)的實(shí)踐經(jīng)驗(yàn),包括優(yōu)化數(shù)據(jù)預(yù)處理,學(xué)習(xí)類型數(shù)據(jù)分割和模型評(píng)價(jià)。這些都是將海綿模式轉(zhuǎn)換成代碼。許多的數(shù)據(jù)科學(xué)的藝術(shù),在于你做的用于解決特定問題的大量微觀決策。這是練習(xí)微觀決策的很好的機(jī)會(huì),同時(shí)可以評(píng)估每一個(gè)的結(jié)果。
scikit-learn是一個(gè)非常簡(jiǎn)單的框架,能快速實(shí)現(xiàn)一些機(jī)器學(xué)習(xí)模型。你會(huì)發(fā)現(xiàn),在完成一個(gè)任務(wù)的過程當(dāng)中,你會(huì)問自己同樣的問題——如何最好地進(jìn)行數(shù)據(jù)分割?什么是最好的參數(shù)?……
月底的時(shí)候,你應(yīng)該給自己最后一個(gè)項(xiàng)目,那就是簡(jiǎn)單梯度下降算法代碼。這是機(jī)器學(xué)習(xí)中最常用的優(yōu)化策略。如果你可以從頭開始編碼,那么一切都會(huì)變得更容易。
第一周
數(shù)據(jù)科學(xué)中的 python https://www.youtube.com/watch?v=T5pRlIbr6gg
智能數(shù)學(xué) https://www.youtube.com/watch?v=xRJCOz3AfYY
介紹Tensorflow https://www.youtube.com/watch?v=2FmcHiLCwTU
第二周
Udacity機(jī)器學(xué)習(xí) https://eu.udacity.com/course/intro-to-machine-learning--ud120
第三、四周
機(jī)器學(xué)習(xí)項(xiàng)目 https://github.com/NirantK/awesome-project-ideas
第三個(gè)月:深度學(xué)習(xí)
進(jìn)入第3個(gè)月,深度學(xué)習(xí)是一種特定的算法,即神經(jīng)網(wǎng)絡(luò)算法。這種算法需要給定大量的數(shù)據(jù)和強(qiáng)大的計(jì)算能力,它的效果和時(shí)間都優(yōu)于其它算法,這就是為什么它如此受歡迎。
看看我在YouTube上對(duì)深度學(xué)習(xí)課程的介紹,看一下Fast.AI的課程——有36小時(shí)高質(zhì)量課程是免費(fèi)的。在過去兩周里,僅僅實(shí)現(xiàn)了在深度學(xué)習(xí)應(yīng)用里實(shí)現(xiàn)深度學(xué)習(xí)應(yīng)用。期間,你的github上應(yīng)該至少有5-10個(gè)項(xiàng)目涉及到機(jī)器學(xué)習(xí)和深度學(xué)習(xí)。你可以從簡(jiǎn)單的感知器學(xué)習(xí)到最先進(jìn)的模型,它們的差異通常只是在結(jié)構(gòu)上的一些小的調(diào)整?,F(xiàn)在深層學(xué)習(xí)空間擁有豐富的技術(shù)文獻(xiàn),其中一些好東西都是免費(fèi)的。
3個(gè)月之后,不管是你機(jī)器學(xué)習(xí)領(lǐng)域工作的工程師,或是開了一家咨詢公司,還是開發(fā)出自己的基于 AI 的產(chǎn)品,都應(yīng)該有足夠的信心運(yùn)用你所學(xué)的知識(shí)。不要告訴自己,我學(xué)不會(huì)或者我不夠聰明。記住,學(xué)習(xí)是一個(gè)漫長(zhǎng)的過程,不管你有多大的年紀(jì),從哪里來,你都可以實(shí)現(xiàn)這個(gè)目標(biāo)。借助互聯(lián)網(wǎng)的力量,你可以在這個(gè)領(lǐng)域產(chǎn)生影響。
如果你不喜歡我的學(xué)習(xí)計(jì)劃,那就自己制定一個(gè)吧。做最適合你自己的事情,最好是讓一個(gè)朋友和你一起同步學(xué)習(xí),這樣就能彼此監(jiān)督鼓勵(lì),而不半途而廢。只要給自己一個(gè)積極的心理暗示,就不會(huì)輕易放棄。
人工智能將覆蓋每一個(gè)行業(yè),改變它對(duì)人類的意義。不管你是否理解它,不管你支持那一邊,這一切都發(fā)生得十分迅猛。 開始你的學(xué)習(xí)之旅吧,我在這里等大家。
第一周 深度學(xué)習(xí)介紹 https://www.youtube.com/watch?v=vOppzHpvTiQ
第二周 Fast.AI的深度學(xué)習(xí) http://course.fast.ai/
第三、四周 我Github上的深度學(xué)習(xí)實(shí)例 https://github.com/llSourcell?tab=repositories
視頻原址 https://www.youtube.com/watch?v=Cr6VqTRO1v0
更多文章,關(guān)注雷鋒網(wǎng) 雷鋒網(wǎng)
添加雷鋒字幕組微信號(hào)(leiphonefansub)為好友
備注「我要加入」,To be an AI Volunteer !
雷峰網(wǎng)原創(chuàng)文章,未經(jīng)授權(quán)禁止轉(zhuǎn)載。詳情見轉(zhuǎn)載須知。