0
本文作者: 三川 | 2017-01-21 20:43 |
編者注:澳大利亞機(jī)器學(xué)習(xí)專家、暢銷書作者 Jason Brownlee,對(duì)機(jī)器學(xué)習(xí)領(lǐng)域的各類優(yōu)質(zhì)書籍進(jìn)行了盤點(diǎn),匯總成這份閱讀指南。在雷鋒網(wǎng)所篩選的學(xué)習(xí)資源中,這堪稱是迄今為止最全面、最完整、權(quán)威性比較高的一份 ML 書單,涵蓋了最值得學(xué)習(xí)者、從業(yè)者、開發(fā)者認(rèn)真研讀的精品書目。這份指南適合多樣背景的讀者:從想要了解機(jī)器學(xué)習(xí)的普通人,到入門新手,再到高階開發(fā)者和學(xué)術(shù)研究人員。因此,雷鋒網(wǎng)對(duì)其進(jìn)行編譯整理,特來與大家分享。
友情提醒:該指南只考慮了英文市場(chǎng)的機(jī)器學(xué)習(xí)圖書,適合大家作為國際 ML 讀物的參考。而例如周志華老師 《機(jī)器學(xué)習(xí)》等國內(nèi)優(yōu)秀著作并沒有體現(xiàn),請(qǐng)讀者見諒。
Jason Brownlee:
我喜歡書,對(duì)于搞到的每一本機(jī)器學(xué)習(xí)書籍,我都要去讀。
我認(rèn)為,有好的參考資源,是對(duì)你心中機(jī)器學(xué)習(xí)謎題進(jìn)行“解惑”的最快方式。閱讀多本書,你就有了看待疑難問題的多種角度。
這份指南中,你會(huì)發(fā)現(xiàn)機(jī)器學(xué)習(xí)領(lǐng)域最值得一讀的好書。
有許多原因促使人們想要機(jī)器學(xué)習(xí)書籍。因此,我采用了三種不同方式對(duì)機(jī)器學(xué)習(xí)書籍進(jìn)行分類、排列,使讀者們能按圖索驥快速查找。比方說:
依據(jù)類別(難易):教材,科普等。
依據(jù)話題:Python,深度學(xué)習(xí)等
依據(jù)出版商:Packt,O’Reilly 等
所有書都包括了亞馬遜或京東鏈接,你可以點(diǎn)擊鏈接了解更多。
找到一個(gè)你最感興趣的話題
瀏覽所選類別的書目
購書、借書、下載
從頭讀到尾
重復(fù)以上過程
把書擺在家里、辦公室顯眼的地方,跟你讀過那本書是兩碼事。別瞎搞收藏。
這是面向普通大眾的機(jī)器學(xué)習(xí)書目。它們讓你體會(huì)到機(jī)器學(xué)習(xí)和數(shù)據(jù)科學(xué)的優(yōu)點(diǎn)和益處,但免去了理論和應(yīng)用細(xì)節(jié)。我還加入了一些個(gè)人非常喜歡的、偏“統(tǒng)計(jì)思維”的流行科普讀物。
The Master Algorithm: How the Quest for the Ultimate Learning Machine Will Remake Our World
Predictive Analytics: The Power to Predict Who Will Click, Buy, Lie, or Die
The Signal and the Noise: Why So Many Predictions Fail–but Some Don't
該類別的首選是: The Signal and the Noise
與上述讀物的樂觀相比,提供了反面觀點(diǎn)的是:Weapons of Math Destruction: How Big Data Increases Inequality and Threatens Democracy.
真正面向零基礎(chǔ)初學(xué)者的機(jī)器學(xué)習(xí)書籍,基本上是一片市場(chǎng)空白。下面的這些書,既包含了科普讀物(見 1.1)中使用機(jī)器學(xué)習(xí)的益處,也部分包含了多見于入門書籍(見 1.3)的應(yīng)用細(xì)節(jié)。
Data Science for Business: What You Need to Know about Data Mining and Data-Analytic Thinking
Data Smart: Using Data Science to Transform Information into Insight
Data Mining: Practical Machine Learning Tools and Techniques (第四版)
該類別的首選是:Data Mining: Practical Machine Learning Tools and Techniques (數(shù)據(jù)挖掘:實(shí)用機(jī)器學(xué)習(xí)工具與技術(shù))
下面是菜鳥入門的首選書單。相當(dāng)于本科生級(jí)別的機(jī)器學(xué)習(xí)資源,適合基礎(chǔ)學(xué)習(xí)者以及開發(fā)者新手。它們覆蓋了廣泛的機(jī)器學(xué)習(xí)話題,傾向于“怎么做”,而非“為什么”或是探討理論。
Machine Learning for Hackers: Case Studies and Algorithms to Get You Started
Programming Collective Intelligence: Building Smart Web 2.0 Applications
譯本:集體智慧編程
An Introduction to Statistical Learning: with Applications in R
該類別的首選是:An Introduction to Statistical Learning: with Applications in R (統(tǒng)計(jì)學(xué)習(xí)導(dǎo)論:基于R應(yīng)用)
下面是世界一流機(jī)器學(xué)習(xí)教材的列表。這些是研究生課程中會(huì)使用到的教科書,覆蓋了一系列方法和背后的理論。
The Elements of Statistical Learning: Data Mining, Inference, and Prediction
譯本:統(tǒng)計(jì)學(xué)習(xí)基礎(chǔ):數(shù)據(jù)挖掘、推理與預(yù)測(cè)
Machine Learning: The Art and Science of Algorithms that Make Sense of Data
該類別的首選是: The Elements of Statistical Learning: Data Mining, Inference, and Prediction (統(tǒng)計(jì)學(xué)習(xí)基礎(chǔ):數(shù)據(jù)挖掘、推理與預(yù)測(cè))
R 語言平臺(tái)的應(yīng)用機(jī)器學(xué)習(xí)書目。
R for Data Science: Import, Tidy, Transform, Visualize, and Model Data
Machine Learning With R Cookbook – 110 Recipes for Building Powerful Predictive Models with R
國內(nèi)名為:R語言機(jī)器學(xué)習(xí)參考手冊(cè)(英文影印版)
An Introduction to Statistical Learning: with Applications in R
R and Data Mining: Examples and Case Studies
譯本:計(jì)算機(jī)科學(xué)叢書:R語言與數(shù)據(jù)挖掘最佳實(shí)踐和經(jīng)典案例
該類別的首選是:Applied Predictive Modeling(應(yīng)用預(yù)測(cè)建模)
使用 Python 或 SciPy 語言平臺(tái)的應(yīng)用機(jī)器學(xué)習(xí)書目。
國內(nèi)名為:Python 語言構(gòu)建機(jī)器學(xué)習(xí)系統(tǒng)(英文影印版)
Introduction to Machine Learning with Python: A Guide for Data Scientists
Machine Learning in Python: Essential Techniques for Predictive Analysis
Python Data Science Handbook: Essential Tools for Working with Data
Introducing Data Science: Big Data, Machine Learning, and more, using Python tools
該類別的首選是: Python Machine Learning (Python 語言構(gòu)建機(jī)器學(xué)習(xí)系統(tǒng))
深度學(xué)習(xí)書目?,F(xiàn)在沒幾本深度學(xué)習(xí)的好書,所以我只得用數(shù)量彌補(bǔ)質(zhì)量。其中有許多專門針對(duì) Tesnorflow 的教程。雷鋒網(wǎng)注:該類推薦書目“全軍覆沒”——沒有一本書有中文譯本。這或許是因?yàn)樯疃葘W(xué)習(xí)領(lǐng)域理論框架尚不完善,缺乏影響力巨大的著作。
Fundamentals of Deep Learning: Designing Next-Generation Machine Intelligence Algorithms
Learning TensorFlow: A guide to building deep learning systems
TensorFlow for Machine Intelligence: A Hands-On Introduction to Learning Algorithms
該類別毫無疑問的首選是:Deep Learning.
另外,Michael Nielsen 的免費(fèi)電子書 Neural Networks and Deep Learning 簡(jiǎn)單易懂,深受許多入門學(xué)習(xí)者的喜愛,雷鋒網(wǎng)將其添加在這里,以作補(bǔ)充。
時(shí)間序列預(yù)測(cè)領(lǐng)域最值得一讀的書目。在該技術(shù)的應(yīng)用方面,目前 R 語言是霸主。
該類別的入門首選是:Forecasting: principles and practice.
該類別的首選教材是:Time Series Analysis: Forecasting and Control.
有三個(gè)出版商在機(jī)器學(xué)習(xí)領(lǐng)域下了大力氣,并且在認(rèn)真出版圖書。
它們是: O'Reilly, Manning 和 Packt。它們的焦點(diǎn)是應(yīng)用書籍。該榜單上的書籍質(zhì)量參差不齊:從嚴(yán)謹(jǐn)設(shè)計(jì)、編排的圖書到裝訂在一起的博文。
在它們的“數(shù)據(jù)”類別,O'Reilly 有超過 100 本圖書,許多與機(jī)器學(xué)習(xí)相關(guān)。以下是最暢銷的幾本:
Programming Collective Intelligence: Building Smart Web 2.0 Applications
譯本:集體智慧編程
Introduction to Machine Learning with Python: A Guide for Data Scientists
Fundamentals of Deep Learning: Designing Next-Generation Machine Intelligence Algorithms
Python Data Science Handbook: Essential Tools for Working with Data
這些書中,Programming Collective Intelligence: Building Smart Web 2.0 Applications (集體智慧編程) 或許是開創(chuàng)了 O'Reilly 該目錄的書,一直很受歡迎。
Manning 的書偏實(shí)用,并且質(zhì)量還行,雖然數(shù)量沒 O’Reilly 和 Packt 那么多。
Manning 目錄里較突出的一本是 Machine Learning in Action(機(jī)器學(xué)習(xí)實(shí)戰(zhàn)),這也許同樣是因?yàn)?,它是該出版社在機(jī)器學(xué)習(xí)和數(shù)據(jù)科學(xué)領(lǐng)域的第一本出版物。
感覺上 Packt 全面擁抱了數(shù)據(jù)科學(xué)和機(jī)器學(xué)習(xí)領(lǐng)域的圖書出版。他們有一大堆針對(duì)晦澀難懂機(jī)器學(xué)習(xí)庫的書。在流行話題上面,比如 R 和 Python,也有不少書籍出版。雷鋒網(wǎng)注:可惜的是,Packt 似乎不重視漢語市場(chǎng),旗下主要機(jī)器學(xué)習(xí)圖書并沒有中文譯本。
以下是一些較流行的書目:
相關(guān)文章:
開發(fā)者入門必讀:最值得看的十大機(jī)器學(xué)習(xí)公開課
2016十大 AI 演講盤點(diǎn),大牛們都發(fā)表了什么真知灼見?
雷峰網(wǎng)版權(quán)文章,未經(jīng)授權(quán)禁止轉(zhuǎn)載。詳情見轉(zhuǎn)載須知。