丁香五月天婷婷久久婷婷色综合91|国产传媒自偷自拍|久久影院亚洲精品|国产欧美VA天堂国产美女自慰视屏|免费黄色av网站|婷婷丁香五月激情四射|日韩AV一区二区中文字幕在线观看|亚洲欧美日本性爱|日日噜噜噜夜夜噜噜噜|中文Av日韩一区二区

您正在使用IE低版瀏覽器,為了您的雷峰網賬號安全和更好的產品體驗,強烈建議使用更快更安全的瀏覽器
此為臨時鏈接,僅用于文章預覽,將在時失效
人工智能 正文
發(fā)私信給AI研習社-譯站
發(fā)送

1

不知道如何開始機器學習?這有份初學者指南!

本文作者: AI研習社-譯站 2018-04-08 17:21
導語:機器學習從0到1系列

雷鋒網按:本文為雷鋒字幕組編譯的技術博客,原標題Math, Stats and NLP for Machine Learning: As Fast As Possible,作者為Souman Roy。

翻譯 | 廖穎  龍珂宇  Noddleslee  J叔   整理 |  凡江

機器學習: 引言

聽過人們談論過機器學習,但對它的概念卻是一知半解?

想要從零開始機器學習,卻被網絡上的海量資源沖昏頭腦?

不用擔心,我們給你們提供了機器學習從0到1系列,這個系列可以讓你從入門到精通。

現(xiàn)在就開始學習吧!

· · ·

這份指南是為了那些對機器學習感興趣,但不知如何開始的朋友們準備的。我想大多厭倦在網上搜索大量資料的人都會有挫敗感,也放棄了有人能指引他們如何入門的希望。

這個系列的目標,就是教會你們從初學者的角度,正確學習機器學習。

· · ·

為什么說數(shù)學是必須的?

機器學習建立在一些數(shù)學的基礎課程上的,比如微積分,線性代數(shù),概率論,統(tǒng)計學和最優(yōu)化。這篇文章旨在幫助你們學習一些基本概念,并提供一個可在 Jupiter Notebook 上使用 python 程序設計語言的可操作方法。

不知道如何開始機器學習?這有份初學者指南!

第1步 : 線性代數(shù)

線性代數(shù)是在計算機里設計優(yōu)化算法的一種方式?——可以解決線性系統(tǒng)約束問題。

線性代數(shù)中你需要了解的概念:

#1 矩陣的秩;

#2 矩陣向量積;

#3 矩陣的列空間和零空間;

#4 特征值和特征向量;

#5 矩陣的奇異值分解;

這是一個了解線性代數(shù)概念的速查表:

不知道如何開始機器學習?這有份初學者指南!

來源:https://minireference.com/static/tutorials/linear_algebra_in_4_pages.pdf

第2步 :概率論和數(shù)理統(tǒng)計

這一數(shù)學分支是用來解決隨機分布量問題的。

概率論與數(shù)理統(tǒng)計中你需要了解的概念:

概率論:

#1 計數(shù)方法和組合方法;

#2 貝葉斯理論;

#3 隨機變量;

#4 期望;

#5 方差;

#6 條件分布和聯(lián)合分布; 

#7 矩量母函數(shù);

#8 指數(shù)型分布族;

數(shù)理統(tǒng)計: 

#1 最大似然估計;

#2 最大后驗概率;

#3 先驗概率和后驗概率;

#4 抽查法;

#5 吉布斯現(xiàn)象;

#6 平均數(shù),眾數(shù),中位數(shù),方差;

這是一個了解概率論和數(shù)理統(tǒng)計概念的速查表 :

不知道如何開始機器學習?這有份初學者指南!

來源: https://static1.squarespace.com/static/54bf3241e4b0f0d81bf7ff36/t/55e9494fe4b011aed10e48e5/1441352015658/probability_cheatsheet.pdf

不知道如何開始機器學習?這有份初學者指南!

來源: http://web.mit.edu/~csvoss/Public/usabo/stats_handout.pdf

第3步 :多元微積分

經典微積分研究變量和變化率之間的關系。但在機器學習中,我們主要使用微分運算來求解函數(shù)的極值,使用積分運算來求解概率模型。

多元微積分中你需要掌握的概念

#1 向量值函數(shù)

#2 偏導函數(shù)

#3 梯度

#4 方向梯度

#5 黑塞算子

#6 雅各比算子

#7 拉普拉斯算子(低量算子)

#8 拉格朗日乘子

不知道如何開始機器學習?這有份初學者指南!

來源: http://tutorial.math.lamar.edu/getfile.aspx?file=B,41,N

第4步:信息論入門

信息論是應用數(shù)學的一個分支,它關注如何“度量“信息。

信息論中你需要掌握的概念:

#1 熵

#2 互信息

#3 信息增益

#4 KL散度(相對熵)

不知道如何開始機器學習?這有份初學者指南!

來源:http://tuvalu.santafe.edu/~simon/cheat_sheet_info.pdf

第5步:NLP(自然語言處理)

自然語言出來指的是利用軟件自動地處理注入講話和文本的技術。

不知道如何開始機器學習?這有份初學者指南!

做為對文本數(shù)據(jù)感興趣的機器學習實踐者,我們關心自然語言領域的工具和方法。

廣義上,利用計算機處理的任何自然語言,均視為自然語言處理,或縮寫為NLP。一個極端的理解比如說,可以簡單地通過統(tǒng)計詞頻來比較不同作者的寫作風格。另一個極端理解是,NLP應該包括理解完整的人類話語,至少某種程度給予有意義的回應。

— 第9頁,利用python進行自然語言處理,2009。

自然語言處理(NLP)指人類語言的一系列自動處理過程的集合名詞。它既包含處理人類輸出的文本,也包含輸出人類可以看的文本。

— 第18頁,利用神經網絡進行自然語言處理, 2017。

語言學的目標是可以將我們周圍所能大量觀察到的對話、文章文本和其他媒介特征化并對其進行解釋。這里既包括研究人類認知,產生和理解語言的能力,也包含理解語言表達方式和客觀世界的關系,還包含理解不同語言的語言結構。

— 第3頁,統(tǒng)計自然語言處理,1999。


這些是必備的數(shù)學、統(tǒng)計自然語言處理知識。我的建議是如果你想深入探索機器學習,你至少需要掌握提到的一些概念。

不知道如何開始機器學習?這有份初學者指南!

· · ·

你過去可能想知道機器學習到底用到了哪些數(shù)學知識,這篇文章算是給你介紹了機器學習(AI)的起步階段所需的一些數(shù)學概念。下章我會討論如何把數(shù)學概念落實到用Python編程中去,為此,也會對Python這門編程語言及其生態(tài)系統(tǒng)作介紹,敬請期待吧!

· · ·



更多文章,關注雷鋒網  雷鋒網雷鋒網

添加雷鋒字幕組微信號(leiphonefansub)為好友

備注「我要加入」,To be an  AI  Volunteer !

不知道如何開始機器學習?這有份初學者指南!


雷峰網原創(chuàng)文章,未經授權禁止轉載。詳情見轉載須知。

不知道如何開始機器學習?這有份初學者指南!

分享:

知情人士

AI研習社(yanxishe.com)譯站頻道,傳播前沿人工智能知識,讓語言不再成為學習知識的門檻。(原雷鋒字幕組)
當月熱門文章
最新文章
請?zhí)顚懮暾埲速Y料
姓名
電話
郵箱
微信號
作品鏈接
個人簡介
為了您的賬戶安全,請驗證郵箱
您的郵箱還未驗證,完成可獲20積分喲!
請驗證您的郵箱
立即驗證
完善賬號信息
您的賬號已經綁定,現(xiàn)在您可以設置密碼以方便用郵箱登錄
立即設置 以后再說