1
本文作者: AI研習(xí)社-譯站 | 2018-11-30 10:18 |
本文為 AI 研習(xí)社編譯的技術(shù)博客,原標(biāo)題 :
What is Deep Learning and how does it work? The easy guide for everyone
作者 | Alexandre Gonfalonieri
翻譯 | M惠M、孫大力
校對(duì) | 醬番梨 整理 | 菠蘿妹
原文鏈接:
https://towardsdatascience.com/what-is-deep-learning-and-how-does-it-work-the-easy-guide-for-everyone-3fd7b65dbd55
我們都熟悉“人工智能”這個(gè)詞。但你最近可能聽(tīng)說(shuō)過(guò)“機(jī)器學(xué)習(xí)” ( Machine Learning )和“深度學(xué)習(xí)” ( Deep Learning ) 等其他術(shù)語(yǔ),它們有時(shí)會(huì)與人工智能 ( AI ) 互換使用。因此,人工智能、機(jī)器學(xué)習(xí)和深度學(xué)習(xí)之間的區(qū)別可能非常不清楚。
關(guān)于這個(gè)主題的文章通常都有很多的高等數(shù)學(xué)、代碼,或者是其他令人困惑的高層次,以致于無(wú)法觸及。
通過(guò)本文,您將了解AI和機(jī)器學(xué)習(xí)的基礎(chǔ)知識(shí)。此外,您將了解最流行的機(jī)器學(xué)習(xí)類型深度學(xué)習(xí)是如何工作的。
在深入學(xué)習(xí)深度學(xué)習(xí)的原理之前,我們必須先解釋下重要術(shù)語(yǔ)之間的差異。
人工智能vs機(jī)器學(xué)習(xí)
人工智能是計(jì)算機(jī)科學(xué)的一個(gè)分支,研究計(jì)算機(jī)中智能行為的仿真。
每當(dāng)一臺(tái)機(jī)器根據(jù)一組預(yù)先定義的解決問(wèn)題的規(guī)則來(lái)完成任務(wù)時(shí),這種行為就被稱為人工智能。
開(kāi)發(fā)人員引入了大量計(jì)算機(jī)需要遵守的規(guī)則。計(jì)算機(jī)內(nèi)部存在一個(gè)可能行為的具體清單,它會(huì)根據(jù)這個(gè)清單做出決定。如今,人工智能是一個(gè)概括性術(shù)語(yǔ),涵蓋了從高級(jí)算法到實(shí)際機(jī)器人的所有內(nèi)容。
我們有四個(gè)不同層次的AI,讓我們來(lái)解釋前兩個(gè):
弱人工智能,也被稱為狹義人工智能,是一種為特定的任務(wù)而設(shè)計(jì)和訓(xùn)練的人工智能系統(tǒng)。弱人工智能的形式之一是虛擬個(gè)人助理,比如蘋果公司的Siri。
強(qiáng)人工智能,又稱人工通用智能,是一種具有人類普遍認(rèn)知能力的人工智能系統(tǒng)。當(dāng)計(jì)算機(jī)遇到不熟悉的任務(wù)時(shí),它具有足夠的智能去尋找解決方案。
機(jī)器學(xué)習(xí)是指計(jì)算機(jī)使用大數(shù)據(jù)集而不是硬編碼規(guī)則來(lái)學(xué)習(xí)的能力。
機(jī)器學(xué)習(xí)允許計(jì)算機(jī)自己學(xué)習(xí)。這種學(xué)習(xí)方式利用了現(xiàn)代計(jì)算機(jī)的處理能力,可以輕松地處理大型數(shù)據(jù)集。
基本上,機(jī)器學(xué)習(xí)是人工智能的一個(gè)子集;更為具體地說(shuō),它只是一種實(shí)現(xiàn)AI的技術(shù),一種訓(xùn)練算法的模型,這種算法使得計(jì)算機(jī)能夠?qū)W習(xí)如何做出決策。
從某種意義上來(lái)說(shuō),機(jī)器學(xué)習(xí)程序根據(jù)計(jì)算機(jī)所接觸的數(shù)據(jù)來(lái)進(jìn)行自我調(diào)整。
監(jiān)督式學(xué)習(xí)vs非監(jiān)督式學(xué)習(xí)
監(jiān)督式學(xué)習(xí)需要使用有輸入和預(yù)期輸出標(biāo)記的數(shù)據(jù)集。
當(dāng)你使用監(jiān)督式學(xué)習(xí)訓(xùn)練人工智能時(shí),你需要提供一個(gè)輸入并告訴它預(yù)期的輸出結(jié)果。
如果人工智能產(chǎn)生的輸出結(jié)果是錯(cuò)誤的,它將重新調(diào)整自己的計(jì)算。這個(gè)過(guò)程將在數(shù)據(jù)集上不斷迭代地完成,直到AI不再出錯(cuò)。
監(jiān)督式學(xué)習(xí)的一個(gè)例子是天氣預(yù)報(bào)人工智能。它學(xué)會(huì)利用歷史數(shù)據(jù)來(lái)預(yù)測(cè)天氣。訓(xùn)練數(shù)據(jù)包含輸入(過(guò)去天氣的壓力、濕度、風(fēng)速)和輸出(過(guò)去天氣的溫度)。
我們還可以想象您正在提供一個(gè)帶有標(biāo)記數(shù)據(jù)的計(jì)算機(jī)程序。例如,如果指定的任務(wù)是使用一種圖像分類算法對(duì)男孩和女孩的圖像進(jìn)行分類,那么男孩的圖像需要帶有“男孩”標(biāo)簽,女孩的圖像需要帶有“女孩”標(biāo)簽。這些數(shù)據(jù)被認(rèn)為是一個(gè)“訓(xùn)練”數(shù)據(jù)集,直到程序能夠以可接受的速率成功地對(duì)圖像進(jìn)行分類,以上的標(biāo)簽才會(huì)失去作用。
它之所以被稱為監(jiān)督式學(xué)習(xí),是因?yàn)樗惴◤挠?xùn)練數(shù)據(jù)集學(xué)習(xí)的過(guò)程就像是一位老師正在監(jiān)督學(xué)習(xí)。在我們預(yù)先知道正確的分類答案的情況下,算法對(duì)訓(xùn)練數(shù)據(jù)不斷進(jìn)行迭代預(yù)測(cè),然后預(yù)測(cè)結(jié)果由“老師”進(jìn)行不斷修正。當(dāng)算法達(dá)到可接受的性能水平時(shí),學(xué)習(xí)過(guò)程才會(huì)停止。
非監(jiān)督式學(xué)習(xí)是利用既不分類也不標(biāo)記的信息進(jìn)行機(jī)器學(xué)習(xí),并允許算法在沒(méi)有指導(dǎo)的情況下對(duì)這些信息進(jìn)行操作。
當(dāng)你使用非監(jiān)督式學(xué)習(xí)訓(xùn)練人工智能時(shí),你可以讓人工智能對(duì)數(shù)據(jù)進(jìn)行邏輯分類。這里機(jī)器的任務(wù)是根據(jù)相似性、模式和差異性對(duì)未排序的信息進(jìn)行分組,而不需要事先對(duì)數(shù)據(jù)進(jìn)行處理。
非監(jiān)督式學(xué)習(xí)的一個(gè)例子是亞馬遜等電子商務(wù)網(wǎng)站的行為預(yù)測(cè)AI。
它將創(chuàng)建自己輸入數(shù)據(jù)的分類,幫助亞馬遜識(shí)別哪種用戶最有可能購(gòu)買不同的產(chǎn)品(交叉銷售策略)。
另一個(gè)例子是,程序可以任意地使用以下兩種算法中的一種來(lái)完成男孩女孩的圖像分類任務(wù)。一種算法被稱為“聚類”,它根據(jù)諸如頭發(fā)長(zhǎng)度、下巴大小、眼睛位置等特征將相似的對(duì)象分到同一個(gè)組。另一種算法被稱為“相關(guān)”,它根據(jù)自己發(fā)現(xiàn)的相似性創(chuàng)建if/then規(guī)則。換句話說(shuō),它確定了圖像之間的公共模式,并相應(yīng)地對(duì)它們進(jìn)行分類。
什么是深度學(xué)習(xí),以及它是如何工作的。
深度學(xué)習(xí)是一種機(jī)器學(xué)習(xí)方法 , 它允許我們訓(xùn)練人工智能來(lái)預(yù)測(cè)輸出,給定一組輸入(指?jìng)魅牖騻鞒鲇?jì)算機(jī)的信息)。監(jiān)督學(xué)習(xí)和非監(jiān)督學(xué)習(xí)都可以用來(lái)訓(xùn)練人工智能。
Andrew Ng:“與深度學(xué)習(xí)類似的是,火箭發(fā)動(dòng)機(jī)是深度學(xué)習(xí)模型,燃料是我們可以提供給這些算法的海量數(shù)據(jù)。”
我們將通過(guò)建立一個(gè)公交票價(jià)估算在線服務(wù)來(lái)了解深度學(xué)習(xí)是如何工作的。為了訓(xùn)練它,我們將使用監(jiān)督學(xué)習(xí)方法。
我們希望我們的巴士票價(jià)估價(jià)師使用以下信息/輸入來(lái)預(yù)測(cè)價(jià)格:
神經(jīng)網(wǎng)絡(luò)
神經(jīng)網(wǎng)絡(luò)是一組粗略模仿人類大腦,用于模式識(shí)別的算法。神經(jīng)網(wǎng)絡(luò)這個(gè)術(shù)語(yǔ)來(lái)源于這些系統(tǒng)架構(gòu)設(shè)計(jì)背后的靈感,這些系統(tǒng)是用于模擬生物大腦自身神經(jīng)網(wǎng)絡(luò)的基本結(jié)構(gòu),以便計(jì)算機(jī)能夠執(zhí)行特定的任務(wù)。
和人類一樣, “AI價(jià)格評(píng)估”也是由神經(jīng)元(圓圈)組成的。此外,這些神經(jīng)元還是相互連接的。
神經(jīng)元分為三種不同類型的層次:
輸入層接收輸入數(shù)據(jù)。在我們的例子中,輸入層有四個(gè)神經(jīng)元:出發(fā)站、目的地站、出發(fā)日期和巴士公司。輸入層會(huì)將輸入數(shù)據(jù)傳遞給第一個(gè)隱藏層。
隱藏層對(duì)輸入數(shù)據(jù)進(jìn)行數(shù)學(xué)計(jì)算。創(chuàng)建神經(jīng)網(wǎng)絡(luò)的挑戰(zhàn)之一是決定隱藏層的數(shù)量,以及每一層中的神經(jīng)元的數(shù)量。
人工神經(jīng)網(wǎng)絡(luò)的輸出層是神經(jīng)元的最后一層,主要作用是為此程序產(chǎn)生給定的輸出,在本例中輸出結(jié)果是預(yù)測(cè)的價(jià)格值。
神經(jīng)元之間的每個(gè)連接都有一個(gè)權(quán)重。這個(gè)權(quán)重表示輸入值的重要性。模型所做的就是學(xué)習(xí)每個(gè)元素對(duì)價(jià)格的貢獻(xiàn)有多少。這些“貢獻(xiàn)”是模型中的權(quán)重。一個(gè)特征的權(quán)重越高,說(shuō)明該特征比其他特征更為重要。
在預(yù)測(cè)公交票價(jià)時(shí),出發(fā)日期是影響最終票價(jià)的最為重要的因素之一。因此,出發(fā)日期的神經(jīng)元連接具有較大的“權(quán)重”。
每個(gè)神經(jīng)元都有一個(gè)激活函數(shù)。它主要是一個(gè)根據(jù)輸入傳遞輸出的函數(shù)。
當(dāng)一組輸入數(shù)據(jù)通過(guò)神經(jīng)網(wǎng)絡(luò)中的所有層時(shí),最終通過(guò)輸出層返回輸出數(shù)據(jù)。
通過(guò)訓(xùn)練改進(jìn)神經(jīng)網(wǎng)絡(luò)
為了提高“AI價(jià)格評(píng)估”的精度,我們需要將其預(yù)測(cè)結(jié)果與過(guò)去的結(jié)果進(jìn)行比較,為此,我們需要兩個(gè)要素:
大量的計(jì)算能力;
大量的數(shù)據(jù)。
訓(xùn)練AI的過(guò)程中,重要的是給它的輸入數(shù)據(jù)集(一個(gè)數(shù)據(jù)集是一個(gè)單獨(dú)地或組合地或作為一個(gè)整體被訪問(wèn)的數(shù)據(jù)集合),此外還需要對(duì)其輸出結(jié)果與數(shù)據(jù)集中的輸出結(jié)果進(jìn)行對(duì)比。因?yàn)锳I一直是“新的”,它的輸出結(jié)果有可能是錯(cuò)誤的。
對(duì)于我們的公交票價(jià)模型,我們必須找到過(guò)去票價(jià)的歷史數(shù)據(jù)。由于有大量“公交車站”和“出發(fā)日期”的可能組合,因而我們需要一個(gè)非常大的票價(jià)清單。
一旦我們遍歷了整個(gè)數(shù)據(jù)集,就有可能創(chuàng)建一個(gè)函數(shù)來(lái)衡量AI輸出與實(shí)際輸出(歷史數(shù)據(jù))之間的差異。這個(gè)函數(shù)叫做成本函數(shù)。即成本函數(shù)是一個(gè)衡量模型準(zhǔn)確率的指標(biāo),衡量依據(jù)為此模型估計(jì)X與Y間關(guān)系的能力。
模型訓(xùn)練的目標(biāo)是使成本函數(shù)等于零,即當(dāng)AI的輸出結(jié)果與數(shù)據(jù)集的輸出結(jié)果一致時(shí)(成本函數(shù)等于0)。
我們?nèi)绾谓档统杀竞瘮?shù)呢?
通過(guò)使用一種叫做梯度下降的方法。梯度衡量得是,如果你稍微改變一下輸入值,函數(shù)的輸出值會(huì)發(fā)生多大的變化。
梯度下降法是一種求函數(shù)最小值的方法。在這種情況下,目標(biāo)是取得成本函數(shù)的最小值。
它通過(guò)每次數(shù)據(jù)集迭代之后優(yōu)化模型的權(quán)重來(lái)訓(xùn)練模型。通過(guò)計(jì)算某一權(quán)重集下代價(jià)函數(shù)的梯度,可以看出最小值的梯度方向。
為了降低成本函數(shù)值,多次遍歷數(shù)據(jù)集非常重要。這就是為什么需要大量計(jì)算能力的原因。
一旦我們通過(guò)訓(xùn)練改進(jìn)了AI,我們就可以利用它根據(jù)上述四個(gè)要素來(lái)預(yù)測(cè)未來(lái)的價(jià)格。雷鋒網(wǎng)
人工智能可以分為兩類,一般的和狹義的。
機(jī)器學(xué)習(xí)只是實(shí)現(xiàn)人工智能的一種方式。
深度學(xué)習(xí)是機(jī)器學(xué)習(xí)的一個(gè)分支,它使用神經(jīng)網(wǎng)絡(luò)來(lái)模擬人類的智力。
神經(jīng)網(wǎng)絡(luò)中有三種類型的神經(jīng)元層:輸入層、隱藏層和輸出層。
神經(jīng)元之間的連接與重量有關(guān)
訓(xùn)練神經(jīng)網(wǎng)絡(luò)是很重要的,大數(shù)據(jù)集是必須的。
想要繼續(xù)查看該篇文章相關(guān)鏈接和參考文獻(xiàn)?
長(zhǎng)按鏈接點(diǎn)擊打開(kāi)或點(diǎn)擊【新手必看:深度學(xué)習(xí)是什么?它的工作原理是什么?】:
https://ai.yanxishe.com/page/TextTranslation/1260
AI研習(xí)社每日更新精彩內(nèi)容,觀看更多精彩內(nèi)容:雷鋒網(wǎng)
等你來(lái)譯:雷鋒網(wǎng)
雷峰網(wǎng)原創(chuàng)文章,未經(jīng)授權(quán)禁止轉(zhuǎn)載。詳情見(jiàn)轉(zhuǎn)載須知。