丁香五月天婷婷久久婷婷色综合91|国产传媒自偷自拍|久久影院亚洲精品|国产欧美VA天堂国产美女自慰视屏|免费黄色av网站|婷婷丁香五月激情四射|日韩AV一区二区中文字幕在线观看|亚洲欧美日本性爱|日日噜噜噜夜夜噜噜噜|中文Av日韩一区二区

您正在使用IE低版瀏覽器,為了您的雷峰網賬號安全和更好的產品體驗,強烈建議使用更快更安全的瀏覽器
此為臨時鏈接,僅用于文章預覽,將在時失效
人工智能開發(fā)者 正文
發(fā)私信給AI研習社-譯站
發(fā)送

0

揭開AI、機器學習和深度學習的神秘面紗

本文作者: AI研習社-譯站 2020-11-02 11:56
導語:這篇文章旨在激發(fā)你對自己數據的回顧,以發(fā)現新的機會。

譯者:AI研習社(Disillusion

雙語原文鏈接:https://www.yanxishe.com/TextTranslation/2998


深度學習、機器學習、人工智能——這些流行詞皆代表了分析學的未來。在這篇文章中,我們將通過一些真實世界的案例來解釋什么是機器學習和深度學習。在以后的文章中,我們將探索垂直用例。這樣做的目的不是要把你變成一個數據科學家,而是讓你更好地理解你可以用機器學習做什么。開發(fā)人員能越來越容易地使用機器學習,數據科學家時常與領域專家、架構師、開發(fā)人員和數據工程師一起工作,因此,詳細了解機器學習的可能性對每個人來說都很重要。你的業(yè)務產生的每一條信息都有增加價值的潛力。這篇和以后的文章旨在激發(fā)你對自己數據的回顧,以發(fā)現新的機會。  

什么是人工智能?

縱觀人工智能的歷史,其定義被不斷重寫。人工智能是一個概括性術語(這個概念始于50年代);機器學習是AI的子集,而深度學習又是機器學習的子集。  

1985年,當我還是美國國家安全局的實習生時,人工智能也是一個非常熱門的話題。在美國國家安全局,我甚至上了一節(jié)麻省理工關于人工智能專家系統(tǒng)的視頻課程。專家系統(tǒng)在規(guī)則引擎中捕獲專家的知識。規(guī)則引擎在金融和醫(yī)療保健等行業(yè)中有廣泛的應用,最近更是用于事件處理,但是當數據發(fā)生變化時,規(guī)則的更新和維護會變得異常困難。機器學習的優(yōu)勢在于從數據中學習,并且可以提供數據驅動的概率預測。  

在過去10年里,分析學發(fā)生了怎樣的變化?

根據《哈佛商業(yè)評論》的托馬斯?達文波特,分析技術過去十年里發(fā)生了翻天覆地的變化,跨商用服務器功能更強大、成本更低的分布式計算,流媒體分析、改進的機器學習技術,都使企業(yè)能夠存儲和分析更多的、不同類型的數據。  

類似Apache Spark這樣的技術使用迭代算法,通過在內存中跨迭代緩存數據并使用更輕量級的線程,進一步加速了分布式數據的并行處理。  

圖形處理單元(GPUs)加快了多核服務器的并行處理速度。GPU擁有一個由數千個更小、更高效的核心組成的大規(guī)模并行架構,這些核心專門設計用于同時處理多任務,而CPU由幾個為順序串行處理而優(yōu)化的核心組成。就潛在的性能而言,從Cray -1進化到如今擁有大量GPU的集群,其性能提升大約是曾經世界上最快計算機的100萬倍,而成本卻只有其極小一部分。  

什么是機器學習?

機器學習使用算法在數據中發(fā)現模式,然后使用一個能識別這些模式的模型對新的數據進行預測。 

一般來說,機器學習可以分為三種類型:監(jiān)督型、非監(jiān)督型、介于兩者之間。監(jiān)督學習算法使用標記數據,而非監(jiān)督學習算法在未標記數據中發(fā)現模式。半監(jiān)督學習使用標記數據和未標記數據的混合。強化學習訓練算法在反饋的基礎上最大化獎勵。 

監(jiān)督學習

監(jiān)督算法使用標記數據,這些數據的輸入和目標的結果或標簽都會提供給算法。  

監(jiān)督學習也被稱為預測建模或預測分析,因為你建立了一個能夠做出預測的模型。預測建模的一些例子是分類和回歸。分類根據已知項的已標記示例(例如,已知是否為欺詐的交易)來識別一個項屬于哪個類別(例如,某交易是否為欺詐)。邏輯回歸預測了一個概率——例如,欺詐的概率。線性回歸預測一個數值——例如,欺詐的數量。

一些分類的例子包括:

  • 信用卡欺詐檢測(欺詐,不是欺詐)。  

  • 信用卡申請(良好信用,不良信用)。  

  • 垃圾郵件檢測(垃圾郵件,不是垃圾郵件)。  

  • 文字情緒分析(快樂,不快樂)。  

  • 預測患者風險(高風險患者、低風險患者)。  

  • 惡性或非惡性腫瘤的分類。  

邏輯回歸(或其他算法)的一些例子包括:

  • 根據歷史汽車保險欺詐性索賠以及這些索賠的特征,例如索賠人的年齡、索賠金額、事故嚴重程度等,預測欺詐發(fā)生的概率。

  • 給定患者特征,預測充血性心力衰竭的概率。  

So線性回歸的一些例子包括: 

  • 根據歷史汽車保險欺詐性索賠以及這些索賠的特征,如索賠人的年齡、索賠金額、事故的嚴重程度等,預測欺詐金額。

  • 根據歷史房地產銷售價格和房屋特征(如平方英尺,臥室數量,位置),預測房子的價格。  

  • 根據歷史上的社區(qū)犯罪統(tǒng)計,預測犯罪率。

這里還有其他的監(jiān)督和非監(jiān)督學習算法,我們不會一一介紹,但我們會詳細介紹每類中的一個。 

分類示例 :借記卡詐騙  

分類選用一組具有已知標簽和預先確定特性的數據,并學習如何根據這些信息標記新數據。特性是你問的“是否”問題。標簽就是這些問題的答案。 

讓我們看一個借記卡詐騙的示例。  

我們想要預測什么?  

  • 某一筆借記卡交易是否為欺詐。

  • 欺詐是標簽(對或錯)。 

你可以用來進行預測的“ 是否 ”問題或屬性是什么?  

  • 今天花費的金額是否大于歷史平均水平?  

  • 今天的這些交易是否在多個國家?  

  • 今天的交易數量是否大于歷史平均水平?  

  • 今天的新商戶類型與過去三個月相比是否較高?  

  • 今天是否在多個帶有風險類別代碼的商家處購買?  

  • 今天是否有不尋常的簽名與以往使用PIN相比?

  • 與過去三個月相比,是否有新的購買行為?  

  • 與過去三個月相比,現在是否有國外購買?  

要構建分類器模型,你需要提取對分類最有貢獻的有用特性。 

決策樹 

決策樹創(chuàng)建一個基于輸入特征預測類或標簽的模型。它的工作原理在于評估每個節(jié)點上包含一個特征的問題,然后根據答案選擇到下一個節(jié)點的分支。預測借記卡欺詐的可能決策樹如下所示。特性問題是節(jié)點,答案“是”或“否”是樹中到子節(jié)點的分支。(注意,真正的樹會有更多的節(jié)點。) 

問題一:24小時內的花費是否大于平均?  

問題2:今天是否有多筆交易來自高風險的商家?  

  • 是欺詐概率 = 90%

  • 非欺詐概率 = 50%

決策樹很受歡迎,因為它們易于可視化和解釋。將算法與集成方法相結合,可以提高模型的精度。一個集成例子是一個隨機森林算法,它結合了決策樹的多個隨機子集。  

無監(jiān)督學習  

無監(jiān)督學習,有時也被稱為描述分析,沒有預先提供的標記數據。這些算法發(fā)現輸入數據中的相似性或規(guī)律。無監(jiān)督學習的一個例子是基于購買數據對相似的客戶進行分組。  

聚類  

在聚類中,一個算法通過分析輸入實例之間的相似性將它們分類。一些聚類用例包括:  

  • 搜索結果分組。  

  • 分組相似客戶。  

  • 分組相似病人。  

  • 文本分類。  

  • 網絡安全異常檢測(發(fā)現不相似之處,集群中的異常值)。  

K均值算法將數據分組到K個集群中,每個數據都屬于離其集群中心均值最近的集群。  

聚類的一個例子是,一個公司希望細分其客戶,以便更好地定制產品和服務??蛻艨梢砸罁热缛丝诮y(tǒng)計和購買歷史記錄等特征被分組。為了得到更有價值的結果,無監(jiān)督學習的聚類常常與有監(jiān)督學習相結合。例如,在這個banking customer 360用例中,首先根據問卷答案對客戶進行細分。接著對客戶群體進行分析,并標上用戶畫像。然后,這些標簽通過客戶ID與賬戶類型和購買內容等特性進行鏈接。最后,我們在被標簽的客戶身上應用了監(jiān)督機器學習,允許將調查用戶畫像與他們的銀行行為聯系起來,以提供深入的見解。  

深度學習  

深度學習用來稱呼多層神經網絡,它是由輸入和輸出之間的節(jié)點“隱含層”組成的網絡。神經網絡有許多變種,你可以在這個神經網絡備忘單上了解更多。改進的算法、GPUs和大規(guī)模并行處理(MPP)使得具有數千層的神經網絡成為可能。每個節(jié)點接受輸入數據和一個權重,然后向下一層的節(jié)點輸出一個置信值,直到到達輸出層,計算出該置信值的誤差。通過在一個叫做梯度下降的過程中進行反向傳播,誤差會再次通過網絡發(fā)送回來,并調整權值來改進模型。這個過程重復了數千次,根據產生的誤差調整模型的權值,直到誤差不無法再減少為止。  

在此過程中,各層學習模型的最優(yōu)特征,其優(yōu)點是特征不需要預先確定。然而,這也意味著一個缺點,即模型的決策是不可解釋的。由于解釋決策可能很重要,研究人員正在開發(fā)新的方法來理解深度學習這個黑盒子。  


AI研習社是AI學術青年和AI開發(fā)者技術交流的在線社區(qū)。我們與高校、學術機構和產業(yè)界合作,通過提供學習、實戰(zhàn)和求職服務,為AI學術青年和開發(fā)者的交流互助和職業(yè)發(fā)展打造一站式平臺,致力成為中國最大的科技創(chuàng)新人才聚集地。

如果,你也是位熱愛分享的AI愛好者。歡迎與譯站一起,學習新知,分享成長。

揭開AI、機器學習和深度學習的神秘面紗

雷峰網版權文章,未經授權禁止轉載。詳情見轉載須知

揭開AI、機器學習和深度學習的神秘面紗

分享:
相關文章

知情人士

AI研習社(yanxishe.com)譯站頻道,傳播前沿人工智能知識,讓語言不再成為學習知識的門檻。(原雷鋒字幕組)
當月熱門文章
最新文章
請?zhí)顚懮暾埲速Y料
姓名
電話
郵箱
微信號
作品鏈接
個人簡介
為了您的賬戶安全,請驗證郵箱
您的郵箱還未驗證,完成可獲20積分喲!
請驗證您的郵箱
立即驗證
完善賬號信息
您的賬號已經綁定,現在您可以設置密碼以方便用郵箱登錄
立即設置 以后再說