丁香五月天婷婷久久婷婷色综合91|国产传媒自偷自拍|久久影院亚洲精品|国产欧美VA天堂国产美女自慰视屏|免费黄色av网站|婷婷丁香五月激情四射|日韩AV一区二区中文字幕在线观看|亚洲欧美日本性爱|日日噜噜噜夜夜噜噜噜|中文Av日韩一区二区

您正在使用IE低版瀏覽器,為了您的雷峰網賬號安全和更好的產品體驗,強烈建議使用更快更安全的瀏覽器
此為臨時鏈接,僅用于文章預覽,將在時失效
人工智能 正文
發(fā)私信給AI研習社-譯站
發(fā)送

0

用 Python 做機器學習不得不收藏的重要庫

本文作者: AI研習社-譯站 2019-01-04 10:34
導語:Python通常被應用統(tǒng)計技術或者數據分析人員當做工作中的首選語言。

用 Python 做機器學習不得不收藏的重要庫

本文為 AI 研習社編譯的技術博客,原標題 :

Essential libraries for Machine Learning in Python

作者 | Shubhi Asthana

翻譯 | 就2

校對 | 就2        整理 | 菠蘿妹

原文鏈接:

https://medium.freecodecamp.org/essential-libraries-for-machine-learning-in-python-82a9ada57aeb


用 Python 做機器學習不得不收藏的重要庫

用 Python 做機器學習不得不收藏的重要庫

Python通常被應用統(tǒng)計技術或者數據分析人員當做工作中的首選語言。數據科學家也會用python作為連接自身工作與WEB 應用程序/生產環(huán)境集成中。

Python在機器學習領域非常出色。它具有一致的語法、更短的開發(fā)時間和靈活性,非常適合開發(fā)能夠直接插入生產系統(tǒng)的復雜模型和預測引擎。

Python的一個最大的資產是其廣泛的庫。

庫是一組用給定語言編寫的程序和功能的集合。一組健壯的庫可以使開發(fā)人員更容易執(zhí)行復雜的任務,而無需重寫許多代碼。

機器學習很大程度上是基于數學。具體來說就是數學優(yōu)化、統(tǒng)計和概率。Python庫幫助那些不具備開發(fā)人員知識的研究人員/數學家輕松地“進行機器學習”。

以下是機器學習中最常用的一些庫:


  Scikit-learn   經典的ML算法

用 Python 做機器學習不得不收藏的重要庫

Scikit-learn 是最流行的ML 庫之一,他支持很多監(jiān)督學習和非監(jiān)督學習算法。例如:線性回歸,邏輯回歸,決策樹,聚類 ,k-means等。

他基于兩個python庫:Numpy 和 Scipy 。 他為常見的機器學習和數據挖掘提供了一組算法:聚類,回歸和分類。甚至像數據轉換,特征選擇,集成學習這樣的任務也可與通過簡短幾行代碼實現。

對于機器學習的新手來說,Scikit-learn 是一個夠用的工具,直到你自己開始實現更復雜的算法。


  Tensorflow for Deep Learning 深度學習

用 Python 做機器學習不得不收藏的重要庫

如果你在機器學習的世界里,你可能聽過,嘗試過或者實現過某種形式的深度學習的算法。但是他們是必要的嗎?回答可能是不必要。但是完成他們后感覺很酷對嗎? 回答是:對的!酷斃了。

Tensorflow 有趣的地方在于,當你使用python 編寫代碼,你可以編譯和運行在你的CPU 或者GPU 上,而且你不需要寫 c++或者 CUDA 的代碼,就可以運行在GPUs 集群上。

他使用一個多層節(jié)點的系統(tǒng),允許你快速的簡歷,訓練,部署具有大量數據集的人工神經網絡。這讓谷歌能夠識別照片中的物體,通過語音識別程序理解在口語中的單詞。


  Theano is also for Deep Learning

用 Python 做機器學習不得不收藏的重要庫

Theano 是另一個用于數值計算的優(yōu)秀類庫,有點類似于Numpy。Theano 允許你高效的定義,優(yōu)化和評估涉及多維數組的數學表達式。

使Theano 與眾不同的是它利用了計算機的GPU。這使得它能夠比單獨在CPU上運行時快100倍進行數據密集型計算。Theano的速度使得它對于深度學習和其他復雜的計算任務特別有價值。

Theano 庫的最終發(fā)布是在去年——2017年,版本1.0.0包含了許多新特性、界面更改和改進。


  Pandas  數據提取與預處理

panda是一個非常流行的庫,它提供了簡單易用且直觀的高級數據結構。

它有許多內建的方法來分組、組合數據和過濾以及執(zhí)行時間序列分析。

panda可以輕松地從SQL數據庫、CSV、Excel、JSON文件等不同來源獲取數據,并對數據進行操作。圖書館有兩個主要結構:

  • Series“級數”---- 一維 。

用 Python 做機器學習不得不收藏的重要庫

  • Data Frames“數據幀”---- 二維。

用 Python 做機器學習不得不收藏的重要庫

如果想得知關于如何使用序列和數據看框架的更多細節(jié),請查看的我的其他文章。


  Matplotlib用于數據可視化

用 Python 做機器學習不得不收藏的重要庫

如果你不能很好的與其他人交流,那么最好的,最復雜的機器學習就顯得沒有意義。

那么如何從這些數據中轉換出價值呢?你如何激勵你的業(yè)務分析師,告訴他們充滿“洞察力”的“故事”?

這就是Matplotlib發(fā)揮作用的地方。它是每個數據科學家用于創(chuàng)建2D圖形和圖形的標準Python庫。它是命令行簡單,這意味著它需要更多的命令來生成好看的圖形和數字,而不是使用一些高級庫。

然而,這也帶來了靈活性。有了足夠的命令,您可以使用Matplotlib制作任何您想要的圖形。您可以構建不同的圖表,從直方圖和散點圖到非笛卡爾坐標圖。

它支持所有操作系統(tǒng)上的不同GUI后端,還可以將圖形導出到通用矢量和圖形格式,如PDF、SVG、JPG、PNG、BMP、GIF等。


  Seaborn是另一個數據可視化庫

用 Python 做機器學習不得不收藏的重要庫

Seaborn是一個流行的可視化庫,它建立在Matplotlib的基礎之上。它是一個高級庫,這意味著更容易生成某些類型的圖,包括熱圖、時間序列和小提琴圖。


  最后

這是機器學習中最重要的Python庫的集合。如果您打算使用Python和數據科學,那么這些庫是值得一看的,同時也值得您熟悉。

我是否錯過了任何重要的Python ML庫?如果是,請務必在下面的評論中提到它。盡管我試圖介紹最有用的庫,但可能仍然沒有介紹其他一些值得研究的庫。

問題或建議嗎?我很想聽聽你的意見——請隨意留言。


想要繼續(xù)查看該篇文章相關鏈接和參考文獻?

長按鏈接點擊打開或點擊底部【用python做機器學習不得不收藏的重要庫】:

https://ai.yanxishe.com/page/TextTranslation/1119


AI研習社每日更新精彩內容,觀看更多精彩內容:雷鋒網雷鋒網雷鋒網

AI/機器學習年度2018年度進展綜述

算法基礎:五大排序算法Python實戰(zhàn)教程

手把手:用PyTorch實現圖像分類器(第一部分)

手把手:用PyTorch實現圖像分類器(第二部分)


等你來譯:

對混亂的數據進行聚類

初學者怎樣使用Keras進行遷移學習 

強化學習:通往基于情感的行為系統(tǒng) 

一文帶你讀懂 WaveNet:谷歌助手的聲音合成器


雷峰網原創(chuàng)文章,未經授權禁止轉載。詳情見轉載須知。

用 Python 做機器學習不得不收藏的重要庫

分享:
相關文章

知情人士

AI研習社(yanxishe.com)譯站頻道,傳播前沿人工智能知識,讓語言不再成為學習知識的門檻。(原雷鋒字幕組)
當月熱門文章
最新文章
請?zhí)顚懮暾埲速Y料
姓名
電話
郵箱
微信號
作品鏈接
個人簡介
為了您的賬戶安全,請驗證郵箱
您的郵箱還未驗證,完成可獲20積分喲!
請驗證您的郵箱
立即驗證
完善賬號信息
您的賬號已經綁定,現在您可以設置密碼以方便用郵箱登錄
立即設置 以后再說