丁香五月天婷婷久久婷婷色综合91|国产传媒自偷自拍|久久影院亚洲精品|国产欧美VA天堂国产美女自慰视屏|免费黄色av网站|婷婷丁香五月激情四射|日韩AV一区二区中文字幕在线观看|亚洲欧美日本性爱|日日噜噜噜夜夜噜噜噜|中文Av日韩一区二区

您正在使用IE低版瀏覽器,為了您的雷峰網(wǎng)賬號安全和更好的產(chǎn)品體驗,強烈建議使用更快更安全的瀏覽器
此為臨時鏈接,僅用于文章預覽,將在時失效
人工智能 正文
發(fā)私信給恒亮
發(fā)送

1

開發(fā)者必備:基于Linux生態(tài)的十大AI開源框架盤點

本文作者: 恒亮 2017-01-12 11:20
導語:一篇針對泛Linux生態(tài)的頂級人工智能開源工具盤點。

前不久,雷鋒網(wǎng)曾盤點了一系列機器學習相關的開源平臺,包括谷歌的TensorFlow、微軟的CNTK以及百度的PaddlePaddle等等(詳情見文末“相關閱讀”)。這些平臺各具特點,其中某些已經(jīng)在業(yè)內(nèi)得到了廣泛認可和應用。

與此前不同,本文將從開發(fā)者的角度出發(fā),特別是針對開發(fā)者中為數(shù)眾多的Linux系統(tǒng)和Mac系統(tǒng)用戶,奉上一篇針對泛Linux生態(tài)的頂級人工智能開源工具盤點(當然,有些工具也并非只兼容Linux)。

1. Deeplearning4j:為Java用戶量身定制

開發(fā)者必備:基于Linux生態(tài)的十大AI開源框架盤點

Deeplearning4j(Deep Learning For Java)是Java和Scala環(huán)境下的一個開源分布式的深度學習項目,由總部位于美國舊金山的商業(yè)智能和企業(yè)軟件公司Skymind牽頭開發(fā),并得到了騰訊的投資。正如它的命名,Deeplearning4j的運行需要Java虛擬機JVM的支持。

Deeplearning4j團隊在官網(wǎng)表示,他們希望通過一些深度學習算法的開發(fā),將商業(yè)帶入智能化數(shù)據(jù)的時代。也正是為了實現(xiàn)這一理想,惠及更多的用戶,因此選擇了移植性更好的Java環(huán)境來實現(xiàn)這些算法。目前,Deeplearning4j的這些算法已經(jīng)在谷歌、Facebook和微軟等平臺得到了廣泛應用。

值得一提的是,為了便于開發(fā)者自由定制,Deeplearning4j已經(jīng)開放了盡可能多的算法調節(jié)接口,并對接口參數(shù)做出了詳盡解釋。同時,Deeplearning4j團隊還開發(fā)了針對矩陣運算的ND4J和ND4S庫(N-Dimensional Arrays for Java/Scala),同樣需要JVM的支持。

Deeplearning4j遵循Apache 2.0開源協(xié)議,提供了基于AWS云服務的GPU運算支持,以及微軟服務器框架的支持。

官網(wǎng):http://deeplearning4j.org/

2. Caffe:廣受歡迎的深度學習框架

開發(fā)者必備:基于Linux生態(tài)的十大AI開源框架盤點

Caffe的全稱是 “Convolution Architecture For Feature Extraction”,意為“用于特征提取的卷積架構”,主要開發(fā)者來自伯克利大學的視覺與學習中心(Berkeley Vision and Learning Center,BVLC),基于BSD 2-Clause開源許可協(xié)議發(fā)布。

Caffe是業(yè)內(nèi)著名的深度學習框架,根據(jù)官網(wǎng)介紹,其主要特點是:運算速度快(官方顯示在單片NVIDIA K40 GPU的運算能力下,Caffe每天可以處理超過60M的圖片數(shù)據(jù)),模塊定制方便(在CPU或GPU之間的轉換只需要簡單修改一下參數(shù)設定),擴展能力強大(目前有超過一千名開發(fā)者基于Caffe開發(fā)了分支版本),以及豐富的社區(qū)支持(Caffe已經(jīng)被授權給各種研究機構、初創(chuàng)公司和工業(yè)集團),因此特別適合于神經(jīng)網(wǎng)絡建模和圖像處理任務。

官網(wǎng):http://caffe.berkeleyvision.org/

3. H2O:企業(yè)級機器學習框架

開發(fā)者必備:基于Linux生態(tài)的十大AI開源框架盤點

H2O(即水的化學式)是一個開源、快速、可擴展的分布式機器學習框架,同時提供了大量的算法實現(xiàn)。它支持深度學習、梯度推進(Gradient Boosting)、隨機森林(Random Forest)、廣義線性模型(即邏輯回歸,彈性網(wǎng)絡)等各種機器學習算法。

H2O框架的核心代碼由Java編寫,數(shù)據(jù)和模型通過分布式的key/value存儲在各個集群節(jié)點的內(nèi)存中,算法使用Map/Reduce框架實現(xiàn),并使用了Java中的Fork/Join機制來實現(xiàn)多線程。

H2O是一個更關注企業(yè)用戶的人工智能分析工具,它聚焦于為掌握大量數(shù)據(jù)的企業(yè)用戶提供快速精準的預測分析模型,從海量數(shù)據(jù)中提取有助于商業(yè)決策的信息。

根據(jù)H2O官方的數(shù)據(jù),目前已經(jīng)有超過7萬名數(shù)據(jù)科學家和8萬家組織機構成為了H2O平臺的忠實擁躉。

官網(wǎng):http://www.h2o.ai/

4. MLlib:基于Spark框架的機器學習算法實現(xiàn)庫

開發(fā)者必備:基于Linux生態(tài)的十大AI開源框架盤點

MLlib是Apache開源項目Spark針對一些常用的機器學習算法的實現(xiàn)庫,同時也包括了相關的測試程序和數(shù)據(jù)生成器。

按照官網(wǎng)的描述,MLlib的主要特點是易用(天生兼容Spark框架的API接口和Python、Java、Scala等多種語言)、高性能(依靠Spark的數(shù)據(jù)管理能力,運行迭代和邏輯回歸算法時比Hadoop框架快100倍)和易于部署(可以直接在現(xiàn)有的Hadoop數(shù)據(jù)集群上運行)。

MLlib目前支持分類、回歸、推薦、聚類、生存分析等多種機器學習算法。

官網(wǎng):https://spark.apache.org/mllib/

5. Apache Mahout:Hadoop廣泛采用的機器學習開源框架

開發(fā)者必備:基于Linux生態(tài)的十大AI開源框架盤點

Apache Mahout同樣也是一個Apache開源項目,與MLlib相對應,Mahout是應用在Hadoop平臺下的機器學習開源框架。

Mahout有如下三個主要特點:

1) 提供簡單、可擴展的編程環(huán)境和框架;

2) 同時為Scala + Apache Spark、H2O以及Apache Flik平臺提供打包好的算法實現(xiàn);

3) 支持R語言的語法規(guī)則進行矩陣計算。

官網(wǎng):http://mahout.apache.org/

6. OpenNN:專注神經(jīng)網(wǎng)絡的實現(xiàn)庫

開發(fā)者必備:基于Linux生態(tài)的十大AI開源框架盤點

OpenNN的全稱為“Open Neural Networks Library”,即開源神經(jīng)網(wǎng)絡庫,其核心代碼由C++編寫,從名字就可以看出,其主要面向深度學習領域,助力于用戶構建各種不同的神經(jīng)網(wǎng)絡模型。

據(jù)官方描述,OpenNN可用于實現(xiàn)監(jiān)督學習場景中任何層次的非線性模型,同時還支持各種具有通用近似屬性的神經(jīng)網(wǎng)絡設計。

除了模型的多層支持外,OpenNN最主要優(yōu)勢還在于強大的性能表現(xiàn)。具體來說就是,OpenNN能夠通過C++語言實現(xiàn)的核心代碼高效地調節(jié)內(nèi)容使用,通過OpenMP庫很好地平衡多線程CPU調用,以及通過CUDA工具對GPU進行加速。

官網(wǎng):http://www.opennn.net/

7. Oryx 2:重新設計了Lambda架構

開發(fā)者必備:基于Linux生態(tài)的十大AI開源框架盤點

Oryx 2是Oryx項目的2.0版,前身名為 Myrrix,后來被大數(shù)據(jù)公司 Cloudera 收購,才改名為 Oryx。

Oryx 2.0關注于大規(guī)模機器學習/預測分析基礎框架的實時表現(xiàn),它基于Apache Spark和Apache Kafka框架開發(fā),并重新設計了Lambda架構,使得層次之間的復用性更強。

2.0版相比之前實現(xiàn)了更多算法,包括ALS協(xié)同過濾、隨機森林、以及K-means++等。

官網(wǎng):http://oryx.io/

8. OpenCyc:全球最龐大、最完備的通用型知識庫與常識推理引擎

開發(fā)者必備:基于Linux生態(tài)的十大AI開源框架盤點

OpenCyc是Cycorp公司推出的一個基于Cyc的開源版本,而Cyc是目前全球最龐大、最完備的通用型知識庫與常識推理引擎。

OpenCyc包含數(shù)十萬個精心組織的Cyc詞條。Cycorp公司不但免費提供OpenCyc,同時也鼓勵開發(fā)者基于OpenCyc開發(fā)針對于特定應用領域的分支版本。

目前,OpenCyc已經(jīng)被成功應用在大數(shù)據(jù)建模、語言數(shù)據(jù)整合、智能文本理解、特定領域的專家系統(tǒng)建模和人工智能游戲。

官網(wǎng):http://www.cyc.com/platform/opencyc/

9. Apache SystemML:專注于大數(shù)據(jù)分析的開源機器學習平臺

開發(fā)者必備:基于Linux生態(tài)的十大AI開源框架盤點

SystemML是一個利用機器學習算法進行大數(shù)據(jù)分析的開源AI平臺,其主要特點是支持R語言和Python的語法,專注于大數(shù)據(jù)分析領域,以及專門為高階數(shù)學計算設計。

按照官網(wǎng)的介紹,Apache SystemML基于Apache Spark框架運行,其最大的特點就是能夠自動、逐行地評估數(shù)據(jù),并根據(jù)評估結果確定用戶的代碼應該直接運行在驅動器上還是運行在Apache Spark集群上。

除了Apache Spark之外,SystemML還支持Apache Hadoop、Jupyter和Apache Zeppelin等多個平臺。目前,SystemML技術已經(jīng)成功應用在交通、航空和金融等多個領域。

官網(wǎng):http://systemml.apache.org/

10. NuPIC:基于層級實時存儲算法的機器智能平臺

開發(fā)者必備:基于Linux生態(tài)的十大AI開源框架盤點

NuPIC是一個與眾不同的開源機器智能平臺,它基于一種大腦皮層理論,即“層級實時存儲算法”(Heirarchical Temporary Memory,HTM)。NuPIC聚焦于分析實時數(shù)據(jù)流,可以通過學習數(shù)據(jù)之間基于時間的狀態(tài)變化,對未知數(shù)據(jù)進行預測,并揭示其中的非常規(guī)特性。

NuPIC關鍵的功能特性包括:

1) 持續(xù)的在線學習:NuPIC模型可以持續(xù)根據(jù)快速變化的數(shù)據(jù)流進行實時調整;

2) 時間和空間分析:像人腦一樣,NuPIC可以同時模擬時間和空間的變化;

3) 實時的數(shù)據(jù)流分析:智能化的數(shù)據(jù)分析不會隨著數(shù)據(jù)量的增加而改變;

4) 預測和建模:通過通用性的大腦皮層算法,對數(shù)據(jù)進行預測、建模和學習;

5) 強大的異常檢測能力:實時檢測數(shù)據(jù)流的擾動,不依靠僵化的閾值設置和過時的算法;

6) 層級實時存儲算法:支持全新的HTM計算架構。

官網(wǎng):http://numenta.org/

由于2016僅僅是人工智能走向主流的元年,未來隨著技術的進一步發(fā)展和革新,勢必會出現(xiàn)更多、更豐富的開發(fā)工具。這里值得注意的一點是:工具的意義不僅在于解決了日常研發(fā)中遇到的各種問題,更在于降低了開發(fā)的難度,引導了更多人投入到人工智能的研發(fā)之中。雷鋒網(wǎng)

來源:tecmint,雷鋒網(wǎng)編譯

相關閱讀:

BAT 在下一盤大棋?深度盤點國內(nèi)四大機器學習開源平臺

盤點四大民間機器學習開源框架:Theano、Caffe、Torch 和 SciKit-learn

谷歌、微軟、OpenAI 等巨頭的七大機器學習開源項目 看這篇就夠了

雷峰網(wǎng)版權文章,未經(jīng)授權禁止轉載。詳情見轉載須知。

開發(fā)者必備:基于Linux生態(tài)的十大AI開源框架盤點

分享:
相關文章

編輯

歡迎交流,微信:whl123465
當月熱門文章
最新文章
請?zhí)顚懮暾埲速Y料
姓名
電話
郵箱
微信號
作品鏈接
個人簡介
為了您的賬戶安全,請驗證郵箱
您的郵箱還未驗證,完成可獲20積分喲!
請驗證您的郵箱
立即驗證
完善賬號信息
您的賬號已經(jīng)綁定,現(xiàn)在您可以設置密碼以方便用郵箱登錄
立即設置 以后再說