Github 上評價最高的 5 個機器學(xué)習(xí)項目

本文作者： skura

2019-08-01 15:48

導(dǎo)語：非常棒的資源~

雷鋒網(wǎng) AI 科技評論按，機器學(xué)習(xí)作為一個領(lǐng)域，正以驚人的速度發(fā)展。Github 是全世界開發(fā)者都在關(guān)注的網(wǎng)站，最高質(zhì)量的代碼被定期發(fā)布在這里。

照片由 Morgan Harper Nichols 發(fā)布在 Unsplash 上

顯然，在機器學(xué)習(xí)的世界里，不可能跟蹤所有的事情。但是在 Github 上你可以跟蹤所有的項目，Github 對每個項目都有 star 評定?；旧?，如果你為一個 repo 打上 star，那么就表示你對這個項目感興趣，并跟蹤你感興趣的 repo。

Github 上評價最高的 5 個機器學(xué)習(xí)項目

這樣，star 數(shù)量就可以成為了解最受關(guān)注項目的指標(biāo)之一，讓我們看看 5 個高評級的項目吧。

1.face-recognition——25858★

github 地址：https://github.com/ageitgey/face_recognition

世界上最簡單的面部識別工具。它為 python 和命令行提供了一個應(yīng)用程序編程接口（API）。它對于識別和處理圖像中的人臉特別有用。它是使用 dlib 最先進的人臉識別算法構(gòu)建的。深度學(xué)習(xí)模型在「Labeled Faces in the Wild」數(shù)據(jù)集的上的識別精度為 99.38%。

它還提供了一個簡單的人臉識別命令行工具，這個工具讓你可以從命令行本身對文件夾中的圖像進行人臉識別！

你可以用它來找到圖像中出現(xiàn)的人臉：

Github 上評價最高的 5 個機器學(xué)習(xí)項目

import face_recognition
image = face_recognition.load_image_file("your_file.jpg")
face_locations = face_recognition.face_locations(image)

也可以用它來查找面部特征，了解人的眼睛、鼻子、嘴和下巴的位置和輪廓：

Github 上評價最高的 5 個機器學(xué)習(xí)項目

import face_recognition
image = face_recognition.load_image_file("your_file.jpg")
face_landmarks_list = face_recognition.face_landmarks(image)

可以化妝：

Github 上評價最高的 5 個機器學(xué)習(xí)項目

可以識別圖片中的人是誰：

Github 上評價最高的 5 個機器學(xué)習(xí)項目

import face_recognition
known_image = face_recognition.load_image_file("biden.jpg")
unknown_image = face_recognition.load_image_file("unknown.jpg")
biden_encoding = face_recognition.face_encodings(known_image)[0]
unknown_encoding = face_recognition.face_encodings(unknown_image)[0]
results = face_recognition.compare_faces([biden_encoding], unknown_encoding)

這個庫還可以進行實時人臉識別

Github 上評價最高的 5 個機器學(xué)習(xí)項目

相關(guān)代碼可以點擊以下網(wǎng)址查看：https://github.com/ageitgey/face_recognition/blob/master/examples/facerec_from_webcam_faster.py。

2.fastText by FacebookResearch—18,819★

github 地址：https://github.com/facebookresearch/fastText

fastText 是 Facebook 團隊的一個開源免費庫，用于單詞表達的高效學(xué)習(xí)。它是輕量級的，允許用戶學(xué)習(xí)文本表示和句子分類。它在標(biāo)準(zhǔn)的通用硬件上工作。模型甚至可以縮小到在移動設(shè)備上使用。

文本分類是許多應(yīng)用程序要解決的核心問題，如垃圾郵件檢測、情感分析或智能答案。文本分類的目標(biāo)是將文檔（如電子郵件、文章、文本消息、產(chǎn)品評論等）分配到多個類別。

Github 上評價最高的 5 個機器學(xué)習(xí)項目

單詞分類示例來源：alterra.ai

它是對 NLP 愛好者來說非常有用的資源。

Github 上評價最高的 5 個機器學(xué)習(xí)項目

其目錄如下：

Github 上評價最高的 5 個機器學(xué)習(xí)項目

1.資源

模型
補充數(shù)據(jù)
問答
備忘清單

2.使用要求

3.構(gòu)建 fastText

獲取源碼
使用 make 創(chuàng)建 fastText（推薦）
使用 cmake 創(chuàng)建 fastText
使用 Python 創(chuàng)建 fastText

4.用例

詞表示學(xué)習(xí)
獲取詞匯庫之外的詞匯向量
文本分類

5.完整文檔

6.參考資料

用字信息豐富字向量
有效的文本分類技巧
FastText.zip：壓縮文本分類模型

7.加入 fastText 社區(qū)

8.證書

這里面的資源非常豐富。例如，在第一部分——資源里面，有最新的英語單詞向量、在 Wikipedia 和 Crawl 上訓(xùn)練的 157 種語言的詞向量、用于語言識別和各種監(jiān)督任務(wù)的模型。

Github 上評價最高的 5 個機器學(xué)習(xí)項目

后面的部分還介紹了補充數(shù)據(jù)集、常見的問題及對應(yīng)的答案以及這個工具的使用要求等，解釋非常詳細(xì)，且都附有代碼~

3.awesome-tensorflow—14,424★

項目地址：https://github.com/jtoy/awesome-tensorflow

這是一組幫助你理解和使用 TensorFlow 的資源。Github repo 包含一個很棒的 TensorFlow 實驗、庫和項目的管理列表。

TensorFlow 是由 Google 發(fā)布的一個端到端的開源機器學(xué)習(xí)平臺。它擁有一個由工具、庫和社區(qū)資源組成的綜合生態(tài)系統(tǒng)，使研究人員能夠使用 ML 中最先進的技術(shù)。IT 開發(fā)人員可以通過使用它，輕松地構(gòu)建和部署 ML 驅(qū)動的應(yīng)用程序。

Github 上評價最高的 5 個機器學(xué)習(xí)項目

該資源的目錄如下：

Github 上評價最高的 5 個機器學(xué)習(xí)項目

目錄分為：

教程
模型/項目
由 TensorFlow 提供支持
庫
工具
教學(xué)視頻
論文
博客文章
社區(qū)
圖書推薦

在第一部分——教程里面，介紹了很多 Tensorflow 的基礎(chǔ)知識和基本原理、應(yīng)用，包括框架的介紹，代碼示例和案例講解，概念方法講解等，還提供了視頻和詳細(xì)文檔。

Github 上評價最高的 5 個機器學(xué)習(xí)項目

后面還推薦了很多項目，書籍以及優(yōu)秀博文，尤其是學(xué)習(xí)視頻這塊，資源非常詳盡，從 Tensorflow 的安裝到深度學(xué)習(xí)和圖像識別都進行了講解，對初學(xué)者真的非常友好，感興趣的同學(xué)可以打開看看：

Github 上評價最高的 5 個機器學(xué)習(xí)項目

TensorFlow Guide 1 - 安裝使用指南
TensorFlow Guide 2 - 第一個視頻的后續(xù)
TensorFlow Basic Usage - 基本用法介紹指南
TensorFlow Deep MNIST for Experts - 理解 Deep MNIST
TensorFlow Udacity Deep Learning - 在擁有 1 GB 數(shù)據(jù)的 Cloud 9 上在線免費安裝 Tensorflow 的方法
Why Google wants everyone to have access to TensorFlow - 谷歌為什么希望所有人都能訪問 Tensorflow
Videos from TensorFlow Silicon Valley Meet Up 1/19/2016
Videos from TensorFlow Silicon Valley Meet Up 1/21/2016
Stanford CS224d Lecture 7 - Introduction to TensorFlow - Richard Socher 在Stanford 的演講，關(guān)于自然語言處理和深度學(xué)習(xí)
Diving into Machine Learning through TensorFlow - Pycon 2016 Portland Oregon, Slide & Code by Julia Ferraioli, Amy Unruh, Eli Bixby
Large Scale Deep Learning with TensorFlow - Jeff Dean 的視頻
Tensorflow and deep learning - without at PhD - by Martin G?rner
Tensorflow and deep learning - without at PhD, Part 2 (Google Cloud Next '17) - by Martin G?rner
Image recognition in Go using TensorFlow - by Alex Pliutau

4.predictionio by Apache—11852 ★

github 地址：https://github.com/apache/predictionio

ApachePredictionIO 是一個面向開發(fā)人員、數(shù)據(jù)科學(xué)家和最終用戶的開源機器學(xué)習(xí)框架。用戶可以使用這個框架來構(gòu)建、部署和測試真實的 ML 應(yīng)用程序。

它甚至支持事件收集、評估和查詢預(yù)測結(jié)果。它是基于 Hadoop、HBase 等可擴展的開源服務(wù)的。

就機器學(xué)習(xí)領(lǐng)域而言，它減輕了開發(fā)人員的負(fù)擔(dān)。

Github 上評價最高的 5 個機器學(xué)習(xí)項目

在這個 repo 里面，對 ApachePredictionIO 的安裝、如何快速開始、如何解決錯誤、相關(guān)文檔以及社區(qū)等等都進行了說明：

Github 上評價最高的 5 個機器學(xué)習(xí)項目

目錄如下：

安裝（安裝 Apache PredictionIO 的兩種方式）
快速開始（快速的入門指南）
bug 和功能請求（如何報告錯誤、請求新功能）
文檔（項目有關(guān)文檔）
貢獻（可以提交自己的修改）
社區(qū)（訂閱、跟蹤相關(guān)新聞）

這個工具的網(wǎng)站打開界面如下：

Github 上評價最高的 5 個機器學(xué)習(xí)項目

左側(cè)詳細(xì)地解釋了工具的使用方法，比如，打開「Installing Apache PredictionIO」，可以看到很詳細(xì)的安裝教程：

Github 上評價最高的 5 個機器學(xué)習(xí)項目

如果你想開始使用它，可以點擊這個網(wǎng)址：http://predictionio.apache.org/

5.Style2Paints—9184 ★

github 地址：https://github.com/style2paints

網(wǎng)站：https://style2paints.github.io/

twitter 地址：https://twitter.com/IlIIlIIIllIllII

這個 repo 與上述所有 repo 略有不同，因為它由于缺少資金而被關(guān)閉了！這是一個非常有趣的概念，用人工智能來給圖像上色。

他們聲稱，Style2paints V4 是當(dāng)前最佳的人工智能驅(qū)動線條藝術(shù)著色工具。

Github 上評價最高的 5 個機器學(xué)習(xí)項目

他們還談到，Style2Paints 不同于以前的端到端、圖像到圖像的翻譯方法，因為它是第一個在現(xiàn)實人類工作流程中對線條藝術(shù)進行著色的系統(tǒng)。大多數(shù)人類藝術(shù)家都熟悉這個工作流程。

打開網(wǎng)站，可以看到上面有很詳細(xì)的圖文告訴大家如何去使用這個工具。你可以控制渲染模式，還可以選擇細(xì)心和粗心模式，保存進度。當(dāng)然，上面還有關(guān)于常見問題的解答。

Style2Paints V4 非常的好用！任何人都能在十分鐘內(nèi)學(xué)會！首先你需要下載一張線稿，在工具上保存、上傳之后，再選擇自己喜歡的人工智能畫師，就可以對上傳的線稿進行渲染了。

在最新版本里面，還有careful mode （細(xì)心模式）和 careless mode （粗心模式）。在細(xì)心模式（careful mode）中，人工智能會細(xì)心的涂抹平滑，精細(xì)的顏色。但是這個模式下的人工智能會限制自我的發(fā)揮來迎合人類。在粗心模式（careless mode）中，人工智能會自己發(fā)揮，但是可能細(xì)節(jié)上會出現(xiàn)丟失。同時可能人工智能會反抗你的提示。