0
雷鋒網(wǎng) AI 科技評論按,機(jī)器學(xué)習(xí)作為一個領(lǐng)域,正以驚人的速度發(fā)展。Github 是全世界開發(fā)者都在關(guān)注的網(wǎng)站,最高質(zhì)量的代碼被定期發(fā)布在這里。
照片由 Morgan Harper Nichols 發(fā)布在 Unsplash 上
顯然,在機(jī)器學(xué)習(xí)的世界里,不可能跟蹤所有的事情。但是在 Github 上你可以跟蹤所有的項目,Github 對每個項目都有 star 評定?;旧?,如果你為一個 repo 打上 star,那么就表示你對這個項目感興趣,并跟蹤你感興趣的 repo。
這樣,star 數(shù)量就可以成為了解最受關(guān)注項目的指標(biāo)之一,讓我們看看 5 個高評級的項目吧。
1.face-recognition——25858★
github 地址:https://github.com/ageitgey/face_recognition
世界上最簡單的面部識別工具。它為 python 和命令行提供了一個應(yīng)用程序編程接口(API)。它對于識別和處理圖像中的人臉特別有用。它是使用 dlib 最先進(jìn)的人臉識別算法構(gòu)建的。深度學(xué)習(xí)模型在「Labeled Faces in the Wild」數(shù)據(jù)集的上的識別精度為 99.38%。
它還提供了一個簡單的人臉識別命令行工具,這個工具讓你可以從命令行本身對文件夾中的圖像進(jìn)行人臉識別!
你可以用它來找到圖像中出現(xiàn)的人臉:
import face_recognition
image = face_recognition.load_image_file("your_file.jpg")
face_locations = face_recognition.face_locations(image)
也可以用它來查找面部特征,了解人的眼睛、鼻子、嘴和下巴的位置和輪廓:
import face_recognition
image = face_recognition.load_image_file("your_file.jpg")
face_landmarks_list = face_recognition.face_landmarks(image)
可以化妝:
可以識別圖片中的人是誰:
import face_recognition
known_image = face_recognition.load_image_file("biden.jpg")
unknown_image = face_recognition.load_image_file("unknown.jpg")
biden_encoding = face_recognition.face_encodings(known_image)[0]
unknown_encoding = face_recognition.face_encodings(unknown_image)[0]
results = face_recognition.compare_faces([biden_encoding], unknown_encoding)
這個庫還可以進(jìn)行實時人臉識別
相關(guān)代碼可以點擊以下網(wǎng)址查看:https://github.com/ageitgey/face_recognition/blob/master/examples/facerec_from_webcam_faster.py。
2.fastText by FacebookResearch—18,819★
github 地址:https://github.com/facebookresearch/fastText
fastText 是 Facebook 團(tuán)隊的一個開源免費庫,用于單詞表達(dá)的高效學(xué)習(xí)。它是輕量級的,允許用戶學(xué)習(xí)文本表示和句子分類。它在標(biāo)準(zhǔn)的通用硬件上工作。模型甚至可以縮小到在移動設(shè)備上使用。
文本分類是許多應(yīng)用程序要解決的核心問題,如垃圾郵件檢測、情感分析或智能答案。文本分類的目標(biāo)是將文檔(如電子郵件、文章、文本消息、產(chǎn)品評論等)分配到多個類別。
單詞分類示例來源:alterra.ai
它是對 NLP 愛好者來說非常有用的資源。
其目錄如下:
1.資源
模型
補(bǔ)充數(shù)據(jù)
問答
備忘清單
2.使用要求
3.構(gòu)建 fastText
獲取源碼
使用 make 創(chuàng)建 fastText(推薦)
使用 cmake 創(chuàng)建 fastText
使用 Python 創(chuàng)建 fastText
4.用例
詞表示學(xué)習(xí)
獲取詞匯庫之外的詞匯向量
文本分類
5.完整文檔
6.參考資料
用字信息豐富字向量
有效的文本分類技巧
FastText.zip:壓縮文本分類模型
7.加入 fastText 社區(qū)
8.證書
這里面的資源非常豐富。例如,在第一部分——資源里面,有最新的英語單詞向量、在 Wikipedia 和 Crawl 上訓(xùn)練的 157 種語言的詞向量、用于語言識別和各種監(jiān)督任務(wù)的模型。
后面的部分還介紹了補(bǔ)充數(shù)據(jù)集、常見的問題及對應(yīng)的答案以及這個工具的使用要求等,解釋非常詳細(xì),且都附有代碼~
3.awesome-tensorflow—14,424★
項目地址:https://github.com/jtoy/awesome-tensorflow
這是一組幫助你理解和使用 TensorFlow 的資源。Github repo 包含一個很棒的 TensorFlow 實驗、庫和項目的管理列表。
TensorFlow 是由 Google 發(fā)布的一個端到端的開源機(jī)器學(xué)習(xí)平臺。它擁有一個由工具、庫和社區(qū)資源組成的綜合生態(tài)系統(tǒng),使研究人員能夠使用 ML 中最先進(jìn)的技術(shù)。IT 開發(fā)人員可以通過使用它,輕松地構(gòu)建和部署 ML 驅(qū)動的應(yīng)用程序。
該資源的目錄如下:
目錄分為:
教程
模型/項目
由 TensorFlow 提供支持
庫
工具
教學(xué)視頻
論文
博客文章
社區(qū)
圖書推薦
在第一部分——教程里面,介紹了很多 Tensorflow 的基礎(chǔ)知識和基本原理、應(yīng)用,包括框架的介紹,代碼示例和案例講解,概念方法講解等,還提供了視頻和詳細(xì)文檔。
后面還推薦了很多項目,書籍以及優(yōu)秀博文,尤其是學(xué)習(xí)視頻這塊,資源非常詳盡,從 Tensorflow 的安裝到深度學(xué)習(xí)和圖像識別都進(jìn)行了講解,對初學(xué)者真的非常友好,感興趣的同學(xué)可以打開看看:
TensorFlow Guide 1 - 安裝使用指南
TensorFlow Guide 2 - 第一個視頻的后續(xù)
TensorFlow Basic Usage - 基本用法介紹指南
TensorFlow Deep MNIST for Experts - 理解 Deep MNIST
TensorFlow Udacity Deep Learning - 在擁有 1 GB 數(shù)據(jù)的 Cloud 9 上在線免費安裝 Tensorflow 的方法
Why Google wants everyone to have access to TensorFlow - 谷歌為什么希望所有人都能訪問 Tensorflow
Stanford CS224d Lecture 7 - Introduction to TensorFlow - Richard Socher 在Stanford 的演講,關(guān)于自然語言處理和深度學(xué)習(xí)
Diving into Machine Learning through TensorFlow - Pycon 2016 Portland Oregon, Slide & Code by Julia Ferraioli, Amy Unruh, Eli Bixby
Large Scale Deep Learning with TensorFlow - Jeff Dean 的視頻
Tensorflow and deep learning - without at PhD - by Martin G?rner
Tensorflow and deep learning - without at PhD, Part 2 (Google Cloud Next '17) - by Martin G?rner
Image recognition in Go using TensorFlow - by Alex Pliutau
4.predictionio by Apache—11852 ★
github 地址:https://github.com/apache/predictionio
ApachePredictionIO 是一個面向開發(fā)人員、數(shù)據(jù)科學(xué)家和最終用戶的開源機(jī)器學(xué)習(xí)框架。用戶可以使用這個框架來構(gòu)建、部署和測試真實的 ML 應(yīng)用程序。
它甚至支持事件收集、評估和查詢預(yù)測結(jié)果。它是基于 Hadoop、HBase 等可擴(kuò)展的開源服務(wù)的。
就機(jī)器學(xué)習(xí)領(lǐng)域而言,它減輕了開發(fā)人員的負(fù)擔(dān)。
在這個 repo 里面,對 ApachePredictionIO 的安裝、如何快速開始、如何解決錯誤、相關(guān)文檔以及社區(qū)等等都進(jìn)行了說明:
目錄如下:
安裝(安裝 Apache PredictionIO 的兩種方式)
快速開始(快速的入門指南)
bug 和功能請求(如何報告錯誤、請求新功能)
文檔(項目有關(guān)文檔)
貢獻(xiàn)(可以提交自己的修改)
社區(qū)(訂閱、跟蹤相關(guān)新聞)
這個工具的網(wǎng)站打開界面如下:
左側(cè)詳細(xì)地解釋了工具的使用方法,比如,打開「Installing Apache PredictionIO」,可以看到很詳細(xì)的安裝教程:
如果你想開始使用它,可以點擊這個網(wǎng)址:http://predictionio.apache.org/
5.Style2Paints—9184 ★
github 地址:https://github.com/style2paints
網(wǎng)站:https://style2paints.github.io/
twitter 地址:https://twitter.com/IlIIlIIIllIllII
這個 repo 與上述所有 repo 略有不同,因為它由于缺少資金而被關(guān)閉了!這是一個非常有趣的概念,用人工智能來給圖像上色。
他們聲稱,Style2paints V4 是當(dāng)前最佳的人工智能驅(qū)動線條藝術(shù)著色工具。
他們還談到,Style2Paints 不同于以前的端到端、圖像到圖像的翻譯方法,因為它是第一個在現(xiàn)實人類工作流程中對線條藝術(shù)進(jìn)行著色的系統(tǒng)。大多數(shù)人類藝術(shù)家都熟悉這個工作流程。
打開網(wǎng)站,可以看到上面有很詳細(xì)的圖文告訴大家如何去使用這個工具。你可以控制渲染模式,還可以選擇細(xì)心和粗心模式,保存進(jìn)度。當(dāng)然,上面還有關(guān)于常見問題的解答。
Style2Paints V4 非常的好用!任何人都能在十分鐘內(nèi)學(xué)會!首先你需要下載一張線稿,在工具上保存、上傳之后,再選擇自己喜歡的人工智能畫師,就可以對上傳的線稿進(jìn)行渲染了。
在最新版本里面,還有careful mode (細(xì)心模式) 和 careless mode (粗心模式)。在細(xì)心模式 (careful mode)中,人工智能會細(xì)心的涂抹平滑,精細(xì)的顏色。但是這個模式下的人工智能會限制自我的發(fā)揮來迎合人類。在粗心模式 (careless mode)中,人工智能會自己發(fā)揮,但是可能細(xì)節(jié)上會出現(xiàn)丟失。同時可能人工智能會反抗你的提示。
sketching -> color filling/flattening -> gradients/details adding -> shading
Style2Paints 是根據(jù)上面的流程設(shè)計的。這樣的流只需單擊 2 次,就可以從最左邊的圖像生成中間圖像。
只需再點擊 4 次,你就可以得到下圖:
互聯(lián)網(wǎng)就像是海洋,機(jī)器學(xué)習(xí)就像是流入其中的河流。github 上的 star 是對這條寶河進(jìn)行篩選的一個很好的度量標(biāo)準(zhǔn)。
via:https://towardsdatascience.com/highest-rated-ml-projects-on-github-694486293512
雷鋒網(wǎng)雷鋒網(wǎng)
雷峰網(wǎng)版權(quán)文章,未經(jīng)授權(quán)禁止轉(zhuǎn)載。詳情見轉(zhuǎn)載須知。