0
本文作者: AI研習(xí)社-譯站 | 2018-11-22 14:53 |
本文為 AI 研習(xí)社編譯的技術(shù)博客,原標(biāo)題 :
25 Open-Source Machine Learning Repos to Inspire Your Next Project
作者 | Khoa Pham
翻譯 | 狒狒 校對(duì) | 姚秀清
整理 | 菠蘿妹
原文鏈接:
https://heartbeat.fritz.ai/25-open-source-machine-learning-repos-to-inspire-your-next-project-3b027a90155
很有啟發(fā)性的25個(gè)開源機(jī)器學(xué)習(xí)項(xiàng)目
在過去幾年中,機(jī)器學(xué)習(xí)開辟了很多新的領(lǐng)域,出現(xiàn)了很多高級(jí)應(yīng)用案例:Facebook的臉部識(shí)別、Netflix的電影推薦、PrimaAI的圖像風(fēng)格轉(zhuǎn)移、Siri的語音識(shí)別、Google Allo的自然語言處理等等。
除了這些用例之外,GitHub上還有大量優(yōu)秀的開源機(jī)器學(xué)習(xí)項(xiàng)目。以下列出了目前最受歡迎的項(xiàng)目。希望讀者能從中學(xué)到新東西,并受到啟發(fā)。
TensorFlow是一個(gè)用于研究和生產(chǎn)的開源機(jī)器學(xué)習(xí)庫。TensorFlow為初學(xué)者和專家提供了用于桌面、移動(dòng)、web和云開發(fā)的API接口。
TensorFlow最初由谷歌大腦團(tuán)隊(duì)開發(fā),用于內(nèi)部使用,2015年11月9日TensorFlow根據(jù)Apache 2.0開源許可協(xié)議進(jìn)行正式對(duì)外發(fā)布。
最新版本的TensorFlow支持Keras,這是一種高級(jí)神經(jīng)網(wǎng)絡(luò)API,用Python編寫,能夠基于TensorFlow、CNTK或Theano運(yùn)行。還有支持Javascript和Swift的接口。
Scikit-learn最初是由David Cournapeau在夏季谷歌代碼活動(dòng)上編寫的。它的名字或多或少參考了SciPy工具包。Scikit-learn擁有基于NumPy、SciPy和Matplotlib的簡單高效的數(shù)據(jù)挖掘和數(shù)據(jù)分析工具。因?yàn)樗唵我子?,所以?jīng)常與TensorFlow一起配合使用。
除了TensorFlow、Keras和Scikit-learn之外,還有來自Apache的MXNet深度學(xué)習(xí)框架。 它是為效率和靈活性而設(shè)計(jì)的——它允許您混合使用符號(hào)和指令式編程來最大化效率和生產(chǎn)力。可以訪問它的模型社區(qū)獲取更多采用MXNet的模型。
如果沒有提到PyTorch,這個(gè)列表就不完整了,PyTorch是機(jī)器學(xué)習(xí)愛好者的另一個(gè)流行選擇。 PyTorch基于Torch,由Facebook作為機(jī)器學(xué)習(xí)的框架而分發(fā)。 PyTorch是一個(gè)Python包,它提供了兩個(gè)高級(jí)特性:帶強(qiáng)GPU加速的張量計(jì)算(比如NumPy)和基于tape的autograd系統(tǒng)的深層神經(jīng)網(wǎng)絡(luò)。
https://twitter.com/pytorch/status/966324198758006784
Magenta 是一個(gè)研究項(xiàng)目,探索機(jī)器學(xué)習(xí)在藝術(shù)和音樂創(chuàng)作過程中的作用。 這主要涉及開發(fā)新的深度學(xué)習(xí)和增強(qiáng)學(xué)習(xí)算法,以生成歌曲、圖像、繪圖和其他材料。 但這也是在構(gòu)建智能工具和接口方面的探索,這些工具和接口允許藝術(shù)家和音樂家使用這些模型擴(kuò)展(而不是替換!)他們的創(chuàng)作過程。
主要的repo采用Python語言,但針對(duì)Javascript語言也有magenta.js。 在展示先進(jìn)的機(jī)器學(xué)習(xí)應(yīng)用方面,Magenta 是一個(gè)完美的項(xiàng)目。我們大多數(shù)人從未想到過。若對(duì) Magenta感興趣,可以使用聲音和繪圖生成器來查看一些演示。
這個(gè)項(xiàng)目旨在給線條藝術(shù)著色。人工智能可以根據(jù)給定的顏色風(fēng)格在草圖上作畫,創(chuàng)建自己的顏色風(fēng)格并在草圖上作畫,或者轉(zhuǎn)移另一個(gè)插圖的風(fēng)格。
有一些新的功能,如圖像錨和圖像轉(zhuǎn)換,值得一看。
這個(gè)項(xiàng)目有兩個(gè)組件——cyclegan和pix2pix,它們包含用于非成對(duì)和成對(duì)圖像到圖像轉(zhuǎn)換的PyTorch實(shí)現(xiàn)。一開始,它看起來像另一個(gè)相當(dāng)普通的風(fēng)格轉(zhuǎn)換的解決方案,但它可以做一些不同的事情,比如把一匹馬轉(zhuǎn)換成斑馬,或者把現(xiàn)場照片轉(zhuǎn)換成莫奈風(fēng)格的畫作。這個(gè)過程足夠快,可以在視頻直播中使用。
我們有一些用于圖像和視頻的樣式轉(zhuǎn)換工具,那么聲音呢?深度語音對(duì)話就是這種能力的一個(gè)完美案例。
如果你能模仿一位名人的聲音或者像一位著名歌手那樣唱歌呢?這個(gè)項(xiàng)目一開始的目標(biāo)是將某人的聲音轉(zhuǎn)換為特定的目標(biāo)聲音。這就是所謂的語音風(fēng)格轉(zhuǎn)換。我們致力于這個(gè)項(xiàng)目,旨在將某人的聲音轉(zhuǎn)換為著名的英國女演員凱特溫斯萊特的聲音。我們實(shí)現(xiàn)了一個(gè)深度神經(jīng)網(wǎng)絡(luò)來實(shí)現(xiàn)這一點(diǎn),并且使用了超過2小時(shí)的由Kate Winslet朗讀的有聲書讀物作為數(shù)據(jù)集。
如果你還不相信,那就去SoundCloud,有很多Kate Winslet聲音的Demo。
StarGAN是這篇論文的一個(gè)PyTorch實(shí)現(xiàn): 多區(qū)域圖像到圖像轉(zhuǎn)換的統(tǒng)一生成對(duì)抗性網(wǎng)絡(luò)。
它超越了樣式轉(zhuǎn)換,通過應(yīng)用不同的發(fā)型、皮膚類型、年齡、性別和不同的情緒來轉(zhuǎn)換源圖像。非常棒。
這聽起來可能并不有趣,因?yàn)楝F(xiàn)在我們可以很容易地在iOS和Android上使用Core ML或ML Kit。但更深入的觀察顯示這是多么的棒。它不僅能識(shí)別人臉,還能識(shí)別情緒和性別。
實(shí)時(shí)人臉檢測和情感/性別分類使用fer2013/IMDB數(shù)據(jù)集與Keras CNN模型和OpenCV。
Uber AI Labs建立了這個(gè)深度概率軟件庫,以幫助簡化其交通服務(wù)的預(yù)測和優(yōu)化。這個(gè)庫對(duì)于任何處理概率建模的人來說都很有興趣。
機(jī)會(huì)范圍從匹配乘客與司機(jī),建議最佳路線,并到找到合理的資源池組合,甚至是創(chuàng)造下一代智能汽車。為了解決這些挑戰(zhàn),我們將最先進(jìn)的人工智能(AI)技術(shù)與擁有豐富專業(yè)知識(shí)的數(shù)據(jù)科學(xué)家、工程師和其他用戶相結(jié)合。我們正在探索一種工具優(yōu)先的方法,使我們和其他人能夠創(chuàng)造出下一代人工智能解決方案。
作為Facebook研究項(xiàng)目的一部分,ParlAI是一個(gè)框架,用于訓(xùn)練和評(píng)估各種基于公開可用對(duì)話數(shù)據(jù)集的人工智能模型。ParlAI使得研究人員可以訪問許多流行的數(shù)據(jù)集,同時(shí)擁有一個(gè)統(tǒng)一的框架來共享和測試對(duì)話模型。你可以在這里閱讀更多關(guān)于ParlAI的內(nèi)容。
facet是可視化機(jī)器學(xué)習(xí)數(shù)據(jù)集的工具。
可視化實(shí)現(xiàn)為 Polymer web組件,由Typescript代碼支持,可以很容易地嵌入到Jupyter筆記本或網(wǎng)頁中。
可視化的關(guān)鍵方面是跨多個(gè)數(shù)據(jù)集的離群點(diǎn)檢測和分布比較。有趣的值(例如高比例的缺失數(shù)據(jù),或者跨多個(gè)數(shù)據(jù)集的不同特性分布)用紅色突出顯示。
ELF是一個(gè)使用AlphaGoZero/AlphaZero重新實(shí)現(xiàn)的游戲研究平臺(tái)。ELF為游戲研究提供了端到端解決方案。它包括小型實(shí)時(shí)戰(zhàn)略游戲環(huán)境、并發(fā)模擬、基于數(shù)千臺(tái)機(jī)器的分布式訓(xùn)練、直觀的api、基于web的可視化以及一個(gè)由PyTorch提供支持的強(qiáng)化學(xué)習(xí)框架。
Detectron是Facebook AI 研究部門的軟件系統(tǒng),它實(shí)現(xiàn)了最先進(jìn)的目標(biāo)檢測算法,包括Mask R-CNN。它是用Python編寫的,并由Caffe2深度學(xué)習(xí)框架提供支持。
采用TensorFlow CNN實(shí)現(xiàn),這可能是圖像風(fēng)格轉(zhuǎn)換的最好例子之一,正如它的名字所暗示的,它的運(yùn)行非???。實(shí)現(xiàn)了基于Gatys藝術(shù)風(fēng)格的神經(jīng)算法,Johnson對(duì)實(shí)時(shí)風(fēng)格轉(zhuǎn)換和超分辨率的感知損失,以及Ulyanov的實(shí)例規(guī)范化。
這個(gè)工具為面部識(shí)別提供了簡單的api。它能發(fā)現(xiàn)面部特征,并能猜出照片中的人是誰。
使用dlib最先進(jìn)的面部識(shí)別技術(shù)進(jìn)行深度學(xué)習(xí)。該模型對(duì)自然環(huán)境中被標(biāo)記的人臉的測試準(zhǔn)確率為99.38%。 也提供了一個(gè)簡單的命令來進(jìn)行執(zhí)行面部識(shí)別。
face_recognition
命令行工具,允許您從命令行對(duì)圖像文件夾進(jìn)行面部識(shí)別!
另一個(gè)極好的風(fēng)格轉(zhuǎn)換項(xiàng)目。這個(gè)repo包含代碼和一篇研究論文:深度照片風(fēng)格變換。它提供了簡單的api來處理合并樣式和源圖像。令人印象非常深刻的照片風(fēng)格變換。
fastText 是一種高效學(xué)習(xí)詞匯表示和句子分類的庫。
為了更好地了解這個(gè)項(xiàng)目,可以查看他們的文本分類教程,該教程展示了如何在監(jiān)督學(xué)習(xí)中使用這個(gè)庫。文本分類的目的是將文檔(如電子郵件、帖子、短信、產(chǎn)品評(píng)論等)分配給一個(gè)或多個(gè)類別。
AirSim是一個(gè)基于虛幻引擎來模擬無人機(jī)、汽車的應(yīng)用。它是開源的,跨平臺(tái)的,它支持流行的飛行控制器硬件,如PX4用于物理和視覺的仿真。它是一個(gè)虛擬插件,可以簡單地放到任何你想要的不真實(shí)的環(huán)境中。
機(jī)器學(xué)習(xí)能做的比我們想象的更多。 Deep Image Prior ,它采用神經(jīng)網(wǎng)絡(luò)修復(fù)圖像——但不需要學(xué)習(xí)。
這個(gè)工具可以恢復(fù)帶有刮痕,壞點(diǎn),或不需要的文本標(biāo)記損壞的圖像。
Open Pose 是第一個(gè)實(shí)時(shí)多人系統(tǒng),可以在單個(gè)圖像上同時(shí)檢測人體、手、面部和腳的關(guān)鍵點(diǎn)(總共135個(gè)關(guān)鍵點(diǎn))。它能探測到腳、身體、臉和手。
PirateAI在模擬環(huán)境(島嶼)中訓(xùn)練自主個(gè)體(海盜)。 這個(gè)程序運(yùn)行一個(gè)訓(xùn)練管道,在游戲(尋找寶藏)和模型訓(xùn)練(Keras + hyperopt)之間交替進(jìn)行。
與這個(gè)列表中的許多項(xiàng)目相比,這是相當(dāng)簡單的,但是它是學(xué)習(xí)神經(jīng)網(wǎng)絡(luò)如何工作的一個(gè)很好的起點(diǎn)。 這個(gè)實(shí)現(xiàn)是純Swift的,沒有使用任何庫,而且很容易模仿。
Deep Exemplar-Based Colorization 是基于范例進(jìn)行局部著色的第一個(gè)深度學(xué)習(xí)方法。 給定一個(gè)參考的彩色圖像,我們的卷積神經(jīng)網(wǎng)絡(luò)直接將灰度圖像轉(zhuǎn)換成彩色圖像輸出。 這是論文“基于深度范例的色彩化”的應(yīng)用。
謝謝你瀏覽這個(gè)列表。我希望你已經(jīng)找到了一些能激勵(lì)和吸引你的東西。相對(duì)而言,機(jī)器學(xué)習(xí)剛剛起步,所以未來肯定會(huì)有更多有趣的新項(xiàng)目。這里有更多的資源供進(jìn)一步探索:
GitHub Machine Learning Collection: 每天都能發(fā)現(xiàn)熱門機(jī)器學(xué)習(xí)項(xiàng)目
Awesome machine learning: 有一個(gè)關(guān)于所有事情的“令人驚訝的列表”——這個(gè)列表以機(jī)器學(xué)習(xí)為中心,它的管理令人印象深刻。
Fantastic machine learning: 這個(gè)列表主要是關(guān)于ML相關(guān)的核心項(xiàng)目。 雷鋒網(wǎng)雷鋒網(wǎng)雷鋒網(wǎng)
歡迎在Hacker News和Reddit上討論這篇文章
想要繼續(xù)查看該篇文章相關(guān)鏈接和參考文獻(xiàn)?
長按鏈接點(diǎn)擊打開或點(diǎn)擊【這25個(gè)開源機(jī)器學(xué)習(xí)項(xiàng)目,一般人我不告訴Ta】:
http://ai.yanxishe.com/page/TextTranslation/1122
AI研習(xí)社每日更新精彩內(nèi)容,觀看更多精彩內(nèi)容:
使用 SKIL 和 YOLO 構(gòu)建產(chǎn)品級(jí)目標(biāo)檢測系統(tǒng)
AI課程/書籍/視頻講座/論文精選大列表
如何極大效率地提高你訓(xùn)練模型的速度?
數(shù)據(jù)科學(xué)家應(yīng)當(dāng)了解的五個(gè)統(tǒng)計(jì)基本概念:統(tǒng)計(jì)特征、概率分布、降維、過采樣/欠采樣、貝葉斯統(tǒng)計(jì)
雷峰網(wǎng)原創(chuàng)文章,未經(jīng)授權(quán)禁止轉(zhuǎn)載。詳情見轉(zhuǎn)載須知。