0
本文作者: 黃善清 | 2019-01-06 10:32 |
雷鋒網(wǎng) AI 科技評(píng)論按:剛過(guò)去的 2018 年對(duì)人工智能與機(jī)器學(xué)習(xí)領(lǐng)域來(lái)說(shuō)是「豐收」的一年,我們看到越來(lái)越多具有影響力的機(jī)器學(xué)習(xí)應(yīng)用被開(kāi)發(fā)出來(lái),并且應(yīng)用到了實(shí)際生活的諸多領(lǐng)域,特別是在醫(yī)療保健、金融、語(yǔ)音識(shí)別、增強(qiáng)現(xiàn)實(shí)和更復(fù)雜的 3D 視頻應(yīng)用領(lǐng)域。
此外,我們發(fā)現(xiàn)業(yè)內(nèi)產(chǎn)生越來(lái)越多應(yīng)用驅(qū)動(dòng)型的研究工作,數(shù)量上甚至超過(guò)了理論驅(qū)動(dòng)型研究。不可否認(rèn)這種變化有其弊端,然而我們要看到它積極的一面,隨著能夠迅速被商業(yè)轉(zhuǎn)化的研究增多,對(duì)整個(gè)行業(yè)產(chǎn)生了不可估量的積極影響,這在機(jī)器學(xué)習(xí)開(kāi)源領(lǐng)域尤其明顯。
最后,一起看看過(guò)去一年中 6 個(gè)最實(shí)用的機(jī)器學(xué)習(xí)項(xiàng)目。這些項(xiàng)目都已發(fā)布了代碼與數(shù)據(jù)集,方便個(gè)人和小團(tuán)隊(duì)進(jìn)行學(xué)習(xí)并創(chuàng)造價(jià)值,這些項(xiàng)目也許在理論上并不具有開(kāi)創(chuàng)性,卻非常實(shí)用。
本文源自 Towards Data Science 的 George Seif,雷鋒網(wǎng) AI 科技評(píng)論編譯如下。
1)Fast.ai
開(kāi)源地址:
https://github.com/fastai/fastai
Fast.ai 庫(kù)能讓我們通過(guò)最優(yōu)方案來(lái)簡(jiǎn)化神經(jīng)網(wǎng)絡(luò)的訓(xùn)練工程,它抽象出了在實(shí)際搭建深度神經(jīng)網(wǎng)絡(luò)過(guò)程中的所有細(xì)節(jié)工作,設(shè)計(jì)上充分考慮了從業(yè)者們構(gòu)建程序的思維模式,因而非常易于使用。該庫(kù)最初是為 Fast.ai 課程的學(xué)生所創(chuàng)建,通過(guò)簡(jiǎn)潔易懂的方式在 Pytorch 庫(kù)的基礎(chǔ)上進(jìn)行編寫(xiě)。另外,它在文件庫(kù)的整理上也是一流的。(文件庫(kù)地址:https://docs.fast.ai/)
2)Detectron
開(kāi)源地址:
https://github.com/facebookresearch/Detectron
Detectron 是由 Facebook 開(kāi)發(fā)用于物體檢測(cè)與實(shí)例分割的研究型平臺(tái),用深度學(xué)習(xí)框架 Caffe2 寫(xiě)成,包含了各類(lèi)物體檢測(cè)算法的實(shí)現(xiàn),如:
Mask R-CNN:通過(guò) Faster R-CNN 結(jié)構(gòu)實(shí)施物體檢測(cè)與實(shí)例分割。
(https://arxiv.org/abs/1703.06870)
RetinaNet:特征金字塔網(wǎng)絡(luò),通過(guò)獨(dú)特的 Focal Loss 來(lái)處理具有挑戰(zhàn)性的案例。
(https://arxiv.org/abs/1708.02002)
Faster R-CNN:物體檢測(cè)網(wǎng)絡(luò)中最常見(jiàn)的結(jié)構(gòu)。
所有網(wǎng)絡(luò)均可使用以下任一備選分類(lèi)網(wǎng)絡(luò):
ResNeXt{50101152}
(https://arxiv.org/abs/1611.05431)
RESNET{50101152}
(https://arxiv.org/abs/1512.03385)
特征金字塔網(wǎng)絡(luò)(使用 ResNet / ResNeXt)
(https://arxiv.org/abs/1612.03144)
VGG16
值得一提的是,這些平臺(tái)功能自帶 COCO 數(shù)據(jù)集上的預(yù)訓(xùn)練模型,這也意味著用戶(hù)可以快速使用。同時(shí)這些功能均已嚴(yán)格按照標(biāo)準(zhǔn)評(píng)估指標(biāo)在 Detectron model zoo(https://github.com/facebookresearch/Detectron/blob/master/MODEL_ZOO.md)中完成測(cè)試工作。
3)FastText
開(kāi)源地址:
https://github.com/facebookresearch/fastText
這是另一項(xiàng)來(lái)自 Facebook 的研究成果,fastText 庫(kù)專(zhuān)為文本表示與文本分類(lèi)而編寫(xiě)。該庫(kù)配備了預(yù)先訓(xùn)練好的單詞向量模型,涵蓋語(yǔ)言達(dá) 150 多種,可用于完成多項(xiàng)任務(wù),包括文本分類(lèi)、摘要和翻譯等。
4)AutoKeras
Auto-Keras 是用于自動(dòng)機(jī)器學(xué)習(xí)(AutoML)的開(kāi)源軟件庫(kù),由德克薩斯 A&M 大學(xué)的 DATA Lab(http://faculty.cs.tamu.edu/xiahu/index.html)與社區(qū)貢獻(xiàn)者共同開(kāi)發(fā)。AutoML 的目標(biāo)是為缺乏數(shù)據(jù)科學(xué)或機(jī)器學(xué)習(xí)背景的領(lǐng)域?qū)<覀兇蛟煲粋€(gè)易于使用的深度學(xué)習(xí)工具。Auto-Keras 提供了為深度學(xué)習(xí)模型自動(dòng)匹配最佳架構(gòu)與超參數(shù)的功能。
5)Dopamine
開(kāi)源地址:
https://github.com/google/dopamine
Dopamine 是 Google 專(zhuān)為加速?gòu)?qiáng)化學(xué)習(xí)算法原型設(shè)計(jì)而創(chuàng)建的研究框架,在嚴(yán)格遵照 RL 算法、指標(biāo)與基準(zhǔn)的基礎(chǔ)上,達(dá)到靈活且易于使用的目的。
根據(jù) Dopamine 提供的文檔顯示,他們產(chǎn)品設(shè)計(jì)原則包括:
便于執(zhí)行的實(shí)驗(yàn):幫助新用戶(hù)運(yùn)行基準(zhǔn)實(shí)驗(yàn)
靈活的開(kāi)發(fā)流程:促進(jìn)更多開(kāi)創(chuàng)性想法的誕生
簡(jiǎn)潔可靠:能夠落地實(shí)現(xiàn)一些較舊或者較流行的算法
可重復(fù)性:確保結(jié)果得以復(fù)現(xiàn)
6)vid2vid
開(kāi)源地址:
https://github.com/NVIDIA/vid2vid
vid2vid 是基于 Nvidia 最先進(jìn)視頻到視頻合成算法的 Pytorch 實(shí)現(xiàn)項(xiàng)目。視頻到視頻合成算法的目標(biāo)是習(xí)得從輸入源視頻(例如一系列語(yǔ)義分割 mask)到輸出可精確描繪源視頻內(nèi)容的真實(shí)渲染視頻過(guò)程中的映射函數(shù)。
該庫(kù)的優(yōu)點(diǎn)在于選擇的多樣性:它提供了針對(duì)自動(dòng)駕駛/城市場(chǎng)景、人臉以及人體姿勢(shì)在內(nèi)的不同 vid2vid 應(yīng)用程序。此外,還附帶了豐富的指令和功能,其中包括數(shù)據(jù)集加載、任務(wù)評(píng)估、網(wǎng)絡(luò)訓(xùn)練和多 GPU!
特別提及
ChatterBot:用于創(chuàng)建對(duì)話(huà)引擎和聊天機(jī)器人的機(jī)器學(xué)習(xí)項(xiàng)目
開(kāi)源地址:
https://github.com/gunthercox/ChatterBot
Kubeflow:Kubernetes 的機(jī)器學(xué)習(xí)工具包
開(kāi)源地址:
https://github.com/kubeflow/kubeflow
imgaug:用于圖像增強(qiáng)的深度學(xué)習(xí)項(xiàng)目
開(kāi)源地址:
https://github.com/aleju/imgaug
imbalanced-learn:scikit 下的 Python 框架,專(zhuān)用于修復(fù)不平衡的數(shù)據(jù)集
開(kāi)源地址:
https://github.com/scikit-learn-contrib/imbalanced-learn
mlflow:用于管理 ML 項(xiàng)目周期的開(kāi)源平臺(tái),覆蓋實(shí)驗(yàn)、復(fù)現(xiàn)與部署等流程。
開(kāi)源地址:
https://github.com/mlflow/mlflow
AirSim:基于 Unreal Engine/ Unity 的自動(dòng)駕駛汽車(chē)模擬器,由微軟出品
開(kāi)源地址:
https://github.com/Microsoft/AirSim
雷鋒網(wǎng) AI 科技評(píng)論
雷峰網(wǎng)原創(chuàng)文章,未經(jīng)授權(quán)禁止轉(zhuǎn)載。詳情見(jiàn)轉(zhuǎn)載須知。