0
本文作者: skura | 2019-11-02 11:00 |
在 2019 年最值得學(xué)習(xí)的機(jī)器學(xué)習(xí)項(xiàng)目(上)中,我們盤點(diǎn)了很多優(yōu)秀的機(jī)器學(xué)習(xí)項(xiàng)目,其中有 3D 姿態(tài)估計(jì),建筑機(jī)器翻譯,圖像和視頻中的汽車消除等等有意思的內(nèi)容。接下來,我們將繼續(xù)介紹更多優(yōu)秀的機(jī)器學(xué)習(xí)項(xiàng)目,讓同學(xué)們都能找到感興趣的學(xué)習(xí)內(nèi)容。
在下篇中,我們將以一個(gè)內(nèi)衣檢測項(xiàng)目作為開始,下面讓我們看看有哪些好玩的項(xiàng)目吧~
內(nèi)衣檢測儀
——Nick Bourdakos
這完全可以理解。但嚴(yán)肅地說,ML 驅(qū)動(dòng)的 NSFW 濾波器是一個(gè)非常有用的應(yīng)用程序,可以調(diào)節(jié)用戶生成的內(nèi)容。
twitter:https://twitter.com/bourdakos1
代碼:https://github.com/cloud-annotations/training?source=post_page-----e74d7d347c2----------------------
BERT,完全在設(shè)備上運(yùn)行
——Hugging Face
上面,我們討論了 Hugging Face 為將最強(qiáng)大的語言模型引入智能手機(jī)等邊緣設(shè)備所做的持續(xù)努力。這個(gè)演示是一個(gè)關(guān)于在 ios 上用 BERT 回答問題的項(xiàng)目。
twitter:https://twitter.com/julien_c
代碼:
「潛在歷史」:集體攝影記憶
——Refik Anadol
這是一個(gè)令人驚嘆的視覺演示,可以喚起對現(xiàn)代歷史的深刻欣賞與喜歡。VentureBeat 對該項(xiàng)目的簡介很好地解釋了這一點(diǎn):
這篇文章從一組 30 萬張照片中生成圖像,其中包括有 150 年歷史的斯德哥爾摩市檔案館和過去 15 年從同一地點(diǎn)拍攝的彩色圖像。
由此產(chǎn)生的效果是對集體記憶的藝術(shù)呈現(xiàn),大致說可以與當(dāng)今世界融為一體。
twitter:https://twitter.com/refikanadol
VentureBeat 特征:
項(xiàng)目頁面:
從自拍中移除手機(jī)的掩蔽和圖像處理
——Abhishek Singh
照片中沒有手機(jī)的鏡像自拍是真的鏡像自拍,還是別的什么?不管是哪一類,Abhishek Singh 的酷炫演示分三步進(jìn)行:
分割模型對屬于 phone 類對象的每個(gè)像素進(jìn)行分類。
將像素級掩膜應(yīng)用于分割電話。
將圖像應(yīng)用于分割后的手機(jī),產(chǎn)生模糊效果。
twitter:https://twitter.com/shekitup
代碼:
網(wǎng)址:https://github.com/shekit/mirror-selfie?source=post_page-----e74d7d347c2----------------------
用 DVD-GAN 生成整個(gè)視頻
——Aidan Clark, Jeff Donahue, Karen Simonyan
在這里,我們有一個(gè)生成模型,能夠生成具有高復(fù)雜度和保真度的視頻。這種視頻樣本的生成可能會改變合成數(shù)據(jù)集的生存能力。在用 GANs 生成圖像方面有相當(dāng)多的工作(這里的許多項(xiàng)目都展示了這一點(diǎn)),但是生成高質(zhì)量的視頻在數(shù)據(jù)生成、視頻合成和視頻預(yù)測任務(wù)等方面提供了廣泛的可能性。
twitter:https://twitter.com/roadrunning01
論文:
論文:https://arxiv.org/abs/1907.06571?source=post_page-----e74d7d347c2----------------------
在 BigGAN 的潛在空間尋找一幅先前生成的圖像
——Mario Klingemann
這里的推特說明了一切。此外,這個(gè)線程還包含更多演示視頻,通過額外的迭代來展示項(xiàng)目的進(jìn)度。能看到 ML 工程師使用 GAN 潛在空間的各種不同方式,真是太神奇了。
twitter:https://twitter.com/quasimondo
用神經(jīng)繪畫技術(shù)去除運(yùn)動(dòng)物體
——Abhishek Singh
在某些方面類似于他的鏡像項(xiàng)目(如上圖所示)。這一次讓我笑了——不知為什么,看到世界級的運(yùn)動(dòng)員追逐一個(gè)看不見的球真的很有趣。
Abhishek 還快速概述了項(xiàng)目結(jié)構(gòu):
「Maskrcnn 在 Coco 數(shù)據(jù)集上訓(xùn)練以識別和分割對象->將其屏蔽并刪除像素->在 Place2 數(shù)據(jù)集上訓(xùn)練邊緣連接模型以填充丟失的像素。」
twitter:https://twitter.com/shekitup
HoloGAN:學(xué)習(xí)物體的幾何表示
——Thu Nguyen-Phuoc
看到分離的三維表示僅僅來自單一視圖的二維圖像令人印象深刻。
來自摘要:
我們的實(shí)驗(yàn)表明,利用顯式的三維特征,HoloGAN 能夠?qū)⑷S姿態(tài)和身份信息分離出來,并進(jìn)一步分解為形狀和外觀,同時(shí)仍然能夠生成與其他生成模型相似或更高視覺質(zhì)量的圖像。HoloGAN 只能從未標(biāo)記的二維圖像進(jìn)行端到端的訓(xùn)練。特別是,我們不需要姿態(tài)標(biāo)簽、三維形狀或同一對象的多個(gè)視圖。這表明 HoloGAN 是第一個(gè)以完全無監(jiān)督的方式從自然圖像中學(xué)習(xí)三維表示的生成模型。
twitter:https://twitter.com/thunguyenphuoc
項(xiàng)目頁面:
使用姿態(tài)估計(jì)在瀏覽器中自動(dòng)更改文本大小
——Olesya Chenyavskaya
我是 ML 項(xiàng)目的忠實(shí)粉絲,這些項(xiàng)目致力于使我們每天使用的工具更容易訪問。這里就有一個(gè)改變?yōu)g覽器窗口內(nèi)的文本大小的項(xiàng)目。
twitter:https://twitter.com/monolesan
項(xiàng)目頁面和 demo:
網(wǎng)址:https://glitch.com/~make-me-big?source=post_page-----e74d7d347c2----------------------
「Gym City」:用神經(jīng)網(wǎng)絡(luò)模擬城市
——Sam Earle
這個(gè)項(xiàng)目的 github repo 比以往任何時(shí)候都能更好地解釋這里發(fā)生的事情,因此我將讓它在這里完成工作:
一個(gè)強(qiáng)化學(xué)習(xí)界面,用于可變規(guī)模的城市規(guī)劃型健身房環(huán)境。
twitter:https://twitter.com/jamesonthecrow
代碼:
網(wǎng)址:https://github.com/smearle/gym-city?source=post_page-----e74d7d347c2----------------------
基于 GANs 和單參考圖像的運(yùn)動(dòng)風(fēng)格轉(zhuǎn)換
——SVIP Lab
運(yùn)動(dòng)模擬+風(fēng)格轉(zhuǎn)換是一個(gè)很酷的想法,而在這個(gè)項(xiàng)目中提出的統(tǒng)一框架具有廣泛的轉(zhuǎn)換可能性。
摘要包含了對該項(xiàng)目的特色描述,包括它與其他方法的區(qū)別:
現(xiàn)有的任務(wù)特定方法主要使用 2D 關(guān)鍵點(diǎn)(姿勢)來估計(jì)人體結(jié)構(gòu)。然而,它們只表達(dá)位置信息,沒有能力描述個(gè)體的個(gè)性化形狀,也無法模擬肢體旋轉(zhuǎn)。本文提出了一種三維人體網(wǎng)格恢復(fù)模型,它不僅可以對關(guān)節(jié)的位置和旋轉(zhuǎn)進(jìn)行建模,而且可以對個(gè)性化的人體形狀進(jìn)行表征。為了保留源信息,如紋理、樣式、顏色和面部特征,我們提出了一種帶液體翹曲塊的液體翹曲 GAN,它在圖像和特征空間中傳播源信息,并根據(jù)參考合成圖像。
twitter:https://twitter.com/roadrunning01
論文:
網(wǎng)址:https://arxiv.org/abs/1909.12224?source=post_page-----e74d7d347c2----------------------
項(xiàng)目頁面:
代碼:
網(wǎng)址:https://github.com/svip-lab/impersonator?source=post_page-----e74d7d347c2----------------------
由 DeepMind 創(chuàng)作的 Spiral:19 筆畫出一幅肖像
——Yaroslav Ganin 和 DeepMindAI
本質(zhì)上,這個(gè)項(xiàng)目允許用戶無條件地從 Celeba HQ 數(shù)據(jù)集生成圖像,分 19 步(這里稱為筆觸)。我也很喜歡這里的油畫美感。
twitter:https://twitter.com/yaroslav_ganin
模型:
代碼:
網(wǎng)址:https://github.com/deepmind/spiral?source=post_page-----e74d7d347c2----------------------
照亮已拍下的肖像照片
——Hao Zhou, Sunil Hadap, Kaylan Sunkavili 和 David Jacobs
我當(dāng)然不是一個(gè)有才華的攝影師,要在我拍攝的照片上獲得正確的光線總是很困難的。因此,能夠自動(dòng)地為光線不好的圖像設(shè)定特定的照明級別是一個(gè)非常吸引人的想法。
twitter:https://twitter.com/roadrunning01
項(xiàng)目頁面:
網(wǎng)址:https://zhhoper.github.io/dpr.html?source=post_page-----e74d7d347c2----------------------
代碼:
網(wǎng)址:https://github.com/zhhoper/DPR?source=post_page-----e74d7d347c2----------------------
最后,本著萬圣節(jié)的精神——Jack-o- GANterns?
——Michael Friesen
必須在這里加入雙關(guān)語。一個(gè)有趣的季節(jié)性使用 GAN 的玩法——其中一些看起來像設(shè)計(jì),我已經(jīng)嘗試(并失?。┒嗄?。讓恐怖表演開始吧…
twitter:https://twitter.com/MichaelFriese10
好啦,今年最有趣的機(jī)器學(xué)習(xí)項(xiàng)目盤點(diǎn)就到這里了。本次盤點(diǎn)包含了機(jī)器學(xué)習(xí)相關(guān)的各個(gè)領(lǐng)域各種有趣的項(xiàng)目,同時(shí)還附上了相關(guān)的代碼鏈接,以及論文鏈接,相關(guān)的 twitter 等,感興趣的同學(xué)們可以好好利用這些優(yōu)質(zhì)的資源,在玩這些項(xiàng)目的同時(shí)還能學(xué)到新知識,一舉兩得!
via:https://heartbeat.fritz.ai/2019s-awesome-machine-learning-projects-with-visual-demos-e74d7d347c2?gi=7b82d428eb9b
雷鋒網(wǎng)雷鋒網(wǎng)雷鋒網(wǎng)
雷峰網(wǎng)版權(quán)文章,未經(jīng)授權(quán)禁止轉(zhuǎn)載。詳情見轉(zhuǎn)載須知。