丁香五月天婷婷久久婷婷色综合91|国产传媒自偷自拍|久久影院亚洲精品|国产欧美VA天堂国产美女自慰视屏|免费黄色av网站|婷婷丁香五月激情四射|日韩AV一区二区中文字幕在线观看|亚洲欧美日本性爱|日日噜噜噜夜夜噜噜噜|中文Av日韩一区二区

<label id="qtdnu"></label>

<li id="qtdnu"><legend id="qtdnu"></legend></li>

<span id="qtdnu"></span>

您正在使用IE低版瀏覽器，為了您的雷峰網(wǎng)賬號安全和更好的產品體驗，強烈建議使用更快更安全的瀏覽器

此為臨時鏈接，僅用于文章預覽，將在時失效

人工智能正文

發(fā)私信給何之源

發(fā)送

8

GAN學習指南：從原理入門到制作生成Demo，總共分幾步？

本文作者：何之源

2017-01-22 10:10

導語：本文介紹下GAN和DCGAN的原理，以及如何使用Tensorflow做一個簡單的生成圖片的demo。

雷鋒網(wǎng)注：本文作者何之源，復旦大學計算機科學碩士在讀，研究人工智能計算機視覺方向。本文由雷鋒網(wǎng)編輯整理自作者知乎專欄，獲授權發(fā)布。

生成式對抗網(wǎng)絡（GAN）是近年來大熱的深度學習模型。最近正好有空看了這方面的一些論文，跑了一個GAN的代碼，于是寫了這篇文章來介紹一下GAN。

本文主要分為三個部分：

介紹原始的GAN的原理
同樣非常重要的DCGAN的原理
如何在Tensorflow跑DCGAN的代碼，生成如題圖所示的動漫頭像，附送數(shù)據(jù)集哦 :-)

一、GAN原理介紹

說到GAN第一篇要看的paper當然是Ian Goodfellow大牛的Generative Adversarial Networks，這篇paper算是這個領域的開山之作。

GAN的基本原理其實非常簡單，這里以生成圖片為例進行說明。假設我們有兩個網(wǎng)絡，G（Generator）和D（Discriminator）。正如它的名字所暗示的那樣，它們的功能分別是：

G是一個生成圖片的網(wǎng)絡，它接收一個隨機的噪聲z，通過這個噪聲生成圖片，記做G(z)。
D是一個判別網(wǎng)絡，判別一張圖片是不是“真實的”。它的輸入?yún)?shù)是x，x代表一張圖片，輸出D（x）代表x為真實圖片的概率，如果為1，就代表100%是真實的圖片，而輸出為0，就代表不可能是真實的圖片。

在訓練過程中，生成網(wǎng)絡G的目標就是盡量生成真實的圖片去欺騙判別網(wǎng)絡D。而D的目標就是盡量把G生成的圖片和真實的圖片分別開來。這樣，G和D構成了一個動態(tài)的“博弈過程”。

最后博弈的結果是什么？在最理想的狀態(tài)下，G可以生成足以“以假亂真”的圖片G(z)。對于D來說，它難以判定G生成的圖片究竟是不是真實的，因此D(G(z)) = 0.5。

這樣我們的目的就達成了：我們得到了一個生成式的模型G，它可以用來生成圖片。

以上只是大致說了一下GAN的核心原理，如何用數(shù)學語言描述呢？這里直接摘錄論文里的公式：

GAN學習指南：從原理入門到制作生成Demo，總共分幾步？

簡單分析一下這個公式：

整個式子由兩項構成。x表示真實圖片，z表示輸入G網(wǎng)絡的噪聲，而G(z)表示G網(wǎng)絡生成的圖片。
D(x)表示D網(wǎng)絡判斷真實圖片是否真實的概率（因為x就是真實的，所以對于D來說，這個值越接近1越好）。而D(G(z))是D網(wǎng)絡判斷G生成的圖片的是否真實的概率。
G的目的：上面提到過，D(G(z))是D網(wǎng)絡判斷G生成的圖片是否真實的概率，G應該希望自己生成的圖片“越接近真實越好”。也就是說，G希望D(G(z))盡可能得大，這時V(D, G)會變小。因此我們看到式子的最前面的記號是min_G。
D的目的：D的能力越強，D(x)應該越大，D(G(x))應該越小。這時V(D,G)會變大。因此式子對于D來說是求最大(max_D)

下面這幅圖片很好地描述了這個過程：

GAN學習指南：從原理入門到制作生成Demo，總共分幾步？

那么如何用隨機梯度下降法訓練D和G？論文中也給出了算法：

GAN學習指南：從原理入門到制作生成Demo，總共分幾步？

這里紅框圈出的部分是我們要額外注意的。第一步我們訓練D，D是希望V(G, D)越大越好，所以是加上梯度(ascending)。第二步訓練G時，V(G, D)越小越好，所以是減去梯度(descending)。整個訓練過程交替進行。

二、DCGAN原理介紹

我們知道深度學習中對圖像處理應用最好的模型是CNN，那么如何把CNN與GAN結合？DCGAN是這方面最好的嘗試之一（點擊查看論文）

DCGAN的原理和GAN是一樣的，這里就不在贅述。它只是把上述的G和D換成了兩個卷積神經(jīng)網(wǎng)絡（CNN）。但不是直接換就可以了，DCGAN對卷積神經(jīng)網(wǎng)絡的結構做了一些改變，以提高樣本的質量和收斂的速度，這些改變有：

取消所有pooling層。G網(wǎng)絡中使用轉置卷積（transposed convolutional layer）進行上采樣，D網(wǎng)絡中用加入stride的卷積代替pooling。
在D和G中均使用batch normalization
去掉FC層，使網(wǎng)絡變?yōu)槿矸e網(wǎng)絡
G網(wǎng)絡中使用ReLU作為激活函數(shù)，最后一層使用tanh
D網(wǎng)絡中使用LeakyReLU作為激活函數(shù)

DCGAN中的G網(wǎng)絡示意：

GAN學習指南：從原理入門到制作生成Demo，總共分幾步？

三、DCGAN in Tensorflow

好了，上面說了一通原理，下面說點有意思的實踐部分的內容。

DCGAN的原作者用DCGAN生成LSUN的臥室圖片，這并不是特別有意思。之前在網(wǎng)上看到一篇文章 Chainerで顔イラストの自動生成 - Qiita ，是用DCGAN生成動漫人物頭像的，效果如下：

GAN學習指南：從原理入門到制作生成Demo，總共分幾步？

這是個很有趣的實踐內容?？上г氖怯肅hainer做的，這個框架使用的人不多。下面我們就在Tensorflow中復現(xiàn)這個結果。

1. 原始數(shù)據(jù)集的搜集

首先我們需要用爬蟲爬取大量的動漫圖片，原文是在這個網(wǎng)站：http://safebooru.donmai.us/中爬取的。我嘗試的時候，發(fā)現(xiàn)在我的網(wǎng)絡環(huán)境下無法訪問這個網(wǎng)站，于是我就寫了一個簡單的爬蟲爬了另外一個著名的動漫圖庫網(wǎng)站：konachan.net。

爬蟲代碼如下：

GAN學習指南：從原理入門到制作生成Demo，總共分幾步？

這個爬蟲大概跑了一天，爬下來12萬張圖片，大概是這樣的：

GAN學習指南：從原理入門到制作生成Demo，總共分幾步？

可以看到這里面的圖片大多數(shù)比較雜亂，還不能直接作為數(shù)據(jù)訓練，我們需要用合適的工具，截取人物的頭像進行訓練。

2. 頭像截取

截取頭像和原文一樣，直接使用github上一個基于opencv的工具：nagadomi。

簡單包裝下代碼：

GAN學習指南：從原理入門到制作生成Demo，總共分幾步？

截取頭像后的人物數(shù)據(jù)：

GAN學習指南：從原理入門到制作生成Demo，總共分幾步？

這樣就可以用來訓練了！

如果你不想從頭開始爬圖片，可以直接使用我爬好的頭像數(shù)據(jù)（275M，約5萬多張圖片）：百度云盤提取碼：g5qa

3. 訓練

DCGAN在Tensorflow中已經(jīng)有人造好了輪子：carpedm20/DCGAN，我們直接使用這個代碼就可以了。

不過原始代碼中只提供了有限的幾個數(shù)據(jù)庫，如何訓練自己的數(shù)據(jù)？在model.py中我們找到讀數(shù)據(jù)的幾行代碼：

if config.dataset == 'mnist':
data_X, data_y = self.load_mnist()
else:
data = glob(os.path.join("./data", config.dataset, "*.jpg"))

這樣讀數(shù)據(jù)的邏輯就很清楚了，我們在data文件夾中再新建一個anime文件夾，把圖片直接放到這個文件夾里，運行時指定--dataset anime即可。

運行指令（參數(shù)含義：指定生成的圖片的尺寸為48x48，我們圖片的大小是96x96，跑300個epoch）：

python main.py --image_size 96 --output_size 48 --dataset anime --is_crop True --is_train True --epoch 300

4. 結果

第1個epoch跑完（只有一點點輪廓）：

GAN學習指南：從原理入門到制作生成Demo，總共分幾步？

第5個epoch之后的結果：

GAN學習指南：從原理入門到制作生成Demo，總共分幾步？

第10個epoch：

GAN學習指南：從原理入門到制作生成Demo，總共分幾步？

200個epoch，仔細看有些圖片確實是足以以假亂真的：

GAN學習指南：從原理入門到制作生成Demo，總共分幾步？

題圖是我從第300個epoch生成的。

四、總結和后續(xù)

簡單介紹了一下GAN和DCGAN的原理。以及如何使用Tensorflow做一個簡單的生成圖片的demo。

一些后續(xù)閱讀：

Ian Goodfellow對GAN一系列工作總結的ppt，確實精彩，推薦：GAN之父NIPS 2016演講現(xiàn)場直擊：全方位解讀生成對抗網(wǎng)絡的原理及未來

GAN論文匯總，包含code：zhangqianhui/AdversarialNetsPapers

雷峰網(wǎng)特約稿件，未經(jīng)授權禁止轉載。詳情見轉載須知。

38人收藏

分享：

相關文章

何之源

專欄作者

復旦大學計算機科學碩士，方向為人工智能，計算機視覺。

發(fā)私信

當月熱門文章

最新文章

熱門搜索

移動互聯(lián)網(wǎng) 芯片 LeiPhone Magic Leap iPhone 5 社交 Xbox One Pebble 蘋果公司高德聯(lián)通

為了您的賬戶安全，請驗證郵箱

您的郵箱還未驗證,完成可獲20積分喲！

重發(fā)郵箱修改郵箱

請驗證您的郵箱

立即驗證

完善賬號信息

您的賬號已經(jīng)綁定，現(xiàn)在您可以設置密碼以方便用郵箱登錄

立即設置 以后再說