Github代碼實(shí)踐：Pytorch實(shí)現(xiàn)的語義分割器

本文作者： AI研習(xí)社-譯站

2018-05-03 14:27

導(dǎo)語：通過這個代碼，你可以根據(jù)草圖訓(xùn)練模型或者通過使用Detectron中得到預(yù)訓(xùn)練權(quán)重(*.pk)來進(jìn)行推斷。

雷鋒網(wǎng)按：本文為雷鋒字幕組編譯的Github項(xiàng)目，原標(biāo)題A Pytorch Implementation of Detectron，作者為 roytseng-tw。

翻譯 | 楊婉迪陳明霏整理 | 凡江

Github代碼實(shí)踐：Pytorch實(shí)現(xiàn)的語義分割器

使用Detectron預(yù)訓(xùn)練權(quán)重輸出 *e2e_mask_rcnn-R-101-FPN_2x* 的示例

Github代碼實(shí)踐：Pytorch實(shí)現(xiàn)的語義分割器

從Detectron輸出的相關(guān)示例

Github代碼實(shí)踐：Pytorch實(shí)現(xiàn)的語義分割器

使用Detectron預(yù)訓(xùn)練權(quán)重輸出 *e2e_keypoint_rcnn-R-50-FPN_s1x*的示例

這個代碼是按照Detectron的安裝架構(gòu)來實(shí)現(xiàn)的，僅支持部分功能性，你可以通過點(diǎn)擊此鏈接來獲取更多相關(guān)信息。

通過這個代碼，你可以……

根據(jù)草圖訓(xùn)練模型；
通過使用Detectron中得到預(yù)訓(xùn)練權(quán)重(*.pk)來進(jìn)行推斷；

這個儲存器最早是建在jwyang/faster-rcnn.pytorch上的，但是經(jīng)過多次的修改，這個結(jié)構(gòu)已經(jīng)變了很多了而且現(xiàn)在更類似于Detectron。為了直接從正式的預(yù)訓(xùn)練權(quán)重文件中重新得到結(jié)果，我刻意將所有東西弄得和Detectron的運(yùn)行方法相似或者一致了。

這個工具有以下特征：

這個完全是Pytorch代碼，當(dāng)然了，也有一些CUDA代碼。
它支持多圖像的批處理加工訓(xùn)練。
它支持多GPUs 訓(xùn)練。
它支持三種合并方法，但是需要注意的是只有roi align能被改進(jìn)去匹配 Caffe2的安裝。所以，盡管去用就好了。
它可以高效利用內(nèi)存。對于數(shù)據(jù)的批處理，這兒有兩種可選擇的技術(shù)去減少顯存使用量：1）根據(jù)類別分組：同批次的一組圖像是有相似的類別比率 2)根據(jù)類別剪裁：剪裁圖像太長了。類別分組是在Detectron運(yùn)行，所以用來默認(rèn)，類別剪裁是來自jwyang/faster-rcnn.pytorch，所以它不能用來默認(rèn)。

除此之外，我提供一個定制化的模型nn.DataParallel ，它能夠使不同批次混亂的型號出現(xiàn)在不同的繪圖處理器上。你可以在My nn.DataParallel 這節(jié)找到更多關(guān)于這個的詳細(xì)內(nèi)容。

支持的網(wǎng)絡(luò)模型

主要架構(gòu)：

ResNet series: ResNet50_conv4_body, ResNet50_conv5_body, ResNet101_Conv4_Body, ResNet101_Conv5_Body, ResNet152_Conv5_Body

FPN: fpn_ResNet50_conv5_body, fpn_ResNet50_conv5_P2only_body, fpn_ResNet101_conv5_body,fpn_ResNet101_conv5_P2only_body, fpn_ResNet152_conv5_body, fpn_ResNet152_conv5_P2only_body

ResNeXt也被運(yùn)行了但是還沒有測試。
Box head: ResNet_roi_conv5_head, roi_2mlp_head
Mask head: mask_rcnn_fcn_head_v0upshare, mask_rcnn_fcn_head_v0up, mask_rcnn_fcn_head_v1up4convs, mask_rcnn_fcn_head_v1up
Keypoints head: roi_pose_head_v1convX

注意：這個命名和那個用在Detectron的是相似的。只是刪掉前置的add_，如果有的話。

支持的數(shù)據(jù)集

現(xiàn)在只有COCO是被支持的。但是，整個數(shù)據(jù)集庫運(yùn)行幾乎是和 Detectron的是一樣的，所以用Detectron支持添加更多的數(shù)據(jù)集是很簡單的。

配置選擇

架構(gòu)單一明確的配置文件是放在configs下的。一般的配置文件lib/core/config.py里所有的選項(xiàng)都基本是和Detectron相同的默認(rèn)值。所以把架構(gòu)單一的configs轉(zhuǎn)化到Detectron是非常輕松的。

怎樣把配置文件從Detectron轉(zhuǎn)化出來

1. 刪除 MODEL.NUM_CLASSES 。在JsonDataset初賦值過程中被設(shè)置。

2. 刪除 TRAIN.WEIGHTS，TRAIN.DATASETS 和TEST.DATASETS。

3. 在模型類型的選擇中，

（比如： MODEL.CONV_BODY，F(xiàn)AST_RCNN.ROI_BOX_HEAD ……）如果在數(shù)串中存在 add_，則將其刪除。

4. 如果想給模型加載更多的ImageNet 預(yù)訓(xùn)練權(quán)重，添加指向預(yù)訓(xùn)練權(quán)重文件的RESNETS.IMAGENET_PRETRAINED_WEIGHTS 。如果沒有就把MODEL.LOAD_IMAGENET_PRETRAINED_WEIGHTS設(shè)置成 False

更多的細(xì)節(jié)

一些選項(xiàng)是不能使用的因?yàn)橄嚓P(guān)的功能性還沒有實(shí)現(xiàn)。但是有一些不能被使用的原因是我用不同方法安裝了程序。

這里有一些沒有影響但值得注意的選項(xiàng)：

SOLVER.LR_POLICY, SOLVER.MAX_ITER, SOLVER.STEPS,SOLVER.LRS ：就目前情況，訓(xùn)練指令被這些命令行參數(shù)控制：

--epochs：要訓(xùn)練多少 epochs 。一個 epoch意味著要遍歷整個訓(xùn)練集并且將默認(rèn)值設(shè)為6。

--lr_decay_epochs:每一epochs都是衰減學(xué)習(xí)率的。衰減是發(fā)生在每個 epoch的開始。 Epoch 是以0索引開始的，默認(rèn)值是 [4, 5]。

要獲得更多地命令行參數(shù)，請參考python train_net.py --help

SOLVER.WARM_UP_ITERS, SOLVER.WARM_UP_FACTOR, SOLVER.WARM_UP_METHOD：在紙上做預(yù)熱訓(xùn)練Accurate，Large Minibatch SGD：在一小時內(nèi)訓(xùn)練 ImageNet 是不能被運(yùn)行的。
OUTPUT_DIR ：使用命令行參數(shù)來代替--output_base_dir 去明確化輸出目錄。

當(dāng)更多地選項(xiàng)被提供：

MODEL.LOAD_IMAGENET_PRETRAINED_WEIGHTS = True：是否載入 ImageNet的預(yù)訓(xùn)練權(quán)重。
RESNETS.IMAGENET_PRETRAINED_WEIGHTS = ''：預(yù)訓(xùn)練網(wǎng)絡(luò)的權(quán)重文件路徑。如果是以 '/' 開始的，那它就是一個絕對路徑。否則就會被當(dāng)作是一個和ROOT_DIR相關(guān)的路徑。
TRAIN.ASPECT_CROPPING = False, TRAIN.ASPECT_HI = 2，TRAIN.ASPECT_LO = 0.：根據(jù)類別選項(xiàng)的剪裁去限制圖像類別比率范圍的選項(xiàng)。
RPN.OUT_DIM_AS_IN_DIM = True，RPN.OUT_DIM = 512 ，RPN.CLS_ACTIVATION = 'sigmoid' ：RPN的正式運(yùn)行有相同的輸入和輸出特征通道，它們使用sigmoid作為激活函數(shù)作為對fg/bg class類的輸出預(yù)測，在jwyang's implementation，它把輸出路徑數(shù)字確定為512而且使用softmax為激活函數(shù)。

我的nn.DataParallel

TBA

開始

克隆這個倉庫：

git clone https://github.com/roytseng-tw/mask-rcnn.pytorch.git

命令

在 python3下測試。

python安裝包

pytorch==0.3.1 (cuda80, cudnn7.1.2)

torchvision==0.2.0

numpy

scipy

opencv

pyyaml

pycocotools — COCO數(shù)據(jù)集專用，也可以通過 pip安裝。

tensorboardX —可以在Tensorboard上記錄losses。

一個 NVIDAI GPU 和 CUDA 8.0 或者更高。一些操作只有g(shù)pu 安裝。
注意：不同版本的 Pytorch安裝包有不同的顯存使用量。

編寫

編寫CUDA代碼：

cd lib # please change to this directory
sh make.sh

如果你在使用 Volta GPU, 在lib/mask.sh 文件中取消注釋這一句并且記住在上面這行后打上一個反斜杠。CUDA_PATH 路徑默認(rèn)為/usr/loca/cuda 。如果你想要在不同路徑下使用CUDA庫，根據(jù)實(shí)際情況改變這行語句。

這條語句將會編譯你需要的所有模塊，包括NMS、 ROI_Pooing、ROI_Crop 和 ROI_Align模塊。（事實(shí)上GPU NMS模塊從未被使用過...）

特別注意的是，如果你使用CUDA_VISIBLE_DEVICES 來設(shè)置GPU，確保在編譯代碼的時候至少有一個GPU可見。

數(shù)據(jù)準(zhǔn)備

在repo下創(chuàng)建一個數(shù)據(jù)文件夾，

cd {repo_root}
mkdir data

COCO：下載coco圖片數(shù)據(jù) 以及從coco網(wǎng)站上獲得的注釋

確保根據(jù)下面的文件結(jié)構(gòu)將文件放置好：

coco
├── 注釋
| ├── instances_minival2014.json
│ ├── instances_train2014.json
│ ├── instances_train2017.json
│ ├── instances_val2014.json
│ ├── instances_val2017.json
│ ├── instances_valminusminival2014.json
│ ├── person_keypoints_train2014.json
│ ├── person_keypoints_train2017.json
│ ├── person_keypoints_val2014.json
│ └── person_keypoints_val2017.json
└── 圖片
├── train2014
├── train2017
├── val2014
└── val2017

下載instances_minival2014.json和instances_valminusminival2014.json的鏈接

隨便將數(shù)據(jù)集放在任意想放的地方，然后將數(shù)據(jù)集軟連接到data/ 文件夾下：

ln -s path/to/coco data/coco

推薦將圖片輸入SSD網(wǎng)絡(luò)來使訓(xùn)練效果更加好。

根據(jù)我的經(jīng)驗(yàn)來看， COCO2014針對相關(guān)的圖片數(shù)據(jù)有一些不同尺寸(h,w)的掩碼注釋。可能 instances_minival2014.jsoninstances_valminusminival2014.json 包含了錯誤的掩碼注釋。然而COCO2017 數(shù)據(jù)集并沒有這個問題.。據(jù)說 COCO train2017數(shù)據(jù)集與 (COCO train 2014 + COCO minival 2014)相當(dāng) ，并且 COCO test 2017數(shù)據(jù)集與COCO valminusminival 2014數(shù)據(jù)集相當(dāng)。因此，使用 COCO 2017 訓(xùn)練-驗(yàn)證切分集來重做結(jié)果是可以的。

預(yù)訓(xùn)練模型

我使用ImageNet數(shù)據(jù)在 Caffe中為骨干網(wǎng)絡(luò)預(yù)訓(xùn)練權(quán)重。

ResNet50, ResNet101, ResNet152
VGG16 (vgg骨干網(wǎng)絡(luò)現(xiàn)在還沒有完成)

下載它們并把它們放在 {repo_root}/data/pretrained_model路徑下。

你可以使用下面的命令行語句將它們?nèi)肯螺d下來：

- 額外需要的安裝包：argparse_color_formater, colorama

python tools/download_imagenet_weights.py

注： Caffe的預(yù)訓(xùn)練權(quán)重比Pytorch 預(yù)訓(xùn)練的效果要稍好一些。我們使用Caffe 預(yù)訓(xùn)練上面鏈接的模型來重做結(jié)果。順便提一點(diǎn)，Detectron（一個開源目標(biāo)檢測庫）也使用Caffe預(yù)訓(xùn)練得到的權(quán)重。

如果你想用pytorch預(yù)訓(xùn)練模型，請記住將圖片數(shù)據(jù)從BGR矩陣轉(zhuǎn)化為RGB矩陣，并且也用pytorch預(yù)訓(xùn)練模型過程中相同的數(shù)據(jù)處理方法（去均值以及標(biāo)準(zhǔn)化）。

訓(xùn)練

基于res50骨干網(wǎng)絡(luò)從頭開始訓(xùn)練mask-rcnn網(wǎng)絡(luò)

python tools/train_net.py --dataset coco2017 --cfg configs/e2e_mask_rcnn_R-50-C4.yml --use_tfboard --bs {batch_size} --nw {num_workers}

使用 --bs 來將默認(rèn)的批處理規(guī)模（例如8）改變?yōu)檫m合你GPU的合適值。類似地還有--nw（數(shù)據(jù)加載線程在config.py中默認(rèn)為4）。

使用 —use_tfboard 在Tensorboard上展示損失函數(shù)的對數(shù)值。

在每個訓(xùn)練期結(jié)束的時候，通過完全相同的設(shè)置對訓(xùn)練效果進(jìn)行概括性展示。

python tools/train_net.py --dataset coco2017 --cfg configs/e2e_mask_rcnn_R-50-C4.yml --resume --load_ckpt {path/to/the/checkpoint} --bs {batch_size}

w/ 和 w/o --resume的區(qū)別：如果規(guī)定了--resume，優(yōu)化器狀態(tài)將會被從 checkpoint文件中加載下來，否則將不會加載。

訓(xùn)練 keypoint-rcnn網(wǎng)絡(luò)

python tools/train_net.py --dataset keypoints_coco2017 ...

Detectron預(yù)訓(xùn)練權(quán)重的調(diào)整

python train_net.py --dataset coco2017 --cfg cfgs/e2e_mask_rcnn_R-50-C4.yml --load_detectron {path/to/detectron/weight} --bs {batch_size}

注：優(yōu)化器狀態(tài) (SGD的動量) 沒有被加載(或被實(shí)現(xiàn))。

推斷結(jié)果

python tools/infer_simple.py --dataset coco --cfg cfgs/e2e_mask_rcnn_R-50-C4.yml --load_detectron {path/to/detectron/weight} --image_dir {dir/of/input/images} --output_dir {dir/to/save/visualizations}

--output_dir 默認(rèn)為infer_outputs。

衡量標(biāo)準(zhǔn)

keypoint_rcnn

e2e_keypoint_rcnn_R-50-FPN

訓(xùn)練命令行： python tools/train_net.py --dataset keypoints_coco2017 --cfg configs/e2e_keypoint_rcnn_R-50-FPN.yaml --bs 8

以8張圖片為一個批訓(xùn)練集，將數(shù)據(jù)集訓(xùn)練6個周期，從第5個和第6個訓(xùn)練周期開始后學(xué)習(xí)率以0.1倍速衰減。每個周期迭代 (113198 / 8) （向下取整）= 14149次。

數(shù)據(jù)集: keypoints_coco_2017_val

任務(wù)：框定盒

Github代碼實(shí)踐：Pytorch實(shí)現(xiàn)的語義分割器

任務(wù)：關(guān)鍵點(diǎn)

表格中的值為Detectron e2e_keypoint_rcnn_R-50-FPN_1x網(wǎng)絡(luò)得到的AP值，該網(wǎng)絡(luò)以16張圖片為批訓(xùn)練集迭代訓(xùn)練90000次，在第60000次和第80000次迭代開始后學(xué)習(xí)率以0.1倍速衰減。

可視化

從頭開始基于coco_train_2017數(shù)據(jù)訓(xùn)練 e2e_mask_rcnn_R-50_C4 網(wǎng)絡(luò)，以4張圖片為一批進(jìn)行處理，訓(xùn)練了1 個訓(xùn)練周期：

Github代碼實(shí)踐：Pytorch實(shí)現(xiàn)的語義分割器