丁香五月天婷婷久久婷婷色综合91|国产传媒自偷自拍|久久影院亚洲精品|国产欧美VA天堂国产美女自慰视屏|免费黄色av网站|婷婷丁香五月激情四射|日韩AV一区二区中文字幕在线观看|亚洲欧美日本性爱|日日噜噜噜夜夜噜噜噜|中文Av日韩一区二区

您正在使用IE低版瀏覽器,為了您的雷峰網(wǎng)賬號安全和更好的產(chǎn)品體驗,強烈建議使用更快更安全的瀏覽器
此為臨時鏈接,僅用于文章預(yù)覽,將在時失效
人工智能開發(fā)者 正文
發(fā)私信給圖普科技
發(fā)送

0

用TensorFlow實現(xiàn)物體檢測的像素級分類

本文作者: 圖普科技 編輯:郭奕欣 2018-04-14 08:02
導(dǎo)語:TensorFlow 的物體檢測從原來的圖像級別成功上升到了像素級別。

雷鋒網(wǎng) AI 科技評論按:本文由「圖普科技」編譯自Using Tensorflow Object Detection to Do Pixel Wise Classification。

最近,TensorFlow 的「物體檢測 API」有了一個新功能,它能根據(jù)目標對象的像素位置來確定該對象的像素。換句話來說,TensorFlow 的物體檢測從原來的圖像級別成功上升到了像素級別。

使用 TensorFlow 的「物體檢測 API」圖片中的物體進行識別,最后的結(jié)果是圖片中一個個將不同物體框起來的方框。最近,這個「物體檢測 API」有了一個新功能,它能根據(jù)目標對象的像素位置確定該對象的像素,實現(xiàn)物體的像素分類。

用TensorFlow實現(xiàn)物體檢測的像素級分類

TensorFlow 的物體檢測 API 模型——Mask-RCNN

實例分割

「實例分割」是物體檢測的延伸,它能讓我們在普通的物體檢測的基礎(chǔ)上獲取關(guān)于該對象更加精確、全面的信息。

在什么情況下我們才需要這樣精確的信息呢?

  • 無人駕駛汽車

    為了確保安全,無人駕駛汽車需要精確定位道路上其他車輛和行人。

  • 機器人系統(tǒng)

    機器人在連接兩個部件時,如果知道這兩個部件的確切位置,那么機器人的操作就會更加高效、準確。

「實例分割」的方法有很多,TensorFlow 進行「實例分割」使用的是 Mask RCNN 算法。

Mask R-CNN 算法概述

用TensorFlow實現(xiàn)物體檢測的像素級分類

Mask RCNN 算法架構(gòu)

在介紹 Mask RCNN 之前,我們先來認識一下 Faster R-CNN。

Faster-RCNN 是一個用于物體檢測的算法,它被分為兩個階段:第一階段被稱為「候選區(qū)域生成網(wǎng)絡(luò)」(RPN),即生成候選物體的邊框;第二階段本質(zhì)上是 Fast R-CNN 算法,即利用 RolPool 從每個候選邊框獲取對象特征,并執(zhí)行分類和邊框回歸。這兩個階段所使用的特征可以共享,以更快地獲得圖像推算結(jié)果。

Faster R-CNN 對每個候選對象都有兩個輸出,一個是分類標簽,另一個是對象邊框。而 Mask-RCNN 就是在 Faster R-CNN 的兩個輸出的基礎(chǔ)上,添加一個掩碼的輸出,該掩碼是一個表示對象在邊框中像素的二元掩碼。但是這個新添加的掩碼輸出與原來的分類和邊框輸出不同,它需要物體更加精細的空間布局和位置信息。因此,Mask R-CNN 需要使用「全卷積神經(jīng)網(wǎng)絡(luò)」(FCN)。

用TensorFlow實現(xiàn)物體檢測的像素級分類

全卷積神經(jīng)網(wǎng)絡(luò)(FCN)的算法架構(gòu)

「全卷積神經(jīng)網(wǎng)絡(luò)」是「語義分割」中十分常見的算法,它利用了不同區(qū)塊的卷積和池化層,首先將一張圖片解壓至它原本大小的三十二分之一,然后在這種粒度水平下進行預(yù)測分類,最后使用向上采樣和反卷積層將圖片還原到原來的尺寸。

因此,Mask RCNN 可以說是將?Faster RCNN 和「全卷積神經(jīng)網(wǎng)絡(luò)」這兩個網(wǎng)絡(luò)合并起來,形成的一個龐大的網(wǎng)絡(luò)架構(gòu)。

實操 Mask-RCNN

  • 圖片測試

你可以利用 TensorFlow 網(wǎng)站上的共享代碼來對 Mask RCNN 進行圖片測試。以下是我的測試結(jié)果:

用TensorFlow實現(xiàn)物體檢測的像素級分類

Mask RCNN on Kites Image

  • 視頻測試

對我來說,最有意思的是用 YouTube 視頻來測試這個模型。我從 YouTube 上下載了好幾條視頻,開始了視頻測試。

視頻測試的主要步驟:

1. 使用 VideoFileClip 功能從視頻中提取出每個幀;

2. 使用 fl_image 功能對視頻中截取的每張圖片進行物體檢測,然后用修改后的視頻圖片替換原本的視頻圖片;

3. 最后,將修改后的視頻圖像合并成一個新的視頻。

GitHub地址為:https://github.com/priya-dwivedi/Deep-Learning/blob/master/Mask_RCNN/Mask_RCNN_Videos.ipynb

Mask RCNN 的深入研究

下一步的探索包括:

  • 測試一個精確度更高的模型,觀察兩次測試結(jié)果的區(qū)別;

  • 使用 TensorFlow 的物體檢測 API 在定制的數(shù)據(jù)集上對 Mask RCNN 進行測試。

本文由雷鋒網(wǎng)專欄作者編譯,轉(zhuǎn)載需經(jīng)雷鋒網(wǎng)許可。

via kdnuggets

雷峰網(wǎng)版權(quán)文章,未經(jīng)授權(quán)禁止轉(zhuǎn)載。詳情見轉(zhuǎn)載須知。

用TensorFlow實現(xiàn)物體檢測的像素級分類

分享:
相關(guān)文章

專欄作者

基于圖像識別技術(shù)多維度解讀圖片和視頻
當月熱門文章
最新文章
請?zhí)顚懮暾埲速Y料
姓名
電話
郵箱
微信號
作品鏈接
個人簡介
為了您的賬戶安全,請驗證郵箱
您的郵箱還未驗證,完成可獲20積分喲!
請驗證您的郵箱
立即驗證
完善賬號信息
您的賬號已經(jīng)綁定,現(xiàn)在您可以設(shè)置密碼以方便用郵箱登錄
立即設(shè)置 以后再說