簡(jiǎn)易版物體識(shí)別！

本文作者： AI研習(xí)社-譯站

2019-07-04 14:47

導(dǎo)語(yǔ)：“如果你不能簡(jiǎn)單地解釋它，你就不能很好地理解它”

簡(jiǎn)易版物體識(shí)別！

原標(biāo)題 | Object Recognition, simplified !
作者 | Ulysse-pacome koudou
譯者 | Aitechnology（曠視算法研究員）、汪鵬（重慶郵電大學(xué)）、Dylan的琴（重慶郵電大學(xué)）
本文編輯：王立魚(yú)
原文鏈接：
https://medium.com/data-science-demystified/object-recognition-made-easier-61eb8b5fa3fa

簡(jiǎn)易版物體識(shí)別！

阿爾伯特·愛(ài)因斯坦曾經(jīng)說(shuō)過(guò)這么一句話“如果你不能簡(jiǎn)單地解釋它，你就不能很好地理解它”，我深以為然！

尤其是在計(jì)算機(jī)視覺(jué)領(lǐng)在業(yè)務(wù)中，阻止AI發(fā)展的主要障礙之一是深度學(xué)習(xí)解決方案是需要完全掌握和理解這些工具的工作方式，這是極其復(fù)雜的。

除此之外，還有為業(yè)務(wù)案例開(kāi)發(fā)和實(shí)施正確的解決方案的時(shí)效性。顯然，該列表并非詳盡無(wú)遺，因此企業(yè)在實(shí)施此類工具時(shí)會(huì)慢慢采取行動(dòng)。我還要補(bǔ)充說(shuō)，與一個(gè)更簡(jiǎn)單且可能更舊的解決方案相比，評(píng)估實(shí)現(xiàn)特定案例的AI解決方案的價(jià)值是非常好的，但如果工具本身并沒(méi)有得到很好的理解，有時(shí)可能會(huì)遇到挑戰(zhàn)?！癆I”，“機(jī)器學(xué)習(xí)”，“深度學(xué)習(xí)”是當(dāng)下的流行語(yǔ)，每個(gè)人都希望發(fā)展自己的AI點(diǎn)，增強(qiáng)客戶體驗(yàn)和理解，探索更多并擴(kuò)展他們的專業(yè)范圍，這是很好的?。oA.I。

這是一個(gè)幫助我們實(shí)現(xiàn)對(duì)象檢測(cè)算法作為解決方案工具的解決方案。非常感謝John Olafenwa及其團(tuán)隊(duì)構(gòu)建ImageAI軟件包，這使得程序員的生活變得更加輕松，不僅可以使用，還可以了解對(duì)象檢測(cè)的工作原理。//深入了解DeepQuestAI。使用ImageAI實(shí)現(xiàn)測(cè)試只能在幾行中完成，快速而強(qiáng)大。

現(xiàn)在讓我們實(shí)操一下！

要求：

Jupyter 筆記本安裝了Tensorflow和Keras。
你可以使用Anaconda Navigator在JN上安裝Tensorflow和Keras，只需選擇您的環(huán)境并在搜索欄中寫入包名稱（注意：確保選擇未安裝）

簡(jiǎn)易版物體識(shí)別！

從Anaconda 安裝Tensorflow

從原文下載ImageAI軟件包，雖然Anaconda尚未提供，但誰(shuí)知道明天會(huì)發(fā)生什么？
下載H5Py存儲(chǔ)Numpy矩陣的圖像，更多信息可以參看H5py_website。
最后但同樣重要的是，激情。請(qǐng)喜歡和享受你正在做的事情，如果你對(duì)你正在編碼的內(nèi)容不感興趣，編碼會(huì)變得非常無(wú)聊，即使這只是一行代碼。成功=時(shí)間+激情。
要安裝的庫(kù)：Scipy，Numpy，OpenCV，Tensorflow，Pillow，Matplotlib和Keras。

注意：確保將H5py和ImageAI保留在工作目錄中！

現(xiàn)在我們已經(jīng)完成所有設(shè)置，我們將通過(guò)幾行代碼來(lái)識(shí)別圖像文檔中的大多數(shù)基本對(duì)象。在我們使用Jupiter Notebook之前設(shè)置，確保所有下載都在工作目錄中。
作為輸入，我們將在2015年夏天在蒙特利爾某處拍攝一張非常漂亮的照片，目標(biāo)最終將是檢測(cè)照片上的內(nèi)容，是否有汽車，人物？更多？多少。

簡(jiǎn)易版物體識(shí)別！

2015年夏季

首先要安裝ImageAI

簡(jiǎn)易版物體識(shí)別！

這是命令行應(yīng)該返回的結(jié)果。然后加載所有必要的包。

簡(jiǎn)易版物體識(shí)別！

對(duì)于實(shí)際的檢測(cè)我們使用的是著名的開(kāi)源庫(kù)OpenCV，然后基于Tensorflow的Keras預(yù)訓(xùn)練模型我們搭建神經(jīng)網(wǎng)絡(luò)。實(shí)際上永遠(yuǎn)不要忘記，Matplotlib可以清晰的對(duì)檢測(cè)到的方形區(qū)域進(jìn)行判別，np框架能夠用來(lái)存儲(chǔ)數(shù)據(jù)（再一次發(fā)揮巨大作用?。┳詈笪覀儗⒐ぷ髂夸浡暶鳛榭蓤?zhí)行路徑，方面后面使用H5py。

簡(jiǎn)易版物體識(shí)別！

點(diǎn)擊此處查看完整代碼

現(xiàn)在John的團(tuán)隊(duì)通過(guò)創(chuàng)建很長(zhǎng)的、痛苦的和復(fù)雜的代碼來(lái)實(shí)現(xiàn)這一目標(biāo)。通過(guò)簡(jiǎn)單的調(diào)用神經(jīng)網(wǎng)絡(luò)的額模型并將圖片作為輸入可以使你的編碼變得更容易。最終，你可以在工作目錄下得到輸出結(jié)果。

簡(jiǎn)易版物體識(shí)別！

所有這一切都很不錯(cuò)，但是我們依然希望得到結(jié)果。。。這有一個(gè)簡(jiǎn)單的函數(shù)可以打印出名字和通過(guò)網(wǎng)絡(luò)預(yù)測(cè)得到的概率。

簡(jiǎn)易版物體識(shí)別！

在這種情況下，我們引用了三個(gè)輸出項(xiàng)，輸出圖像，檢測(cè)到的對(duì)象的名稱及其概率百分比。我們有圖像，這里是proba的百分比。名字看起來(lái)像這樣：

簡(jiǎn)易版物體識(shí)別！

不一定按順序給出，我們的模型已成功檢測(cè)到我作為前景中的人，自行車，即使完整的自行車不在圖片上，另一方面，后面至少有四輛車和幾個(gè)人。由于特征提取，背景和形狀，我身后的綠色汽車被檢測(cè)到三次。我們可以深入研究這個(gè)問(wèn)題，但這是一個(gè)全新的主題，我建議你閱讀這篇文章以獲取更多信息。

對(duì)這個(gè)結(jié)果感到滿意，我又嘗試了另一張圖片，看看模型可以做到什么程度吧。

簡(jiǎn)易版物體識(shí)別！

而且它再次令人印象深刻，能夠以66％的概率檢測(cè)到背包。并且能夠區(qū)分汽車和卡車，但在第二個(gè)例子中有幾個(gè)人沒(méi)檢測(cè)到。這仍然是由于特征提取和形狀的問(wèn)題，希望模型會(huì)變得更好點(diǎn)！

完整代碼查看請(qǐng)點(diǎn)擊這里：

簡(jiǎn)易版物體識(shí)別！

我們最后一件事沒(méi)有涉及的是何時(shí)使用物體檢測(cè)？如果你還沒(méi)有對(duì)此做出響應(yīng)，可以閱讀這篇文章，它提供了有關(guān)如何使用對(duì)象檢測(cè)的七個(gè)有趣想法。記住，不要局限于這些想法！雷鋒網(wǎng)雷鋒網(wǎng)雷鋒網(wǎng)

想要繼續(xù)查看該篇文章相關(guān)鏈接和參考文獻(xiàn)？

點(diǎn)擊【簡(jiǎn)易版物體識(shí)別！】即可訪問(wèn)~

Github項(xiàng)目推薦 | AMD GPU上的HD畫質(zhì)50fps實(shí)時(shí)車輛檢測(cè)

本項(xiàng)目使用深度學(xué)習(xí)網(wǎng)絡(luò)Yolo-V2以高清分辨率（1920x1080）以驚人的50幀/秒的速度檢測(cè)實(shí)時(shí)交通中的汽車/公共汽車。項(xiàng)目中使用的模型針對(duì)使用MIVisionX工具包在AMD-GPU上的推理性能進(jìn)行了優(yōu)化。

詳情查看：https://ai.yanxishe.com/page/blogDetail/13656

雷峰網(wǎng)原創(chuàng)文章，未經(jīng)授權(quán)禁止轉(zhuǎn)載。詳情見(jiàn)轉(zhuǎn)載須知。