0
原標(biāo)題 | Object Recognition, simplified !
作者 | Ulysse-pacome koudou
譯者 | Aitechnology(曠視算法研究員)、汪鵬(重慶郵電大學(xué))、Dylan的琴(重慶郵電大學(xué))
本文編輯:王立魚(yú)
原文鏈接:
https://medium.com/data-science-demystified/object-recognition-made-easier-61eb8b5fa3fa
阿爾伯特·愛(ài)因斯坦曾經(jīng)說(shuō)過(guò)這么一句話“如果你不能簡(jiǎn)單地解釋它,你就不能很好地理解它”,我深以為然!
尤其是在計(jì)算機(jī)視覺(jué)領(lǐng)在業(yè)務(wù)中,阻止AI發(fā)展的主要障礙之一是深度學(xué)習(xí)解決方案是需要完全掌握和理解這些工具的工作方式,這是極其復(fù)雜的。
除此之外,還有為業(yè)務(wù)案例開(kāi)發(fā)和實(shí)施正確的解決方案的時(shí)效性。顯然,該列表并非詳盡無(wú)遺,因此企業(yè)在實(shí)施此類工具時(shí)會(huì)慢慢采取行動(dòng)。我還要補(bǔ)充說(shuō),與一個(gè)更簡(jiǎn)單且可能更舊的解決方案相比,評(píng)估實(shí)現(xiàn)特定案例的AI解決方案的價(jià)值是非常好的,但如果工具本身并沒(méi)有得到很好的理解,有時(shí)可能會(huì)遇到挑戰(zhàn)?!癆I”,“機(jī)器學(xué)習(xí)”,“深度學(xué)習(xí)”是當(dāng)下的流行語(yǔ),每個(gè)人都希望發(fā)展自己的AI點(diǎn),增強(qiáng)客戶體驗(yàn)和理解,探索更多并擴(kuò)展他們的專業(yè)范圍,這是很好的?。oA.I。
這是一個(gè)幫助我們實(shí)現(xiàn)對(duì)象檢測(cè)算法作為解決方案工具的解決方案。非常感謝John Olafenwa及其團(tuán)隊(duì)構(gòu)建ImageAI軟件包,這使得程序員的生活變得更加輕松,不僅可以使用,還可以了解對(duì)象檢測(cè)的工作原理。//深入了解DeepQuestAI。使用ImageAI實(shí)現(xiàn)測(cè)試只能在幾行中完成,快速而強(qiáng)大。
要求:
Jupyter 筆記本安裝了Tensorflow和Keras。
你可以使用Anaconda Navigator在JN上安裝Tensorflow和Keras,只需選擇您的環(huán)境并在搜索欄中寫入包名稱(注意:確保選擇未安裝)
從Anaconda 安裝Tensorflow
從原文下載ImageAI軟件包,雖然Anaconda尚未提供,但誰(shuí)知道明天會(huì)發(fā)生什么?
下載H5Py存儲(chǔ)Numpy矩陣的圖像,更多信息可以參看H5py_website。
最后但同樣重要的是,激情。請(qǐng)喜歡和享受你正在做的事情,如果你對(duì)你正在編碼的內(nèi)容不感興趣,編碼會(huì)變得非常無(wú)聊,即使這只是一行代碼。成功=時(shí)間+激情。
要安裝的庫(kù):Scipy,Numpy,OpenCV,Tensorflow,Pillow,Matplotlib和Keras。
注意:確保將H5py和ImageAI保留在工作目錄中!
現(xiàn)在我們已經(jīng)完成所有設(shè)置,我們將通過(guò)幾行代碼來(lái)識(shí)別圖像文檔中的大多數(shù)基本對(duì)象。在我們使用Jupiter Notebook之前設(shè)置,確保所有下載都在工作目錄中。
作為輸入,我們將在2015年夏天在蒙特利爾某處拍攝一張非常漂亮的照片,目標(biāo)最終將是檢測(cè)照片上的內(nèi)容,是否有汽車,人物?更多?多少。
2015年夏季
首先要安裝ImageAI
這是命令行應(yīng)該返回的結(jié)果。然后加載所有必要的包。
對(duì)于實(shí)際的檢測(cè)我們使用的是著名的開(kāi)源庫(kù)OpenCV,然后基于Tensorflow的Keras預(yù)訓(xùn)練模型我們搭建神經(jīng)網(wǎng)絡(luò)。實(shí)際上永遠(yuǎn)不要忘記,Matplotlib可以清晰的對(duì)檢測(cè)到的方形區(qū)域進(jìn)行判別,np框架能夠用來(lái)存儲(chǔ)數(shù)據(jù)(再一次發(fā)揮巨大作用?。┳詈笪覀儗⒐ぷ髂夸浡暶鳛榭蓤?zhí)行路徑,方面后面使用H5py。
點(diǎn)擊此處查看完整代碼
現(xiàn)在John的團(tuán)隊(duì)通過(guò)創(chuàng)建很長(zhǎng)的、痛苦的和復(fù)雜的代碼來(lái)實(shí)現(xiàn)這一目標(biāo)。通過(guò)簡(jiǎn)單的調(diào)用神經(jīng)網(wǎng)絡(luò)的額模型并將圖片作為輸入可以使你的編碼 變得更容易。最終,你可以在工作目錄下得到輸出結(jié)果。
所有這一切都很不錯(cuò),但是我們依然希望得到結(jié)果。。。這有一個(gè)簡(jiǎn)單的函數(shù)可以打印出名字和通過(guò)網(wǎng)絡(luò)預(yù)測(cè)得到的概率。
在這種情況下,我們引用了三個(gè)輸出項(xiàng),輸出圖像,檢測(cè)到的對(duì)象的名稱及其概率百分比。我們有圖像,這里是proba的百分比。名字看起來(lái)像這樣:
不一定按順序給出,我們的模型已成功檢測(cè)到我作為前景中的人,自行車,即使完整的自行車不在圖片上,另一方面,后面至少有四輛車和幾個(gè)人。由于特征提取,背景和形狀,我身后的綠色汽車被檢測(cè)到三次。我們可以深入研究這個(gè)問(wèn)題,但這是一個(gè)全新的主題,我建議你閱讀這篇文章以獲取更多信息。
對(duì)這個(gè)結(jié)果感到滿意,我又嘗試了另一張圖片,看看模型可以做到什么程度吧。
而且它再次令人印象深刻,能夠以66%的概率檢測(cè)到背包。并且能夠區(qū)分汽車和卡車,但在第二個(gè)例子中有幾個(gè)人沒(méi)檢測(cè)到。這仍然是由于特征提取和形狀的問(wèn)題,希望模型會(huì)變得更好點(diǎn)!
完整代碼查看請(qǐng)點(diǎn)擊這里:
我們最后一件事沒(méi)有涉及的是何時(shí)使用物體檢測(cè)?如果你還沒(méi)有對(duì)此做出響應(yīng),可以閱讀這篇文章,它提供了有關(guān)如何使用對(duì)象檢測(cè)的七個(gè)有趣想法。記住,不要局限于這些想法!雷鋒網(wǎng)雷鋒網(wǎng)雷鋒網(wǎng)
想要繼續(xù)查看該篇文章相關(guān)鏈接和參考文獻(xiàn)?
點(diǎn)擊【簡(jiǎn)易版物體識(shí)別!】即可訪問(wèn)~
Github項(xiàng)目推薦 | AMD GPU上的HD畫質(zhì)50fps實(shí)時(shí)車輛檢測(cè)
本項(xiàng)目使用深度學(xué)習(xí)網(wǎng)絡(luò)Yolo-V2以高清分辨率(1920x1080)以驚人的50幀/秒的速度檢測(cè)實(shí)時(shí)交通中的汽車/公共汽車。 項(xiàng)目中使用的模型針對(duì)使用MIVisionX工具包在AMD-GPU上的推理性能進(jìn)行了優(yōu)化。
詳情查看:https://ai.yanxishe.com/page/blogDetail/13656
雷峰網(wǎng)原創(chuàng)文章,未經(jīng)授權(quán)禁止轉(zhuǎn)載。詳情見(jiàn)轉(zhuǎn)載須知。