25 行 Python 代碼實(shí)現(xiàn)人臉檢測——OpenCV 技術(shù)教程

本文作者：三川

2017-05-26 18:43

導(dǎo)語：建議先讀一遍本文再跑代碼。

雷鋒網(wǎng)按：這是篇是利用 OpenCV 進(jìn)行人臉識別的技術(shù)講解。閱讀本文之前，這是注意事項(xiàng)：

建議先讀一遍本文再跑代碼——你需要理解這些代碼是干什么的。成功跑一遍不是目的，能夠舉一反三、在新任務(wù)上找出 bug 才是。
請確保用的是 OpenCV v2
你需要一個(gè)網(wǎng)絡(luò)攝像頭

OpenCV

OpenCV 是最流行的計(jì)算機(jī)視覺庫，原本用 C 和 C++ 開發(fā)，現(xiàn)在也支持 Python。

它使用機(jī)器學(xué)習(xí)算法在圖像中搜索人的面部。對于人臉這么復(fù)雜的東西，并沒有一個(gè)簡單的檢測能對是否存在人臉下結(jié)論，而需要成千上萬的特征匹配。算法把人臉識別任務(wù)分解成數(shù)千個(gè)小任務(wù)，每個(gè)都不難處理。這些任務(wù)也被稱為分類器。

對于類似于人臉的對象，你或許需要不少于 6000 個(gè)分類器，每一個(gè)都需要成功匹配（當(dāng)然，有容錯(cuò)率），才能檢測出人臉。但這有一個(gè)問題：對于人臉識別，算法從左上角開始計(jì)算一個(gè)個(gè)數(shù)據(jù)塊，不停問“這是張臉嗎”。每個(gè)數(shù)據(jù)塊有超過 6000 個(gè)檢測，加起來的計(jì)算量會達(dá)到數(shù)百萬級別，計(jì)算機(jī)很可能會讓你等得花兒都謝了。

OpenCV 使用 cascades 來避免這種情況。Cascade 是什么？最佳答案已經(jīng)在字典里了：一條瀑布或者連續(xù)瀑布。

好比連續(xù)瀑布，OpenCV cascade 把人臉檢測問題分解為好幾步。對于每個(gè)數(shù)據(jù)塊，它都進(jìn)行一個(gè)粗略、快速的檢測。若通過，會再進(jìn)行一個(gè)更仔細(xì)的檢測，以此不斷類推。該算法有 30 到 50 個(gè)這樣的階段，或者說 cascade。只有通過全部階段，算法才會判斷檢測到人臉。這樣做的好處是：大多數(shù)圖形都會在頭幾步就產(chǎn)生否定反饋，算法因而不需要在它上面測試所有 6000 個(gè)特征，大大節(jié)省了時(shí)間。相對于“正常流程”耗費(fèi)數(shù)個(gè)小時(shí)，這可以實(shí)時(shí)實(shí)現(xiàn)人臉檢測。

實(shí)踐中的 Cascade

它的理論也許聽起來很復(fù)雜，實(shí)際操作起來其實(shí)是很簡單的。這些 cascades 只是一系列包含 OpenCV 數(shù)據(jù)的 XML 文件。你用想要的 cascade 初始化代碼，它自會替你做你想要的事。

由于人臉識別的普遍性，OpenCV 有一系列能檢測各種東西的內(nèi)置 cascade，從眼睛到手到腿都可以檢測。甚至還有針對非人體物體的 cascade。比如說，如果你經(jīng)營一家賣香蕉的水果店，想要監(jiān)測偷香蕉的人，就有一個(gè)家伙開發(fā)了一個(gè)針對這一場景的算法！

安裝 OpenCV

首選，你需要找到對應(yīng)你的操作系統(tǒng)的正確設(shè)置文件。

我發(fā)現(xiàn)，安裝 OpenCV 是最難的一個(gè)環(huán)節(jié)。如果你遇到奇怪的、無法解釋的錯(cuò)誤，有可能是庫崩潰了、32 與 64 比特的兼容問題等等。個(gè)人經(jīng)驗(yàn)是，只用 Linux 虛擬機(jī)，從頭安裝 OpenCV 最簡單。

安裝好之后，你可以開啟一個(gè) Python 會話，敲出下面的代碼，來測試它是否能工作：

$ python
>>> import cv2
>>>

如果沒彈出任何錯(cuò)誤，你就可以到下個(gè)環(huán)節(jié)了。

理解代碼

源代碼可在資源庫下載。記得拿好 face_detect.py 文本、abba.png 圖片以及 haarcascade_frontalface_default.xml。下面，我把代碼分解開來。

# Get user supplied values
imagePath = sys.argv[1]
cascPath = sys.argv[2]

將圖片和 cascade 名字作為命令行參數(shù)傳入。我們會用 Abba 圖片和 OpenCV 提供的默認(rèn) cascade 來人臉檢測。

# Create the haar cascade
faceCascade = cv2.CascadeClassifier(cascPath)

現(xiàn)在，我們創(chuàng)建一個(gè) cascade，并用人臉 cascade 初始化。這把人臉 cascade 導(dǎo)入內(nèi)存，所以它隨時(shí)可以使用。記住，該 cascade 只是一個(gè)包含人臉檢測數(shù)據(jù)的 XML 文件。

# Read the image
image = cv2.imread(imagePath)
gray = cv2.cvtColor(image, cv2.COLOR_BGR2GRAY)

讀取圖片把它轉(zhuǎn)化到灰度格式。

# Detect faces in the image
faces = faceCascade.detectMultiScale(
gray,
scaleFactor=1.1,
minNeighbors=5,
minSize=(30, 30),
flags = cv2.cv.CV_HAAR_SCALE_IMAGE
)

該函數(shù)做的就是檢測人臉，是代碼核心部分。所以，我們來過一遍選項(xiàng)。

DetectMultiScale 函數(shù)是一個(gè)檢測物體的通用函數(shù)。我們在人臉 cascade 上調(diào)用它，它檢測的就是人臉。第一個(gè)選項(xiàng)是灰度圖片。

第二個(gè)是 scaleFactor。有的人臉離鏡頭近，會比其他人臉更大。ScaleFactor 對此進(jìn)行補(bǔ)償。

檢測算法使用移動窗口來檢測物體。在系統(tǒng)宣布檢測到人臉之前，minNeighbors 會對當(dāng)前其周圍有多少物體進(jìn)行定義。MinSize 給出每個(gè)窗口的大小。

我用的是這些領(lǐng)域的常用值?，F(xiàn)實(shí)中，你會拿不同的值試驗(yàn)窗口尺寸、擴(kuò)展因素等參數(shù)，直到找出最比較合適的那一個(gè)。

當(dāng)該函數(shù)認(rèn)為它找到一張人臉時(shí)，會返回一個(gè)矩形列表。下一步，我們會進(jìn)行循環(huán)，直到它認(rèn)為檢測出了什么。

print "Found {0} faces!".format(len(faces))
# Draw a rectangle around the faces
for (x, y, w, h) in faces:
cv2.rectangle(image, (x, y), (x+w, y+h), (0, 255, 0), 2)

該函數(shù)返回四個(gè)值：矩形的 x 和 y 坐標(biāo)，以及它的高和寬。我們用這些值和內(nèi)置的 rectangle() 函數(shù)，畫出矩陣。