1
本文作者: 李尊 | 2016-07-27 12:47 |
你是否遇到過這種情況?——外出與小孩散步,TA發(fā)現(xiàn)一朵很漂亮的花,跑過來問你是什么,但是你突然愣住了—因為你并不知道它是什么花。
目前世界上至少存在250000種花,即便是經(jīng)驗豐富的植物學(xué)者也很難全部認(rèn)識它們。如果現(xiàn)在告訴你以后不用尷尬對小孩承認(rèn)你并不知道它是什么花,不久之后你就能在無論什么時候都能馬上認(rèn)出任何一種花卉或者任何植物的品種,會不會很期待?
鑒于目前圖像識別的強大能力以及使用智能手機隨手拍照的便利,普通人通過使用工具也能輕松的識別各種花卉。這個工具叫做智能花卉識別系統(tǒng)(Smart Flower Recognition System),說起來這個系統(tǒng)也是在微軟研究院學(xué)者與中國科學(xué)院植物研究所(Institute of Botany, Chinese Academy of Sciences,IBCAS)偶然促成的。
微軟亞洲研究院常務(wù)副院長芮勇在一次研討會上介紹了微軟的圖像識別技術(shù),在場的中國科學(xué)院植物研究所的植物學(xué)家大為高興,因為之前他們付出了大量努力來收集區(qū)域花卉分布數(shù)據(jù),但效果并不好。植物學(xué)家們馬上意識到微軟亞洲研究院(MSRA)的圖像識別技術(shù)在這方面擁有巨大的潛力,同時芮勇也發(fā)現(xiàn)他也找到用來提升圖像識別在解決真實問題方面的最佳試驗工具。
這項合作幫助中國科學(xué)院植物研究所加速累積了260萬的圖像數(shù)據(jù),鑒于全世界任何人都能將任意花卉圖片上傳到這個數(shù)據(jù)庫中,且沒有人能對這個上傳進行監(jiān)督分類,微軟亞洲研究院團隊必須創(chuàng)造一個算法來過濾掉“不合格”的圖片。但這還只是研究員Jianlong Fu和他的團隊建立這個能夠在許多不同種類的花卉中識別微小差異的工具中所面臨的第一個問題。
為了實現(xiàn)這個目標(biāo)他們訓(xùn)練多層卷積神經(jīng)網(wǎng)絡(luò),用來識別使用了一系列可以學(xué)習(xí)的過濾器的圖像。概括來說,它的工作方式是這樣的:
在向前傳導(dǎo)的過程中,每個過濾器對于輸入容量的寬度和高度來說都是卷曲的,且在過濾器和輸入中間計算點積。對于過濾器來說這樣產(chǎn)生了一個二維的激活圖,結(jié)果是神經(jīng)網(wǎng)絡(luò)學(xué)會了在輸入?yún)^(qū)給定空間位置激活每一種特定特性種類的過濾器。
在輸入80萬張圖片到深度學(xué)習(xí)框架中后,微軟亞洲研究院(MSRA)的研究人員逐漸讓機器實現(xiàn)了在圖片識別上超過90%的的準(zhǔn)確率,這個令人震驚的結(jié)果遠(yuǎn)遠(yuǎn)超過人類的識別正確率。
同時這個計劃也大大幫助了中科院的植物學(xué)家們接近他們的目標(biāo),中科院植物所的Zheping Xu說到這個花卉識別系統(tǒng)不僅讓業(yè)內(nèi)專家有效地掌握中國植物分布的情況,還幫助對花卉非常有興趣的普通人學(xué)到更多的知識。
一張圖片經(jīng)過神經(jīng)網(wǎng)絡(luò)層層分析之后,機器學(xué)習(xí)能夠識別出其為“雛菊”。
從目前公布的結(jié)果來看,智能花卉識別系統(tǒng)(Smart Flower Recognition System)的識別準(zhǔn)確率還是非常不錯的。據(jù)微軟公布的消息,不久之后開發(fā)者將基于這個花卉識別系統(tǒng)開服出相關(guān)的應(yīng)用,植物學(xué)家們能更加深入他們的研究,家長們在面臨孩子類似的問題前能不再尷尬,與此同時普通人也能更深入得欣賞花卉的美。
聽起來似乎很不錯,但是這個智能花卉識別系統(tǒng)(Smart Flower Recognition System)不免讓人想起之前微軟推出后火遍全球的how-old.net(測測你的年齡)。
How-old.net是微軟在Azure上用新發(fā)布的人臉識別APIs為2015年微軟開發(fā)者大會的展示搭建的,借助人臉識別API這個網(wǎng)站可以分析用戶上傳的照片中人物的性別和年齡。How-old.net它使用了包括機器學(xué)習(xí)在內(nèi)的各種最新技術(shù),具體實現(xiàn)過程如下:
檢測:檢測圖片中人臉的位置
圖像對準(zhǔn):確定一些關(guān)鍵的點的位置,比如眉毛、睛、子、角等,確定這些點之后可以確定人臉區(qū)域。
特征提?。河辛藞D像區(qū)域之后,開始提取形狀、紋理、幾何信息是比較關(guān)鍵的特征。
訓(xùn)練:有了大量特征數(shù)據(jù)以及對應(yīng)的年齡數(shù)據(jù),建立一個模型開始訓(xùn)練。
估計年齡:新來一張圖片,獲取特征,根據(jù)訓(xùn)練獲取的訓(xùn)練參數(shù),估計年齡。
How-old.net主要是靠三個技術(shù)來完成的,它們分別是人臉檢測、性別分類和年齡檢測。其中人臉檢測是其他兩個技術(shù)的基礎(chǔ),而年齡檢測和性別檢測,它們只是在機器學(xué)習(xí)的過程中解決了分類的問題。這個涉及到人臉特征的畫像、收集可學(xué)習(xí)的數(shù)據(jù),建立一個分類模型以及模型優(yōu)化。How-old.net的人臉定位功能及性別識別功能大致準(zhǔn)確,然而年齡預(yù)測結(jié)果并不是每次都準(zhǔn)確,如下圖中加拿大流行歌手Justin Bieber的實際年齡只有22歲(和選取的圖片也有部分關(guān)系)。
林志穎與郭德綱同齡,吳奇隆比他倆都大,但是測出來的結(jié)果卻是
使用機器學(xué)習(xí)的How-old.net雖然大部分測試結(jié)果都是準(zhǔn)確的,但是也存在各種識別出錯的情況(也是How-old.net爆紅的因素之一)。號稱能達到90%的的準(zhǔn)確率,同樣使用機器學(xué)習(xí)的智能花卉識別系統(tǒng)(Smart Flower Recognition System)是否會出現(xiàn)類似的錯誤,這也是不由得令人好奇。
PS : 本文由雷鋒網(wǎng)獨家編譯,未經(jīng)許可拒絕轉(zhuǎn)載!
via Microsoft Blog
雷峰網(wǎng)原創(chuàng)文章,未經(jīng)授權(quán)禁止轉(zhuǎn)載。詳情見轉(zhuǎn)載須知。