0
雷鋒網(wǎng) AI 開發(fā)者按:在信息技術(shù)中,作為近年來快速發(fā)展地人工智能中一重要領(lǐng)域——圖像識別技術(shù)已廣泛應(yīng)用于眾多應(yīng)用領(lǐng)域。隨著信息技術(shù)的日新月異,圖像識別技術(shù)也得到十分迅猛的發(fā)展。在這期間,研究人員與工程師們一直都在努力嘗試打破計算機視覺系統(tǒng)的邊界,然后將研究成果應(yīng)用到現(xiàn)實世界的問題中。
為此,我們 AI 研習(xí)社也嘗試將圖像識別聚焦于生活美食領(lǐng)域,希望通過一些食物識別的基礎(chǔ)識別挑戰(zhàn)賽,讓更多開發(fā)者受益于圖像識別技術(shù)的實踐。有關(guān)圖片識別及美食識別挑戰(zhàn)賽詳細(xì)內(nèi)容,雷鋒網(wǎng) AI 開發(fā)者整理編輯如下。
《美食識別挑戰(zhàn)賽之「豆腐 VS 土豆」》
自移動互聯(lián)網(wǎng)慢慢滲透到我們大部分人的生活后,圖片這一附屬產(chǎn)物的數(shù)量也變得越來越大。據(jù) Instagram 官方曾報道,其社區(qū)內(nèi)每日上傳圖片目前能夠達(dá)到億量級。
這些圖片不僅能夠展示足夠大的信息量,并且可以不受語言地域限制擁有跨國界的更廣泛的受眾。如果能夠合理且正確的提取這些圖片內(nèi)包含的信息,我們將有機會更好的運用這些信息創(chuàng)造更美好的生活;這也就是圖片識別技術(shù)的意義之一。
因此,我們對于圖像識別的定義即為計算機對圖像進(jìn)行處理、分析和理解,以識別各種不同模式的目標(biāo)和對像的技術(shù);但需要注意的是圖像識別主要需處理具有一定復(fù)雜性的信息,其處理技術(shù)并非隨意出現(xiàn)在計算機中。
這一技術(shù)的發(fā)展主要經(jīng)歷了三個階段,即:文字識別、數(shù)字圖像處理與識別、物體識別。從最初進(jìn)入我們生活的「人臉識別」APP;到之后與神經(jīng)網(wǎng)絡(luò)融合進(jìn)一步對圖像進(jìn)行分類處理;再到人工智能機器識別與交互的過程;我們可以看到圖像識別極具潛力的應(yīng)用前景。
圖像識別技術(shù)的過程大致與人相仿,該技術(shù)最終通過一些醫(yī)學(xué)研究人員的實踐,結(jié)合計算機程序?qū)ο嚓P(guān)內(nèi)容模擬并予以實現(xiàn),主要分為 4 個步驟:
圖像預(yù)處理 主要指將聲音和光等信息通過傳感器向電信號轉(zhuǎn)換,即對識別對象的基本信息進(jìn)行獲取,并將其轉(zhuǎn)換為計算機可識別的信息;
圖像分割 主要是指把圖像分成若干個特定的、具有獨特性質(zhì)的區(qū)域并提出感興趣目標(biāo)的技術(shù)和過程。它是由圖像處理到圖像分析的關(guān)鍵步驟;
圖像識別系統(tǒng)圖
特征提取 它指的是使用計算機提取圖像信息,決定每個圖像的點是否屬于一個圖像特征,具體而言,即識別圖像具有種類多樣的特點,特征抽取也被稱為獲取特征;
判斷匹配 基于一定的識別規(guī)則判斷得到特征的主要種類,最終得到對圖像內(nèi)容的識別結(jié)果。
我們將常見的圖像識別:人臉識別、虹膜識別、指紋識別等直接識別類;但其實包括:生物識別、物體與場景識別、視頻識別等內(nèi)容識別也屬于這個范疇。
場景識別示例
具體而言,生活中我們能見到會自動躲避障礙物的掃地機器人;通過一張圖片,我們可以搜同款物品完成網(wǎng)上購物;我們可以看到運用了自動駕駛技術(shù)的小轎車;工業(yè)生產(chǎn)中,也可以看到自動化檢測車間等,這些應(yīng)用都與圖片識別技術(shù)有關(guān)。
而回到我們賽題中的「美食識別」領(lǐng)域,圖片識別技術(shù)也會有極強的應(yīng)用空間。我們不僅可以直接利用該技術(shù)實現(xiàn)在就餐時,智能刷卡打菜;也可以將這一技術(shù)與農(nóng)業(yè)生產(chǎn)領(lǐng)域相結(jié)合,對菜品出產(chǎn)時的新鮮度、可食用性、輕微碰傷等狀態(tài)進(jìn)行智能檢測。
將 AI 檢測運用于農(nóng)業(yè)生產(chǎn)
小到生活娛樂,大到社會生產(chǎn),圖片識別技術(shù)大大提高了生活生產(chǎn)的效率,這也有力的說明了有效應(yīng)用圖像識別技術(shù)將使得社會與經(jīng)濟價值得到更好的發(fā)揮。
不僅如此,圖像識別還被視為計算視覺技術(shù)體系中的重要一環(huán)。一方面,它的發(fā)展將很大程度上決定人工智能領(lǐng)域的發(fā)展高度;另一方面,該技術(shù)的成長與完備也離不開人工智能網(wǎng)絡(luò)中更多數(shù)據(jù)的開放、更多基礎(chǔ)工具的開源以及高性能的 AI 計算芯片和優(yōu)秀的深度學(xué)習(xí)算法等的進(jìn)步。
將圖片識別技術(shù)運用于餐廳收費處
因此,圖像識別對于開發(fā)者而言,更是具有非同尋常的意義,這也是 AI 研習(xí)社強力推出圖像識別挑戰(zhàn)賽的初衷。
本次挑戰(zhàn)賽則是圍繞圖片識別技術(shù)展開,并將其聚焦于美食識別小的領(lǐng)域。通過對食物圖片中「豆腐」與「土豆」的判斷,從而得到正確的識別結(jié)果。
開始時間:2019-11-28 09:00:00
結(jié)束時間:2019-12-28 00:00:00
在本次挑戰(zhàn)賽期間,我們向大家免費開放了由天數(shù)智芯 SkydataLab AI 云平臺所提供的 GPU 資源。報名之后點擊頁面右側(cè)的「獲取免費云訓(xùn)練資源」,即可無償使用。
免費云訓(xùn)練資源說明
本次大賽一共設(shè)置了三種獎項,三種獎項互不沖突,而優(yōu)秀的選手可以直接一次性拿走全三項獎金哦!獎項包括:
參與獎(Participation Award)
金額:占總獎金的30%;
獲獎人數(shù):所有人(每人僅能獲得一次參與獎);
獲獎條件:提交結(jié)果大于標(biāo)準(zhǔn)分,標(biāo)準(zhǔn)分=50;
R為得分區(qū)間系數(shù),R1(0.45)、R2(0.2)、R3(0.15)、R4(0.12)、R5(0.08);
money為已經(jīng)發(fā)放的參與獎獎金;
突破獎(Prizes)
金額:占總獎金20%;
獲獎人數(shù):所有人;
Pn-1求和表示已經(jīng)發(fā)放的突破獎獎金
Sn-Sn-1 表示本次得分和上次得分之差
特別提醒:越早提交,突破分?jǐn)?shù)越大,獎金越多
排名獎(Ranking Award)
金額:占總獎金50%;
獲獎人數(shù):得分前5名
T為獎金時間系數(shù),比賽上線第一周、一個月,T(周)=0.5,T(月)=0.5;
K為排名獎金分配系數(shù),前5名分配系數(shù)分別為0.45、0.2、0.15、0.12、0.08;
本次比賽的唯一任務(wù)即:正確識別圖片中食物種類,識別出土豆則得到結(jié)果「1」,識別出豆腐則得到結(jié)果「0」。本次訓(xùn)練集為 7502 張,測試集為 1407 張,全部都經(jīng)過了人工篩選,可保證圖片均可有效識別。
數(shù)據(jù)集圖片示例
注:train.csv 文件是訓(xùn)練集的結(jié)果文件。1 是有土豆的,0 是有豆腐的。(其中,訓(xùn)練集和測試集 ID 都是從 0 開始)。
數(shù)據(jù)集地址:http://1t.click/bqUV
最終提交結(jié)果文件如下所示,其中,第一個字段位:樣本 ID,即圖片名(例如:1.jpg,那么 ID 是 1);第二個字段:1 是有土豆的,0 是有豆腐的:
整個比賽的評審?fù)耆该骰?,我們將會對比選手提交的 csv 文件,確認(rèn)正確識別圖片數(shù)據(jù),并按照如下公式計算得分,其中:
True:模型分類正確數(shù)量
Total :測試集樣本總數(shù)量
我們也會在每日 24:00,將最新結(jié)果更新在官網(wǎng)排行榜上,你可以實時查看自己的排名情況。
更多信息,請點擊參賽地址查看:https://god.yanxishe.com/16
雷鋒網(wǎng) AI 開發(fā)者 雷鋒網(wǎng)
雷峰網(wǎng)原創(chuàng)文章,未經(jīng)授權(quán)禁止轉(zhuǎn)載。詳情見轉(zhuǎn)載須知。