0
本文作者: 楊鯉萍 | 2020-02-13 21:35 |
雷鋒網(wǎng) AI 開(kāi)發(fā)者按:就在幾個(gè)月前,AI 研習(xí)社推出了第一場(chǎng)有關(guān)美食識(shí)別的挑戰(zhàn)賽(http://www.ozgbdpf.cn/news/201912/flrnkIxJGI4bw3TE.html)。該比賽要求參賽者能夠從給出待識(shí)別圖片中正確區(qū)分豆腐與土豆,這一任務(wù)也讓眾多圖片識(shí)別愛(ài)好者得到了初級(jí)練手。
相較第一場(chǎng)美食識(shí)別挑戰(zhàn)賽,這次推出的比賽 2.0 難度略有增加。除了食材種類的成倍增加之外,四種食材的圖片辨識(shí)度也有所降低。這對(duì)于專注于圖像識(shí)別的開(kāi)發(fā)者而言,相信是非常值得嘗試的一次挑戰(zhàn)!
如果你單純以為這次挑戰(zhàn)賽只是將種類增加了 2 類,那可就誤會(huì)大了。從學(xué)術(shù)的角度來(lái)看,這次的問(wèn)題實(shí)際上是由之前的二分類問(wèn)題擴(kuò)展到了多分類問(wèn)題。
通常在處理二分類問(wèn)題時(shí),我們只需將所涉及類別分為兩類,例如:真(1),假(0),然后再進(jìn)行兩兩配對(duì)即可。之后根據(jù)測(cè)試結(jié)果與實(shí)際情況的對(duì)比,我們還會(huì)得到一個(gè)混淆矩陣,其中包括四類數(shù)據(jù):
預(yù)測(cè)為真且實(shí)際為真的 True Positives(TP)
預(yù)測(cè)為假且實(shí)際為真的 False Negatives(FN)
預(yù)測(cè)為真且實(shí)際為假的 False Positives(FP)
預(yù)測(cè)為假且實(shí)際為假 True Negatives(TN)
二分類問(wèn)題
除此之外,也涉及到由此衍生的多個(gè)衡量模型質(zhì)量的相關(guān)指標(biāo)。例如:精確率 (Precision)——模型判斷正確的數(shù)據(jù) (TP+TN) 占總數(shù)據(jù)的比例;召回率 (Recall)——模型正確判斷出的正例 (TP) 占數(shù)據(jù)集中所有正例的比例;準(zhǔn)確率 (Accuracy)——針對(duì)模型判斷出的所有正例 (TP+FP) 而言, 其中真正例 (TP) 占的比例。
而如果是多分類問(wèn)題,例如本次挑戰(zhàn)賽所涉及的 4 類,不僅分類將對(duì)應(yīng)增加為茄子(0)、山藥(1)、苦瓜(2)、西蘭花(3),而且相應(yīng)的混淆矩陣也將由之前的 2*2 變?yōu)?4*4。如果多分類問(wèn)題擴(kuò)展到 10 類,那混淆矩陣將會(huì)變成 10*10 的矩陣。
多類細(xì)胞分類問(wèn)題示例
類似于線性回歸分類,多元線性回歸較單元線性回歸問(wèn)題,增加變量個(gè)數(shù)即單變量推廣到多元;運(yùn)用梯度下降法時(shí),方法同單變量線性回歸,代價(jià)函數(shù)也將有很大的變化。
具體而言,多變量的時(shí)候,變量的取值范圍將有差異。如果差異過(guò)大,產(chǎn)生的代價(jià)函數(shù)極不規(guī)整,像特別狹長(zhǎng)的橢圓,這時(shí)候進(jìn)行梯度下降時(shí),路徑會(huì)十分曲折。
圖片來(lái)源:https://blog.csdn.net/qq_36187544/article/details/87879423
如此一來(lái),多分類問(wèn)題不僅有多個(gè)參數(shù)增加的代價(jià)問(wèn)題;同時(shí),考慮到模型質(zhì)量問(wèn)題,也需要有更為復(fù)雜的衡量指標(biāo)來(lái)對(duì)模型進(jìn)行判斷與優(yōu)化。因此,多分類問(wèn)題每多一個(gè)類別,識(shí)別問(wèn)題的復(fù)雜維度將大大增加。
當(dāng)問(wèn)題從二分類變?yōu)槎喾诸悤r(shí),通常開(kāi)發(fā)者們采用的是拆解法,即:將多分類問(wèn)題拆分成多個(gè)二分類問(wèn)題,為每一個(gè)二分類問(wèn)題訓(xùn)練一個(gè)分類器,再綜合多個(gè)分類標(biāo)準(zhǔn)下的預(yù)測(cè)結(jié)果進(jìn)行集成,得到最終分類。這種將問(wèn)題轉(zhuǎn)換的拆分策略主要為三種:
二元關(guān)聯(lián) 將每個(gè)標(biāo)簽當(dāng)做單獨(dú)的一個(gè)類分類問(wèn)題。給定數(shù)據(jù)集 D 這里有 N 個(gè)類別,這種情況下就是將這些類別兩兩配對(duì),從而產(chǎn)生 N(N-1)/2 個(gè)二分類任務(wù),在測(cè)試的時(shí)候把樣本傳給這些分類器,然后進(jìn)行決策。
分類器鏈 將每一次的一個(gè)類作為正例,其余作為反例,總共訓(xùn)練 N 個(gè)分類器。測(cè)試的時(shí)候若僅有一個(gè)分類器預(yù)測(cè)為正的類別則對(duì)應(yīng)的類別標(biāo)記作為最終分類結(jié)果,若有多個(gè)分類器預(yù)測(cè)為正類,則選擇置信度最大的類別作為最終分類結(jié)果。
多分類策略 基于一種糾錯(cuò)輸出碼的分類方法,分為編碼與解碼兩個(gè)步驟。編碼負(fù)責(zé)對(duì) N 個(gè)類別做 M 次劃分,解碼則負(fù)責(zé)用 M 個(gè)分類器分別對(duì)測(cè)試樣本進(jìn)行預(yù)測(cè),得到最終預(yù)測(cè)結(jié)果。
ECOC 編碼示意圖
但不管是哪種策略,對(duì)于每個(gè)分類器的訓(xùn)練集,開(kāi)發(fā)者都可以先將原始訓(xùn)練集的標(biāo)簽重新定義分成兩類,轉(zhuǎn)化為二分類問(wèn)題,然后對(duì)每個(gè)分類器作相應(yīng)的心理,從而對(duì)測(cè)試集進(jìn)行分類判斷得到每一個(gè)分類器標(biāo)簽,最后在通過(guò)對(duì)各個(gè)分類器的標(biāo)簽得到最后的識(shí)別結(jié)果。
除此之外,選擇合適的評(píng)價(jià)指標(biāo)有助于選出更適合于當(dāng)前任務(wù)的算法,開(kāi)發(fā)者還可以為這一識(shí)別模型設(shè)計(jì)合適的評(píng)價(jià)指標(biāo)。對(duì)于分類任務(wù)而言,評(píng)價(jià)指標(biāo)主要關(guān)注點(diǎn)在于系統(tǒng)分類正確的能力;因此,所涉及到的評(píng)價(jià)指標(biāo)可參考二分類的精確率、召回率、準(zhǔn)確率等。
對(duì)于多類別分類,圖示為兩特征分 3 類
本次 AI 研習(xí)社發(fā)起的美食識(shí)別挑戰(zhàn)賽任務(wù)即:正確判斷美食圖片中出現(xiàn)的食材。其中,食材共 4 種分類,包含了:茄子、山藥、苦瓜、西蘭花。
這相對(duì)于第一場(chǎng)美食識(shí)別系列挑戰(zhàn)賽「土豆 or 豆腐」而言,難度有所上升。但和之前比賽相同的是,每張圖片只包含了其中一種食材。
來(lái)源:AI 研習(xí)社
大賽主頁(yè)提供了「肺炎 X 光片」相關(guān)的數(shù)據(jù)集,包括了訓(xùn)練集 6140 張,測(cè)試集 856 張。參賽者需要根據(jù)美食圖片中食材進(jìn)行分類,其中:茄子=0、山藥=1、苦瓜=2、西蘭花=3。
開(kāi)始時(shí)間:2020-02-13 18:00:00
結(jié)束時(shí)間:2020-03-14 23:59:59
本次大賽基礎(chǔ)獎(jiǎng)金池為 3000 元,比賽一共設(shè)置了三種獎(jiǎng)項(xiàng),包括了:參與獎(jiǎng)(30%)、突破獎(jiǎng)(20%)、排名獎(jiǎng)(50%);AI 研習(xí)社春節(jié)紅包活動(dòng)仍在繼續(xù),邀請(qǐng)好友參賽得獎(jiǎng)金,獎(jiǎng)金直接劃入個(gè)人賬戶,視同比賽獎(jiǎng)金。以上四種獎(jiǎng)項(xiàng)均互不沖突哦!
數(shù)據(jù)集部分圖片示例
數(shù)據(jù)集下載鏈接:
https://static.leiphone.com/food_challenge2.zip
春節(jié)紅包活動(dòng):
最終提交結(jié)果文件如下所示,其中,第一個(gè)字段位:測(cè)試集圖片 ID(注意 ID 即文件名是從 0 開(kāi)始的);第二個(gè)字段:食材 ID(茄子=0、山藥=1、苦瓜=2、西蘭花=3)
Ps:建議使用 UTF-8 編碼,共計(jì) 856 個(gè)結(jié)果,因?yàn)閿?shù)量不足可能導(dǎo)致無(wú)法評(píng)分哈~
整個(gè)比賽的評(píng)審?fù)耆该骰?,我們將?huì)對(duì)比選手提交的 csv 文件,確認(rèn)正確分辨圖片數(shù)據(jù),并按照如下公式計(jì)算得分,其中:
True:模型分類正確數(shù)量
Total :測(cè)試集樣本總數(shù)量
每日 24:00,我們也會(huì)將最新結(jié)果更新在官網(wǎng)排行榜上,你可以隨時(shí)隨地查看自己的排名情況。
更多信息,可進(jìn)入?yún)①愔黜?yè)查看:https://god.yanxishe.com/26
雷鋒網(wǎng) AI 開(kāi)發(fā)者 雷鋒網(wǎng)
雷峰網(wǎng)原創(chuàng)文章,未經(jīng)授權(quán)禁止轉(zhuǎn)載。詳情見(jiàn)轉(zhuǎn)載須知。