0
本文作者: no name | 2016-08-29 10:27 |
導(dǎo)讀:多類別分類問題在機(jī)器學(xué)習(xí)領(lǐng)域吸引了很多關(guān)注,傳統(tǒng)的解決方案傾向于將其變?yōu)槎鄠€二元問題,相應(yīng)的策略包括決策樹、神經(jīng)網(wǎng)絡(luò)等等。本文被PRICAI 2016大會收錄,提出了一種最大間距二叉樹糾錯輸出碼,對應(yīng)的編碼矩陣更加穩(wěn)定和易識別。
標(biāo)題:最大間距二叉樹糾錯輸出碼
摘要:編碼是糾錯輸出碼(ECOCs)中最重要的一步。傳統(tǒng)的編碼策略通常與數(shù)據(jù)無關(guān)。最近,提出的一些樹形編碼算法率先利用交互信息預(yù)估類間可分性,將二叉樹自上而下分層分區(qū),以獲得一個編碼矩陣。但這些標(biāo)準(zhǔn)通常是由一個非參數(shù)方法計(jì)算得到,一般來說需要大量樣本,而且更可能產(chǎn)生不穩(wěn)定的結(jié)果。本文中,我們提出了一種新穎的編碼算法,它利用類間最大間距為基準(zhǔn),構(gòu)造了一個基于最大間距、自底向上的二叉樹。因此,相應(yīng)的編碼矩陣在之后的分類中更加穩(wěn)定和易識別。實(shí)驗(yàn)結(jié)果表明在ECOC中,我們的算法比一些最先進(jìn)的編碼算法性能更好。
關(guān)鍵詞:多類別分類;最大間距二叉樹;糾錯輸出編碼
第一作者簡介:
Fa Zheng
東南大學(xué)計(jì)算機(jī)系,教育部計(jì)算機(jī)網(wǎng)絡(luò)與信息集成重點(diǎn)實(shí)驗(yàn)室。
via PRICAI 2016
雷鋒網(wǎng)按: 本文由雷鋒網(wǎng)獨(dú)家編譯,未經(jīng)許可禁止轉(zhuǎn)載!
雷峰網(wǎng)原創(chuàng)文章,未經(jīng)授權(quán)禁止轉(zhuǎn)載。詳情見轉(zhuǎn)載須知。