0
本文作者: 章敏 | 2016-08-31 16:40 |
導(dǎo)讀:ECAI 2016是歐洲展示AI科學(xué)成果的最佳場(chǎng)所,大會(huì)為研究人員提供了很好的機(jī)會(huì),去介紹和聽(tīng)取當(dāng)代最優(yōu)秀的人工智能研究成果。
摘要:組稀疏表示(GSR)利用了數(shù)據(jù)中的組結(jié)構(gòu),并在許多問(wèn)題上效果很好。 然而,該組結(jié)構(gòu)必須事先手動(dòng)給出。在許多實(shí)際情況下,如分類,樣本都是根據(jù)他們的標(biāo)簽進(jìn)行分組的。在這種情況下,構(gòu)建一個(gè)一致的組結(jié)構(gòu)確實(shí)不容易。其原因有:1)樣本可能被錯(cuò)誤地標(biāo)記;2)標(biāo)簽分配到大數(shù)據(jù)中非常費(fèi)時(shí)且成本高。在本文中,我們提出并制定了一個(gè)新的問(wèn)題,用半監(jiān)督組稀疏表示(SS-GSR)支持標(biāo)記和未標(biāo)記數(shù)據(jù)中的組稀疏表示。同時(shí)學(xué)習(xí)一個(gè)更強(qiáng)大的組結(jié)構(gòu),它可以被進(jìn)一步利用以更有效地代表其他未標(biāo)記的數(shù)據(jù)。我們開(kāi)發(fā)了一個(gè)模型來(lái)解決SS—GSR問(wèn)題,它基于子空間分割中的流形假設(shè),即同一組中樣本特征空間緊密聯(lián)系在一起且跨越相同的子空間。我們還提出了一個(gè)交替算法來(lái)解決模型。最后,我們通過(guò)大量的實(shí)驗(yàn)驗(yàn)證了該模型。
Longwen Gao
任職:上海市智能信息處理重點(diǎn)實(shí)驗(yàn)室,復(fù)旦大學(xué)計(jì)算機(jī)科學(xué)院博士
研究方向:數(shù)據(jù)挖掘,人工神經(jīng)網(wǎng)絡(luò),人工智能
相關(guān)學(xué)術(shù)論文:
·“Effectively classifying short texts by structured sparse representation with dictionary filtering”
本文中,我們提出并制定了半監(jiān)督GSR(SS-GSR)對(duì)含標(biāo)記和未標(biāo)記的數(shù)據(jù)集進(jìn)行組稀疏表示。它可以克服傳統(tǒng)GSR的兩大缺陷:1)在GSR中預(yù)定義組結(jié)構(gòu)可能與數(shù)據(jù)中不完全一致;2)GSR中未利用未標(biāo)記數(shù)據(jù)的潛在組結(jié)構(gòu)。相比于GSR,SS-GSR可以利用標(biāo)記數(shù)據(jù)的先驗(yàn)組結(jié)構(gòu)和未標(biāo)記數(shù)據(jù)的組結(jié)構(gòu)信息。相比于SSL方法,SS-GSR可以從數(shù)據(jù)中自動(dòng)的學(xué)習(xí)結(jié)構(gòu)化親和矩陣,而不是使用一個(gè)固定的。
我們將SS-GSR應(yīng)用于監(jiān)督和半監(jiān)督分類任務(wù),驗(yàn)證了SS-GS的有效性和優(yōu)越性。
via:ECAI 2016
PS : 本文由雷鋒網(wǎng)獨(dú)家編譯,未經(jīng)許可拒絕轉(zhuǎn)載!
雷峰網(wǎng)原創(chuàng)文章,未經(jīng)授權(quán)禁止轉(zhuǎn)載。詳情見(jiàn)轉(zhuǎn)載須知。