丁香五月天婷婷久久婷婷色综合91|国产传媒自偷自拍|久久影院亚洲精品|国产欧美VA天堂国产美女自慰视屏|免费黄色av网站|婷婷丁香五月激情四射|日韩AV一区二区中文字幕在线观看|亚洲欧美日本性爱|日日噜噜噜夜夜噜噜噜|中文Av日韩一区二区

您正在使用IE低版瀏覽器,為了您的雷峰網(wǎng)賬號安全和更好的產(chǎn)品體驗(yàn),強(qiáng)烈建議使用更快更安全的瀏覽器
此為臨時(shí)鏈接,僅用于文章預(yù)覽,將在時(shí)失效
業(yè)界 正文
發(fā)私信給黃鑫
發(fā)送

1

ICML論文精選:無監(jiān)督學(xué)習(xí)的研究和應(yīng)用

本文作者: 黃鑫 2016-06-21 21:57
導(dǎo)語:第二天的會議即將開始

深度學(xué)習(xí)的類型按照數(shù)據(jù)是否有標(biāo)記來區(qū)別可以分為三種:監(jiān)督學(xué)習(xí)、半監(jiān)督學(xué)習(xí)和無監(jiān)督學(xué)習(xí)。事實(shí)上人類不可能把每件事都手把手的教給AI。無監(jiān)督學(xué)習(xí)應(yīng)該才是未來的趨勢。

ICML給無監(jiān)督學(xué)習(xí)單獨(dú)開了一個(gè)專區(qū),包括無監(jiān)督學(xué)習(xí)的研究和應(yīng)用。我們今天主要來關(guān)注一下無監(jiān)督學(xué)習(xí)應(yīng)用方面的論文。

深度嵌入的無監(jiān)督聚類分析(Unsupervised Deep Embedding for Clustering Analysis)

聚類分析對許多數(shù)據(jù)驅(qū)動的應(yīng)用領(lǐng)域來說非常重要,并且已經(jīng)以距離函數(shù)和分組算法的表現(xiàn)形式被廣泛徹底的研究過了。而聚焦于聚類分析的學(xué)習(xí)表現(xiàn)的研究相對來說則比較少。這篇論文,我們提出了一個(gè)深度嵌入式聚類方法(Deep Embedded Clustering,DEC),它可以使用深度神經(jīng)網(wǎng)絡(luò)實(shí)現(xiàn)同時(shí)學(xué)習(xí)特征表示和聚類任務(wù)。

這種方法在圖像和文本語言識別領(lǐng)域的實(shí)驗(yàn)中的表現(xiàn)比現(xiàn)今最好的方法都有顯著的提升。

用于檢查數(shù)據(jù)的馬爾可夫調(diào)制標(biāo)記的泊松過程(Markov-modulated Marked Poisson Processes for Check-in Data)

論文建立了一個(gè)時(shí)間連續(xù)的概率模型來研究由時(shí)間和位置組成的“通過檢查點(diǎn)(check-in)”的軌跡數(shù)據(jù)。我們將數(shù)據(jù)組織成一種標(biāo)記點(diǎn)變化進(jìn)程的實(shí)現(xiàn),并且是一種由馬卡洛夫跳躍進(jìn)程(Markov jump process,MJP)條結(jié)果的強(qiáng)烈的標(biāo)記分布式排列。

論文也將通過給每個(gè)用戶分配一個(gè)“優(yōu)先地點(diǎn)”的方式將用戶異質(zhì)性考慮到了模型之中。還通過放棄“Bag of words”(忽略掉文本的語法和語序,用一組無序的單詞來表達(dá)一段文字或者一個(gè)文檔的方法)假設(shè)和在連續(xù)時(shí)間中執(zhí)行的方式擴(kuò)展了潛在狄利克雷分布的考慮。

分層復(fù)合泊松分解(Hierarchical Compound Poisson Factorization)

分層泊松分解(HPF)已經(jīng)被證明在極端稀疏的推薦系統(tǒng)中具有很好的擴(kuò)展性。但是由于稀疏系統(tǒng)和響應(yīng)模型的緊密耦合特性限制了后者的表達(dá)豐富性。本文介紹了一種分層復(fù)合泊松分解函數(shù)(Hierarchical Compound Poisson Factorization,HCPF),既有良好的泊松伽馬架構(gòu),與高維極端稀疏矩陣相比又同時(shí)具有HPF良好的擴(kuò)展性。這個(gè)新的算法經(jīng)過了九個(gè)離散型和三個(gè)連續(xù)型數(shù)據(jù)集的測試,都表明HCPF在捕捉稀疏度和響應(yīng)之間的關(guān)系的性能優(yōu)于HPF。

在單細(xì)胞的基因表達(dá)數(shù)據(jù)校正技術(shù)變化的狄利克雷過程混合模型(Dirichlet Process Mixture Model for Correcting Technical Variation in Single-Cell Gene Expression Data)

論文介紹了一種單細(xì)胞基因數(shù)據(jù)表達(dá)的迭代標(biāo)準(zhǔn)和聚類方法。新興的細(xì)胞RNA編碼技術(shù)可以允許人們發(fā)現(xiàn)和描述關(guān)于細(xì)胞的很多信息。但是現(xiàn)在的數(shù)據(jù)很容易被實(shí)驗(yàn)的錯(cuò)誤結(jié)果或者細(xì)胞特性的描述偏差影響。目前的解決方法:研究生物信號前先執(zhí)行總體的誤差糾正,并不能從根本上解決問題。

論文提出的模型由分層貝葉斯混合模型和細(xì)胞特異性規(guī)模的因素組成,用來幫助數(shù)據(jù)的重復(fù)迭代和聚類,梳理清楚由生物信號產(chǎn)生的技術(shù)誤差。并且證明了這種方法要比現(xiàn)行的方法更有優(yōu)勢。

多時(shí)間序列的非參數(shù)關(guān)系回歸模型的自動構(gòu)建(Automatic Construction of Nonparametric Relational Regression Models for Multiple Time Series)

論文建立了兩個(gè)相關(guān)的、可以通過找到導(dǎo)致變化的共同因素同時(shí)處理三組時(shí)間序列數(shù)據(jù)的核心學(xué)習(xí)方法。這種學(xué)習(xí)方法對現(xiàn)實(shí)中一些數(shù)據(jù)集做出了更加精確的模型建立。解決了之前系統(tǒng)精確度、特異性和描述準(zhǔn)確度不夠的問題。

人類的學(xué)習(xí)應(yīng)該屬于半監(jiān)督學(xué)習(xí)和無監(jiān)督學(xué)習(xí)的結(jié)合。因此這兩種領(lǐng)域的研究都很有關(guān)注的價(jià)值。

雷峰網(wǎng)原創(chuàng)文章,未經(jīng)授權(quán)禁止轉(zhuǎn)載。詳情見轉(zhuǎn)載須知。

分享:
相關(guān)文章
當(dāng)月熱門文章
最新文章
請?zhí)顚懮暾埲速Y料
姓名
電話
郵箱
微信號
作品鏈接
個(gè)人簡介
為了您的賬戶安全,請驗(yàn)證郵箱
您的郵箱還未驗(yàn)證,完成可獲20積分喲!
請驗(yàn)證您的郵箱
立即驗(yàn)證
完善賬號信息
您的賬號已經(jīng)綁定,現(xiàn)在您可以設(shè)置密碼以方便用郵箱登錄
立即設(shè)置 以后再說