丁香五月天婷婷久久婷婷色综合91|国产传媒自偷自拍|久久影院亚洲精品|国产欧美VA天堂国产美女自慰视屏|免费黄色av网站|婷婷丁香五月激情四射|日韩AV一区二区中文字幕在线观看|亚洲欧美日本性爱|日日噜噜噜夜夜噜噜噜|中文Av日韩一区二区

您正在使用IE低版瀏覽器,為了您的雷峰網賬號安全和更好的產品體驗,強烈建議使用更快更安全的瀏覽器
此為臨時鏈接,僅用于文章預覽,將在時失效
人工智能 正文
發(fā)私信給小東
發(fā)送

1

谷歌 Embedding Projector 開源,高維數據可視化變得超簡單!

本文作者: 小東 2016-12-09 15:04
導語:谷歌高維數據可視化工具Embedding Projector開源,從此數據可視化變得異常簡單。

雷鋒網消息,最近谷歌開源了網頁版數據可視化工具Embedding Projector,該項目作為Tensorflow的一部分,能對高維數據進行可視化展示與分析。以下是雷鋒網整理編譯的谷歌研究院介紹內容,未經許可不得轉載。

最近機器學習界可謂是碩果累累,從圖像識別、語言翻譯再到醫(yī)療診斷,可謂讓人大開眼界。隨著機器學習的廣泛應用,探索模型是如何理解數據這一問題正在變得越來越重要,但是數據通常是用成百上千維的向量表示,因此我們需要一個專門的工具來探索、研究這個數據高維空間。

為了使大家能夠更加直觀的研究數據,我們開源了我們自己研發(fā)的網頁版數據可視化工具Embedding Projector,這個可視化工具是TensorFlow的一部分,可以用來對高維數據進行可視化展示與分析,此外還有一個單一版,這個版本不需要安裝TensorFlow,便可直接運行,大家可以去 projector.tensorflow.org 下載。

谷歌 Embedding Projector 開源,高維數據可視化變得超簡單!

嵌入探索

通常我們需要訓練的數據是不能直接作為機器學習算法的輸入的,我們應當將這些數據(例如:詞語、聲音、視頻等數據)表示成一種機器可以理解(處理)的數據形式。我們使用的是嵌入方法,即將數據表示成一個向量,這個向量包含了數據各個方面的信息。例如,在自然語言中,兩個意思相近的詞會映射到同一向量空間中兩個不同的點,但這兩個點的位置應該是相近的。

Embedding Projector這個工具使用起來很簡單,它可以實現數據的2D或3D效果展示。輕點鼠標,便可實現數據的旋轉、縮放。我們按照word2vec教程在TensorFlow上訓練了一些詞向量,將這些詞向量通過我們的工具進行可視化展示,點擊圖中任意一點(表示詞向量的點),那么通過這種算法算出的,與這個詞語義相關的詞以及其向量空間距離就會羅列出來。它給我們提供了一種非常重要的探究算法性能的方法。下圖展示了“important”這個詞在向量空間中的語義相近點

谷歌 Embedding Projector 開源,高維數據可視化變得超簡單!


降維方法

Embedding Projector提供了三種常用的數據降維方法,這些方法可以使復雜數據可視化變的簡單一些。具體為以下三種:PCA,、t-SNE、custom linear projections。PCA用在探究數據內部結構、發(fā)現數據重要維度信息上;t-SNE用于探究數據的周圍信息、確定其與哪些周圍數據屬于同類(聚類效果),確保向量保留了數據的含義信息。custom linear projections用于確定數據含義的‘方向’(在生成模型中,統(tǒng)一數據,正式語氣與非正式語氣其含義是不同的,加入這些因素可以提高機器學習模型的適應性)。

下圖是在一個35K的電子郵件常用短語數據集上,使用custom linear projection方法得出的與‘See attachments’相鄰的100個點

谷歌 Embedding Projector 開源,高維數據可視化變得超簡單!

此外在Embedding Projector網站上還有一些數據集,你可以去網站下載,然后試一下我們的可視化軟件,如果你想公開你的訓練結果,這很簡單,你只需要單擊軟件的“Publish”按鈕,便可以實現訓練結果的共享了。我們希望Embedding Projector在機器學習應用方面,對研發(fā)人員有所幫助,也希望幫助大家更好理解,機器學習算法是如何對數據進行解釋的。如果想了解更多的細節(jié),請參看這里

via Open sourcing the Embedding Projector: a tool for visualizing high dimensional data

【招聘】雷鋒網堅持在人工智能、無人駕駛、VR/AR、Fintech、未來醫(yī)療等領域第一時間提供海外科技動態(tài)與資訊。我們需要若干關注國際新聞、具有一定的科技新聞選題能力,翻譯及寫作能力優(yōu)良的外翻編輯加入。

簡歷投遞至 guoyixin@leiphone.com,工作地 深圳;

或投遞至 wudexin@leiphone.com,工作地 北京。

雷峰網原創(chuàng)文章,未經授權禁止轉載。詳情見轉載須知

谷歌 Embedding Projector 開源,高維數據可視化變得超簡單!

分享:
相關文章
當月熱門文章
最新文章
請?zhí)顚懮暾埲速Y料
姓名
電話
郵箱
微信號
作品鏈接
個人簡介
為了您的賬戶安全,請驗證郵箱
您的郵箱還未驗證,完成可獲20積分喲!
請驗證您的郵箱
立即驗證
完善賬號信息
您的賬號已經綁定,現在您可以設置密碼以方便用郵箱登錄
立即設置 以后再說