0
本文作者: 三川 | 2017-04-15 18:22 |
雷鋒網(wǎng)消息:今日凌晨,DataScience Inc. 發(fā)布了 DataScience Trends。
這是一個(gè)針對(duì) GitHub 資源庫(kù)的交互式數(shù)據(jù)分析與可視化工具,能方便地對(duì)各開源算法庫(kù)的活動(dòng)、狀態(tài)、人氣進(jìn)行比對(duì),包括新 commits 和 pull requests。開發(fā)者可用它來考察開源項(xiàng)目大趨勢(shì),以及篩選感興趣的項(xiàng)目。順便說一句,它免費(fèi)使用。
它基于 GitHub 和谷歌去年公開的 3TB GitHub 項(xiàng)目數(shù)據(jù)。
據(jù)雷鋒網(wǎng)了解,操作它不需要寫代碼,界面簡(jiǎn)潔。因此,即便是新手也能輕松使用,用它來挖掘 GitHub 項(xiàng)目信息,在時(shí)間軸上與趨勢(shì)進(jìn)行交互。另外,數(shù)據(jù)范圍也可任意調(diào)節(jié)。
DataScience Inc. CTO William Mercha 表示:
“當(dāng)下,正是開源工具不斷蠶食有償解決方案市場(chǎng)空間的時(shí)候。使用 DataScience Trends 挖掘出的開源項(xiàng)目信息,對(duì)于需要找到合適開源軟件的開發(fā)團(tuán)隊(duì)非常寶貴。去年在 Burtch Works 的市場(chǎng)調(diào)查中,有 62% 的數(shù)據(jù)分析從業(yè)者表示,相比經(jīng)典解決方案 SAS,他們更傾向于使用開源語(yǔ)言 Python 和 R。在企業(yè)級(jí)領(lǐng)域,這是一個(gè)市場(chǎng)大趨勢(shì)。
在 GitHub 文檔里,有許多可探索的領(lǐng)域。比如某個(gè)資源庫(kù)的熱門程度(從星標(biāo)數(shù)量、書簽收藏?cái)?shù)量獲知) ,還有開源工具集的合作(從 pull requests 看出)。
我們使用 DataScience Trends 來尋找最受歡迎的開源工具,然后把它們整合入我們的企業(yè)平臺(tái) DataScience Cloud。比如,我們通過 DataScience Trends 能清楚看出,TensorFlow 刺激了開發(fā)者對(duì)與之兼容的神經(jīng)網(wǎng)絡(luò)庫(kù) Keras 的興趣;還有,數(shù)據(jù)可視化工具 ggplot 在 Python 開發(fā)者群體中的影響力不斷壯大。隨著 GitHub 的存檔不斷增長(zhǎng),DataScience Trends 用戶能夠挖掘出更多的有價(jià)值信息。“
由于數(shù)據(jù)集多達(dá) 3 TB,DataScience Trends 帶來的探索可能性幾乎是無限的。它覆蓋了一萬個(gè)最熱門 GitHub 資源庫(kù)的數(shù)據(jù),包含項(xiàng)目開發(fā)活動(dòng)、流行程度、合作等方面的信息。此外,DataScience Trends 還內(nèi)置了其它幾項(xiàng)功能,以方便探索開源軟件數(shù)據(jù):
具體日期與數(shù)值
用戶可利用任意數(shù)據(jù)可視化方法,來觀察某一日期節(jié)點(diǎn)的數(shù)據(jù)與數(shù)值。
標(biāo)準(zhǔn)化的比較趨勢(shì)
任意大小、任意流行度的算法庫(kù),可通過一個(gè)通用檢索框架來進(jìn)行比較。只需一次點(diǎn)擊,就能從“相對(duì)”視圖返回到“絕對(duì)值”視圖。
共享功能
每次探索都會(huì)生成一個(gè)獨(dú)立的 URL。當(dāng)然,用戶也可點(diǎn)擊“共享”圖標(biāo)。
更多請(qǐng)?jiān)L問 DataScience Trends 官網(wǎng):https://www.datascience.com/resources/tools/trends
雷鋒網(wǎng)提醒,下載需提交使用申請(qǐng)。
via kdnuggets
相關(guān)文章:
谷歌上線全新開源網(wǎng)站,展示開源項(xiàng)目管理流程
雷峰網(wǎng)版權(quán)文章,未經(jīng)授權(quán)禁止轉(zhuǎn)載。詳情見轉(zhuǎn)載須知。