丁香五月天婷婷久久婷婷色综合91|国产传媒自偷自拍|久久影院亚洲精品|国产欧美VA天堂国产美女自慰视屏|免费黄色av网站|婷婷丁香五月激情四射|日韩AV一区二区中文字幕在线观看|亚洲欧美日本性爱|日日噜噜噜夜夜噜噜噜|中文Av日韩一区二区

您正在使用IE低版瀏覽器,為了您的雷峰網(wǎng)賬號(hào)安全和更好的產(chǎn)品體驗(yàn),強(qiáng)烈建議使用更快更安全的瀏覽器
此為臨時(shí)鏈接,僅用于文章預(yù)覽,將在時(shí)失效
人工智能開發(fā)者 正文
發(fā)私信給skura
發(fā)送

0

cuDF:加快數(shù)據(jù)處理流程的DataFrame庫(kù)

本文作者: skura 2019-05-03 09:18
導(dǎo)語(yǔ):數(shù)據(jù)科學(xué)家常用的工具

雷鋒網(wǎng) AI 科技評(píng)論按,數(shù)據(jù)處理是數(shù)據(jù)工程師經(jīng)常要面對(duì)的問題,今天要推薦的是一個(gè)和數(shù)據(jù)處理相關(guān)的 DataFrame 庫(kù)——cuDF。

cuDF 是一個(gè)基于 Apache Arrow 列內(nèi)存格式的數(shù)據(jù)幀庫(kù),它是一個(gè) GPU DataFrame 庫(kù),可以進(jìn)行加載,連接,聚合,過濾等數(shù)據(jù)操作。

cuDF 提供了類似 pandas 的 API,數(shù)據(jù)工程師和數(shù)據(jù)科學(xué)家都很熟悉它們,他們可以使用它輕松地加快工作流程,而無(wú)需深入了解 CUDA 編程的細(xì)節(jié)。

例如,以下代碼段下載 CSV,然后使用 GPU 將其解析為行和列并運(yùn)行計(jì)算:

import cudf, io, requests

from io import StringIO

url="https://github.com/plotly/datasets/raw/master/tips.csv"

content = requests.get(url).content.decode('utf-8')

tips_df = cudf.read_csv(StringIO(content))
tips_df['tip_percentage'] = tips_df['tip']/tips_df['total_bill']*100


# display average tip by dining party size

print(tips_df.groupby('size').tip_percentage.mean())

得到的輸出為:

size

1    21.729201548727808

2    16.571919173482897

3    15.215685473711837

4    14.594900639351332

5    14.149548965142023

6    15.622920072028379

Name: tip_percentage, dtype: float64

想查看更多示例,可以瀏覽的完整 API 文檔,或查看更詳細(xì)的說(shuō)明。

那么如何安裝這個(gè)工具?請(qǐng)參閱 Demo Docker Repository,根據(jù)正在運(yùn)行的 NVIDIA CUDA 版本選擇一個(gè)標(biāo)簽。

安裝

conda

cuDF 可以通過渠道安裝 conda(miniconda,或完整的 Anaconda 發(fā)行版) rapidsai:

# for CUDA 9.2

conda install -c nvidia -c rapidsai -c numba -c conda-forge -c defaults \
   cudf=0.6 python=3.6 cudatoolkit=9.2


# or, for CUDA 10.0

conda install -c nvidia -c rapidsai -c numba -c conda-forge -c defaults \
   cudf=0.6 python=3.6 cudatoolkit=10.0

我們還提供從我們最新開發(fā)分支的尖端構(gòu)建的夜間 conda 包。

Pip

cuDF 也可以用 PyPi 安裝。

# for CUDA 9.2

python3.6 -m pip install cudf-cuda92==0.6


# or, for CUDA 10.0

python3.6 -m pip install cudf-cuda100==0.6

注意:只有 Linux 系統(tǒng)支持 cuDF,并且 Python 的版本必須是 3.6 或 3.7 版本。

via : https://github.com/rapidsai/cudf

雷鋒網(wǎng)雷鋒網(wǎng)

雷峰網(wǎng)版權(quán)文章,未經(jīng)授權(quán)禁止轉(zhuǎn)載。詳情見轉(zhuǎn)載須知

cuDF:加快數(shù)據(jù)處理流程的DataFrame庫(kù)

分享:
相關(guān)文章
當(dāng)月熱門文章
最新文章
請(qǐng)?zhí)顚懮暾?qǐng)人資料
姓名
電話
郵箱
微信號(hào)
作品鏈接
個(gè)人簡(jiǎn)介
為了您的賬戶安全,請(qǐng)驗(yàn)證郵箱
您的郵箱還未驗(yàn)證,完成可獲20積分喲!
請(qǐng)驗(yàn)證您的郵箱
立即驗(yàn)證
完善賬號(hào)信息
您的賬號(hào)已經(jīng)綁定,現(xiàn)在您可以設(shè)置密碼以方便用郵箱登錄
立即設(shè)置 以后再說(shuō)