0
本文作者: AI研習(xí)社 | 2020-05-25 10:11 |
https://www.yanxishe.com/resourceDetail/1564?from=leiphonecolumn_res0525
數(shù)據(jù)挖掘一般是指從大量的數(shù)據(jù)中通過算法搜索隱藏于其中信息的過程。大多數(shù)數(shù)據(jù)挖掘的教材都專注于介紹理論基礎(chǔ),因而往往難以理解和學(xué)習(xí)。
本書是寫給程序員的一本數(shù)據(jù)挖掘指南,可以幫助讀者動手實(shí)踐數(shù)據(jù)挖掘、集體智慧并構(gòu)建推薦系統(tǒng)。全書共8章,介紹了數(shù)據(jù)挖掘的基本知識和理論、協(xié)同過濾、內(nèi)容過濾及分類、算法評估、樸素貝葉斯、非結(jié)構(gòu)化文本分類以及聚類等內(nèi)容。本書采用“在實(shí)踐中學(xué)習(xí)”的方式,用生動的圖示、大量的表格、簡明的公式、實(shí)用的Python代碼示例,闡釋數(shù)據(jù)挖掘的知識和技能。每章還給出了習(xí)題和練習(xí),幫助讀者鞏固所學(xué)的知識。
本書適合對數(shù)據(jù)挖掘、數(shù)據(jù)分析和推薦系統(tǒng)感興趣的程序員及相關(guān)領(lǐng)域的從業(yè)者閱讀參考;同時,本書也可以作為一本輕松有趣的數(shù)據(jù)挖掘課程教學(xué)參考書。
Ron Zacharski是一名軟件開發(fā)工程師,曾在威斯康辛大學(xué)獲美術(shù)學(xué)士學(xué)位,之后還在明尼蘇達(dá)大學(xué)獲得了計(jì)算機(jī)科學(xué)博士學(xué)位。博士后期間,他在愛丁堡大學(xué)研究語言學(xué)。正是基于廣博的學(xué)識,他不僅在新墨西哥州立大學(xué)的計(jì)算研究實(shí)驗(yàn)室工作,期間還接觸過自然語言處理相關(guān)的項(xiàng)目,而該實(shí)驗(yàn)室曾被《連線》雜志評為機(jī)器翻譯研究領(lǐng)域翹楚。除此之外,他還曾教授計(jì)算機(jī)科學(xué)、語言學(xué)、音樂等課程,是一名博學(xué)多才的科技達(dá)人。
王斌 博士,中國科學(xué)院信息工程研究所研究員,博士生導(dǎo)師,中國科學(xué)院大學(xué)兼職教授,研究方向?yàn)樾畔z索、自然語言處理與數(shù)據(jù)挖掘。主持國家973、863、國家自然科學(xué)基金、國際合作基金、部委及企業(yè)合作等課題近30項(xiàng),發(fā)表學(xué)術(shù)論文130余篇,領(lǐng)導(dǎo)研制的多個系統(tǒng)上線使用,曾獲國家科技進(jìn)步二等獎和北京市科學(xué)技術(shù)二等獎各一項(xiàng)?,F(xiàn)為中國中文信息學(xué)會理事、信息檢索、社會媒體處理、語言與知識計(jì)算等多個專業(yè)委員會委員、《中文信息學(xué)報(bào)》編委、中國計(jì)算機(jī)學(xué)會高級會員及中文信息處理專業(yè)委員會委員。多次擔(dān)任SIGIR、ACL、CIKM等會議的程序委員會委員?!缎畔z索導(dǎo)論》、《大數(shù)據(jù):互聯(lián)網(wǎng)大規(guī)模數(shù)據(jù)挖掘與分布式處理》、《機(jī)器學(xué)習(xí)實(shí)戰(zhàn)》、《Mahout實(shí)戰(zhàn)》譯者。2006年起在中國科學(xué)院大學(xué)講授《現(xiàn)代信息檢索》研究生課程,累計(jì)選課人數(shù)已超過1500人。迄今培養(yǎng)博士、碩士研究生近40名。
AI 研習(xí)社已經(jīng)和阿里大文娛、曠視、搜狗搜索、小米等知名公司達(dá)成聯(lián)系,幫助大家更好地求職找工作,一鍵投遞簡歷至 HR 后臺,準(zhǔn)備了一些內(nèi)推渠道群。
歡迎大家添加研習(xí)社小學(xué)妹微信(aiyanxishe),小學(xué)妹拉你加入(備注求職)。
雷鋒網(wǎng)雷鋒網(wǎng)雷鋒網(wǎng)
相關(guān)文章:
資料 | 精品教材-《Grokking深度學(xué)習(xí)》
資料 | 機(jī)器學(xué)習(xí)中的數(shù)學(xué)
資料 | 利用Python進(jìn)行數(shù)據(jù)分析
資料 | 跟著迪哥學(xué)Python數(shù)據(jù)分析與機(jī)器學(xué)習(xí)實(shí)戰(zhàn)
資料 | 【中譯本】Effective Python. 編寫高質(zhì)量 Python 代碼的 59 個有效方法.Brett Slatkin
資料 | Java 核心技術(shù)第 10 版(套裝共 2 冊)
資料 | 數(shù)據(jù)科學(xué)家養(yǎng)成手冊
資料 | 重磅!阿里達(dá)摩院發(fā)布2020十大科技趨勢(附PDF)
資料 | 解憂程序員——高薪編程、求職面試與成長轉(zhuǎn)型寶典
資料 | Python入門經(jīng)典:以解決計(jì)算問題為導(dǎo)向的Python編程實(shí)踐
資料 | 2019年新書《基于PyTorch的自然語言處理》pdf
資料 | 普林斯頓大學(xué)陳丹琦主講2020課程《深度學(xué)習(xí)自然語言處理》課程課件
資料 | Yann Lecun 紐約大學(xué)《深度學(xué)習(xí)(PyTorch)》課程(2020)PPT
資料 | 干貨書《數(shù)據(jù)科學(xué)數(shù)學(xué)系基礎(chǔ)》2020 最新版
資料 | 《(中文版)數(shù)據(jù)結(jié)構(gòu)與算法分析:C 語言描述》
雷峰網(wǎng)版權(quán)文章,未經(jīng)授權(quán)禁止轉(zhuǎn)載。詳情見轉(zhuǎn)載須知。