0
本文作者: AI研習社 | 2020-09-08 10:32 |
本書面向所有對機器學習與數(shù)據(jù)挖掘的實踐及競賽感興趣的讀者,從零開始,以Python編程語言為基礎(chǔ),在不涉及大量數(shù)學模型與復雜編程知識的前提下,逐步帶領(lǐng)讀者熟悉并且掌握當下最流行的機器學習、數(shù)據(jù)挖掘與自然語言處理工具,如Scikitlearn、NLTK、Pandas、gensim、XGBoost、Google Tensorflow等。
全書共分4章。第1章簡介篇,介紹機器學習概念與Python編程知識;第2章基礎(chǔ)篇,講述如何使用Scikit-learn作為基礎(chǔ)機器學習工具;第3章進階篇,涉及怎樣借助高級技術(shù)或者模型進一步提升既有機器學習系統(tǒng)的性能;第4章競賽篇,以Kaggle平臺為對象,幫助讀者一步步使用本書介紹過的模型和技巧,完成三項具有代表性的競賽任務(wù)。
范淼,清華大學計算機系人工智能研究所博士,研究方向涉及機器學習與自然語言處理技術(shù)。2015年3月受國家留學基金委公派至美國紐約大學計算機系聯(lián)合培養(yǎng)。攻讀博士期間,于所在研究領(lǐng)域內(nèi)多個重要國際會議與期刊上發(fā)表論文近20篇。先后在Hulu、MSRA(微軟亞洲研究院)、百度自然語言處理部、Bosch(博世)北美硅谷研究院等多個公司的研發(fā)部門實習,并承擔機器學習與自然語言處理相關(guān)的研究任務(wù)。
李超, 工學博士,清華大學副研究員,信息技術(shù)研究院Web 與軟件技術(shù)研究中心副主任。中國計算機學會信息存儲技術(shù)專委會委員、中國計算機學會高級會員、全國文獻影像技術(shù)標準化技術(shù)委員會(SAC/TC86/SC6)委員、IEEE 會員。研究領(lǐng)域包括海量數(shù)據(jù)存儲、組織與管理、分析,及其在數(shù)字圖書館/檔案館/教育/醫(yī)療/金融等領(lǐng)域的應(yīng)用。主持及參與多項國家973、863、科技支撐、自然基金等縱向項目及橫向合作項目。已發(fā)表學術(shù)論文50 余篇、獲得授權(quán)發(fā)明專利10 余項。
本站所有資源版權(quán)均屬于原作者所有,這里所提供資源均只能用于參考學習用,請勿直接商用。如需刪除,請聯(lián)系 kefu@yanxishe.com
AI 研習社已經(jīng)和阿里大文娛、曠視、搜狗搜索、小米等知名公司達成聯(lián)系,幫助大家更好地求職找工作,一鍵投遞簡歷至 HR 后臺,準備了一些內(nèi)推渠道群。
歡迎大家添加研習社小學妹微信(aiyanxishe),小學妹拉你加入(備注求職)。
雷鋒網(wǎng)雷鋒網(wǎng)雷鋒網(wǎng)
相關(guān)文章:
資料 | Python數(shù)據(jù)分析基礎(chǔ)教程:NumPy學習指南(中文第2版)
資料 | 2020年清華大學劉知遠新書《自然語言處理表示學習技術(shù)》(全英文)
雷峰網(wǎng)版權(quán)文章,未經(jīng)授權(quán)禁止轉(zhuǎn)載。詳情見轉(zhuǎn)載須知。