0
本文作者: AI研習(xí)社 | 2020-08-20 10:18 |
內(nèi)容簡(jiǎn)介 · · · · · ·
Scrapy是使用Python開(kāi)發(fā)的一個(gè)快速、高層次的屏幕抓取和Web抓取框架,用于抓Web站點(diǎn)并從頁(yè)面中提取結(jié)構(gòu)化的數(shù)據(jù)?!毒≒ython爬蟲(chóng)框架Scrapy》以Scrapy 1.0版本為基礎(chǔ),講解了Scrapy的基礎(chǔ)知識(shí),以及如何使用Python和三方API提取、整理數(shù)據(jù),以滿(mǎn)足自己的需求。
本書(shū)共11章,其內(nèi)容涵蓋了Scrapy基礎(chǔ)知識(shí),理解HTML和XPath,安裝Scrapy并爬取一個(gè)網(wǎng)站,使用爬蟲(chóng)填充數(shù)據(jù)庫(kù)并輸出到移動(dòng)應(yīng)用中,爬蟲(chóng)的強(qiáng)大功能,將爬蟲(chóng)部署到Scrapinghub云服務(wù)器,Scrapy的配置與管理,Scrapy編程,管道秘訣,理解Scrapy性能,使用Scrapyd與實(shí)時(shí)分析進(jìn)行分布式爬取。本書(shū)附錄還提供了各種軟件的安裝與故障排除等內(nèi)容。
本書(shū)適合軟件開(kāi)發(fā)人員、數(shù)據(jù)科學(xué)家,以及對(duì)自然語(yǔ)言處理和機(jī)器學(xué)習(xí)感興趣的人閱讀。
作者簡(jiǎn)介 · · · · · ·
作者:[美]迪米特里奧斯 考奇斯-勞卡斯(Dimitrios Kouzis-Loukas)
譯者:李斌 Dimitrios Kouzis-Loukas作為一位軟件開(kāi)發(fā)人員,已經(jīng)擁有超過(guò)15年的經(jīng)驗(yàn)。同時(shí),他還使用自己掌握的知識(shí)和技能,向廣大讀者講授如何編寫(xiě)軟件。 他學(xué)習(xí)并掌握了多門(mén)學(xué)科,包括數(shù)學(xué)、物理學(xué)以及微電子學(xué)。他對(duì)這些學(xué)科的透徹理解,提高了自身的標(biāo)準(zhǔn),而不只是“實(shí)用的解決方案”。他知道真正的解決方案應(yīng)當(dāng)是像物理學(xué)規(guī)律一樣確定,像ECC內(nèi)存一樣健壯,像數(shù)學(xué)一樣通用。 Dimitrios目前正在使用新的數(shù)據(jù)中心技術(shù)開(kāi)發(fā)低延遲、高可用的分布式系統(tǒng)。他是語(yǔ)言無(wú)關(guān)論者,不過(guò)對(duì)Python、C++和Java略有偏好。他對(duì)開(kāi)源軟硬件有著堅(jiān)定的信念,他希望他的貢獻(xiàn)能夠造福于各個(gè)社區(qū)和全人類(lèi)。 關(guān)于譯者 李斌,畢業(yè)于北京科技大學(xué)計(jì)算機(jī)科學(xué)與技術(shù)專(zhuān)業(yè),獲得碩士學(xué)位。曾任職于阿里巴巴,當(dāng)前供職于凡普金科,負(fù)責(zé)應(yīng)用安全工作。熱愛(ài)Python編程和Web安全,希望以更加智能和自動(dòng)化的方式提升網(wǎng)絡(luò)安全。
補(bǔ)充說(shuō)明 · · · · · ·
本站所有資源版權(quán)均屬于原作者所有,這里所提供資源均只能用于參考學(xué)習(xí)用,請(qǐng)勿直接商用。如需刪除,請(qǐng)聯(lián)系 kefu@yanxishe.com
AI 研習(xí)社已經(jīng)和阿里大文娛、曠視、搜狗搜索、小米等知名公司達(dá)成聯(lián)系,幫助大家更好地求職找工作,一鍵投遞簡(jiǎn)歷至 HR 后臺(tái),準(zhǔn)備了一些內(nèi)推渠道群。
歡迎大家添加研習(xí)社小學(xué)妹微信(aiyanxishe),小學(xué)妹拉你加入(備注求職)。
雷鋒網(wǎng)雷鋒網(wǎng)雷鋒網(wǎng)
相關(guān)文章:
資料 | 數(shù)據(jù)結(jié)構(gòu)與算法 JavaScript 描述
資料 | OpenCV計(jì)算機(jī)視覺(jué)編程攻略(第3版)》
資料 | AAAI-20 Tutorial :機(jī)器教學(xué)最新進(jìn)展(來(lái)自伊利諾伊大學(xué)厄巴納-香檳分校)(115頁(yè)P(yáng)PT)
資料 | 編寫(xiě)可維護(hù)的 JavaScript
資料 | 精通 Python 網(wǎng)絡(luò)爬蟲(chóng):核心技術(shù)、框架與項(xiàng)目實(shí)戰(zhàn)
資料 | Keras 圖像深度學(xué)習(xí)實(shí)戰(zhàn)
資料 | 圖靈程序設(shè)計(jì)叢書(shū):深度學(xué)習(xí)入門(mén):基于Python的理論與實(shí)現(xiàn)
資料 | NLP漢語(yǔ)自然語(yǔ)言處理原理與實(shí)踐 作者鄭捷
資料 | 數(shù)字圖像處理與機(jī)器視覺(jué)Visual C++與Matlab實(shí)現(xiàn) 作者張錚
資料 | Python 機(jī)器學(xué)習(xí)基礎(chǔ)教程
資料 | O'Reilly精品圖書(shū)系列:算法精解 C 語(yǔ)言描述 (簡(jiǎn)體中文)
資料 | 白話(huà)深度學(xué)習(xí)與TensorFlow
雷峰網(wǎng)版權(quán)文章,未經(jīng)授權(quán)禁止轉(zhuǎn)載。詳情見(jiàn)轉(zhuǎn)載須知。