作者:崔庆才著
索书号:TP311.561/10128
馆藏地:
校本部馆 - 科技新书展示架(3楼)
顺德校区馆 - 顺德科技新书展示架(3楼)
编辑推荐
案例丰富,注重实战 博客文章过百万的静觅大神力作 全面介绍了数据采集、数据存储、动态网站爬取、App爬取、验证码破解、模拟登录、代理使用、爬虫框架、分布式爬取等知识 涉及的库或工具:urllib、requests、Beautiful Soup、XPath、pyquery、redis-py、PyMongo、PyMySQL、Selenium、Splash、Charles、mitmproxy、mitmdump、Appium、pyspider、Scrapy、Scrapy-Redis、Scrapy-Splash、Docker、Bloom Filter、Gerapy等
内容简介
本书介绍了如何利用Python 3开发网络爬虫,书中首先介绍了环境配置和基础知识,然后讨论了urllib、requests、正则表达式、Beautiful Soup、XPath、pyquery、数据存储、Ajax数据爬取等内容,接着通过多个案例介绍了不同场景下如何实现数据爬取,*后介绍了pyspider框架、Scrapy框架和分布式爬虫。 本书适合Python程序员阅读。
作者简介
崔庆才,北京航空航天大学硕士,静觅博客(https: cuiqingcai.com )博主,爬虫博文访问量已过百万,喜欢钻研,热爱生活,乐于分享。欢迎关注个人微信公众号“进击的Coder”。
周一至周日 8:00-22:00
周一至周日 8:00-22:00
电话:020-62789014(本部)
0757-29985219(顺德)
电话:020-61648543
电话:020-61648053
电话:020-62789012
电话:020-61648051
电话:020-62789012
邮政编码:510515
邮政编码:528305
当前IP地址:3.135.214.139