开馆时间:8:00-22:00
English 我的图书馆 学校主页 旧版入口 馆长信箱
资源检索
  • 首页
    EN 留言
  • 使用图书馆
    借阅服务
    • 借阅证办理
    • 借阅提示
    • 借阅权限
    • 图书借还与续借
    • 图书预约与委托
    • 学位论文查阅
    • 书刊遗失赔偿
    • 校友卡办理
    • 馆际互借
    • 离校手续办理
    自助服务
    • 研讨室预约
    • 在线选座
    • 自助上机
    • 自助借还
    • 自助打印复印扫描
    • 单人学习舱
    • 朗读亭
    • 软件下载
    • 无线上网
    咨询服务
    • 馆长信箱
    • 邮件咨询
    • QQ咨询
    • 微信咨询
    • 电话咨询
    校外访问
    • 使用说明
    • 修改密码
    • 开通须知(含申请表下载)
    • 访问入口
    • 科技查新
    • 查收查引
    • 文献传递
    • 期刊评价
    • 精品资源
    • 培训讲座
    • SCI动态
    • ESI高水平论文
    • ESI基础知识
    • 论文重复性检测
    • 资产登记
    • 学生馆员
  • 电子资源
    • 中文期刊
    • 外文期刊
    • 电子图书
    • 循证医学资源
    • 多媒体资源
    • 教学资源
    • 专利资源
    • 预印本资源
    • 免费资源
    • 自建数据库
    • 试用数据库
    • 版权使用公告
  • 教学支持
    • 课程教学
    • 精品课程
    • 培训讲座
    • 爱课平台
    • 泛信息素养
    • 生成式人工智能专题
  • 科研支持
    • ESI高水平论文
    • ESI基础知识
    • ESI期刊列表
    • SCI动态
    • 查收查引
    • 决策信息服务
    • 科技查新
    • 论文写作指导
    • 论文重复性检测
    • 南医研究前沿
    • 期刊评价
    • 文献传递
    • 学科服务
    • 专利信息服务
  • 校史馆
    • 校史馆简介
    • 参观须知
    • 参观预约细则
    • 校史馆捐赠
  • 我的图书馆
  • 本馆概况
    • 本馆简介
    • 馆藏布局
    • 规章制度
    • 使用统计
    • 姊妹馆合作
    • 学生馆员
    • 馆员天地
    • 支部建设
  • 帮助
    • 联系我们
    • 常见问题
    • 失物招领
    • 投诉与建议
  • 本馆馆藏
  • 南医发现
  • 全国高校
    馆藏
  • CASHL
  • 读秀检索
  • 站内检索
本馆馆藏
南医发现
全国高校馆藏
CASHL
读秀检索
站内检索
新书推荐
新书推荐
首页 > 新书推荐
实战Python网络爬虫

作者:黄永祥

索书号:TP311.561/10149

馆藏地:

校本部馆 - 科技新书展示架(3楼)

顺德校区馆 - 顺德科技新书展示架(3楼)

 

编辑推荐

  从爬虫软件开发到自己动手开发爬虫框架

  从原理到实践,深入浅出,热门爬虫核心技术全掌握

  涵盖丰富的爬虫工具、库、框架,十余个实战项目

  资深爬虫工程师倾力奉献,入门、进阶、求职必备

 

内容简介

  本书从原理到实践,循序渐进地讲述了使用Python开发网络爬虫的核心技术。全书从逻辑上可分为基础篇、实战篇和爬虫框架篇三部分。基础篇主要介绍了编写网络爬虫所需的基础知识,包括网站分析、数据抓取、数据清洗和数据入库。网站分析讲述如何使用Chrome和Fiddler抓包工具对网站做全面分析;数据抓取介绍了Python爬虫模块Urllib和Requests的基础知识;数据清洗主要介绍字符串操作、正则和BeautifulSoup的使用;数据入库讲述了MySQL和MongoDB的操作,通过ORM框架SQLAlchemy实现数据持久化,进行企业级开发。实战篇深入讲解了分布式爬虫、爬虫软件的开发、12306抢票程序和微博爬取等。框架篇主要讲述流行的爬虫框架Scrapy,并以Scrapy与Selenium、Splash、Redis结合的项目案例,让读者深层次了解Scrapy的使用。此外,本书还介绍了爬虫的上线部署、如何自己动手开发一款爬虫框架、反爬虫技术的解决方案等内容。本书使用Python 3.X编写,技术先进,项目丰富,适合欲从事爬虫工程师和数据分析师岗位的初学者、大学生和研究生使用,也很适合有一些网络爬虫编写经验,但希望更加全面、深入理解Python爬虫的开发人员使用。

 

作者简介

  黄永祥,CSDN博客专家和签约讲师,多年软件研发经验,主要从事机器人流程系统研发、大数据系统研发、网络爬虫研发以及自动化运维系统研发。擅长使用Python编写高质量代码,对Python有深入研究,热爱分享和新技术的探索。

上一篇:Spring Boot + Spring Cloud + Vue + Element项目实战:手把手教你开发权限管理系统

下一篇:JSP & Servlet学习笔记(第3版)——从Servlet到Spring Boot

返回列表

校本部开馆时间

周一至周日       8:00-22:00

顺德馆开馆时间

周一至周日       8:00-22:00

  • 南方医科大学
  • 中国图书馆学会高校分会
  • 教育部高校图工委
  • 广东高校图工委
  • 广东省高等学校数字化文献资源共享服务体系
友情链接

学习支持部

电话:020-62789014(本部)
        0757-29985219(顺德)

综合业务部

电话:020-61648543
       

参考咨询部

电话:020-61648053

决策与知识产权信息服务部

电话:020-62789012

文献采编部

电话:020-61648051

知识产权信息服务部

电话:020-62789012

校本部地址:广州市沙太南路1023号南方医科大学

邮政编码:510515

顺德校区地址:广东省佛山市顺德区容桂街马冈大道33号

邮政编码:528305


当前IP地址:3.141.12.150

COPYRIGHT © 2004-2025 南方医科大学图书馆版权所有 技术支持:广州镭拓网络科技有限公司