机读格式显示(MARC)
- 000 01347nam0 2200241 450
- 010 __ |a 978-7-302-62656-5 |d CNY109.00
- 100 __ |a 20230522d2023 em y0chiy50 ea
- 200 1_ |a Python爬虫实战基础 |A Python pa chong shi zhan ji chu |f 李科均著
- 210 __ |a 北京 |c 清华大学出版社 |d 2023
- 215 __ |a x, 414页 |c 图 |d 26cm
- 330 __ |a 本书介绍Python网络爬虫开发从业者必备的基础能力体系。本书以网络爬虫为核心, 涉及大大小小数十个能力体系。本书前半部分介绍爬虫开发的基础内容, 包括爬虫开发必备的环境搭建、开发中常用工具的使用方法和技巧、网页的构成原理和网页信息提取的方法、常用数据库的使用方法和应用场景, 如通过Redis内置的布隆过滤器实现大规模URL地址的去重任务。本书后半部分主要讲解网络爬虫开发所需的必要能力, 包括网络通信的底层原理、背后涉及的互联网协议标准及如何对这些协议进行分析并加以利用, 使用Docker部署网络爬虫所需的环境和爬虫项目的打包部署, 使用网络爬虫的核心请求requests实现与服务器的通信和交互, 使用自动化神器Selenium对复杂的爬虫需求进行快速实现, 以及网络爬虫的多任务开发, 重点是通过多线程和多进程来提高爬虫效率。
- 606 0_ |a 软件工具 |A ruan jian gong ju |x 程序设计
- 701 _0 |a 李科均 |A li ke jun |4 著
- 801 _0 |a CN |b 湖北三新 |c 20230522
- 905 __ |a AUSTL |d TP311.561/L451