MARC状态:审校 文献类型:中文图书 浏览次数:2
- 题名/责任者:
- 网络爬虫原理与实践:基于C#语言/李健, 种惠芳著
- 出版发行项:
- 北京:机械工业出版社,2023
- ISBN及定价:
- 978-7-111-71694-5/CNY79.00
- 载体形态项:
- 265页:图;26cm
- 其它题名:
- 基于C#语言
- 丛编项:
- 数据科学与工程技术丛书
- 个人责任者:
- 李健 著
- 个人责任者:
- 种惠芳 著
- 学科主题:
- 软件工具-程序设计
- 中图法分类号:
- TP311.561
- 一般附注:
- 战略支援部队信息工程大学出版基金
- 书目附注:
- 有书目 (第264-265页)
- 提要文摘附注:
- 全书共分11章: 第1章介绍网络爬虫的基础知识, 包括网络、网页和爬虫概述; 第2章简要介绍C#编程, 并侧重与网络爬虫相关的内容; 第3章介绍网络资源下载的方法, 并实现通用资源下载器; 第4章介绍网页数据抽取的方法, 重点实现HTML解析器; 第5章介绍XML和JSON数据抽取的方法, 从而获得更丰富的目标数据; 第6章介绍爬虫数据的存储, 可将采集结果保存到文件或数据库; 第7章介绍网络爬虫的搜索方式, 包括深度优先搜索和广度优先搜索, 并实现爬虫控制器; 第8章介绍多线程爬虫, 并实现自定义线程池以提高爬虫效率; 第9章介绍如何使用代理服务器, 并实现自定义代理池; 第10章介绍常见的浏览器内核, 以及如何使用GeckoFx模拟浏览器获取深层数据; 第11章介绍抽取模板的表示、管理以及可视化配置方法。
全部MARC细节信息>>
索书号 | 条码号 | 年卷期 | 馆藏地 | 书刊状态 | 还书位置 |
TP311.561/L419A20-3 | 004273485 | 计算机科学书库 | 可借 | 计算机科学书库 | |
TP311.561/L419A20-3 | 004273486 | 计算机科学书库 | 可借 | 计算机科学书库 |
显示全部馆藏信息