ISBN/价格: | 978-7-111-71694-5:CNY79.00 |
---|---|
作品语种: | chi |
出版国别: | CN 110000 |
题名责任者项: | 网络爬虫原理与实践/.李健,种惠芳著 |
出版发行项: | 北京:,机械工业出版社:,2023 |
载体形态项: | 265页:;+图:;+26cm |
丛编项: | 数据科学与工程技术丛书 |
一般附注: | 战略支援部队信息工程大学出版基金 |
提要文摘: | 本书以C#为平台,介绍网络爬虫开发的基本知识、原理和方法。全书共分11章:第1章介绍网络爬虫的基础知识,包括网络、网页和爬虫概述;第2章简要介绍C#编程,并侧重与网络爬虫相关的内容;第3章介绍网络资源下载的方法,并实现通用资源下载器;第4章介绍网页数据抽取的方法,重点实现HTM解析器:第5章介绍xI和JSON数据抽取的方法,从而获得更丰富的目标数据;第6章介绍爬虫数据的存储,可将采集结果保存到文件或数据库;第7章介绍网络爬虫的搜索方式,包括深度优先搜索和广度优先搜索,并实现爬虫控制器;第8章介绍多线程爬虫,并实现自定义线程池以提高爬虫效率;第9章介绍如何使用代理服务器,并实现自定义代理池;第10章介绍常见的浏览器内核,以及如何使用GeckoFx模拟浏览器获取深层数据;第11章介绍抽取模板的表示、管理以及可视化配置方法。 |
并列题名: | Principle and practice of eng |
题名主题: | 软件工具 程序设计 |
中图分类: | TP311.561 |
个人名称等同: | 李健 著 |
个人名称等同: | 种惠芳 著 |
记录来源: | CN 安徽时代 20230906 |