ISBN/价格: | 978-7-111-73385-0:CNY59.90 |
作品语种: | chi |
出版国别: | CN 110000 |
题名责任者项: | 数据采集与预处理技术应用/.安俊秀[等]编著 |
出版发行项: | 北京:,机械工业出版社:,2023.08 |
载体形态项: | 196页:;+图:;+26cm |
一般附注: | 面向新工科高等院校大数据专业系列教材 信息技术新工科产学研联盟数据科学与大数据技术工作委员会推荐教材 |
提要文摘: | 本书共有九章,从数据采集与预处理概述开始,介绍了大数据环境的搭建,并对数据采集与数据预处理的技术方法进行了系统介绍。数据采集的内容包括Flume日志数据采集、Kafka日志数据采集、Fluentd与Logstach等一系列数据采集技术;数据预处理的内容包括网络爬虫采集Web数据、Python数据预处理技术、Kettle数据处理技术、Pig和OpenRefine这些数据预处理技术。旨在让读者了解并基本掌握当下主要的数据采集与预处理技术、工具,以及它们的使用方法。 |
并列题名: | Data collection and preprocessing technology eng |
题名主题: | 数据采集 高等学校 教材 |
---|
题名主题: | 数据处理 高等学校 教材 |
中图分类: | TP274-43 |
个人名称等同: | 安俊秀 编著 |
记录来源: | CN 安徽时代 20231127 |