机读格式显示(MARC)
- 010 __ |a 978-7-121-42169-3 |d CNY69.00
- 100 __ |a 20211027d2021 em y0chiy50 ea
- 200 1_ |a 大数据技术及应用 |A da shu ju ji shu ji ying yong |e 基于Python语言 |f 严宣辉 ... [等] 编著
- 210 __ |a 北京 |c 电子工业出版社 |d 2021
- 215 __ |a xii, 345页 |c 图 |d 26cm
- 225 2_ |a 新工科·数据科学与大数据系列 |A xin gong ke ·shu ju ke xue yu da shu ju xi lie
- 304 __ |a 题名页题: 严宣辉, 张仕, 赖会霞, 韩凤萍编著
- 314 __ |a 严宣辉, 男, 福建师范大学数学与信息学院副教授、理学博士, 硕士生导师, 数字福建环境监测物联网实验室副主任、福建省人工智能学会理事。
- 330 __ |a 本书共9章, 围绕大数据的基本概念和大数据处理的主要环节编写。第1章主要介绍大数据的概念、特点和构成; 第2章主要介绍在Windows系统中安装Linux虚拟机及构建Hadoop分布式集群的方法; 第3章主要介绍大数据采集工具的使用及数据预处理的常用方法; 第4章首先介绍Hadoop的发展历史、软件生态、核心组件和命令结构, 然后以HDFS为重点, 介绍其体系结构和特点, 并详细介绍HDFS的交互式命令; 第5章介绍大数据环境下存储工具HBase的数据模型; 第6章介绍Hive的存储模型, 第7章介绍在Hadoop平台上利用Python设计MapReduce程序的基本思路; 第8章介绍大数据分析与挖掘过程中的常用算法; 第9章介绍数据可视化的常用方法及常用工具。本书的内容与实际应用紧密结合, 目的是让读者能了解大数据的基本概念、理解大数据技术的基本原理、初步掌握大数据处理和分析的基本方法, 为未来应用大数据思维和大数据分析方法解决工作中的实际问题打下良好的基础。
- 410 _0 |1 2001 |a 新工科·数据科学与大数据系列
- 606 0_ |a 数据处理 |A shu ju chu li |x 高等学校 |j 教材
- 701 _0 |a 严宣辉 |A yan xuan hui |4 编著
- 701 _0 |a 张仕 |A zhang shi |4 编著
- 701 _0 |a 赖会霞 |A lai hui xia |4 编著
- 801 _0 |a CN |b 湖北三新 |c 20211027
- 905 __ |a AUSTL |d TP274/Y879A51