MARC状态:审校 文献类型:中文图书 浏览次数:2
- 题名/责任者:
- Python大数据处理库PySpark实战/汪明著
- 出版发行项:
- 北京:清华大学出版社,2021.03
- ISBN及定价:
- 978-7-302-57508-5/CNY79.00
- 载体形态项:
- 310页:图;26cm
- 个人责任者:
- 汪明 著
- 学科主题:
- 数据处理
- 学科主题:
- 软件工具-程序设计-教材
- 非控制主题词:
- Python
- 中图法分类号:
- TP274
- 中图法分类号:
- TP311.561
- 提要文摘附注:
- 本书分为7章, 第1章介绍大数据的基本概念、常用的大数据分析工具 ; 第2章介绍Spark作为大数据处理的特点和算法 ; 第3章介绍Spark实战环境的搭建, 涉及Windows和Linux操作系统 ; 第4章介绍如何灵活应用PySpark对数据进行操作 ; 第5章介绍PySpark ETL处理, 涉及PySpark读取数据、对数据进行统计分析等数据处理相关内容 ; 第6章介绍PySpark如何利用MLib库进行分布式机器学习 (Titanic幸存者预测) ; 第7章介绍一个PySpark和Kafka结合的实时项目。
全部MARC细节信息>>
索书号 | 条码号 | 年卷期 | 馆藏地 | 书刊状态 | 还书位置 |
TP311.561/W519A32 | 004205925 | 计算机科学书库 | 可借 | 计算机科学书库 | |
TP311.561/W519A32 | 004205926 | 计算机科学书库 | 可借 | 计算机科学书库 |
显示全部馆藏信息