MARC状态:审校 文献类型:中文图书 浏览次数:5
- 题名/责任者:
- 数据科学并行计算/白琰冰编著
- 出版发行项:
- 北京:中国人民大学出版社,2021.05
- ISBN及定价:
- 978-7-300-29059-1/CNY49.00
- 载体形态项:
- 275页:图;26cm
- 丛编项:
- 数据科学与大数据技术丛书
- 个人责任者:
- 白琰冰 编著
- 学科主题:
- 数据处理-研究
- 中图法分类号:
- TP274
- 责任者附注:
- 白琰冰, 中国人民大学统计学院数据科学与大数据统计系讲师, 硕士生导师, 中国人民大学杰出青年学者, 北京大数据协会理事会理事。
- 提要文摘附注:
- 本书通俗地讲解数据科学与并行计算的基本概念、方法和原理, 系统地介绍基于典型大数据场景的并行计算解决思路, 同时涵盖常用的数据并行计算工具的操作实践, 使读者知其然更知其所以然。本书的特色在于: 注重对大数据科学方法核心应用的讲解, 突出以并行计算思维解决大数据场景问题的案例教学。基于典型大数据场景案例数据集, 循序渐进地引导读者利用Parallel、Sparklyr、Dask和PySpark等主流并行计算工具实现数据的清洗、转换、描述和建模分析。帮助读者系统全面地构建数据科学的基本知识体系, 领会数据并行计算方法的精髓, 掌握不同编程语言和并行计算工具针对不同规模数据集的优缺点, 能够利用并行计算工具解决实际的数据分析问题。
全部MARC细节信息>>
索书号 | 条码号 | 年卷期 | 馆藏地 | 书刊状态 | 还书位置 |
TP274/B912 | 004244088 | 计算机科学书库 | 可借 | 计算机科学书库 | |
TP274/B912 | 004244089 | 计算机科学书库 | 可借 | 计算机科学书库 |
显示全部馆藏信息