机读格式显示(MARC)
- 000 01592nam 22002771 450
- 010 __ |a 978-7-300-29059-1 |d CNY49.00
- 100 __ |a 20210629d2021 em y0chiy50 ea
- 200 1_ |a 数据科学并行计算 |A shu ju ke xue bing xing ji suan |d = Parallel computing in data science |f 白琰冰编著 |z eng
- 210 __ |a 北京 |c 中国人民大学出版社 |d 2021.05
- 215 __ |a 275页 |c 图 |d 26cm
- 225 2_ |a 数据科学与大数据技术丛书 |A shu ju ke xue yu da shu ju ji shu cong shu
- 314 __ |a 白琰冰, 中国人民大学统计学院数据科学与大数据统计系讲师, 硕士生导师, 中国人民大学杰出青年学者, 北京大数据协会理事会理事。
- 330 __ |a 本书通俗地讲解数据科学与并行计算的基本概念、方法和原理, 系统地介绍基于典型大数据场景的并行计算解决思路, 同时涵盖常用的数据并行计算工具的操作实践, 使读者知其然更知其所以然。本书的特色在于: 注重对大数据科学方法核心应用的讲解, 突出以并行计算思维解决大数据场景问题的案例教学。基于典型大数据场景案例数据集, 循序渐进地引导读者利用Parallel、Sparklyr、Dask和PySpark等主流并行计算工具实现数据的清洗、转换、描述和建模分析。帮助读者系统全面地构建数据科学的基本知识体系, 领会数据并行计算方法的精髓, 掌握不同编程语言和并行计算工具针对不同规模数据集的优缺点, 能够利用并行计算工具解决实际的数据分析问题。
- 410 _0 |1 2001 |a 数据科学与大数据技术丛书
- 510 1_ |a Parallel computing in data science |z eng
- 606 0_ |a 数据处理 |A shu ju chu li |x 研究
- 701 _0 |a 白琰冰 |A bai yan bing |4 编著
- 801 _0 |a CN |b 万品图书 |c 20221010
- 905 __ |a AUSTL |d TP274/B912