机读格式显示(MARC)

000 01592nam 22002771 450

001 0000428555

005 20221202100900.0

010 __ |a 978-7-300-29059-1 |d CNY49.00

100 __ |a 20210629d2021 em y0chiy50 ea

101 0_ |a chi

102 __ |a CN |b 110000

105 __ |a a z 000yy

106 __ |a r

200 1_ |a 数据科学并行计算 |A shu ju ke xue bing xing ji suan |d = Parallel computing in data science |f 白琰冰编著 |z eng

210 __ |a 北京 |c 中国人民大学出版社 |d 2021.05

215 __ |a 275页 |c 图 |d 26cm

225 2_ |a 数据科学与大数据技术丛书 |A shu ju ke xue yu da shu ju ji shu cong shu

314 __ |a 白琰冰, 中国人民大学统计学院数据科学与大数据统计系讲师, 硕士生导师, 中国人民大学杰出青年学者, 北京大数据协会理事会理事。

330 __ |a 本书通俗地讲解数据科学与并行计算的基本概念、方法和原理, 系统地介绍基于典型大数据场景的并行计算解决思路, 同时涵盖常用的数据并行计算工具的操作实践, 使读者知其然更知其所以然。本书的特色在于: 注重对大数据科学方法核心应用的讲解, 突出以并行计算思维解决大数据场景问题的案例教学。基于典型大数据场景案例数据集, 循序渐进地引导读者利用Parallel、Sparklyr、Dask和PySpark等主流并行计算工具实现数据的清洗、转换、描述和建模分析。帮助读者系统全面地构建数据科学的基本知识体系, 领会数据并行计算方法的精髓, 掌握不同编程语言和并行计算工具针对不同规模数据集的优缺点, 能够利用并行计算工具解决实际的数据分析问题。

410 _0 |1 2001 |a 数据科学与大数据技术丛书

510 1_ |a Parallel computing in data science |z eng

606 0_ |a 数据处理 |A shu ju chu li |x 研究

690 __ |a TP274 |v 5

701 _0 |a 白琰冰 |A bai yan bing |4 编著

801 _0 |a CN |b 万品图书 |c 20221010

905 __ |a AUSTL |d TP274/B912