机读格式显示(MARC)
- 000 01323nam0 2200265 450
- 010 __ |a 978-7-302-49073-9 |d CNY99.00
- 099 __ |a CAL 012018010083
- 100 __ |a 20180112d2018 em y0chiy50 ea
- 200 1_ |a Python+Spark 2.0+Hadoop机器学习与大数据实战 |A Python+Spark 2.0+Hadoop ji qi xue xi yu da shu ju shi zhan |f 林大贵著
- 210 __ |a 北京 |c 清华大学出版社 |d 2018
- 215 __ |a XVII, 519页 |c 图 |d 26cm
- 330 __ |a 本书从浅显易懂的“大数据和机器学习”原理说明入手,讲述大数据和机器学习的基本概念,如分类、分析、训练、建模、预测、机器学习(推荐引擎)、机器学习(二元分类)、机器学习(多元分类)、机器学习(回归分析)和数据可视化应用等。书中不仅加入了新近的大数据技术,还丰富了“机器学习”内容。为降低读者学习大数据技术的门槛,书中提供了丰富的上机实践操作和范例程序详解,展示了如何在单机Windows系统上通过Virtual Box虚拟机安装多机Linux虚拟机,如何建立Hadoop集群,再建立Spark开发环境。书中介绍搭建的上机实践平台并不限制于单台实体计算机。
- 606 0_ |a 软件工具 |A ruan jian gong ju |x 程序设计
- 606 0_ |a 数据处理软件 |A shu ju chu li ruan jian
- 701 _0 |a 林大贵 |A lin da gui |4 著
- 801 _0 |a CN |b 辽批 |c 20180517
- 905 __ |a AUSTL |d TP311.561/L248