机读格式显示(MARC)
- 000 01321nam0 22002651 450
- 010 __ |a 978-7-302-61450-0 |d CNY89.00
- 100 __ |a 20231120d2022 em y0chiy50 ea
- 200 1_ |a Spark 3.x大数据分析实战 |A Spark 3.x da shu ju fen xi shi zhan |f 张伟洋著
- 210 __ |a 北京 |c 清华大学出版社 |d 2022.09
- 215 __ |a 310页 |c 图 |d 26cm
- 314 __ |a 张伟洋, 大数据领域资深专家, 拥有多年互联网公司软件研发经验。
- 330 __ |a 本书基于Spark 3.2.x版本, 从Spark核心编程语言Scala讲起, 涵盖了当前整个Spark生态系统主流的大数据开发技术。全书共9章, 第1章讲解了Scala语言的基础知识, 包括IDEA工具的使用等 ; 第2章讲解了Spark的主要组件、集群架构原理、集群环境搭建以及Spark应用程序的提交和运行 ; 第3-9章讲解了离线计算框架Spark RDD、Spark SQL和实时计算框架Kafka、Spark Streaming、Structured Streaming以及图计算框架GraphX等的基础知识、架构原理, 同时包括常用Shell命令、API操作、内核源码剖析, 并通过多个实际案例讲解各个框架的具体应用以及与Hadoop生态系统框架Hive、HBase、Kafka的整合操作。
- 606 0_ |a 数据处理软件 |A shu ju chu li ruan jian
- 701 _0 |a 张伟洋 |A zhang wei yang |4 著
- 801 _0 |a CN |b 辽批 |c 20231120
- 905 __ |a AUSTL |d TP274/Z867-3