Spark2.x 快速入门教程

会员
关注

Spark进入2.0时代,引入了很多优秀特性,性能上有较大提升,API更易用。在“编程统一”方面非常惊艳,实现了离线计算和流计算API的统一,实现了Spark sql和Hive Sql操作API的统一。真正做到了“更简单、更快速、更智能”!

实验1
Spark2.x 新特性
知识点: 1.对标准的SQL支持 2.DataFrame和DatasetAPI介绍 3.StructuredStreaming
实验2
Spark SQL
知识点: 1.Dataframe/Dataset介绍 2.SparkSession 3.Dataframe/Dataset案例操作
实验3
Hive on Spark
知识点: 1.Hive/MySQL安装 2.Hive整合Spark 3.SparkSQL测试
实验4
Structured Streaming
知识点: 1.StructuredStreaming 2.outputmode
实验5
Spark 处理多种数据源
知识点: 1.Parquet数据源 2.Json数据源 3.JDBC数据源
Spark2.x 快速入门教程
实验楼楼+
实验楼会员