Spark2.x 快速入门教程 会员

关注
473 人学过 47人关注 15人评论

Spark进入2.0时代,引入了很多优秀特性,性能上有较大提升,API更易用。在“编程统一”方面非常惊艳,实现了离线计算和流计算API的统一,实现了Spark sql和Hive Sql操作API的统一。真正做到了“更简单、更快速、更智能”!

实验1
Spark2.x 新特性
知识点: 1.对标准的SQL支持 2.DataFrame和DatasetAPI介绍 3.StructuredStreaming
实验2
Spark SQL
知识点: 1.Dataframe/Dataset介绍 2.SparkSession 3.Dataframe/Dataset案例操作
实验3
Hive on Spark
知识点: 1.Hive/MySQL安装 2.Hive整合Spark 3.SparkSQL测试
实验4
Structured Streaming
知识点: 1.StructuredStreaming 2.outputmode
实验5
Spark 处理多种数据源
知识点: 1.Parquet数据源 2.Json数据源 3.JDBC数据源
实验6
Streaming 整合 Flume
知识点: 1.Flumeagent 2.SparkStreaming
实验7
Streaming 整合 Kafka
知识点: 1.KafkaReceiver 2.KafkaDirect 3.SparkStreaming 4.Maven
登录 后发表评论
最新评论
全部 第1节 第2节 第3节 第4节 第5节 第6节 第7节

0% Complete

加载中,精彩就在后面...

卡住了?点击重试