Spark2.x 快速入门教程 会员

关注
297 人学过 38人关注 10人评论

Spark进入2.0时代,引入了很多优秀特性,性能上有较大提升,API更易用。在“编程统一”方面非常惊艳,实现了离线计算和流计算API的统一,实现了Spark sql和Hive Sql操作API的统一。真正做到了“更简单、更快速、更智能”!

第1节
Spark2.x 新特性
知识点: 1.对标准的SQL支持2.DataFrame和DatasetAPI介绍3.StructuredStreaming
第2节
Spark SQL
知识点: 1.Dataframe/Dataset介绍2.SparkSession3.Dataframe/Dataset案例操作
第3节
Hive on Spark
知识点: 1.Hive/MySQL安装2.Hive整合Spark3.SparkSQL测试
第4节
Structured Streaming
知识点: 1.StructuredStreaming2.outputmode
第5节
Spark 处理多种数据源
知识点: 1.Parquet数据源2.Json数据源3.JDBC数据源
第6节
Streaming 整合 Flume
知识点: 1.Flumeagent2.SparkStreaming
第7节
Streaming 整合 Kafka
知识点: 1.KafkaReceiver2.KafkaDirect3.SparkStreaming4.Maven
登录 后发表评论
最新评论
全部 第1节 第2节 第3节 第4节 第5节 第6节 第7节