你将学到的
  • Spark SQL 的基本原理和简单操作
  • RDD 转换为 DataFrame 的两种方式
  • Spark SQL 与 Hive 整合
  • 电影数据分析实战
  • SpringBoot 的基本使用
  • 离线日志分析实战
  • DataFrames 和 DataSets 抽象数据结构
  • Hive 概述和搭建
  • Spark SQL 操作多数据源
  • ECharts 数据可视化工具
  • 数据可视化实战
  • NLP 数据挖掘实战
课程内容
  共6个章节
实验 1 Spark SQL入门

知识点: 1.SparkSQL的基本原理 2.SparkSQL相对Hive等MapReduce作业的优点 3.SparkSQL的简单操作 4.DataFrames和DataSets两种抽象数据结构的使用 5.RDD转换为DataFrame的两种方式

实验 2 Spark SQL 进阶

知识点: 1.Hive概述和搭建使用 2.SparkSQL与Hive的整合 3.SparkSQL操作多数据源 4.SparkSQL的简单性能优化

实验 3 电影数据分析实战

知识点: 1.SparkSQL的应用 2.Maven的简单使用 3.IDEA工具的使用 4.MySQL的简单使用

实验 4 数据可视化实战

知识点: 1.ECharts的基本使用 2.SpringBoot的基本简单使用 3.MySQL的基本操作

实验 5 离线日志分析实战

知识点: 1.Flume的安装使用 2.Spark核心操作 3.SparkSQL的使用 4.SQL语句

实验 6 Spark SQL进行NLP数据挖掘实战

知识点: 1.SparkSQL 2.NLP初步认识 3.jieba分词器的使用 4.d3cloud绘制词云

课程介绍

本训练营主要从入门讲解 Spark SQL 的使用,最后通过实战案例来巩固之前所学的知识,让学员达到深入浅出,融会贯通的教学目标。对于 Hive 会从入门带大家学习,SpringBoot 框架也会手把手教大家搭建,在最后,会通过讲解 NLP 基础知识,并且使用实战案例对影评信息进行情感分析。

适合人群

  • 了解 JAVA 或者 SCALA。
  • 了解 Spark Core。
  • 了解 Mysql 的简单使用。
  • 了解 JAVA EE 基础知识。

课程信息

  • 学习周期:课程有效期 2 个月,2 个月后无法进行在线实验,但可查看文档内容。高级会员有效期内可一直学习,到期后课程失效,且无法查看文档。部分云主机实验环境因成本较高,存在开启次数限制。关于课程退款等相关注意事项说明,请阅读 用户付费协议。 提醒:在线环境不可保存,且每个实验仅可开启 6 次(每次 60 分钟)。
  • 版权说明:课程内容为实验楼原创或实验楼在原作者授权下制作。未经书面同意,擅自爬取、转载和再分发课程内容,均将受到严肃追责。
  • 企业团报:企业购买,请点击 企业用户咨询
课程教师

不清不慎 共发布过 1 门课程

专注于Java后台应用以及大数据系统的开发,有多年开发经验,熟悉大数据生态圈组件,曾参与多个大数据项目的开发,拥有丰富的编程经验。

查看老师的所有课程 >
实验楼楼+
实验楼会员
会员
开通会员,即刻开始学习
公众号
实验楼学习助手 实验楼订阅号