学习
课程
在线编程,提高编码技能
题库
梯度刷题,剑指大厂OFFER
图书
系统学习,构建知识图谱
项目库
积累高价值项目经验
竞赛
PK挑战,综合评测个人能力
蓝桥杯
赛事专区
关于大赛
大赛通知
大赛章程
比赛赛规
竞赛科目
比赛大纲
获奖名单
赛点名单
历届真题
备赛专区
15届
设计赛
NEW
学习资料
资料文档
练习系统
证书查询
大赛回顾
联系我们
我是院校
我是学生
就业
考证
蓝桥工程实践能力考试(LEAT)
企业认可的求职强力背书
1+X 证书
教育部认证的等级证书
工信人才能力提升证书
完成线上指定课程学习后即可申领
工信人才岗位能力认证证书
蓝桥杯获奖选手免考自愿申领
讨论区
校企版
院校在线实训平台
赋能教师开设在线实战课
企业版 SaaS
赋能企业提升 IT 实战能力
登录
注册
课程
书籍
问答
Spark 大数据动手实验
完全在线实验的 Spark 培训课程,从 Spark 的安装开始,带你逐步完成 Spark 技术入门。再通过一系列实践项目的动手操作,让你全面入门 Spark 相关技术。课程涵盖 Scala,Streaming,SparkSQL,MLlib,GraphX 等 Spark 相关技术,教程中提供尽可能丰富的步骤说明和截图,详细的理论知识会附上相关文章链接。
3514人学过
中级
实战课
Spark SQL 基础入门
本课程将学习 Spark SQL 的基础概念,了解如何利用 SQL Context 及相关的 API 进行统计分析。同时,课程还将通过分析股票价格与石油价格关系,进一步学习如何利用 Spark SQL 完成数据分析。
2797人学过
初级
会员
Spark MLlib 数据情感分析
本次课程将介绍如何使用Spark MLlib对Twitter上的流数据进行情感分析,并且利用Python的工具包basemap可视化美国不同的州对于曾经的总统候选人希拉里及川普的情感分析结果,通过地理信息可视化我们可直观的感受到这两位候选人的受欢迎程度。
2572人学过
初级
会员
Python 实现流式日志分析系统
我们知道网站用户访问流量是不间断的,基于网站的访问日志,即 Web log 分析是典型的流式实时计算应用场景。比如百度统计,它可以做流量分析、来源分析、网站分析、转化分析。另外还有特定场景分析,比如安全分析,用来识别 CC 攻击、 SQL 注入分析、脱库等。在本课程中,我们将基于 Spark Streaming 流式计算框架,简单地实现一个类似于百度分析的系统。本课程源自图灵教育的《Spark 最佳实践》第6章第3节,感谢图灵教育授权实验楼发布。
5013人学过
初级
会员
Spark SQL 入门到上手实战
主要从 Spark SQL 的入门开始讲解,最后通过实战案例来巩固之前所学的知识,让学员达到深入浅出,融会贯通的教学目标。对于 Hive 相关知识我们会从入门开始学习。SpringBoot 框架也会手把手教大家搭建。在最后,会讲解 NLP 的基础知识,并且使用实战案例对影评信息进行情感分析。
1538人学过
初级
实战课
Spark 实现流量日志分析
本节课将介绍如何用 Spark 分析日志。日志在计算机系统中是一个非常广泛的概念,操作系统内核、各种应用服务都有可能输出日志。日志包含很多有用的信息,例如访问者的 IP、时间、目标网页、来源地址等,分析日志能帮助企业营销做出决策。
1785人学过
初级
会员
Spark 和 D3.js 分析航班大数据
本课程将通过一个航班数据分析实例来学习 Spark 综合技巧和数据可视化技术。在航班数据分析实验中,可以学习到如何使用 OpenRefine 进行简单的数据清洗,以及如何通过 Spark 提供的 DataFrame、 SQL 和机器学习框架等工具,对航班起降的记录数据进行分析,尝试找出造成航班延误的原因,以及对航班延误情况进行预测。在数据可视化实验中,可以学习到 D3.js 中的数据读取、插值、元素选取、属性设置等 API 的用法。
1588人学过
初级
会员
Spark Streaming 基础入门
Spark Streaming 是 Spark 引擎的一种扩展,适用于实时处理流式数据。本课程将带你学习 Spark Streaming 的工作机制,了解 Streaming 应用的基本结构,以及如何在 Streaming 应用中附加 SQL 查询。本课程难度为一般,属于初级级别课程,适合具有 Spark 基础的用户,熟悉 Spark Streaming 的工作机制。
1531人学过
初级
会员
大数据带你挖掘打车的秘籍
出租车是我们生活中经常乘坐的一种交通工具,但打车难的问题也限制了我们更好地利用这种交通方式。在哪些地方出租车更容易打到?在什么时候更容易打到出租车?本课程将基于某市的出租车行驶轨迹数据,带你学习如何应用Spark SQL和机器学习相关技巧,并且通过数据可视化手段展现分析结果。
3015人学过
初级
会员
Spark 实现电影推荐系统
MLlib 是运行在 Spark 上一个机器学习算法库,借助 Spark 的内存计算,可以使机器学习的模型计算时间大大缩短。本节课基于协同过滤算法实现简易电影推荐。
1479人学过
初级
会员
Spark 分析银行营销数据
存款营销是银行吸收存款的主要经营模式,通过现有数据建立模型来判断客户是否订阅存款业务,从而帮助商业银行更好的分配人力资源,提高业务量,以满足现阶段营销活动对提高营销成功率的期望。 本实验会使用spark机器学习中的逻辑回归算法,分析银行营销数据,按照机器学习开发步骤,建立逻辑回归模型,预测客户是否会存款,并评估预测模型的精确度。
1474人学过
初级
会员
Spark MLlib 基础入门
本课程将可以学习到 Spark 的机器学习库 MLlib 的相关知识,掌握 MLlib 中的基本数据类型。同时,本课程还将通过一个电影推荐的实例,讲解如何利用机器学习算法解决实际问题。
1445人学过
初级
会员
Spark 流式计算商品关注度
本课程将使用 Scoket 来模拟用户浏览商品产生实时数据,并使用 Spark Streaming 构建实时数据处理系统。
982人学过
初级
会员
Spark DataFrame 基础入门
本课程将针对飞行准点率数据集,通过一些简单的分析任务来学习 DataFrame 的由来、构建方式以及一些常用操作。在本课程中,你可以了解到 Spark 生态体系中,核心的 RDD 与 DataFrame 之间的区别和联系。同时,你还可以学习到在 Spark 中加载数据集的方式、如何配置和使用第三方库等等。
1213人学过
初级
会员
Spark DataFrames 进阶实战
本课程将通过更加深入的讲解,使用真实的 SFPD 数据集,结合实际问题的分析过程,带你学习 DataFrame 的创建方式、常用操作、UDF 自定义函数 和重分区相关知识。
1270人学过
高级
会员
«
上一页
1
2
下一页
»