使用 Spark 进行流量日志分析 会员

关注
546 人学过 40人关注 3人评论

日志在计算机系统中是一个非常广泛的概念,任何程序都有可能输出日志:操作系统内核、各种应用服务器等等。日志包含很多有用的信息,例如访问者的 IP、访问的时间、访问的目标网页、来源的地址以及访问者所使用的客户端的 UserAgent 信息等,分析日志能帮助企业营销做出决策,本节课将介绍如何用 Spark 分析日志。

实验1
Spark 流量分析日志
知识点: 1.二次排序 2.序列化 3.SparkRDD
登录 后发表评论
最新评论
全部 第1节

0% Complete

加载中,精彩就在后面...

卡住了?点击重试