你将学到的
  • Python MRJob模块的安装
  • 使用MRJob实现文本统计
  • 重写MRJob函数实现复杂数据处理
  • Hadoop——Python各模块介绍
  • Python MRJob的运行方式
lab-classic 实验 1 Python玩转Hadoop之MRjob入门

知识点: 1.PythonMRJob模块的安装 2.HadoopPython各模块介绍 3.使用MRJob实现文本统计 4.PythonMRJob的运行方式 5.重写MRJob函数实现复杂数据处理

课程介绍

实验任务

  1. 使用mrjob实现词组统计
  2. 实战模拟 - 统计每部电影的热度
  3. 实战模拟 - 统计每部电影的观看用户列表
  4. 实战模拟 - 统计每个用户的观影列表

先学知识

需要先学习 Python 基础课程,例如 Python3 简明教程,同时最好对大数据的基本概念,如 mapreduce 等有所了解。

课程难度

本课程难度为简单,属于初级级别课程。

面向用户

本课程适合具有 Python 基础的用户,熟悉 Python 基础知识并加深巩固。

课程教师

LOU4056888224 共发布过 1 门课程

查看老师的所有课程 >
实验楼楼+
实验楼会员