Python玩转Hadoop之MRjob入门

会员
关注

Python是做数据分析最好的语言。大数据当然也离不开Hadoop,Hadoop由JAVA写成,但Python也可以很好地操控它。本课程介绍了Python中MRjob模块,通过该模块,可以让开发者非常简单的通过Python来使用Hadoop进行数据分析。

实验1
Python玩转Hadoop之MRjob入门
知识点: 1.PythonMRJob模块的安装 2.Hadoop——Python各模块介绍 3.使用MRJob实现文本统计 4.PythonMRJob的运行方式 5.重写MRJob函数实现复杂数据处理