适合人群

1. 熟悉Python编程基础

《楼+ 之数据分析与挖掘实战》课程将会使用 Python 语言作为代码实战过程中唯一的编 程语言。除了 Python 语言具备语法简单,上手快的特点。选择其的另一个重要原因是 目前在机器学习领域,最优秀的开源项目和工具几乎都提供了对 Python 语言的支持。

如果你对 Python3 还不够了解和熟悉,那就非常推荐学习实验楼免费基础课程:《Python3 简明教程》 的前 12 个实验,如果有时间,能独立完成其中的挑战是极好的。

2. 有一定的专业知识背景(非必要)

如果你已经拥有了工业领域或其他领域的专业知识背景,同时对数据挖掘技术感兴趣。通过学习《楼+ 数据挖掘实战》课程会使得你更轻松地将数据挖掘思维带入现有的工作场景中,延伸出新的工作愿景。

每周付出的时间

每周至少有 12 小时用于完成实验、挑战任务

坚持到底的决心

不会因为遇到困难而半途而废,有毅力坚持到最后

积极主动的态度

遇到问题能与小组同学及助教讨论,积极主动寻求答案

真实学员评价

整体的课程安排和设计都不错 班主任特别热心,努力学习的一周经常会有夸奖,还有老师的鼓励和及时的答疑

感觉这六周能学到这么多内容也完全达到了我的预期,但是第五周内容感觉太多太难,希望那一部分内容的代码可以多些注释

实验楼的学习模式不同于一般的视频教学,能自己上手在线写代码,对自己的技能提升有很大的帮助。

说实话,这个课程真的很不错。如果有时间有毅力能坚持的话,我相信会有巨大的收获的。奈何我没有坚持下来,真的很遗憾。不过我会在今后继续努力。

我真的是之前找了很多网站学习,视频看了不少,总感觉没学到什么 遇上实验楼的一周后就决定在这买课程学习了 模式很好,实践出真知,希望实验楼越来越好,长久走下去。

实验楼最有效也是最能锻炼水平的地方就在于实时实操,相较于跟着视频看老师讲解更加具备深刻记忆效果,虽然我还没有学完整门课程,但是后续会补上的,可能是传统的视频教学方式有一种先入为主的概念,所以针对这种学习方式能接受的人不太多,所以希望更多的人可以接受这种学习方式。

实验楼的环境真的很好,大部分内容对初学者也可以称得上友好了,自己偶尔会懈怠和着急,但班主任时常的问候和每日准时的邮件会给我动力,过度焦虑对我个人而言是一个亟待解决的问题,但这种程度的提醒还是让我很有收获。并且实验楼的内容真的很丰富,我本身信息收集和搜索的能力有欠缺,实验楼给了我一个学习的很好的平台,尤其弥补了眼高手低的问题。以后仍会继续使用,感谢!

课程安排

技能准备阶段

本课程将使用Python作为代码实战过程中的唯一编程语言,需要你熟悉使用 Python 构建机器学习模型的常用工具模块,包括 NumPy 和 Pandas 。

第0周

课程技能准备

本课程将使用 Python 作为代码实战过程中的唯一编程语言,需要你熟悉使用 Python 完成数据分析挖掘的常用工具模块,包括 NumPy,Pandas 。如果你还未掌握上述技能,请在开课前自学以下课程: 《Python3 简明教程》《NumPy 百题大冲关》《Pandas 百题大冲关》

数据挖掘流程学习阶段

本阶段将围绕着数据挖掘经典流程,学习并掌握数据采集、数据预处理、数据建模以及数据可视化等内容。阶段将涉及大量的数据分析、机器学习、Python 模块、及常用方法的介绍和使用。

第1周

数据采集方法

本周将围绕着数据分析挖掘的首个步骤,即数据采集相关内容展开。内容将涉及使用 Python 采集数据的相关方法,数据库及 SQL 基础语法知识,以及学习使用 API 或爬虫采集网络数据的相关模块。
第2周

数据预处理方法

数据预处理是数据挖掘和模型构建前十分重要的步骤,一般会消耗完整项目流程一半以上的时间。本周内容将从数据预处理的 4 个大方向出发,熟悉数据清洗、数 据集成、数据转换、数据规约等涉及到的数十项不同的手段和方法。
第3周

数据建模方法(上)

随着机器学习的发展,我们不再仅建立一些数据统计模型,而越来越依赖于将大量优质的机器学习方法用于建模的需要。从而通过现有数据去预测,去挖掘更多有价值的信息。本周内容将涉及常用的机器学习分类、回归、聚类算法和原理,并对关联规则等其他数据挖掘方法进行介绍。
第4周

数据建模方法(下)

时间序列分析是数据分析过程中,尤其是在金融数据分析过程中会经常遇到的。本周内容将会学习时间序列处理中涉及到的基本概念和方法,并掌握使用 Pandas进行时间序列数据处理的方法和手段,同时学习使用 Facebook 开源的时间序列处理工具完成时序数据分析建模。

数据挖掘项目实战阶段

本阶段将依托于数据挖掘流程,对不同领域的数个数据挖掘实战项目进行综合学习运行。于此同时,你将会了解到数据挖掘过程中相关的理论和方法,例如数据分析报告撰写、BI 工具使用等。 最终,课程将通过独立完成数据挖掘项目的方式检验学习成果,并将最终的数据挖掘报告提交给我们进行人工评阅。

第5周

数据挖掘项目实验

本周内容将会对前面周次的学习内容进行综合运用,你将会接触到不同领域的数个数据挖掘实战项目。项目将从数据采集、数据预处理、数据建模、数据可视化方面进行完整运用,这将为独立承担数据分析任务打下基础。
第6周

数据挖掘项目挑战

最后一周的内容中,我们将学习除 Python 之外的其他数据处理方法和手段,接触常用的 BI 工具,并了解数据分析报告的撰写方法。同时,课程将提供数个可供选择的数据挖掘题目,你将利用 1 周的时间来独立完成并将最终的数据挖掘报告提交给我们进行人工评阅。

FAQ

课程主要是什么形式的?

*对于课程中的实验,我们会提供完整的代码和详细的文档,同时嵌入关键步骤的录制视频,是在模仿练习;

*对于课程中的挑战,我们会提供实际工作中会遇到的问题或项目任务,包含若干知识点,需要在线完成,系统自动评判PASS或FAIL。

点击此处了解如何学习楼+课程

如果你还不熟悉实验楼,点击这里了解实验楼

开课前需要做什么准备?

1. 只需要准备一台能上网的电脑,学习将在实验楼的在线环境进行,无需安装配置本地环境;

2.阅读课程须知,并完成第0周的课程学习(你可以报名后在课程详情页找到它)

学完能找到工作吗?

课程涵盖完整的数据挖掘流程,从数据采集到数据预处理,从数据建模到数据可视化。除此之外, 你将最后一周接受真实的数据挖掘项目挑战,课程结业之后,可以投递无需强专业背景的数据分析或数据挖掘初级工程师职位。 如果自身有其他专业背景或特长,推荐投递擅长领域的数据挖掘初级工程师职位。

楼+课程与其它课程的区别是什么?

楼+ 面向的是希望系统化学习某一技术的用户,提供了更完善的学习路径和教学服务。楼+课程与其它课程最大的不同体现在教学服务上:

是否支持退款?

开课后24小时内可以申请全额退款。

支持什么付款方式?

目前支持微信,支付宝付款,花呗分期。

课程中如何进行答疑?

实验楼共有3种答疑方式:QQ群实时答疑,1V1桌面共享答疑,讨论区答疑。

其中工作时间(工作日9:00~18:30)可使用QQ群实时答疑,必要的时候会使用实验楼的共享桌面功能提供 1V1 共享桌面协作;

非工作时间,无法保证及时回复,可以在讨论区提问,助教上班后第一时间回复解决。

课程是否有有效期?

楼+的教学服务结束后,无法享受QQ群答疑服务。但仍可以在课程有效期内(默认180天,遇特殊情况可申请延长)学习课程并享受讨论区答疑服务。