你将学到的
  • Pandas 数据预处理
  • K-近邻
  • 线性回归
  • 特征工程
  • 聚类
  • 时间序列数据处理
  • 决策树
  • 随机森林
  • 逻辑回归
  • 主成分分析
  • 梯度下降法
lab-classic 实验 1 使用 Pandas 进行数据探索

知识点: 1.排列 2.索引 3.交叉表 4.透视表 5.数据探索

lab-challenge 挑战 1 人口收入普查数据探索
lab-classic 实验 2 Python 数据可视化分析

知识点: 1.单变量可视化的常用方法 2.多变量可视化的常用方法 3.tSNE

lab-challenge 挑战 2 心血管疾病数据探索分析
lab-classic 实验 3 决策树和 K 近邻分类

知识点: 1.决策树 2.最近邻方法 3.交叉验证

lab-challenge 挑战 3 决策树和随机森林分析应用
lab-classic 实验 4 线性回归和线性分类器

知识点: 1.回归 2.线性分类 3.逻辑回归的正则化 4.逻辑回归的优缺点 5.验证和学习曲线

lab-challenge 挑战 4 逻辑回归用于讽刺文本检测
lab-classic 实验 5 集成学习和随机森林方法

知识点: 1.集成 2.Bootstraping 3.Bagging 4.随机森林 5.特征重要性

lab-challenge 挑战 5 构建信用评分预测分类模型
lab-classic 实验 6 特征工程和特征选择

知识点: 1.特征提取 2.特征转换 3.特征选择

lab-challenge 挑战 6 红酒质量数据回归探索
lab-classic 实验 7 主成分分析和聚类

知识点: 1.PCA降维 2.KMeans 3.近邻传播 4.谱聚类 5.凝聚聚类

lab-challenge 挑战 7 非监督学习应用练习
lab-classic 实验 8 随机梯度下降和独热编码

知识点: 1.随机梯度下降 2.在线学习 3.独热编码 4.哈希技巧

lab-challenge 挑战 8 线性回归和随机梯度下降
lab-classic 实验 9 时间序列处理与应用

知识点: 1.时间序列 2.SARIMA 3.线性回归 4.XGBoost 5.Prophet

lab-challenge 挑战 9 时间序列分析应用练习
课程介绍

实验任务

  • 使用 Pandas 进行数据探索
  • 使用 Pandas 进行数据可视化
  • 学习决策树算法的基本原理,并动手实现
  • 学习 K-近邻算法基本原理,并动手实现
  • 使用交叉验证完成模型选择
  • 学习线性回归于逻辑回归数学原理,并使用 sklearn 实现
  • 学习集成算法思想,并使用 sklearn 实现
  • 学习常用聚类方法,并使用 sklearn 实现
  • 学习常用的时间序列数据处理方法,并动手实现

先学知识

课程难度

本课程难度为中等偏上。

面向用户

本课程主要讲解机器学习常见算法,整体难度中等偏上,该课程适合于对机器学习感兴趣且数学相对较好的用户。

课程教师

huhuhang 共发布过 40 门课程

查看老师的所有课程 >
实验楼楼+
实验楼会员