课程内容
展开全部
  共60个章节
阶段 0 技能准备   展开
共2个章节
阶段 1 数据采集与查询   展开
共13个章节
lab-live 直播 1 开课直播
直播时间:2019-07-18 19:30:00
lab-classic 实验 3 数据文件存储和读取

知识点: 1.数据文件类型 2.数据文件读取 3.数据文件存储 4.JSON解析 5.数据分块读取

lab-challenge 挑战 1 数据文件格式转换

知识点: 1.数据文件读取 2.数据格式转换 3.数据切片

lab-classic 实验 4 SQL 和 NoSQL 数据库

知识点: 1.数据库连接 2.操作SQLite数据库 3.SQL语法介绍 4.Mongodb数据库介绍 5.对Mongodb数据库的增删改查

lab-challenge 挑战 2 数据库连接和查询

知识点: 1.数据库连接 2.查询语句的构造 3.使用Pandas读取和查询数据库 4.针对相关的列的聚合计算

lab-classic 实验 5 HTTP 协议及 API 采集数据

知识点: 1.GET方法请求数据 2.Response响应分析 3.请求URL的构造 4.JSON数据读取 5.开发者工具的使用

lab-challenge 挑战 3 使用 API 采集 GitHub 数据

知识点: 1.Issue页面URL规律分析 2.requests请求URL的构造 3.JSON数据的解析 4.数据的存储

lab-classic 实验 6 网页数据解析与采集

知识点: 1.Pandas模块自动解析表格 2.表格数据的文本匹配 3.XPath节点的选择基本规则 4.lxml模块的使用 5.BeautifulSoup模块中CSS选择器的使用 6.开发者工具中XPath和CSS的路径

lab-challenge 挑战 4 采集实验楼用户数据

知识点: 1.XPath解析数据 2.响应状态的判断

lab-classic 实验 7 使用网络爬虫采集数据

知识点: 1.构造CSS选择器路径 2.获取不同页面的内容 3.Scrapy的安装使用 4.Scrapy提取数据方法 5.Scrapy内置方法 6.正则匹配方法介绍

lab-classic 实验 8 Scrapy 爬虫框架基础

知识点: 1.Scrapy安装使用 2.ScrapyShell常用命令 3.Scrapy爬虫项目结构及功能介绍 4.Item容器与结构化数据的存储 5.爬虫的创建及编写 6.Response对象的处理 7.Pipeline处理数据 8.数据存取与导出 9.多页面数据爬取

lab-challenge 挑战 5 爬取实验楼 Github 仓库数据

知识点: 1.爬虫工程的创建 2.itemspy的编写 3.piplinespy处理数据 4.GithubURL的构造 5.githubpy爬虫的编写

lab-classic 实验 9 第一周挑战解析及课程总结
阶段 2 数据清洁及预处理   展开
共11个章节
lab-classic 实验 10 使用可视化对数据探索

知识点: 1.可视化与数据挖掘的步骤 2.Matplotlib绘制图形 3.Matplotlib添加图形属性 4.等高线的绘制 5.泊松分布和正态分布的绘制 6.Seaborn密度估计图的绘制 7.单变量变量图的绘制 8.热力图的绘制

lab-challenge 挑战 6 泰坦尼克数据集绘图探索

知识点: 1.Seaborn散点图的使用 2.Seaborn计数图的使用 3.子图的绘制

lab-classic 实验 11 数据清洗方法

知识点: 1.数据有效性判定依据 2.数据清洗常用方法 3.缺失值处理 4.重复值的处理 5.IQR值的计算

lab-classic 实验 12 数据集成方法

知识点: 1.Merge合并数据方法 2.Join按照索引合并 3.concat轴堆叠方法 4.map数据映射方法 5.Groupby数据分组聚合方法

lab-classic 实验 13 数据转换方法

知识点: 1.MinMax标准化 2.ZScore标准化 3.独热编码 4.数据离散化

lab-classic 实验 14 数据规约方法

知识点: 1.主成分分析 2.线性判别分析 3.皮尔逊相关系数 4.卡方检验 5.数据抽样

lab-challenge 挑战 7 美国地震台网数据清洗

知识点: 1.数据文件的读取 2.数据集的分割和拼接 3.缺失值处理

lab-challenge 挑战 8 地震台网数据处理分析

知识点: 1.数据离散化 2.分组聚合计算 3.重复值处理 4.数据类型转换

lab-challenge 挑战 9 世界气候数据处理分析

知识点: 1.数据归一化 2.数据集合并 3.缺失值处理 4.数据集的分组求和 5.重制索引

lab-challenge 挑战 10 数据关联处理与绘图

知识点: 1.MinMax归一化 2.缺失值填充处理 3.坐标轴刻度设置 4.子图的绘制

lab-classic 实验 15 第二周挑战解析及课程总结
阶段 3 机器学习建模方法   展开
共13个章节
lab-classic 实验 16 数据建模与机器学习

知识点: 1.机器学习的定义 2.监督学习 3.分类与回归 4.无监督学习与监督学习的区别

lab-classic 实验 17 线性回归实现与应用

知识点: 1.一元线性回归 2.平方损失函数 3.最小二乘法及代数求解 4.线性回归实现 5.最小二乘法的矩阵推导

lab-challenge 挑战 11 纽约东河单车数量回归分析

知识点: 1.数据集的读取 2.数据的提取 3.最小二乘法计算

lab-classic 实验 18 多项式回归实现与应用

知识点: 1.多项式回归介绍 2.多项式回归基础 3.多项式回归预测

lab-challenge 挑战 12 住房价格回归预测

知识点: 1.数据去重 2.皮尔逊相关系数的计算 3.特征转换 4.模型评价

lab-classic 实验 19 逻辑回归实现与应用

知识点: 1.线性可分和不可分 2.Sigmoid分布函数 3.逻辑回归模型 4.对数损失函数 5.梯度下降法

lab-challenge 挑战 13 梯度下降法求解线性回归问题

知识点: 1.数据抽取 2.参数设置 3.梯度的计算 4.参数更新

lab-classic 实验 20 感知机与人工神经网络

知识点: 1.感知机的推导过程 2.随机梯度下降法 3.多层感知机与人工神经网络 4.反向传播算法 5.实现人工神经网络

lab-challenge 挑战 14 手写字符分类预测

知识点: 1.人工神经网络 2.手写字符识别

lab-classic 实验 21 朴素贝叶斯实现与应用

知识点: 1.条件概率 2.贝叶斯定理 3.朴素贝叶斯原理 4.朴素贝叶斯算法实现 5.极大似然估计

lab-classic 实验 22 划分聚类方法实现与应用

知识点: 1.划分聚类介绍 2.KMeans聚类方法 3.中心点移动过程可视化 4.KMeans算法实现

lab-challenge 挑战 15 使用聚类压缩图像

知识点: 1.图像压缩 2.MiniBatchKMeans聚类

lab-classic 实验 23 第三周挑战解析及课程总结
阶段 4 时间序列处理   展开
共12个章节
lab-classic 实验 24 更多机器学习建模方法

知识点: 1.岭回归 2.LASSO回归 3.K近邻算法 4.K折交叉验证 5.朴素贝叶斯算法 6.支持向量机算法 7.决策树算法 8.层次聚类算法 9.密度聚类算法

lab-classic 实验 25 机器学习建模常用评估方法

知识点: 1.模型评估指标 2.准确率的计算 3.混淆矩阵 4.ROC曲线 5.F1值的意义 6.轮廓系数

lab-challenge 挑战 16 钞票真伪鉴别分析预测

知识点: 1.CSV文件读取 2.分类模型的应用 3.模型的训练与预测

lab-classic 实验 26 关联规则学习

知识点: 1.关联规则 2.频繁项集 3.支持度 4.置信度 5.示例购物数据 6.关联规则任务 7.Apriori算法 8.关联规则实战

lab-challenge 挑战 17 购物数据关联规则分析

知识点: 1.数据集制作 2.数据预处理 3.Apriori算法的应用 4.关联规则的生成

lab-classic 实验 27 时间序列数据处理

知识点: 1.时间生成 2.时间转换 3.时间计算 4.时区 5.时间戳 6.时间戳索引 7.时序检索 8.时序偏移 9.重采样

lab-challenge 挑战 18 Google 股票时间序列数据处理

知识点: 1.时间格式转换 2.时序数据重采样 3.数据排序

lab-classic 实验 28 时间序列建模分析

知识点: 1.时序数据特点及分类 2.描述性时序分析 3.统计时序分析 4.平稳时间序列检验 5.自相关图和偏自相关图 6.纯随机性检验 7.ARMA介绍及建模 8.差分运算 9.ARIMA介绍及建模

lab-challenge 挑战 19 农业生产指数建模分析

知识点: 1.数据预处理 2.数据重采样 3.Prophet的使用

lab-classic 实验 29 因素分解及 Prophet 工具使用

知识点: 1.季节性趋势序列 2.因素分解 3.Prophet工具介绍 4.Prophet工具快速入门 5.趋势变化点 6.乘法模型

lab-challenge 挑战 20 成都市 PM2.5 指数分析预测

知识点: 1.缺失值处理 2.数据重采样 3.加法模型 4.重制时间索引

lab-classic 实验 30 第四周挑战解析及课程总结
阶段 5 数据挖掘项目实战   展开
共7个章节
lab-classic 实验 31 苹果公司股票数据分析预测

知识点: 1.数据采集方法 2.数据清洗和预处理 3.绘制K线图 4.绘制相对变化曲线 5.短期交易策略 6.股票长期趋势预测 7.时间序列建模

lab-classic 实验 32 实验楼用户评论情绪分析

知识点: 1.词典模型 2.词袋模型 3.Word2Vec模型 4.数据获取 5.中文分词 6.词向量转换 7.训练情绪分类模型 8.实验楼用户评论情绪分析

lab-classic 实验 33 红楼梦人物关系可视化分析

知识点: 1.红楼梦数据采集 2.数据清洗和转换 3.分词处理 4.词频统计 5.数据分析及可视化 6.人物关系绘制

lab-classic 实验 34 链家上海租房数据分析

知识点: 1.采集数据 2.数据解析和存储 3.数据清洗和预处理 4.地理位置数据处理 5.链家租房数据分析 6.绘制词云 7.数据可视化

lab-classic 实验 35 豆瓣电影评分数据分析预测

知识点: 1.豆瓣数据采集 2.豆瓣数据采集数据概述 3.TOP250电影数据可视化分析 4.周星驰相关的100位演员关系网络 5.电影数据分析 6.电影评论情感分析

lab-classic 实验 36 携程机票价格数据分析

知识点: 1.机票数据采集 2.获取最低票价数据 3.获取班次详情数据 4.数据清洗和转换 5.数据分析

lab-classic 实验 37 数据可视化分析与 Tableau 应用

知识点: 1.数据可视化概述 2.静态可视化工具 3.动态可视化工具 4.常见图表用法说明 5.BI软件介绍 6.Tableau使用介绍 7.Tableau学习路径

阶段 6 数据挖掘项目作业   展开
共2个章节
lab-challenge 挑战 21 数据分析与挖掘项目挑战
lab-live 直播 2 结课直播与项目挑战评讲
直播时间:2019-08-29 19:30:00
课程介绍

【课程报名地址】https://www.shiyanlou.com/louplus/dm

课程教师

huhuhang 共发布过 40 门课程

查看老师的所有课程 >
实验楼楼+
实验楼会员