你将学到的
  • 贝叶斯推断
  • 各种真实的案例
  • 先验分布和后验分布
  • 大数定律
  • PyMC 的使用
  • 数据可视化
  • 马尔科夫链蒙特卡洛算法
  • 损失函数
课程内容
  共13个章节
lab-classic 实验 1 贝叶斯理论

知识点: 1.贝叶斯推断 2.先验概率 3.后验概率 4.贝叶斯推断与传统统计的区别 5.数据可视化

lab-classic 实验 2 概率分布及 PyMC 初探

知识点: 1.离散型和连续型概率分布 2.Poisson分布 3.指数分布 4.用户收发短信行为推断实例 5.PyMC3的初步使用

lab-challenge 挑战 1 多行为变化推断

知识点: 1.贝叶斯推断的应用 2.用户行为变化实例的拓展 3.数据的可视化

lab-classic 实验 3 PyMC 的拓展

知识点: 1.PyMC变量 2.确定型和随机型 3.计算机模拟数据的产生 4.贝叶斯推断的算法总结

lab-classic 实验 4 网站转换率评估

知识点: 1.贝叶斯A/B测试 2.网站的转换率评估 3.数据的真实差异性比较 4.伯努利分布 5.数据的可视化

lab-classic 实验 5 基于隐私算法的学生作弊分析

知识点: 1.隐私算法 2.二项分布 3.计算机仿真 4.PyMC的技巧

lab-classic 实验 6 挑战者号的事故模拟

知识点: 1.正态分布 2.散点图 3.分离图 4.逻辑函数 5.置信区间 6.线圈缺陷预测

lab-classic 实验 7 马尔科夫链蒙特卡洛算法

知识点: 1.贝叶斯景象图 2.MCMC算法 3.无监督聚类 4.收敛性的优化 5.函数的自相关 6.PyMC画图工具

lab-classic 实验 8 MCMC 的秘诀

知识点: 1.子相关性 2.稀释 3.MCMC的初始值的选取 4.先验的选择

lab-classic 实验 9 大数定律

知识点: 1.大数定律 2.泊松分布 3.小数据的无序性 4.Redit网站评论的排序

lab-classic 实验 10 损失函数

知识点: 1.损失函数 2.期望损失 3.展品出价竞猜 4.金融股票预测 5.最小化损失的求解

lab-classic 实验 11 观察暗世界大赛

知识点: 1.暗物质的观测 2.先验的确定 3.欧氏距离 4.数据分析 5.数据可视化

lab-classic 实验 12 先验的选取策略

知识点: 1.主观先验和客观先验 2.Beta分布 3.贝叶斯多臂老虎机 4.共轭先验 5.实验轮盘赌法

课程介绍

贝叶斯推断是概率编程中非常重要的一部分。而传统的贝叶斯推断涉及到复杂的数学分析,对没有雄厚的数学功底的同学来说,非常不友好。而本课程主要利用了 Python 中 PyMC 库,以一种简单且容易让人理解的方式讲述贝叶斯推断 。本课程包括了大量的实际案例,每一个实验在对知识点进行讲解后,都会引入一个实际案例来帮助同学们理解和学习贝叶斯推断,并且在对案例进行数据分析时,我们会进行大量的可视化操作,来方便同学们的学习与理解。

本课程首先介绍了贝叶斯推断的相关概念,然后对公式进行了推导,并且手工建立了一个贝叶斯模型用于推断出硬币为正面的概率,并对推断过程进行了可视化,如下所示:

接下来对 PyMC 基础使用进行了介绍,并且利用该工具包,在不用公式推导的情况下,完成了 用户短信行为变化的时间点的推断。并对变化点进行了可视化,得到变化的关系图如下:

在学习完基础的 PyMC 工具包后,我们首先使用它完成了“网站转换率评估”的实验,本实验通过贝叶斯算法计算出多个网站的转化率,并对这些转换率的后验分布进行了可视化操作,如下:

然后又用该工具包完成了 "基于隐私算法的学生作弊率推断"实例,该实例详细的阐述了传统调查问卷在涉及到隐私问题时,得到答案的不确定性和虚假性,并提出了一种隐私算法,用以得到较为真实的数据。然后利用计算机仿真技术对隐私算法进行模拟,最后利用贝叶斯推断得到该次考试学生的真实作弊率。

然后又利用该工具包实现了”基于正态分布的挑战者号事故发生推断“实例。通过贝叶斯推断找到飞船组件和温度之间的函数范围如下:

然后引入 95%置信区间的概念,找到较为合理的关系函数,最后利用该函数推断出,挑战者号发生事故的概率高达 90%。

在学习和理解完 PyMC 的用法后,我们接下来会学习贝叶斯推断的核心算法:马尔科夫链蒙特卡洛算法。在学完该算法后,完成了一个"混合模型的无监督聚类"实例。我们利用贝叶斯推断将一组数据合理的聚成了两个簇,结果如下:

在学习完马尔科夫链蒙特卡洛算法后,我们会学习大数定律并完成"Reddit 网站热点评论选取"实例。考虑以何种的指标来最好的描述评论的价值,并且阐述了所观测的好评率并非真正的好评率,最后利用贝叶斯推断求得真正的好评率,并得到最佳评论。可视化如下:

之后,会学习损失函数等相关知识点并且完成 ”价格竞猜游戏最佳策略选取“、”金融股票决策“ 和 Kaggle 官网上的一个暗物质比赛:”暗物质光晕位置预测“。在过程中,我们将会学习,损失函数意义和最小值的求法,如下:

我们在完成暗物质位置选取实验时,会学习比赛冠军的解决思路,并成功利用贝叶斯推断完成暗物质光晕位置的预测,如下:

当然除了上述这些实例外,我们还会学习 ”价格竞猜游戏最佳策略选取“、”金融股票决策“、”多臂老虎机策略选择“等实例。在实战中,加深我们对贝叶斯方法的数据分析的理解。

先学课程

需要先了解基础的 Python 语法,推荐学习 Python3 简明教程

课程难度

本课程难度中等

适合人群

本课程使用贝叶斯推断的相关知识,解决了生活中的各种实际问题。适合对概率编程或者贝叶斯方法有兴趣或者了解相关知识却苦于没有实战经验的同学。并且由于本课程包含了大量的数据分析和可视化的方法,因此,本课程也适合于对数据分析和数据可视化有浓厚兴趣的同学。

版权说明

本课程基于 Bayesian Methods for Hackers 开源项目制作,原内容使用 MIT 授权协议。实验楼在取得明确授权的基础上,造原开源协议范围内对内容进行编译。

课程信息

  • 学习周期:课程有效期 2 个月, 2 个月后实验文档一直可以看,但无法进行在线实验。高级会员有效期内可一直学习(部分实验环境因为成本较高会限制次数),高级会员到期后课程失效(不能看文档)。
  • 企业团报:可获得更多支持服务,请点击 购买咨询
课程教师

小强_同学 共发布过 3 门课程

查看老师的所有课程 >
实验楼楼+
实验楼会员
会员
开通会员,即刻开始学习
公众号
实验楼学习助手 实验楼订阅号