《贝叶斯思维:统计建模的Python学习法》——第1章 贝叶斯定理 1.1 条件概率

简介:

本节书摘来异步社区《贝叶斯思维:统计建模的Python学习法》一书中的第1章,第1.1节,作者:【美】Allen B. Downey,更多章节内容可以访问云栖社区“异步社区”公众号查看

第1章 贝叶斯定理

贝叶斯思维:统计建模的Python学习法

1.1 条件概率

所有贝叶斯统计的方法都基于贝叶斯定理,如果有条件概率的学习基础,意识到这一点很自然。因此我们会从概率、条件概率开始,然后到贝叶斯定理,最后讨论贝叶斯统计的内容。

概率表示为0和1之间的数字(包括0和1),含义是某一事件或者预测行为的可信程度,1值表示“事件为真”的情形肯定发生,或表述为预测成真;而0值则表示“事件为真”这一情形为假。

其他中间值表示确定性的程度。例如,0.5通常也会写成50%,意味着一个预测结果发生和不发生有同等可能性。例如,在一个掷硬币事件中,人像面(正面)朝上的概率就非常接近50%。

条件概率是带有某些(前提条件)背景约束下的概率问题。例如,我想了解一下明年自己心脏病发作的可能性。根据疾病控制中心的数据,每年大约有78.5万名美国人罹患心脏病。

美国约有3.11亿人,假设随机挑选一个美国人,那么其在明年心脏病发作的概率大约是0.3%。

但就具体个例而言,“我”可不是那个被随意选中的美国人。流行病学家们已经明确了多种影响心脏病发作的风险因素,根据这些因素我的风险则有可能高于或低于平均值。

本人男,45 岁,有临界高胆固醇,这些因素增加了我发病的可能性;然而,血压低、不抽烟这些因素则降低了可能性。

把上面这些条件输入在线计算器hp2010.nhlbihin.net/atpiii/calculator.asp,我发现自己明年心脏病发作的风险约为0.2%,低于全国平均水平。这个值就是一个条件概率,因为它是基于一系列前提因素的,这些因素构成了我患心脏病的“条件”。

通常条件概率的记号是p(A|B),表示在给定B条件下A事件发生的概率。在这个例子中,A表示我明年罹患心脏病带的概率,而B表示了上面所罗列的条件。

相关文章
|
22天前
|
数据采集 自然语言处理 算法
如何使用Python的Gensim库进行自然语言处理和主题建模?
使用Gensim库进行Python自然语言处理和主题建模,包括:1) 安装Gensim;2) 导入`corpora`, `models`, `nltk`等相关模块;3) 对文本数据进行预处理,如分词和去除停用词;4) 创建字典和语料库;5) 使用LDA算法训练模型;6) 查看每个主题的主要关键词。代码示例展示了从数据预处理到主题提取的完整流程。
37 3
|
20天前
|
机器学习/深度学习 数据挖掘 网络架构
Python对商店数据进行lstm和xgboost销售量时间序列建模预测分析
Python对商店数据进行lstm和xgboost销售量时间序列建模预测分析
|
4天前
|
机器学习/深度学习 自然语言处理 算法
Gensim详细介绍和使用:一个Python文本建模库
Gensim详细介绍和使用:一个Python文本建模库
15 1
|
7天前
|
数据可视化 Python
python中Copula在多元联合分布建模可视化2实例合集|附数据代码
python中Copula在多元联合分布建模可视化2实例合集|附数据代码
|
13天前
|
机器学习/深度学习 数据可视化 TensorFlow
Python用线性回归和TensorFlow非线性概率神经网络不同激活函数分析可视化
Python用线性回归和TensorFlow非线性概率神经网络不同激活函数分析可视化
|
17天前
|
机器学习/深度学习 数据挖掘 API
pymc,一个灵活的的 Python 概率编程库!
pymc,一个灵活的的 Python 概率编程库!
21 1
|
21天前
|
自然语言处理 数据可视化 算法
Python主题建模LDA模型、t-SNE 降维聚类、词云可视化文本挖掘新闻组数据集
Python主题建模LDA模型、t-SNE 降维聚类、词云可视化文本挖掘新闻组数据集
|
25天前
|
机器学习/深度学习 供应链 算法
Python配对交易策略统计套利量化交易分析股票市场
Python配对交易策略统计套利量化交易分析股票市场
|
26天前
|
数据可视化 算法 数据挖掘
Python主题建模LDA模型、t-SNE 降维聚类、词云可视化文本挖掘新闻组数据集2
Python主题建模LDA模型、t-SNE 降维聚类、词云可视化文本挖掘新闻组数据集
|
26天前
|
自然语言处理 数据可视化 算法
Python主题建模LDA模型、t-SNE 降维聚类、词云可视化文本挖掘新闻组数据集1
Python主题建模LDA模型、t-SNE 降维聚类、词云可视化文本挖掘新闻组数据集