【Python数据科学手册】专题:朴素贝叶斯分类

  1. 云栖社区>
  2. 博客>
  3. 正文

【Python数据科学手册】专题:朴素贝叶斯分类

初商 2019-08-04 01:23:00 浏览470
展开阅读全文

朴素贝叶斯模型是一组非常简单快速的分类算法,通常适用于维度非常高的数据集。因为运行速度快,而且可调参数少,因此非常适合为分类问题提供快速粗糙的基本方案。

1、贝叶斯分类

朴素贝叶斯分类器建立在贝叶斯分类方法的基础上,其数学基础是贝叶斯定理(Bayes’s theorem)——一个描述统计量条件概率关系的公式。在贝叶斯分类中,我们希望确定一个具有某些特征的样本属于某类标签的概率,通常记为P(L|特征)

image.png

假如需要确定两种标签,定义为L1 和L2,一种方法就是计算这两个标签的后验概率的比值:

image.png

现在需要一种模型,帮我们计算每个标签的P ( 特征 | Li)。这种模型被称为生成模型,因为它可以训练出生成输入数据的假设随机过程(或称为概率分布)。为每种标签设置生成模型是贝叶斯分类器训练过程的主要部分。

之所以称为“朴素”或“朴素贝叶斯”,是因为如果对每

网友评论

登录后评论
0/500
评论
初商
+ 关注