《R语言数据挖掘:实用项目解析》——第2章,第2.4节解读分布和变换

  1. 云栖社区>
  2. 华章计算机>
  3. 博客>
  4. 正文

《R语言数据挖掘:实用项目解析》——第2章,第2.4节解读分布和变换

华章计算机 2017-05-02 15:09:00 浏览835
展开阅读全文

本节书摘来自华章出版社《R语言数据挖掘:实用项目解析》一书中的第2章,第2.4节解读分布和变换,作者[印度]普拉迪帕塔·米什拉(Pradeepta Mishra),更多章节内容可以访问云栖社区“华章计算机”公众号查看

2.4 解读分布和变换
为了对所有统计假设检验的前提假设有清晰的认识,理解概率分布至关重要。例如,在线性回归分析中,基本的前提假设是误差分布呈正态分布且变量关系为线性。所以在建立模型之前,观察分布的形状并采取可能的校正变换是很重要的,如此才能便于对这些变量使用更深入的统计技术。

2.4.1 正态分布
正态分布原理基于中心极限定理(CLT),表示从一个均值为μ、方差为σ2的总量中抽取的所有大小为n的样本,在n增长趋于无穷时,其分布都近似于一个均值为μ、方差为σ2的正态分布。检查变量的正态性对于移除离群点很重要,因为这样才会使得

网友评论

登录后评论
0/500
评论
华章计算机
+ 关注
所属团队号: 华章计算机