《R语言数据挖掘:实用项目解析》——第2章,第2.7节列联表、二元统计及数据正态性检验

  1. 云栖社区>
  2. 华章计算机>
  3. 博客>
  4. 正文

《R语言数据挖掘:实用项目解析》——第2章,第2.7节列联表、二元统计及数据正态性检验

华章计算机 2017-05-02 15:24:00 浏览1267
展开阅读全文

本节书摘来自华章出版社《R语言数据挖掘:实用项目解析》一书中的第2章,第2.7节列联表、二元统计及数据正态性检验,作者[印度]普拉迪帕塔·米什拉(Pradeepta Mishra),更多章节内容可以访问云栖社区“华章计算机”公众号查看

2.7 列联表、二元统计及数据正态性检验
列联表是由两个或多个分类变量及每个分类所占比例构成的频率表。频率表展示的是一个分类变量,而列联表用来展示两个分类变量。
我们以Cars93数据集为例,来解读列联表、二元统计和数据正态性:


2219767de9ea12ad8b2e89e9f77ebc328402ddc3

前面已给出过汽车的两个分类变量AirBags和Type各自的频率表:


9d0228c79e34fcb747f5ce19d4a8e01f0a8f29bd


42d387f54383974a82aa750ec7b201c775bf6423

如上面的代码所示,conTable对象保存了两个变量的交叉表。每个单元的百分比显示在下列代码中。如果需要计算行百分比或列百分比,则需要指定相应参数的值:


c4af3c55d03c83c65e7f89132e6c3e7253790669

若要计算行百分比,则应将值设为1。若要计算列百分比,则应将值设

网友评论

登录后评论
0/500
评论
华章计算机
+ 关注
所属团队号: 华章计算机