《Python数据分析与挖掘实战》一3.2 数据特征分析

  1. 云栖社区>
  2. 华章计算机>
  3. 博客>
  4. 正文

《Python数据分析与挖掘实战》一3.2 数据特征分析

华章计算机 2017-05-02 16:35:00 浏览2641
展开阅读全文

本节书摘来自华章出版社《Python数据分析与挖掘实战》一书中的第3章,第3.2节,作者 张良均 王路 谭立云 苏剑林,更多章节内容可以访问云栖社区“华章计算机”公众号查看

3.2 数据特征分析

对数据进行质量分析以后,接下来可通过绘制图表、计算某些特征量等手段进行数据的特征分析。

3.2.1 分布分析

分布分析能揭示数据的分布特征和分布类型。对于定量数据,欲了解其分布形式是对称的还是非对称的,发现某些特大或特小的可疑值,可通过绘制频率分布表、绘制频率分布直方图、绘制茎叶图进行直观地分析;对于定性分类数据,可用饼图和条形图直观地显示分布情况。
1.定量数据的分布分析
对于定量变量而言,选择“组数”和“组宽”是做频率分布分析时最主要的问题,一般按照以下步骤进行。
1)求极差。
2)决定组距与组数。
3)决定分点。
4)列出频率分布表。
5)绘制频率分布

网友评论

登录后评论
0/500
评论
华章计算机
+ 关注
所属云栖号: 华章计算机