数据也会说谎:常见的数据造假三种形态!

  1. 云栖社区>
  2. 大数据文摘>
  3. 博客>
  4. 正文

数据也会说谎:常见的数据造假三种形态!

小旋风柴进 2017-05-02 16:02:00 浏览1075
展开阅读全文

日常生活工作中,处处都会与数据打交道,但你知道数据是会“说谎”的,即你看到的数据结果并不是事实。本文介绍一些常见的说谎场景以及如何避免。

1图表欺骗

图表通常用来增强需要文字和数据的说服力,通过可视化的图表更容易让受众接受信息。但图表有时候会表现的不是数据的本质:


1.图表拉伸

如果没有特殊用途,通常图表的长(横轴)与高(纵轴)的比例为1:1到1:2之间,如果在这个范围之外,数据现实的结果会过于异常。比如:

0?wx_fmt=png


2.坐标轴特殊处理

在很多场合下,如果两列数据的取值范围差异性过大,通常在显示时会取对数,这时原来柱状图间的巨大差异会被故意缩小。通常,严谨的分析师在讲解之前会进行告知。比如:

0?wx_fmt=png


3.数据标准化

数据标准化也是一个让数据落在相同区间内常用的方法,常用Z标准化或0-1标准化,如果不提前告知,可能会误以为两列数据取值异常接近,不符合实际业务场景,










网友评论

登录后评论
0/500
评论
小旋风柴进
+ 关注
所属云栖号: 大数据文摘