《数据分析实战 基于EXCEL和SPSS系列工具的实践》一1.3 数据分析的几大抓手

简介: 时不时地有培训学员来问我一个问题:“我怎么样才能把数据分析做好?”要回答这个问题还真是不容易,就像业余围棋爱好者问“我怎么样才能快速提高自己的棋力?”或者刚刚进入职场的大学生问“我怎么样才能把销售业绩做好?”一样。

本节书摘来自华章出版社《数据分析实战
基于EXCEL和SPSS系列工具的实践》一书中的第1章,第1.3节,纪贺元 著,更多章节内容可以访问云栖社区“华章计算机”公众号查看。

1.3 数据分析的几大抓手

时不时地有培训学员来问我一个问题:“我怎么样才能把数据分析做好?”要回答这个问题还真是不容易,就像业余围棋爱好者问“我怎么样才能快速提高自己的棋力?”或者刚刚进入职场的大学生问“我怎么样才能把销售业绩做好?”一样。
任何一项工作要做好,都是一个综合的成体系的事情,这里就简单梳理一下把数据分析做好的几个必要条件。

1.3.1 足够多的数据

给巧妇多一点米吧!数据量越多,每天更新的数据就越多,做分析的价值就越大。这也就是为什么现在数据分析做得比较好的还是电信、金融、互联网等几个行业,汽车行业现在进展也比较快。从部门的角度看,市场部、财务部、生产部、质量部等是需要做数据分析的重点部门,为什么?就是因为数据多啊。

1.3.2 数据质量

光有数据量还不行,数据质量也是非常重要的。总体来说,我国很多企业的数据质量目前还比较低下的,先不说数据是否有造假的成分,光是数据的“粗漏错乱”这些就足以让企业的数据分析人员头疼了。
“粗”是指数据的颗粒度很粗,过于粗疏的数据,使得数据的分析价值非常低。
“漏”是指由于企业的数据规划或者数据记录仪器等的问题,很多数据都没有被记录下来。
“错”和“乱”指记录的数据错误,或者是数据被不同的部门所记录,但是数据对不上。例如有一个指标数据,市场部记录为103,而财务部记录为124,大家看到这个例子可能会觉得这怎么可能啊?但是我想告诉你,由于IT系统的五花八门以及部门之间数据经常缺乏稽核比对,因此很容易出现这类问题。

1.3.3 合适的工具

用来做数据分析的工具很多,比较知名的就有10多种,如果再加上那些不知名的,说几十种都算少的。
有的学员在跟我交流时提到不愿意换工具,例如他好不容易熟悉了Eviews,然后要做销售数据的季节性分解,虽然听说SPSS比较好,但是他不愿意换,觉得再学一个软件比较麻烦。
我个人的观点是:存在的就是合理的。每种软件都有它的优势,反过来,也有它的问题。其实我们可以逆向思维,如果有一个软件什么都能干,那么其他的软件就可以退出市场了。
要把各种软件的优势和长处说清楚是件不容易的事情,2.2节会尽可能做一个总结和描述。

1.3.4 分析结果的呈现

仅仅能够分析数据是不够的,还需要把分析的结果展示给其他人,这包括领导、同事、客户等。数据呈现目前是一个热门话题,所谓呈现,就是把数据分析的比较专业甚至晦涩的结果,以生动的甚至有趣的形式展示给他人看。
比较通俗地讲,有人认为呈现就是画图,我比较认同这个观点,“一图抵千言”,人们对于图形的接受程度要远远高于文字和数字。
EXCEL中有很多绘图技巧,EXCEL的更新版本也在对图形绘制进行不断地改进,各种专业统计工具中都有绘图模块,Stata、SAS、R等软件都有专门的绘图命令用来绘制图形。

相关文章
|
1天前
|
算法 搜索推荐 数据挖掘
数据挖掘实战 —— 抖音用户浏览行为数据分析与挖掘(续)
数据挖掘实战 —— 抖音用户浏览行为数据分析与挖掘(续)
11 1
|
1天前
|
机器学习/深度学习 数据采集 算法
数据挖掘实战 —— 抖音用户浏览行为数据分析与挖掘(二)
数据挖掘实战 —— 抖音用户浏览行为数据分析与挖掘(二)
6 1
|
1天前
|
数据可视化 搜索推荐 数据挖掘
数据挖掘实战 —— 抖音用户浏览行为数据分析与挖掘(一)
数据挖掘实战 —— 抖音用户浏览行为数据分析与挖掘(一)
8 1
|
6天前
|
数据采集 数据可视化 数据挖掘
Python 与 PySpark数据分析实战指南:解锁数据洞见
Python 与 PySpark数据分析实战指南:解锁数据洞见
|
8天前
|
SQL 数据采集 存储
Hive实战 —— 电商数据分析(全流程详解 真实数据)
关于基于小型数据的Hive数仓构建实战,目的是通过分析某零售企业的门店数据来进行业务洞察。内容涵盖了数据清洗、数据分析和Hive表的创建。项目需求包括客户画像、消费统计、资源利用率、特征人群定位和数据可视化。数据源包括Customer、Transaction、Store和Review四张表,涉及多个维度的聚合和分析,如按性别、国家统计客户、按时间段计算总收入等。项目执行需先下载数据和配置Zeppelin环境,然后通过Hive进行数据清洗、建表和分析。在建表过程中,涉及ODS、DWD、DWT、DWS和DM五层,每层都有其特定的任务和粒度。最后,通过Hive SQL进行各种业务指标的计算和分析。
29 1
Hive实战 —— 电商数据分析(全流程详解 真实数据)
|
15天前
|
SQL 人工智能 自然语言处理
让老板成为数据分析师--ChatGpt链接本地数据源实战测试
本文探究ChatGpt等AI机器人能否帮助老板快速的做数据分析?用自然语言同老板进行沟通,满足老板的所有数据分析的诉求?
|
16天前
|
Linux 网络安全 数据处理
【专栏】Linux下的xxd命令是一个强大的二进制数据处理工具,用于十六进制转储和数据分析,我教你应该如何使用!
【4月更文挑战第28天】Linux下的xxd命令是一个强大的二进制数据处理工具,用于十六进制转储和数据分析。它可以显示文件的十六进制和ASCII表示,方便查看内容、分析数据结构和比较文件。xxd支持指定输出格式、写入文件、数据提取和转换等功能。在网络安全分析、程序调试和数据恢复等领域有广泛应用。通过掌握xxd,用户能更深入理解和处理二进制数据。
|
19天前
|
数据采集 数据可视化 数据挖掘
R语言与Python:比较两种数据分析工具
【4月更文挑战第25天】R语言和Python是目前最流行的两种数据分析工具。本文将对这两种工具进行比较,包括它们的历史、特点、应用场景、社区支持、学习资源、性能等方面,以帮助读者更好地了解和选择适合自己的数据分析工具。
|
25天前
|
机器学习/深度学习 数据可视化 数据挖掘
python数据分析工具StatsModels
【4月更文挑战第15天】`StatsModels`是Python的统计库,基于NumPy和SciPy,提供线性模型、广义线性模型、稳健回归、时间序列分析等多样功能。支持离散选择模型、方差分析和非参数统计,还包含图形和可视化工具。安装`StatsModels`可使用`pip install statsmodels`。示例展示了如何进行普通最小二乘回归并绘制回归线。该库适用于数据分析和预测建模。
20 1
|
25天前
|
机器学习/深度学习 数据挖掘 计算机视觉
python数据分析工具SciPy
【4月更文挑战第15天】SciPy是Python的开源库,用于数学、科学和工程计算,基于NumPy扩展了优化、线性代数、积分、插值、特殊函数、信号处理、图像处理和常微分方程求解等功能。它包含优化、线性代数、积分、信号和图像处理等多个模块。通过SciPy,可以方便地执行各种科学计算任务。例如,计算高斯分布的PDF,需要结合NumPy使用。要安装SciPy,可以使用`pip install scipy`命令。这个库极大地丰富了Python在科学计算领域的应用。
15 1