《数据分析实战:基于EXCEL和SPSS系列工具的实践》——2.3 在分析需求和模型之间搭起桥梁

简介:

本节书摘来自华章计算机《数据分析实战:基于EXCEL和SPSS系列工具的实践》一书中的第2章,第2.3节,作者 纪贺元,更多章节内容可以访问云栖社区“华章计算机”公众号查看。

2.3 在分析需求和模型之间搭起桥梁

我们在现实工作中面临的都是实际的需求,这些需求往往乍一看跟数据分析并没有多少关系,例如:

  • 成本上升了,对价格如何影响?
  • 如何降低物流成本?
  • 工厂里面做实验,有的时候成功有的时候失败,原因何在?
  • 来我这里购买的客户有哪些特征?

看到这里,读者可能大致明白了,所谓的数据分析,一开始就没几个人考虑数据,而是首先考虑业务,然后再往数据的地方靠。

2.3.1 识别需求

首先考虑识别需求,还是看一个例子吧,一个北方的加油站企业,经常搞各种活动,大家都知道,加油站如果不搞活动,生意会不大好。问题是加油站经常搞多种活动,于是某一天,企业的领导发话了:我们搞了这么多活动,效果怎么样啊?

好了,这就是需求!非常实在的需求!

2.3.2 分解需求

下一步要分解需求,我们要去做以下的事情:

1)收集没有活动时,各加油站的加油数据。

2)收集有各种活动时,各加油站的加油数据。

需求分解完了,数据也收集完了,就形成了图2-19加油站的加油量数据。

image

2.3.3 选择工具和模型

对于统计的初学者来说,选择工具和模型几乎是最难的,统计软件有很多,统计模型就更加多了,各种模型之间的区分,绝对是一言难尽的事情。需要长期基于统计工具的学习和积累,才能够比较自如地选择模型。

另外,从笔者长期运用工具的经验来看,很多人选择统计模型有其“习惯”和“偏好”,有的人习惯使用相关分析模型,有的人则喜欢决策树模型,不一而足。

相关文章
|
2天前
|
算法 搜索推荐 数据挖掘
数据挖掘实战 —— 抖音用户浏览行为数据分析与挖掘(续)
数据挖掘实战 —— 抖音用户浏览行为数据分析与挖掘(续)
18 1
|
2天前
|
机器学习/深度学习 数据采集 算法
数据挖掘实战 —— 抖音用户浏览行为数据分析与挖掘(二)
数据挖掘实战 —— 抖音用户浏览行为数据分析与挖掘(二)
20 1
|
2天前
|
数据可视化 搜索推荐 数据挖掘
数据挖掘实战 —— 抖音用户浏览行为数据分析与挖掘(一)
数据挖掘实战 —— 抖音用户浏览行为数据分析与挖掘(一)
40 1
|
2天前
|
数据采集 数据可视化 数据挖掘
Python 与 PySpark数据分析实战指南:解锁数据洞见
Python 与 PySpark数据分析实战指南:解锁数据洞见
|
2天前
|
SQL 数据采集 存储
Hive实战 —— 电商数据分析(全流程详解 真实数据)
关于基于小型数据的Hive数仓构建实战,目的是通过分析某零售企业的门店数据来进行业务洞察。内容涵盖了数据清洗、数据分析和Hive表的创建。项目需求包括客户画像、消费统计、资源利用率、特征人群定位和数据可视化。数据源包括Customer、Transaction、Store和Review四张表,涉及多个维度的聚合和分析,如按性别、国家统计客户、按时间段计算总收入等。项目执行需先下载数据和配置Zeppelin环境,然后通过Hive进行数据清洗、建表和分析。在建表过程中,涉及ODS、DWD、DWT、DWS和DM五层,每层都有其特定的任务和粒度。最后,通过Hive SQL进行各种业务指标的计算和分析。
41 1
Hive实战 —— 电商数据分析(全流程详解 真实数据)
|
2天前
|
SQL 人工智能 自然语言处理
让老板成为数据分析师--ChatGpt链接本地数据源实战测试
本文探究ChatGpt等AI机器人能否帮助老板快速的做数据分析?用自然语言同老板进行沟通,满足老板的所有数据分析的诉求?
|
2天前
|
Linux 网络安全 数据处理
【专栏】Linux下的xxd命令是一个强大的二进制数据处理工具,用于十六进制转储和数据分析,我教你应该如何使用!
【4月更文挑战第28天】Linux下的xxd命令是一个强大的二进制数据处理工具,用于十六进制转储和数据分析。它可以显示文件的十六进制和ASCII表示,方便查看内容、分析数据结构和比较文件。xxd支持指定输出格式、写入文件、数据提取和转换等功能。在网络安全分析、程序调试和数据恢复等领域有广泛应用。通过掌握xxd,用户能更深入理解和处理二进制数据。
|
2天前
|
数据挖掘 Python
SPSS时间序列ARIMA、指数平滑法数据分析汽车销量数据
SPSS时间序列ARIMA、指数平滑法数据分析汽车销量数据
|
2天前
|
数据采集 数据可视化 数据挖掘
R语言与Python:比较两种数据分析工具
【4月更文挑战第25天】R语言和Python是目前最流行的两种数据分析工具。本文将对这两种工具进行比较,包括它们的历史、特点、应用场景、社区支持、学习资源、性能等方面,以帮助读者更好地了解和选择适合自己的数据分析工具。
|
2天前
|
机器学习/深度学习 数据可视化 数据挖掘
SPSS用K均值聚类KMEANS、决策树、逻辑回归和T检验研究通勤出行交通方式选择的影响因素调查数据分析
SPSS用K均值聚类KMEANS、决策树、逻辑回归和T检验研究通勤出行交通方式选择的影响因素调查数据分析