《R语言数据挖掘:实用项目解析》——小结

简介:

本节书摘来自华章计算机《R语言数据挖掘:实用项目解析》一书中的第2章,小结,作者[印度]普拉迪帕塔·米什拉(Pradeepta Mishra),译 黄芸,更多章节内容可以访问云栖社区“华章计算机”公众号查看。

小结

探索性数据分析几乎是所有类型的数据挖掘项目都要执行的一项重要操作。解读分布、分布的形状和分布的重要参数是相当重要的。提前的假设检验可帮助我们更好地理解数据。不仅是分布及其性质,不同变量之间的关系也很重要。所以本章介绍了不同变量之间的二元和多元关系以及如何理解这些关系。诸如t检验、F检验、z检验和无参数检验等经典统计检验都是检验假设的重要方法。检验假设本身对于从数据集中得出结论和洞见也很重要。

本章我们介绍了多种统计检验和它们的用法、说明以及可以使用这些检验的场景。在实施探索性数据分析之后,下一章将介绍一些数据可视化方法来使读者对数据有个全方位的了解。有时,图形化的描述是最简单的数据展示方法。下一章将使用不同库中的一些内置数据集来创建直观的可视化。

相关文章
|
1天前
|
数据可视化
【视频】R语言生存分析原理与晚期肺癌患者分析案例|数据分享-4
【视频】R语言生存分析原理与晚期肺癌患者分析案例|数据分享
10 1
|
1天前
【视频】R语言生存分析原理与晚期肺癌患者分析案例|数据分享-2
【视频】R语言生存分析原理与晚期肺癌患者分析案例|数据分享
11 1
|
1天前
|
数据可视化 算法 测试技术
R语言IRT理论:扩展Rasch模型等级量表模型lltm、 rsm 和 pcm模型分析心理和教育测验数据可视化
R语言IRT理论:扩展Rasch模型等级量表模型lltm、 rsm 和 pcm模型分析心理和教育测验数据可视化
|
1天前
|
vr&ar
R语言单变量和多变量(多元)动态条件相关系数DCC-GARCH模型分析股票收益率金融时间序列数据波动率-1
R语言单变量和多变量(多元)动态条件相关系数DCC-GARCH模型分析股票收益率金融时间序列数据波动率
|
4天前
|
移动开发 数据可视化
R语言两层2^k析因试验设计(因子设计)分析工厂产量数据和Lenth方法检验显著性可视化|数据分享(二)
R语言两层2^k析因试验设计(因子设计)分析工厂产量数据和Lenth方法检验显著性可视化|数据分享(二)
14 0
|
4天前
|
自然语言处理 算法 数据挖掘
【视频】文本挖掘:主题模型(LDA)及R语言实现分析游记数据
【视频】文本挖掘:主题模型(LDA)及R语言实现分析游记数据
15 0
|
5天前
|
数据挖掘 算法
灰色关联分析(Grey Relation Analysis,GRA)中国经济社会发展指标
灰色关联分析(Grey Relation Analysis,GRA)中国经济社会发展指标
24 0
灰色关联分析(Grey Relation Analysis,GRA)中国经济社会发展指标
|
5天前
|
数据挖掘
R语言预测期货波动率的实现:ARCH与HAR-RV与GARCH,ARFIMA模型比较
R语言预测期货波动率的实现:ARCH与HAR-RV与GARCH,ARFIMA模型比较
23 0
R语言预测期货波动率的实现:ARCH与HAR-RV与GARCH,ARFIMA模型比较

热门文章

最新文章