备案控制台

开发者社区

开发者社区华章出版社文章正文

《R语言数据挖掘》——2.8 总结

2017-05-02 1249

版权

版权声明：

本文内容由阿里云实名注册用户自发贡献，版权归原作者所有，阿里云开发者社区不拥有其著作权，亦不承担相应法律责任。具体规则请查看《阿里云开发者社区用户服务协议》和《阿里云开发者社区知识产权保护指引》。如果您发现本社区中有涉嫌抄袭的内容，填写侵权投诉表单进行举报，一经查实，本社区将立刻删除涉嫌侵权内容。

简介：

本节书摘来自华章出版社《R语言数据挖掘》一书中的第2章，第2.8节，作者［哈萨克斯坦］贝特·麦克哈贝尔（Bater Makhabel），李洪成许金炜段力辉译，更多章节内容可以访问云栖社区“华章计算机”公众号查看。

2.8　总结

本章主要学习了以下内容：

购物篮分析。

作为关联规则挖掘的第一步，频繁项集是一个主要因素。除算法设计外，定义了闭项集、最大频繁项集。

作为关联规则挖掘的目标，通过支持计数、置信度等度量来挖掘关联规则。除支持计数外，使用相关公式挖掘相关规则。

频繁项集的单调性，即，若某个项集是频繁的，则其所有子集也是频繁的。

Apriori算法是挖掘频繁模式的第一个高效算法，其他诸多算法均为Apriori的变体。

序列中的序列模式。

下一章将介绍基本分类算法，包括ID3、C4.5和CART等算法，这部分内容也是数据挖掘的重要应用。

文章标签：

算法

数据挖掘

关键词：

数据挖掘语言

数据挖掘r语言

r语言数据挖掘

华章计算机

目录

相关文章

华章计算机

|

数据可视化大数据数据挖掘

《R语言数据挖掘：实用项目解析》——导读

华章计算机

1264 0 0

华章计算机

|

数据挖掘

《R语言数据挖掘：实用项目解析》——小结

华章计算机

1297 0 0

华章计算机

|

数据挖掘

《R语言数据挖掘：实用项目解析》——2.9　无参数方法

华章计算机

1594 0 0

华章计算机

|

数据挖掘

《R语言数据挖掘：实用项目解析》——2.8　假设检验

华章计算机

3017 0 0

华章计算机

|

安全数据挖掘

《R语言数据挖掘：实用项目解析》——2.7　列联表、二元统计及数据正态性检验

华章计算机

2692 0 0

华章计算机

|

数据挖掘

《R语言数据挖掘：实用项目解析》——2.6　变量分段

华章计算机

1398 0 0

华章计算机

|

数据挖掘

《R语言数据挖掘：实用项目解析》——2.5　解读分布

华章计算机

1702 0 0

华章计算机

|

新零售数据挖掘

《R语言数据挖掘：实用项目解析》——2.4　解读分布和变换

华章计算机

1700 0 0

华章计算机

|

数据挖掘

《R语言数据挖掘：实用项目解析》——2.3　多元分析

华章计算机

1265 0 0

华章计算机

|

数据挖掘

《R语言数据挖掘：实用项目解析》——2.2　二元分析

华章计算机

1841 0 0

华章出版社

热门文章

最新文章

探索数据挖掘中的特征选择算法

R语言检验独立性：卡方检验(Chi-square test)

R语言基于ARMA-GARCH-VaR模型拟合和预

R语言中使用RCPP并行计算指数加权波动率

R语言用Rshiny探索lme4广义线性混合模型（GLMM）和线性混合模型（LMM）

R语言用加性多元线性回归、随机森林、弹性网络模型预测鲍鱼年龄和可视化

R语言聚类算法的应用实例

R语言中的生存分析Survival analysis晚期肺癌患者4例

R语言极值理论 EVT、POT超阈值、GARCH 模型分析股票指数VaR、条件CVaR：多元化投资组合预测风险测度分析

R语言计量经济学：工具变量法(两阶段最小二乘法2SLS)线性模型分析人均食品消费时间序列数据和回归诊断

R语言两层2^k析因试验设计（因子设计）分析工厂产量数据和Lenth方法检验显著性可视化|数据分享(二)

【视频】文本挖掘：主题模型（LDA）及R语言实现分析游记数据

R语言ARMA GARCH COPULA模型拟合股票收益率时间序列和模拟可视化

【视频】线性混合效应模型(LMM,Linear Mixed Models)和R语言实现案例（一）

灰色关联分析(Grey Relation Analysis,GRA)中国经济社会发展指标

R语言预测期货波动率的实现：ARCH与HAR-RV与GARCH，ARFIMA模型比较

R语言STAN贝叶斯线性回归模型分析气候变化影响北半球海冰范围和可视化检查模型收敛性

R语言中的生存分析Survival analysis晚期肺癌患者4例

R语言极值理论 EVT、POT超阈值、GARCH 模型分析股票指数VaR、条件CVaR：多元化投资组合预测风险测度分析

R语言估计多元标记的潜过程混合效应模型（lcmm）分析心理测试的认知过程

相关课程

更多

高校精品课-北京理工大学-数据仓库与数据挖掘（下）

高校精品课-北京理工大学-数据仓库与数据挖掘（上）

大数据之R语言速成与实战

数据挖掘入门与实践

数据挖掘类比赛汇总

【算法实战】1. 机器学习基础

相关电子书

更多

信息检索与机器学习的华尔兹

阿里云机器学习技术与应用

机器学习之人机交互实战

相关实验场景

更多

自然语言入门：NLP数据读取与数据分析

下一篇

部署LAMP环境（Alibaba Cloud Linux 3）