《R语言数据挖掘:实用项目解析》——导读

简介:


image

前  言

随着数据规模和种类的增长,应用数据挖掘技术从大数据中提取有效信息变得至关重要。这是因为企业认为有必要从大规模数据的实施中获得相应的投资回报。实施数据挖掘的根本性原因是要从大型数据库中发现隐藏的商机,以便利益相关者能针对未来业务做出决策。数据挖掘不仅能够帮助企业降低成本以及提高收益,还能帮助他们发现新的发展途径。

本书将介绍使用R语言(一种开源工具)进行数据挖掘的基本原理。R是一门免费的程序语言,同时也是一个提供统计计算、图形数据可视化和预测建模的软件环境,并且可以与其他工具和平台相集成。本书将结合R语言在示例数据集中的应用来阐释数据挖掘原理。

本书将阐述数据挖掘的一些主题,如数学表述、在软件环境中的实现,以及如何据此来解决商业问题。本书的设计理念是,读者可以从数据管理技术、探索性数据分析、数据可视化等内容着手学习,循序渐进,直至建立高级预测模型(如推荐系统、神经网络模型)。本书也从数据科学、分析学、统计建模以及可视化等角度对数据挖掘这一概念进行了综述。

目  录

[第1章 使用R内置数据进行数据处理
1.1 什么是数据挖掘 ](https://yq.aliyun.com/articles/117846/)
1.2 R语言引论
1.2.1 快速入门
1.2.2 数据类型、向量、数组与矩阵
1.2.3 列表管理、因子与序列
1.2.4 数据的导入与导出
1.3 数据类型转换
1.4 排序与合并数据框
1.5 索引或切分数据框
1.6 日期与时间格式化
1.7 创建新函数
1.7.1 用户自定义函数
1.7.2 内置函数
1.8 循环原理——for循环
1.9 循环原理——repeat循环
1.10 循环原理——while循环
1.11 apply原理
1.12 字符串操作
1.13 缺失值(NA)的处理
小结
[第2章 汽车数据的探索性分析
2.1 一元分析 ](https://yq.aliyun.com/articles/117913/)
2.2 二元分析
2.3 多元分析
2.4 解读分布和变换
2.4.1 正态分布
2.4.2 二项分布
2.4.3 泊松分布
2.5 解读分布
2.6 变量分段
2.7 列联表、二元统计及数据正态性检验
2.8 假设检验
2.8.1 总体均值检验
2.8.2 双样本方差检验
2.9 无参数方法
2.9.1 Wilcoxon符号秩检验
2.9.2 Mann-Whitney-Wilcoxon检验
2.9.3 Kruskal-Wallis检验
小结

相关文章
|
1天前
|
移动开发 数据可视化
R语言两层2^k析因试验设计(因子设计)分析工厂产量数据和Lenth方法检验显著性可视化|数据分享(二)
R语言两层2^k析因试验设计(因子设计)分析工厂产量数据和Lenth方法检验显著性可视化|数据分享(二)
|
1天前
|
自然语言处理 算法 数据挖掘
【视频】文本挖掘:主题模型(LDA)及R语言实现分析游记数据
【视频】文本挖掘:主题模型(LDA)及R语言实现分析游记数据
|
2天前
|
数据挖掘 算法
灰色关联分析(Grey Relation Analysis,GRA)中国经济社会发展指标
灰色关联分析(Grey Relation Analysis,GRA)中国经济社会发展指标
17 0
灰色关联分析(Grey Relation Analysis,GRA)中国经济社会发展指标
|
2天前
|
数据挖掘
R语言预测期货波动率的实现:ARCH与HAR-RV与GARCH,ARFIMA模型比较
R语言预测期货波动率的实现:ARCH与HAR-RV与GARCH,ARFIMA模型比较
14 0
R语言预测期货波动率的实现:ARCH与HAR-RV与GARCH,ARFIMA模型比较
|
2天前
|
存储 资源调度 数据可视化
R语言STAN贝叶斯线性回归模型分析气候变化影响北半球海冰范围和可视化检查模型收敛性
R语言STAN贝叶斯线性回归模型分析气候变化影响北半球海冰范围和可视化检查模型收敛性
27 7
|
2天前
|
数据可视化 数据挖掘
R语言中的生存分析Survival analysis晚期肺癌患者4例
R语言中的生存分析Survival analysis晚期肺癌患者4例
67 7
|
2天前
|
数据挖掘 C语言
R语言极值理论 EVT、POT超阈值、GARCH 模型分析股票指数VaR、条件CVaR:多元化投资组合预测风险测度分析
R语言极值理论 EVT、POT超阈值、GARCH 模型分析股票指数VaR、条件CVaR:多元化投资组合预测风险测度分析
39 6
|
2天前
R语言估计多元标记的潜过程混合效应模型(lcmm)分析心理测试的认知过程
R语言估计多元标记的潜过程混合效应模型(lcmm)分析心理测试的认知过程
18 0