《机器学习与R语言(原书第2版)》一2.4 总结

简介: 在本章中,我们学习了在R中管理数据的基础。从深入剖析用来存储不同类型数据的数据结构开始。R数据的基本结构是向量,它扩展和组合成更复杂的数据结构,比如,列表和数据框。数据框是与数据集概念相联系的R数据结构,数据框内同时有特征和案例。

本节书摘来自华章出版社《机器学习与R语言(原书第2版)》一书中的第2章,第2.4节,美] 布雷特·兰茨(Brett Lantz) 著,李洪成 许金炜 李舰 译更多章节内容可以访问云栖社区“华章计算机”公众号查看。

2.4 总结

在本章中,我们学习了在R中管理数据的基础。从深入剖析用来存储不同类型数据的数据结构开始。R数据的基本结构是向量,它扩展和组合成更复杂的数据结构,比如,列表和数据框。数据框是与数据集概念相联系的R数据结构,数据框内同时有特征和案例。R提供了从电子表格类的数据文件读取数据和把数据框写入电子表格类的数据文件的函数。
然后,我们探索了一个包含二手车价格的真实世界数据集。我们使用常用的中心趋势和分散程度统计量来检验数值变量,用散点图来可视化价格和里程表读数。我们用表格检验名义变量。在检验二手车数据时,我们采用一种可以用来理解所有数据集的探索分析过程。整本书的其他项目都要求这些技能。
既然我们花了些时间来理解R中数据管理的基础,我们就已经准备好了使用机器学习来解决真实世界的问题。第3章,我们将用最近邻方法处理我们的第一个分类任务。

相关文章
|
11天前
|
机器学习/深度学习 数据可视化 计算机视觉
【视频】机器学习交叉验证CV原理及R语言主成分PCA回归分析犯罪率|数据共享
【视频】机器学习交叉验证CV原理及R语言主成分PCA回归分析犯罪率|数据共享
|
1天前
|
机器学习/深度学习 数据采集 算法
数据分享|R语言机器学习预测案例合集:众筹平台、机票折扣、糖尿病患者、员工满意度
数据分享|R语言机器学习预测案例合集:众筹平台、机票折扣、糖尿病患者、员工满意度
|
1天前
|
机器学习/深度学习 算法 数据挖掘
【C 言专栏】C 语言与机器学习的应用
【5月更文挑战第6天】C语言在机器学习中扮演关键角色,以其高效性、灵活性和可移植性实现底层算法、嵌入式系统和高性能计算。在神经网络、决策树和聚类算法等领域的实现中不可或缺。C语言被用于TensorFlow和OpenCV等知名库的底层,常与C++、Python结合使用。尽管面临开发难度和适应新算法的挑战,但C语言在机器学习领域的价值和潜力将持续展现,为科技进步贡献力量。
【C 言专栏】C 语言与机器学习的应用
|
1天前
|
数据可视化
R语言机器学习方法分析二手车价格影响因素
R语言机器学习方法分析二手车价格影响因素
|
8天前
|
机器学习/深度学习 测试技术 数据处理
【视频】R语言机器学习高维数据应用:Lasso回归和交叉验证预测房屋市场租金价格
【视频】R语言机器学习高维数据应用:Lasso回归和交叉验证预测房屋市场租金价格
|
12天前
|
机器学习/深度学习 数据采集 人工智能
使用R语言进行机器学习的初学者指南
【4月更文挑战第25天】本文是R语言机器学习初学者指南,介绍了R语言在统计分析和机器学习中的应用。首先,简述R语言的背景及特点,包括其丰富的统计功能和扩展性。接着,指导如何安装和配置R语言及RStudio,以及设置国内R包安装源。然后,讲解R语言的基础知识,如数据类型、变量、数据结构和控制结构。此外,文中还推荐了几个常用的机器学习库,如caret、gbm、RandomForest和xgboost。最后,通过一个线性回归模型实例,展示了使用R语言进行机器学习的基本流程,包括数据准备、预处理、模型训练、评估和预测。
|
20天前
|
机器学习/深度学习
R语言计量经济学与有时间序列模式的机器学习预测
R语言计量经济学与有时间序列模式的机器学习预测
|
21天前
|
机器学习/深度学习 C++
R语言机器学习实战之多项式回归
R语言机器学习实战之多项式回归
|
21天前
|
机器学习/深度学习 算法 前端开发
如何用R语言在机器学习中建立集成模型?
如何用R语言在机器学习中建立集成模型?
|
6月前
|
机器学习/深度学习 数据采集 算法
r语言机器学习逻辑回归代码实战 结果分析和折线图
r语言机器学习逻辑回归代码实战 结果分析和折线图
52 1

热门文章

最新文章