《R语言数据挖掘:实用项目解析》——第1章,第1.5节索引或切分数据框

简介:

本节书摘来自华章出版社《R语言数据挖掘:实用项目解析》一书中的第1章,第1.5节索引或切分数据框,作者[印度]普拉迪帕塔·米什拉(Pradeepta Mishra),更多章节内容可以访问云栖社区“华章计算机”公众号查看

1.5 索引或切分数据框
在处理一个有着大量观测记录的客户数据集时,需要根据一些筛选规则和有无放回取样来切分数据集。索引是根据一些逻辑条件从数据框中提取数据子集的过程。subset函数的功能与索引一样,可用于从数据框中提取元素。


b1be0ae7d580428068b265042ad263170cd1f115

上述代码的意思是:从audit数据集中选取那些性别为女且年龄超过65岁的观测记录。应该用哪个命令来提取基于这两条规则的audit数据子集呢?本例中有10条观测记录满足前面的条件,上面的代码中输出了数据框的行号。类似的结果也可以使用subset函数获得。这里不使用which 函数,而应使用subset函数,因为后者在传递多个条件参数时效率更高。让我们看看subset函数的使用方法:


1ede2f0f161a6b5103f62ecc5e2d34404c745ba2

subset函数中的附加参数使这个函数更为高效,因为它提供了仅从数据框中选取满足逻辑条件的特定列这个附加益处。

相关文章
|
3月前
|
关系型数据库 MySQL 索引
【MySQL 解析】Hash索引和B+树索引对比分析
【1月更文挑战第11天】【MySQL 解析】Hash索引和B+树索引对比分析
|
2月前
|
存储 SQL 关系型数据库
MySQL - 深入解析MySQL索引数据结构
MySQL - 深入解析MySQL索引数据结构
|
1天前
|
安全 API 数据安全/隐私保护
Elasticsearch 通过索引阻塞实现数据保护深入解析
Elasticsearch 通过索引阻塞实现数据保护深入解析
|
8月前
|
存储
R语言笔记丨因子、数据框基础知识
R语言笔记丨因子、数据框基础知识
|
8月前
|
缓存 Cloud Native 区块链
重塑链上数据索引,Chainbase 云原生 Subgraph 解析
Subgraph 是 The Graph 去中心化应用索引协议的具体实现, 能为各个智能合约创建索引引擎,提供 dataset 数据集供开发者快速查询使用。目前,Chainbase 正式上线并托管的核心 dataset subgraph 数量已经超过 100+。
234 0
重塑链上数据索引,Chainbase 云原生 Subgraph 解析
|
4月前
|
存储 大数据 数据库
深入解析MSSQL聚簇索引:加速查询的利器
深入解析MSSQL聚簇索引:加速查询的利器
|
4月前
|
存储 定位技术 数据库
开启数据库性能之旅:MSSQL存储过程索引优化深度解析
开启数据库性能之旅:MSSQL存储过程索引优化深度解析
|
4月前
|
SQL 关系型数据库 MySQL
万字解析帮你深入理解MySQL!!!(事物、视图和索引)
万字解析帮你深入理解MySQL!!!(事物、视图和索引)
60 0
|
7月前
|
SQL 关系型数据库 MySQL
深入解析MySQL视图、索引、数据导入导出:优化查询和提高效率
索引是一种特殊的数据库结构,由数据表中的一列或多列组合而成,可以用来快速查询数据表中有某一特定值的记录。通过索引,查询数据时不用读完记录的所有信息,而只是查询索引列。否则,数据库系统将读取每条记录的所有信息进行匹配。索引可以根据一个或多个列的值进行排序和搜索,提高查询时的效率。MySQL索引(Index)是一种特殊的数据结构,建立在表的列上,旨在加快数据库查询的速度通过在索引列上创建索引,数据库可以更快地定位和访问特定值,而无需扫描整个数据表。索引可以应用于单个列或多个列的组合,可以按升序或。
|
8月前
R语言之数据框的合并
R语言之数据框的合并
159 1
R语言之数据框的合并

推荐镜像

更多