《从Excel到R 数据分析进阶指南》一3.5 删除重复值

简介:

本节书摘来自异步社区《从Excel到R 数据分析进阶指南》一书中的第3章,第3.5节,作者 王彦平(蓝鲸),更多章节内容可以访问云栖社区“异步社区”公众号查看

3.5 删除重复值

很多数据表中还包含重复值的问题。Excel的数据目录下有“删除重复项”的功能,可以用来删除数据表中的重复值。默认Excel会保留最先出现的数据,删除后面重复出现的数据。


2adeecc89f64d936d81410c38a44e4ff7d0a08af

R中使用duplicated()函数查找重复值。duplicated()函数既可以查找数据表的重复值,也可以查找特定列中的重复值。发现重复值后使用unique()函数删除重复值。下面是具体的代码和比较结果。

#查找数据表重复值
duplicated(df)

#查找特定列的重复值
duplicated(df$city)

#查看数据表的唯一值(删除重复值)
df<-unique(df)


21e73f7deebac7946c1c5e8495c6893553c553f3
相关文章
|
6月前
|
机器学习/深度学习 人工智能 数据可视化
AI时代Excel数据分析提升之道
AI时代Excel数据分析提升之道
268 0
|
6月前
|
存储 数据可视化 数据挖掘
【数据分析入门】Numpy进阶
【数据分析入门】Numpy进阶
|
3月前
|
数据挖掘 数据安全/隐私保护 Python
【Python数据分析】<数据分析工具>基于Excel的数据分析
【1月更文挑战第22天】【Python数据分析】<数据分析工具>基于Excel的数据分析
|
2月前
|
机器学习/深度学习 人工智能 自然语言处理
巧用ChatGPT高效搞定Excel数据分析
随着人工智能技术的不断发展,越来越多的企业开始将其应用于办公场景,以提高员工的工作效率。而在众多办公软件中,Excel无疑是最常用的一款。然而,传统的Excel数据分析方法往往耗时且容易出错。
220 0
|
6月前
|
机器学习/深度学习 存储 数据挖掘
【100天精通Python】Day53:Python 数据分析_NumPy数据操作和分析进阶
【100天精通Python】Day53:Python 数据分析_NumPy数据操作和分析进阶
59 0
|
7月前
|
SQL 数据可视化 数据挖掘
Python 数据分析(四):Pandas 进阶
Python 数据分析(四):Pandas 进阶
68 0
Python 数据分析(四):Pandas 进阶
|
3月前
|
数据可视化 数据挖掘 Python
基于Python开发的Excel数据分析系统(源码+可执行程序+程序配置说明书+程序使用说明书)
基于Python开发的Excel数据分析系统(源码+可执行程序+程序配置说明书+程序使用说明书)
|
4月前
|
数据可视化 大数据 数据挖掘
最新Python大数据之Excel进阶
最新Python大数据之Excel进阶
48 0
|
9月前
|
数据挖掘 Python
【Python数据分析】用Python操作Excel,xlsxwriter的使用介绍
【Python数据分析】用Python操作Excel,xlsxwriter的使用介绍
|
4月前
|
BI 数据格式
如何快速将txt类型的日志文件转换为excel表格并进行数据分析报表统计图(如:饼图、折线图、柱状图)?
如何快速将txt类型的日志文件转换为excel表格并进行数据分析报表统计图(如:饼图、折线图、柱状图)?

热门文章

最新文章