《数据科学:R语言实现》——2.5 使用Excel文件

简介:

本节书摘来自华章出版社《数据科学:R语言实现》一 书中的第2章,第2.5节,作者:R for Data Science Cookbook 丘祐玮(David Chiu),更多章节内容可以访问云栖社区“华章计算机”公众号查看。

2.5 使用Excel文件

Excel是另一种存储和分析数据的常用工具。当然,我们可以把Excel文件转化为CSV文件或者其他文件格式。你也可以在R中安装加载xlsx程序包,来读取和处理Excel数据。
准备工作
在本教程中,你需要给开发环境安装R,同时确保计算机可以访问互联网。
实现步骤
执行下列步骤,读取Excel文档。
1.首先,安装加载xlsx程序包:
screenshot
screenshot

运行原理
在本教程中,我们介绍了如何使用xlsx程序包读取和写入包含世界经济指标的Excel文件。首先,我们需要安装加载xlsx程序包。它允许用户通过R命令,使用Java POI包,读取和写入Excel文件。因此,要使用Java POI包,我们也需要同时安装rJava和xlsxjars。你可以在libraryxlsx]jarsjava下找到Java POI的.jar文件。以作者的计算机为例,它安装了Windows 7操作系统,.jar文件位于C:Program FilesRR-3.2.1libraryxlsxjarsjava路径下。
然后,我们使用函数download.file从链接 data.worldbank.org/topic/economy-and-growth下载世界经济指标数据。download.file默认下载文件为ASCII编码。要下载二进制文件,我们需要设定下载模式为wb。
下载Excel文件之后,我们可以使用Excel查看。Excel文件的截图说明经济指标从第1页的第4行开始。因此,我们可以使用函数read.xlsx2从这个位置读取数据。xlsx程序包提供了两个函数来读取Excel中的数据:read.xlsx和read.xlsx2。因为函数read.xlsx2主要处理Java中的数据,因此read.xlsx2的性能要好些(特别的,read.xlsx2在处理多于100000个数值的数据集时相当快)。
当把工作单的内容都读取到R的数据框后,我们可以从R数据框中选取变量Country.Name、Country.Code、Indicator.Name、Indicator.Code和X2014,然后使用函数dim查看数据框的维度。最后,我们可以使用write.xlsx2把转换后的数据写入一个Excel文件2014wbdata.xlsx中。

目录
打赏
0
0
0
0
1408
分享
相关文章
【全自动改PDF名】批量OCR识别提取PDF自定义指定区域内容保存到 Excel 以及根据PDF文件内容的标题来批量重命名
学校和教育机构常需处理成绩单、报名表等PDF文件。通过OCR技术,可自动提取学生信息并录入Excel,便于统计分析和存档管理。本文介绍使用阿里云服务实现批量OCR识别、内容提取、重命名及导出表格的完整步骤,包括开通相关服务、编写代码、部署函数计算和设置自动化触发器等。提供Python示例代码和详细操作指南,帮助用户高效处理PDF文件。 链接: - 百度网盘:[链接](https://pan.baidu.com/s/1mWsg7mDZq2pZ8xdKzdn5Hg?pwd=8866) - 腾讯网盘:[链接](https://share.weiyun.com/a77jklXK)
137 5
【图片型PDF】批量识别扫描件PDF指定区域局部位置内容,将识别内容导出Excel表格或批量改名文件,基于阿里云OCR对图片型PDF识别改名案例实现
在医疗和政务等领域,图片型PDF文件(如病历、报告、公文扫描件)的处理需求广泛。通过OCR技术识别这些文件中的文字信息,提取关键内容并保存为表格,极大提高了信息管理和利用效率。本文介绍一款工具——咕嘎批量OCR系统,帮助用户快速处理图片型PDF文件,支持区域识别、内容提取、导出表格及批量改名等功能。下载工具后,按步骤选择处理模式、进行区域采样、批量处理文件,几分钟内即可高效完成数百个文件的处理。
210 8
FastExcel:开源的 JAVA 解析 Excel 工具,集成 AI 通过自然语言处理 Excel 文件,完全兼容 EasyExcel
FastExcel 是一款基于 Java 的高性能 Excel 处理工具,专注于优化大规模数据处理,提供简洁易用的 API 和流式操作能力,支持从 EasyExcel 无缝迁移。
474 9
FastExcel:开源的 JAVA 解析 Excel 工具,集成 AI 通过自然语言处理 Excel 文件,完全兼容 EasyExcel
|
4月前
|
按条件将Excel文件拆分到不同的工作表
使用Python的pandas库,可以轻松将Excel文件按条件拆分到不同的工作表中。本文通过一个示例代码展示了如何生成一个包含总成绩表和三个班级表的Excel文件。代码首先创建了一个包含学生姓名、班级和各科成绩的数据框,然后按班级分组,将每个班级的数据分别写入不同的工作表。最后,生成的Excel文件将包含四个工作表,分别为总成绩表和三个班级的成绩表。
65 6
按条件将Excel文件拆分到不同的工作表
|
4月前
|
批量将不同的工作簿合并到同一个Excel文件
本文介绍如何使用Python的`pandas`库批量合并不同工作簿至同一Excel文件。通过模拟生成三个班级的成绩数据,分别保存为Excel文件,再将这些文件合并成一个包含所有班级成绩的总成绩单。步骤包括安装必要库、生成数据、保存与合并工作簿。
98 6
|
4月前
|
按条件将Excel文件拆分到不同的工作表
使用Python的pandas库,可以轻松将Excel文件按条件拆分为多个工作表。本文通过一个具体示例,展示了如何根据学生班级将成绩数据拆分到不同的工作表中,并生成一个包含总成绩表和各班级成绩表的Excel文件。代码简洁明了,适合初学者学习和应用。
84 6
|
5月前
|
实现Excel文件和其他文件导出为压缩包,并导入
实现Excel文件和其他文件导出为压缩包,并导入
84 1
|
5月前
|
Java实现导出多个excel表打包到zip文件中,供客户端另存为窗口下载
Java实现导出多个excel表打包到zip文件中,供客户端另存为窗口下载
335 4
Vue导出el-table表格为Excel文件的两种方式
Vue导出el-table表格为Excel文件的两种方式
303 6
前端基于XLSX实现数据导出到Excel表格,以及提示“文件已经被损坏,无法打开”的解决方法
前端基于XLSX实现数据导出到Excel表格,以及提示“文件已经被损坏,无法打开”的解决方法
446 0

热门文章

最新文章

AI助理

你好,我是AI助理

可以解答问题、推荐解决方案等