日志服务IPython/Jupyter扩展实战：下载数据为Excel文件

2019-02-12 4523

版权

本文内容由阿里云实名注册用户自发贡献，版权归原作者所有，阿里云开发者社区不拥有其著作权，亦不承担相应法律责任。具体规则请查看《阿里云开发者社区用户服务协议》和《阿里云开发者社区知识产权保护指引》。如果您发现本社区中有涉嫌抄袭的内容，填写侵权投诉表单进行举报，一经查实，本社区将立刻删除涉嫌侵权内容。

本文涉及的产品

对象存储 OSS，20GB 3个月

对象存储 OSS，内容安全 1000 次 1年

对象存储OSS，敏感数据保护2.0 200GB 1年

简介： 想要将日志服务的日志下载并保存为Excel或者CSV格式，并且自动处理字段不一致的情况的话，该怎么办？通过使用日志服务IPython/Jupyter扩展，轻松做到这点。

问题

日志服务的数据并不要求统一格式，每条日志可以有不同的关键字集合，例如:

{"city": "123", "province": "vvv"}
{"city": "shanghai", "pop": "2000"}
{"name": "xiao ming", "home": "shanghai"}
        
          
        
        
        
          
          AI 代码解读

因此一般使用日志服务的CLI下载的命令get_log_all或者pull_log_dump时，格式都是单行JSON格式以保证灵活性。

但是大部分情况下，一个日志库的所有日志的关键字集合总体是稳定的；另一方面，Excel格式（或者更简单的CSV格式）相对JSON更加商业应用和人类操作友好一些。

如果期望下载下来时是Excel或者CSV格式，并且自动处理字段不一致的情况的话，该怎么办？

本文通过使用日志服务IPython/Jupyter扩展，轻松做到这点。

前提

安装日志服务扩展

首先，参考文章日志服务IPythonIPython/Jupyter扩展完成安装（IPython Shell、IPython/Jupyter Notebook或者Jupyter Lab均可）

安装Excel相关组件

在IPython所在环境中安装Excel读写的相关组件：

pip install openpyxl xlrd xlwt XlsxWriter
        
          
        
        
        
          
          AI 代码解读

openpyxl - 用于Excel 2010 xlsx/xlsm文件的读写
xlrd - 读取Exce (xls格式）
xlwt - 写Excel (xls格式）
XlsxWriter - 写Excel (xlsx)文件

配置

使用%manage_log配置好链接日志服务的相关入口、秘钥、项目和日志库等。具体参考这里。

场景

1. 将结果保存到Excel中

通过查询命令%%log查询得到Pandas Dataframe，然后调用to_excel即可。

样例：

%%log -1day ~ now
* | select date_format(date_trunc('hour', __time__), '%H:%i') as dt,
        count(1)%100 as pv,
        round(sum(if(status < 400, 1, 0))*100.0/count(1), 1) AS ratio
        group by date_trunc('hour', __time__)
        order by dt limit 1000
        
          
        
        
        
          
          AI 代码解读

df1 = log_df
df1.to_excel('output.xlsx')
        
          
        
        
        
          
          AI 代码解读

2. 将结果保存到Excel多个Sheet中

通过%log或%%log获得多个数据存在不同的Dataframe中后，如下样例操作：

import pandas as pd
writer = pd.ExcelWriter('output2.xlsx') 

df1.to_excel(writer, sheet_name='data1')
df2.to_excel(writer, sheet_name='data2')

writer.save()
        
          
        
        
        
          
          AI 代码解读

3. 定制Excel细节格式

Pandas默认使用Xlwt模块写xls文件、使用Openpyxl模块写xlsx文件。而使用XlsxWriter写xlsx功能更加全面灵活，但需要如下配置。

例如上面例子中的ExcelWriter构造时，增加参数即可：

writer = pd.ExcelWriter('output2.xlsx', engine='xlsxwriter') 
        
          
        
        
        
          
          AI 代码解读

可以定制特定列的格式、样式、甚至直接画Excel图表。具体推荐参考这篇文章。

4. 其他格式

Pandas DataFrame还可以保存其他格式，例如csv、html等，可以进一步参考这里。

进一步参考

日志服务IPythonIPython/Jupyter扩展
Using Excel with pandas
Working with Python Pandas and XlsxWriter
Pandas IO Tools
扫码加入官方钉钉群 (11775223):

日志服务IPython/Jupyter扩展实战：下载数据为Excel文件

问题

前提

安装日志服务扩展

安装Excel相关组件

配置

场景

1. 将结果保存到Excel中

2. 将结果保存到Excel多个Sheet中

3. 定制Excel细节格式

4. 其他格式

进一步参考

云存储

热门文章

最新文章

相关产品

相关课程

相关电子书

相关实验场景

探索云世界

热门

云计算

大数据

云原生

人工智能

数据库

开发与运维

日志服务IPython/Jupyter扩展实战：下载数据为Excel文件

问题

前提

安装日志服务扩展

安装Excel相关组件

配置

场景

1. 将结果保存到Excel中

2. 将结果保存到Excel多个Sheet中

3. 定制Excel细节格式

4. 其他格式

进一步参考

云存储

热门文章

最新文章

相关产品

相关课程

相关电子书

相关实验场景