Excel 行列转换的最简方法-阿里云开发者社区

Excel 行列转换的最简方法

2019-03-26 2122

版权

本文内容由阿里云实名注册用户自发贡献，版权归原作者所有，阿里云开发者社区不拥有其著作权，亦不承担相应法律责任。具体规则请查看《阿里云开发者社区用户服务协议》和《阿里云开发者社区知识产权保护指引》。如果您发现本社区中有涉嫌抄袭的内容，填写侵权投诉表单进行举报，一经查实，本社区将立刻删除涉嫌侵权内容。

简介： 问题描述在工作中时常会遇到对 Excel 表格的处理。当编辑一张 Excel 表格时，发现表格的列数太多，而行数较少，为方便打印，这时你或许会希望将该表格行列转换；或许是为了做进一步做统计分析，当前格式不太方便，这时也会用到行列转换。

问题描述
在工作中时常会遇到对 Excel 表格的处理。当编辑一张 Excel 表格时，发现表格的列数太多，而行数较少，为方便打印，这时你或许会希望将该表格行列转换；或许是为了做进一步做统计分析，当前格式不太方便，这时也会用到行列转换。

下面这种交叉式的 Excel 表是很常见的格式，用来填写和查看都比较方便：

但是，如果想做进一步的统计分析，这种格式就不方便了，需要行列转换，变成如下格式的明细表：

显然，手工操作会非常麻烦，若数据量小还可以，数据量大了会耗费大量时间，简直就是灾难。

我们就以此为例，举例说明几种常见的解决方法。

解决方法
方法 1：Excel 数据透视表
Excel 可以通过数据透视表支持行列转换功能，效果如下图：

显然，这并不是我们想要的格式。Excel 的数据透视表可以满足简单格式的行列转换，但如果格式稍微复杂，转换效果往往是不尽人意。

方法 2：编程语言
以写程序来解决，思路也很简单：

· 加载 excel 文件，装载需要的 sheet 工作表。

· 读取“账套名”所在行，将其转换成字符串数组。

· 读取“科目编码”所在列，将其转换成字符串数组。

· 按“科目编码”分组，与“账套名”数组构造一张表。

· 根据“账套名”对应的数据，遍历所有的明细值填充到相应的表中。

· 这样就可以构造出对应的明细表来。

如果用 Java 来实现，初步估计代码量也不会少于 200 行，若需要结果输出成 excel 文件则开发工作量会更多。虽然 Excel 自己提供了 VBA，但那个麻烦程度谁用谁知道，不提也罢。那其它的语言呢？传说 python 有处理行列转换的功能（pandas 包里有 pivot 功能），代码量相对于 java 会少很多，我们来试一下：

import pandas as pd
import numpy as np

df = pd.read_excel("D:\\excel\\pandas.xlsx", 0, 3)
cols = df.columns.values.tolist() #获取数据头信息

#移去前两列，只保留需要行列转换的列
cols.remove('科目编码')
cols.remove('科目明细')

#构造一个 list.
frames=[]
for col in cols:
    df1 = df.pivot_table(index = ['科目编码','科目明细'], values = [col])
    df1.rename(columns={col: '数值'}, inplace=True)
    df1[3]=col
    #转换后的数据追加到 frames 中.
    frames.append(df1)

# concat 将相同字段的表首尾相接
result=pd.concat(frames)
result.rename(columns={3: '帐套名'}, inplace=True)
result.to_excel('D:\\excel\\pandas_n.xlsx', sheet_name='科目明细')

效果还不错，果然比较简洁！这是 Python 生成的 excel 文件：

不过，存在一点小问题，这个 excel 格式有点特殊，想用 Python 的 pivot，我们要将“科目编码”，“科目明细”移到与转换列标题所在同一行上，变成下面的样子。否则在代码上就得特殊 “照顾”，反正只有一行，手工做一下就算了，比写代码省事。

无论如何，python 的这个细节处理的小“瑕疵”并不影响其方便性。python 确实名不虚传，虽然使用了循环，但整个代码也就只有 10 来行的样子。

还能更简单吗？

嘿嘿，能！

方法 3：集算器编程
下面我们来看集算器的代码：

代码很简单，我们把每一步的中间结果列出来看看：

A1：加载 excel 文件工作表 1，提取指定范围的数据 (从 3 行到 40 行)，其中选项 @ t 表示首行为标题，载入数据, 生成表格如下：

A2：删除非数据行

A3：更换列名称

A4：把从第 3 列开始的列名称连成字符串，用“,”分开

A5：pivot 函数将行列数据进行转换，把 A4 中对应的列数据置放到“数值”列

A6：将整理好的数据另存储为 xlsx 文件

集算器脚本只有 6 行，木有啥循环、判断之类的玩意儿，也不像 Python 那样要先手工倒腾一下，就把这看似有点“乱”的数据表格处理好了。相比之下，Python 采用列优先转换多次循环 “N”字方式，集算器则用行优先一次性处理，在处理数据上，集算器对细节处理及使用习惯更专业。而且集算器的开发环境也容易调试，可以看到每一步运算的中间结果，方便挑出错误，开发更为便捷。在这种常规数据处理的任务中，集算器要比 Python 更为优越。