我的数据框有一个包含字典列表的列。如何将其转换为扩展的数据帧?数据帧如图所示。
A B C
123 abc [{"name":"john"},{"age":"28"},{"salary":"50000"}]
345 bcd [{"name":"alex"},{"age":"38"},{"salary":"40000"}]
567 xyx [{"name":"Dave"},{"age":"82"},{"salary":"30000"}]
我尝试了以下内容
df1=pd.concat([pd.DataFrame(x) for x
indf['C']],keys=df['A']).reset_index(level=1, drop=True).reset_index()
最终输出看起来像
A B name salary age
123 abc john 50000 28
345 bcd alex 40000 38
567 xyx Dave 30000 82
IIUC,将你list的dicts 压缩成一个dict,然后我们使用dataframe构造函数,只需要concat回到原始的df
from itertools import chain
s=pd.DataFrame([dict(chain(*map(dict.items,x))) for x in df.pop('C').tolist()],index=df.index)
s
age name salary
0 28 john 50000
1 38 alex 40000
2 82 Dave 30000
s=pd.concat([df,s],1)
s
A B age name salary
0 123 abc 28 john 50000
1 345 bcd 38 alex 40000
2 567 xyx 82 Dave 30000
数据输入 :
df.to_dict()
{'A': {0: 123, 1: 345, 2: 567}, 'B': {0: 'abc', 1: 'bcd', 2: 'xyx'}, 'C': {0: [{'name': 'john'}, {'age': '28'}, {'salary': '50000'}], 1: [{'name': 'alex'}, {'age': '38'}, {'salary': '40000'}], 2: [{'name': 'Dave'}, {'age': '82'}, {'salary': '30000'}]}}
版权声明:本文内容由阿里云实名注册用户自发贡献,版权归原作者所有,阿里云开发者社区不拥有其著作权,亦不承担相应法律责任。具体规则请查看《阿里云开发者社区用户服务协议》和《阿里云开发者社区知识产权保护指引》。如果您发现本社区中有涉嫌抄袭的内容,填写侵权投诉表单进行举报,一经查实,本社区将立刻删除涉嫌侵权内容。