python – Pandas:合并多个数据帧和控制列名?
内容导读
互联网集市收集整理的这篇技术教程文章主要介绍了python – Pandas:合并多个数据帧和控制列名?,小编现在分享给大家,供广大互联网技能从业者学习和参考。文章包含3037字,纯文字阅读大概需要5分钟。
内容图文
我想将九个Pandas数据帧合并到一个数据帧中,在两列上进行连接,控制列名.这可能吗?
我有九个数据集.所有这些都有以下列:
org, name, items,spend
我想将它们加入到包含以下列的单个数据框中:
org, name, items_df1, spend_df1, items_df2, spend_df2, items_df3...
我一直在阅读merging and joining上的文档.我现在可以合并两个数据集,如下所示:
ad = pd.DataFrame.merge(df_presents, df_trees,
on=['practice', 'name'],
suffixes=['_presents', '_trees'])
这很好用,打印列表(aggregate_data.columns.values)显示以下列:
[org', u'name', u'spend_presents', u'items_presents', u'spend_trees', u'items_trees'...]
但是我如何为九列做到这一点?合并似乎只是一次接受两个,如果我按顺序执行,我的列名将最终非常混乱.
解决方法:
您可以使用functools.reduce迭代地将pd.merge应用于每个DataFrame:
result = functools.reduce(merge, dfs)
这相当于
result = dfs[0]
for df in dfs[1:]:
result = merge(result, df)
要传递on = [‘org’,’name’]参数,可以使用functools.partial定义合并函数:
merge = functools.partial(pd.merge, on=['org', 'name'])
由于在functools.partial中指定后缀参数只允许
一个固定的后缀选择,因为在这里我们需要一个不同的后缀
pd.merge调用,我认为准备DataFrames列是最容易的
调用pd.merge之前的名字:
for i, df in enumerate(dfs, start=1):
df.rename(columns={col:'{}_df{}'.format(col, i) for col in ('items', 'spend')},
inplace=True)
例如,
import pandas as pd
import numpy as np
import functools
np.random.seed(2015)
N = 50
dfs = [pd.DataFrame(np.random.randint(5, size=(N,4)),
columns=['org', 'name', 'items', 'spend']) for i in range(9)]
for i, df in enumerate(dfs, start=1):
df.rename(columns={col:'{}_df{}'.format(col, i) for col in ('items', 'spend')},
inplace=True)
merge = functools.partial(pd.merge, on=['org', 'name'])
result = functools.reduce(merge, dfs)
print(result.head())
产量
org name items_df1 spend_df1 items_df2 spend_df2 items_df3 0 2 4 4 2 3 0 1
1 2 4 4 2 3 0 1
2 2 4 4 2 3 0 1
3 2 4 4 2 3 0 1
4 2 4 4 2 3 0 1
spend_df3 items_df4 spend_df4 items_df5 spend_df5 items_df6 0 3 1 0 1 0 4
1 3 1 0 1 0 4
2 3 1 0 1 0 4
3 3 1 0 1 0 4
4 3 1 0 1 0 4
spend_df6 items_df7 spend_df7 items_df8 spend_df8 items_df9 spend_df9
0 3 4 1 3 0 1 2
1 3 4 1 3 0 0 3
2 3 4 1 3 0 0 0
3 3 3 1 3 0 1 2
4 3 3 1 3 0 0 3
内容总结
以上是互联网集市为您收集整理的python – Pandas:合并多个数据帧和控制列名?全部内容,希望文章能够帮你解决python – Pandas:合并多个数据帧和控制列名?所遇到的程序开发问题。 如果觉得互联网集市技术教程内容还不错,欢迎将互联网集市网站推荐给程序员好友。
内容备注
版权声明:本文内容由互联网用户自发贡献,该文观点与技术仅代表作者本人。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如发现本站有涉嫌侵权/违法违规的内容, 请发送邮件至 gblab@vip.qq.com 举报,一经查实,本站将立刻删除。
内容手机端
扫描二维码推送至手机访问。