python-如何比较pandas groupby对象的列值并将其汇总到新的列行中
内容导读
互联网集市收集整理的这篇技术教程文章主要介绍了python-如何比较pandas groupby对象的列值并将其汇总到新的列行中,小编现在分享给大家,供广大互联网技能从业者学习和参考。文章包含1626字,纯文字阅读大概需要3分钟。
内容图文
![python-如何比较pandas groupby对象的列值并将其汇总到新的列行中](/upload/InfoBanner/zyjiaocheng/663/a4f69fce70754b43b100ffd244846d0e.jpg)
我有以下问题:我想在数据框中创建一列,以汇总一行中的所有值.然后,我想比较该列的行以创建包含所有列中所有值的单个行,但是每个值仅出现一次.例如:我有以下数据框
df1:
Column1 Column2
0 a 1,2,3
1 a 1,4,5
2 b 7,1,5
3 c 8,9
4 b 7,3,5
现在所需的输出将是:
df1_new:
Column1 Column2
0 a 1,2,3,4,5
1 b 1,3,5,7
2 c 8,9
我目前正在尝试的是result = df1.groupby(‘Column1’),但是然后我不知道如何比较分组对象行中的值,然后将它们写入新列并删除重复项.我通读了Group By的pandas文档:split-apply-combine,但找不到解决方法.我还想知道,一旦获得所需的输出,是否有一种方法可以检查df1_new的Column2中每个值在分组对象中有多少行出现.任何帮助,将不胜感激!
解决方法:
可以执行此操作的方法是在分组的DataFrame上应用函数.
此函数首先将系列(针对每个组)转换为列表,然后在列表中使用分割每个字符串,然后使用itertools.chain.from_iterable将完整列表链接到单个列表中,然后将其转换为set,这样就只有唯一值是左,然后对其进行排序,然后使用str.join转换回字符串.范例-
from itertools import chain
def applyfunc(x):
ch = chain.from_iterable(y.split(',') for y in x.tolist())
return ','.join(sorted(set(ch)))
df1_new = df1.groupby('Column1')['Column2'].apply(func1).reset_index()
演示-
In [46]: df
Out[46]:
Column1 Column2
0 a 1,2,3
1 a 1,4,5
2 b 7,1,5
3 c 8,9
4 b 7,3,5
In [47]: from itertools import chain
In [48]: def applyfunc(x):
....: ch = chain.from_iterable(y.split(',') for y in x.tolist())
....: return ','.join(sorted(set(ch)))
....:
In [49]: df.groupby('Column1')['Column2'].apply(func1).reset_index()
Out[49]:
Column1 Column2
0 a 1,2,3,4,5
1 b 1,3,5,7
2 c 8,9
内容总结
以上是互联网集市为您收集整理的python-如何比较pandas groupby对象的列值并将其汇总到新的列行中全部内容,希望文章能够帮你解决python-如何比较pandas groupby对象的列值并将其汇总到新的列行中所遇到的程序开发问题。 如果觉得互联网集市技术教程内容还不错,欢迎将互联网集市网站推荐给程序员好友。
内容备注
版权声明:本文内容由互联网用户自发贡献,该文观点与技术仅代表作者本人。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如发现本站有涉嫌侵权/违法违规的内容, 请发送邮件至 gblab@vip.qq.com 举报,一经查实,本站将立刻删除。
内容手机端
扫描二维码推送至手机访问。