每次遇到新值时,Python cumsum都会递增

互联网集市收集整理的这篇技术教程文章主要介绍了每次遇到新值时,Python cumsum都会递增，小编现在分享给大家，供广大互联网技能从业者学习和参考。文章包含1318字，纯文字阅读大概需要2分钟。

来自R,代码将是

x       <- data.frame(vals = c(100,100,100,100,100,100,200,200,200,200,200,200,200,300,300,300,300,300))
x$state <- cumsum(c(1, diff(x$vals) != 0))

每次行之间的差异为非零时都会标记,以便我可以使用它来查找数据中的转换,如下所示：

   vals state
1   100     1
...
7   200     2
...
14  300     3

什么是Python中的干净等价物？

补充问题

原始问题的答案发布在下面,但对于带有pandas的分组数据框将无法正常工作.

数据：https://pastebin.com/gEmPHAb7.请注意,有2个不同的文件名.

当导入为df_all时,我使用以下内容对其进行分组,然后应用下面发布的解决方案.

df_grouped = df_all.groupby("filename")
df_all["state"] = (df_grouped['Fit'].diff() != 0).cumsum()

解决方法:

使用diff和cumsum,如在R示例中：

df['state'] = (df['vals'].diff()!= 0).cumsum()

这使用True具有整数值1的事实

奖金问题

df_grouped = df_all.groupby("filename")
df_all["state"] = (df_grouped['Fit'].diff() != 0).cumsum()

我想你误解了groupby的作用.所有groupby都是基于标准创建组(在此实例中为文件名).然后,您需要告诉添加另一个操作,以告知该组需要发生什么.
常见操作是平均值,总和或更高级的应用和转换.
您可以在here或here找到更多信息

如果您可以更详细地解释您希望通过groupby实现的目标,我可以帮助您找到正确的方法.如果你想对每个文件名执行上述操作,你可能需要这样的东西：

def get_state(group):
    return (group.diff()!= 0).cumsum()

df_all['state'] = df_all.groupby('filename')['Fit'].transform(get_state)

以上是互联网集市为您收集整理的每次遇到新值时,Python cumsum都会递增全部内容，希望文章能够帮你解决每次遇到新值时,Python cumsum都会递增所遇到的程序开发问题。如果觉得互联网集市技术教程内容还不错，欢迎将互联网集市网站推荐给程序员好友。

版权声明：本文内容由互联网用户自发贡献，该文观点与技术仅代表作者本人。本站仅提供信息存储空间服务，不拥有所有权，不承担相关法律责任。如发现本站有涉嫌侵权/违法违规的内容，请发送邮件至 gblab@vip.qq.com 举报，一经查实，本站将立刻删除。

扫描二维码推送至手机访问。

来源：【匿名】