python – 基于多列删除数据框架之间的交集
内容导读
互联网集市收集整理的这篇技术教程文章主要介绍了python – 基于多列删除数据框架之间的交集,小编现在分享给大家,供广大互联网技能从业者学习和参考。文章包含2050字,纯文字阅读大概需要3分钟。
内容图文
我有这两个数据帧:
df_test
dimension1_id dimension2_id dimension3_id dimension4_id dimension5_id 0 -1 -1 -1 -1 -1
1 1177314888 238198786 5770904146 133207291 Exact
2 1177314888 238198786 5770904266 18395155770 Exact
3 1177314888 238198786 5770904266 19338210057 Exact
4 1177314888 238198786 5770904266 30907903234 Exact
和
df_merge
dimension1_id dimension2_id dimension3_id dimension4_id dimension5_id 0 -1 -1 -1 -1 -1
1 1177314888 238198786 5770904146 133207291 Exact
我想根据dimension1_id,dimension2_id,dimension3_id,dimension4_id和dimension5_id的组合,从df_test中删除df_merge中的所有内容.
这是我的代码:
df_test = df_test[
(df_test['dimension5_id'].isin(df_merge.dimension5_id) == False) &
(df_test['dimension4_id'].isin(df_merge.dimension4_id) == False) & (df_test['dimension3_id'].isin(df_merge.dimension3_id) == False) & (df_test['dimension2_id'].isin(df_merge.dimension2_id) == False) &
(df_test['dimension1_id'].isin(df_merge.dimension1_id) == False)
]
但是这段代码返回一个空数据框.如何从df_test中删除第一行和第二行?
解决方法:
您可以使用逻辑索引通过应用直接比较来屏蔽所需的行.在这种情况下,您可以检查df_test中df_merge中的值:
df_test.isin(df_merge)
生成的逻辑索引充当掩码:
dimension1_id dimension2_id dimension3_id dimension4_id dimension5_id 0 True True True True True True
1 True True True True True True
2 False False False False False False
3 False False False False False False
4 False False False False False False
真值映射到匹配的行,所以我们可以使用?来简单地否定索引,只返回df_merge中不是df_test的行:
df_test[~df_test.isin(df_merge)]
内容总结
以上是互联网集市为您收集整理的python – 基于多列删除数据框架之间的交集全部内容,希望文章能够帮你解决python – 基于多列删除数据框架之间的交集所遇到的程序开发问题。 如果觉得互联网集市技术教程内容还不错,欢迎将互联网集市网站推荐给程序员好友。
内容备注
版权声明:本文内容由互联网用户自发贡献,该文观点与技术仅代表作者本人。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如发现本站有涉嫌侵权/违法违规的内容, 请发送邮件至 gblab@vip.qq.com 举报,一经查实,本站将立刻删除。
内容手机端
扫描二维码推送至手机访问。