python-在多列中用np.nan替换各种重复的值
内容导读
互联网集市收集整理的这篇技术教程文章主要介绍了python-在多列中用np.nan替换各种重复的值,小编现在分享给大家,供广大互联网技能从业者学习和参考。文章包含1612字,纯文字阅读大概需要3分钟。
内容图文
![python-在多列中用np.nan替换各种重复的值](/upload/InfoBanner/zyjiaocheng/670/54c9cb43ae304879a8c26636a066dbad.jpg)
我正在尝试在pandas df中的多个列之间替换重复值.对于下面的df,我有相应于这些日期的日期和值.每个日期的所有值均相同.我只想保留每个日期的第一个值,并用np.nan替换以下重复的值.以下是我的尝试:
import pandas as pd
import numpy as np
d = ({
'Date' : ['1/1/18','1/1/18','1/1/18','2/1/18','2/1/18','3/2/18','3/2/18','3/2/18'],
'Val_D' : [10,10,10,22,22,10,10,10],
'Val_M' : [100,100,100,100,100,240,240,240],
})
df = pd.DataFrame(data = d)
df['Date'] = pd.to_datetime(df['Date'], format= '%d/%m/%y')
pd.Series([10,22,100,240]).duplicated()
dup = df.apply(pd.Series.duplicated, axis = 1)
df = df.where(~dup,np.nan)
print(df)
预期输出:
Date Val_D Val_M
0 1/1/18 10 100
1 1/1/18
2 1/1/18
3 2/1/18 22
4 2/1/18
5 3/2/18 10 240
6 3/2/18
7 3/2/18
解决方法:
好吧,一种方法是简单地使用差异
s = df[['Val_D', 'Val_M']]
df[['Val_D', 'Val_M']] = s[s.diff().ne(0)].fillna('')
即使这产生了预期的输出,但列的dtypes成为对象,并且您失去了使用数字的矢量化能力.因此,我建议您不要这样做.没有最后一块fillna(”),您将得到
Date Val_D Val_M
0 2018-01-01 10.0 100.0
1 2018-01-01 NaN NaN
2 2018-01-01 NaN NaN
3 2018-01-02 22.0 NaN
4 2018-01-02 NaN NaN
5 2018-02-03 10.0 240.0
6 2018-02-03 NaN NaN
7 2018-02-03 NaN NaN
dtype是float.现在,使用fillna(”),您将获得
Date Val_D Val_M
0 2018-01-01 10 100
1 2018-01-01
2 2018-01-01
3 2018-01-02 22
4 2018-01-02
5 2018-02-03 10 240
6 2018-02-03
7 2018-02-03
与对象dtypes.
内容总结
以上是互联网集市为您收集整理的python-在多列中用np.nan替换各种重复的值全部内容,希望文章能够帮你解决python-在多列中用np.nan替换各种重复的值所遇到的程序开发问题。 如果觉得互联网集市技术教程内容还不错,欢迎将互联网集市网站推荐给程序员好友。
内容备注
版权声明:本文内容由互联网用户自发贡献,该文观点与技术仅代表作者本人。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如发现本站有涉嫌侵权/违法违规的内容, 请发送邮件至 gblab@vip.qq.com 举报,一经查实,本站将立刻删除。
内容手机端
扫描二维码推送至手机访问。