首页 / PYTHON / python – 删除重复项,但忽略空值

python – 删除重复项,但忽略空值

内容导读

互联网集市收集整理的这篇技术教程文章主要介绍了python – 删除重复项,但忽略空值，小编现在分享给大家，供广大互联网技能从业者学习和参考。文章包含594字，纯文字阅读大概需要1分钟。

内容图文

所以我知道你可以使用这样的东西来删除重复的行：

the_data.drop_duplicates(subset=['the_key'])

但是,如果某些值的__键为null,如下所示：

   the_key  C  D
1      NaN  *  *
2      NaN     *
3      111  *  *
4      111

它将保留C列中标记的那些.是否有可能得到drop_duplicates将所有nan视为不同并获得保持D列中数据的输出？

解决方法:

使用duplicated链接isna并过滤boolean indexing：

df = df[(~df['the_key'].duplicated()) | df['the_key'].isna()]
#fol oldier pandas versions
#df = df[(~df['the_key'].duplicated()) | df['the_key'].isnull()]
print (df)
   the_key  C    D
1      NaN  *    *
2      NaN       * 
3    111.0  *    *

内容总结

以上是互联网集市为您收集整理的python – 删除重复项,但忽略空值全部内容，希望文章能够帮你解决python – 删除重复项,但忽略空值所遇到的程序开发问题。如果觉得互联网集市技术教程内容还不错，欢迎将互联网集市网站推荐给程序员好友。

内容备注

版权声明：本文内容由互联网用户自发贡献，该文观点与技术仅代表作者本人。本站仅提供信息存储空间服务，不拥有所有权，不承担相关法律责任。如发现本站有涉嫌侵权/违法违规的内容，请发送邮件至 gblab@vip.qq.com 举报，一经查实，本站将立刻删除。

内容手机端

扫描二维码推送至手机访问。

本文链接：https://qyyshop.com/info/740457.html

来源：【匿名】

【上一篇】python – 预处理与tflearn一起使用的csv文件【下一篇】浅谈PHP运行Python脚本的方法

更多 ►

【python – 删除重复项,但忽略空值】教程文章相关的互联网学习教程文章

pandas妙招之 DataFrame基础运算以及空值填充【代码】【图】

相关学习推荐：python教程今天是pandas数据处理专题的第四篇文章，我们一起来聊聊DataFrame中的索引。上一篇文章当中我们介绍了DataFrame数据结构当中一些常用的索引的使用方法，比如iloc、loc以及逻辑索引等等。今天的文章我们来看看DataFrame的一些基本运算。数据对齐我们可以计算两个DataFrame的加和，pandas会自动将这两个DataFrame进行数据对齐，如果对不上的数据会被置为Nan（not a number）。首先我们来创建两个DataFrame：...

Python3学习：如何初始化不同的变量类型为空值【图】

常见的数字，字符，很简单，不多解释。列表List的其值是[x,y,z]的形式字典Dictionary的值是{x:a, y:b, z:c}的形式元组Tuple的值是(a,b,c)的形式所以，这些数据类型的变量，初始化为空值分别是：数值digital_value = 0字符串str_value = "" 或 str_value = ”列表list_value = []字典ditc_value = {}元组tuple_value = ()

python基础-列表&布尔和空值&Number【代码】

文章目录一、列表list1.概述2.创建列表3.列表元素的访问3.1获取元素3.2替换元素3.3 遍历列表 4.列表的操作1.1列表元素组合1.2列表元素重复1.3判断元素是否在列表中1.4列表截取【切片】 5.列表的功能【掌握】6.二维列表二、布尔值和空值1.布尔值2.空值三、数字类型Number1.数字类型分类1.1整数1.2浮点数 2.系统功能2.1数学功能2.2随机数random一、列表list 1.概述变量：使用变量存储数据，但是，缺点:一个变量每次只能存储一个数...

Python之找到所有空值所在行【图】

感谢博主shangyj17的分享，原文章链接位置：https://www.jb51.net/article/169635.htm 1.找出含有空值的行：

关于在python中如何使用pandas库读取excel表格后删除含有空值的列【代码】

在使用pandas读入相关的excel后，若是表格中有空值的列，要如何清洗呢在查阅了网上的相关的资料后，得到了办法 pandas.dropna(axis=1,how=‘any’) axis=0指行，若是参数中不写，则是默认为axis=0， axis=1则是指列 how=‘any’则是指只要列中含有一个空值，就删除该列 how=all’则是代表只有一整列为空值，才删除该列需要注意的是在python3.7的版本里使用pandas.dropna需要有一个变量来接收返回值否则在运行程序的时候不会报...

如何使用与其他两列匹配的python在数据集中填充空值？【代码】

我有一个泰坦尼克号的数据集.它具有属性,我在努力工作1.Age2.Embark(从那里出发的港口乘客.共有3个港口：S,Q和C)3.Survived(0表示没有幸存,1表示没有幸存) 我正在过滤无用的数据.然后,我需要填写Age中存在的Null值.因此,我计算了每个登机航班中幸存和未幸存的乘客数量,即S,Q和C 我找出从每个S,Q和C港口出发后幸存和未幸存的乘客的平均年龄.但是现在我不知道如何在原始的《泰坦尼克号》年龄列中填充这6个值(对于每个S,Q和C来说是3个...

python-用同一列的平均值填充Pyspark数据框列的空值【代码】

有了这样的数据框rdd_2 = sc.parallelize([(0,10,223,"201601"), (0,10,83,"2016032"),(1,20,None,"201602"),(1,20,3003,"201601"), (1,20,None,"201603"), (2,40, 2321,"201601"), (2,30, 10,"201602"),(2,61, None,"201601")])df_data = sqlContext.createDataFrame(rdd_2, ["id", "type", "cost", "date"]) df_data.show()+---+----+----+-------+ | id|type|cost| date| +---+----+----+-------+ | 0| 10| 223| 201601| | ...

python-熊猫在groupby函数中计数空值【代码】

df = pd.DataFrame({'A' : ['foo', 'bar', 'foo', 'bar', 'foo', 'bar', 'foo', 'foo'],'B' : ['one', 'one', 'two', 'three', 'two', 'two', 'one', 'three'],'C' : [np.nan, 'bla2', np.nan, 'bla3', np.nan, np.nan, np.nan, np.nan]})输出：A B C 0 foo one NaN 1 bar one bla2 2 foo two NaN 3 bar three bla3 4 foo two NaN 5 bar two NaN 6 foo one NaN 7 foo three Na...

python – IntegrityError：“city_id”列中的空值违反非空约束【代码】

我两个型号：class City(models.Model):name = models.CharField(max_length=50)country = models.OneToOneField(Country)def __unicode__(self):return self.name class UserProfile(models.Model):user = models.OneToOneField(User)city = models.OneToOneField(City)当我syncdb并创建管理员用户时：IntegrityError: null value in column "city_id" violates not-null constraint我怎么能修复这个错误？解决方法: city = model...

python – XPath：选择空值的标签【代码】

我如何在XPath 1.0中找到空col name =“POW”的所有行？<row> <col name="WOJ">02</col> <col name="POW"/> <col name="GMI"/> <col name="RODZ"/> <col name="NAZWA">DOLNO?L?SKIE</col> <col name="NAZDOD">województwo</col> <col name="STAN_NA">2011-01-01</col> </row>我试过很多解决方案. Firefox扩展XPath Checker选择很少,但lxml.xpath()表示表达式无效或只返回没有行. 我的Python代码：from lxml import html f = open('...

python – 从pandas数据框中删除具有空值的行【代码】

我正在尝试从我的数据框中删除一行,其中一列的值为null.我能找到的大部分帮助都与去除NaN值有关,这些值迄今为止对我没用. 在这里,我创建了数据框：# successfully crated data framedf1 = ut.get_data(symbols, dates) # column heads are 'SPY', 'BBD'# can't get rid of row containing null val in column BBD # tried each of these with the others commented out but always had an # error or sometimes I was able to get...

python pandas空值与缺失值处理

一、空值与缺失值空值：在pandas中的空值是"" 缺失值：在dataframe中为nan或者naT（缺失时间），在series中为none或者nan 二、相关处理函数： df.dropna() df.fillna() df.isnull() df.isna() 三、函数解释： 1. DataFrame.dropna(axis=0, how=any, thresh=None, subset=None, inplace=False) 函数作用：删除含有空值的行或列 axis:维度，axis=0表示index行,axis=1表示columns列，默认为0 how:"all"表示这一行或列中的元素全部缺失...

python – Numpy数组,填充单个列的空值【代码】

我有一个numpy数组,它是使用python列表中的np.array()生成的,所以我的条目是字符串,但有些值是空白的.这是一个示例数组：['1', '1', '1', '1'] ['1', '1', '', '1'] ['1', '1', '1', '1'] ['1', '', '1', '1']没有’NaN’或’None’,它是空白的.我希望能够使用相同的值填充特定列中的所有空白单元格.解决方法:您可以使用numpy.where()来实现此目的.In [8]: arr = numpy.array(['','1','2','3',''])In [9]: arr[numpy.where(arr==''...

python – 用NaN替换字典的空值【代码】

我有一个缺少值的字典(密钥在那里,但相关的值是空的).例如,我想要下面的字典：dct = {'ID':'', 'gender':'male', 'age':'20', 'weight':'', 'height':'5.7'}要改为这种形式：dct = {'ID':NaN, 'gender':'male', 'age':'20', 'weight':NaN, 'height':'5.7'}我怎样才能以最省时的方式写出来呢？解决方法:您可以使用字典理解.同样如评论中所指出的,在Python中命名某些字典不是一个好习惯：dct = {'ID':'', 'gender':'male', 'age':'20...