【Python删除组合字典列表中的重复值】教程文章相关的互联网学习教程文章

如何找到重复值并合并它们? – Python【代码】

所以基本上你有一个列表如下:l = ['a','b','a','b','c','c']输出应该是:[['a','a'],['b','b'],['c','c']]所以基本上将重复的值放在一个列表中, 我试过了:l = ['a','b','a','b','c','c'] it=iter(sorted(l)) next(it) new_l=[] for i in sorted(l):new_l.append([])if next(it,None)==i:new_l[-1].append(i)else:new_l.append([])但是不起作用,如果它确实有效,它就不会有效率解决方法:对列表排序然后使用itertools.groupby:>>> ...

平均Python中两个配对列表的重复值【代码】

在我的代码中,我从不同的来源获得两个不同的列表,但我知道它们的顺序相同.第一个列表(“names”)包含键字符串列表,而第二个列表(“result_values”)是一系列浮点数.我需要使该对唯一,但我不能使用字典,因为只保留插入的最后一个值:相反,我需要对具有重复键的值进行平均(算术平均). 想要结果的示例:names = ["pears", "apples", "pears", "bananas", "pears"] result_values = [2, 1, 4, 8, 6] # ints here but it's the same con...

Python pandas重复值错误【代码】

我有一个大的制表符分隔数据文件,我想使用pandas“read_csv或’read_table’函数在python中读取它.当我读这个大文件时,它显示以下错误,即使关闭”index_col“值.>>> read_csv("test_data.txt", sep = "\t", header=0, index_col=None) Traceback (most recent call last):File "<stdin>", line 1, in <module>File "/Library/Frameworks/EPD64.framework/Versions/7.3/lib/python2.7/site-packages/pandas/io/parsers.py", line 18...

python – 在“group by”pandas数据帧中重复值【代码】

我有以下pandas DataFrame:email cat class_price 0 email1@gmail.com cat1 1 1 email2@gmail.com cat2 2 2 email3@gmail.com cat2 4 3 email1@gmail.com cat2 4 4 email2@gmail.com cat2 1 5 email3@gmail.com cat1 3 6 email1@gmail.com cat1 2 7 email2@gmail.com cat2 1 8 email3@gmail.com cat2 ...

python – Pandas:在条目优先级上使用消除重复值【代码】

我有一个像这样的熊猫日期框架:FRUITS COLOURS 0 apple red 1 berry black 2 apple green 3 grapes green 4 apple black 5 grapes red 6 tomato black 7 tomato green 记住COLORS red的优先顺序>绿色>黑色,我想消除FRUITS中的所有重复条目 期望的输出应该是:FRUITS COLOURS 0 apple red 1 be...

Python:仅在列表末尾删除重复的值【代码】

我有一个python列表,响应顺序很重要.我想仅在列表末尾出现时才过滤掉nan值.我想知道是否有一种有效的方法可以从以下列表中找到:nan = float("nan") responses = [1.0, nan, 9.0, nan, nan, nan, nan, nan, nan, nan, nan]到没有任何尾随nan值的列表: [1.0,nan,9.0] 我知道如何使用列表理解过滤掉所有nan值:import pandas as pd [r for r in responses if pd.notnull(r)] >>> [1.0, 9.0]但是不能想到一种直接的方法来在最后过滤掉...

使用NumPy从Python中的两个配对列表中获得平均重复值【代码】

在过去,我已经面对自己dealing with averaging two paired lists并且我已经成功地使用了那里提供的答案. 然而,对于大(超过20,000)项目,程序有点慢,我想知道使用NumPy是否会使它更快. 我从两个列表开始,一个浮点数和一个字符串:names = ["a", "b", "b", "c", "d", "e", "e"] values = [1.2, 4.5, 4.3, 2.0, 5.67, 8.08, 9.01]我正在尝试计算相同值的平均值,因此在应用它之后,我会得到:result_names = ["a", "b", "c", "d", "e"] r...

python – 在Pandas数据帧中查找重复值和排序的计数【代码】

我有一个包含许多列的Pandas数据框,其中两个是“电影名称”和“年龄”,我想找到排名最低的前五部电影,但只包括至少有电影的电影100个评分(所以至少出现在100行). 例如:movie title ageTitle 1 10 Title 2 12 Title 2 12 Title 3 13 Title 3 13 Title 3 13应该成为:movie title # of ratings avg ageTitle 1 1 10 Title 2 ...

python – 只在带有pandas的组中获取重复值【代码】

我有一个数据框,如:groups ids numbers group3 id4 89 group1 id1 50 group1 id1 30 group1 id2 90 group2 id4 89 group2 id6 76 group3 id4 90并且它想要通过groupby组找到重复的id并获得一个新的数据框,只有按组重复的ID,例如:group1 id1 50 group1 id1 30 group3 id4 89 group3 id4 90我试过了:for groups in df.groupby('groups'):print(df['ids'].duplicated)谢谢你的帮助.解决方法:函数groupby不是必需的,为了...

字典 - 相关标签
组合 - 相关标签