【pandasgroupby分组取每组的前几行记录方法】教程文章相关的互联网学习教程文章

python-熊猫:groupby,并创建一个新的列,将聚合应用于两列【代码】

我在将agg应用于groupby熊猫数据框时遇到困难. 我有一个像这样的数据框df:order_id distance_theo bird_distance 10 100 8010 80 8010 70 8011 90 7011 70 7011 60 7012 200 18012 150 18...

无法使用python中的熊猫根据其最小值获取groupby记录【代码】

我有以下CSVid;price;editor k1;10,00;ed1 k1;8,00;ed2 k3;10,00;ed1 k3;11,00;ed2 k2;10,50;ed1 k1;9,50;ed3如果我执行以下操作import pandas as pd df = pd.read_csv('Testing.csv', delimiter =';') df_reduced= df.groupby(['id', 'editor'])['price'].min()而不是得到k1;8,00;ed2 k2;10,50;ed1 k3;10,00;ed1我懂了k1;10,00;ed18,00;ed29,50;ed3 k2;10,50;ed1 k3;10,00;ed111,00;ed2 那么我可以得到三个ID的最小值吗?解决方法...

python-熊猫在groupby函数中计数空值【代码】

df = pd.DataFrame({'A' : ['foo', 'bar', 'foo', 'bar', 'foo', 'bar', 'foo', 'foo'],'B' : ['one', 'one', 'two', 'three', 'two', 'two', 'one', 'three'],'C' : [np.nan, 'bla2', np.nan, 'bla3', np.nan, np.nan, np.nan, np.nan]})输出:A B C 0 foo one NaN 1 bar one bla2 2 foo two NaN 3 bar three bla3 4 foo two NaN 5 bar two NaN 6 foo one NaN 7 foo three Na...

python-如何在Pandas列中的唯一名称上使用groupby和cumcount【代码】

我有一个看起来像这样的数据框ID ..... config_name config_version ... aa A 0 ab A 7ad A 7ad A 27 bb B 0 cc C 0 cd C 8 我想对config_name进行分组,并在每个唯一的config_version上应用cumcount,以便获得诸如ID ....

python – 使用的更奇怪的结果:pandas中的groupby和nlargest()【代码】

这个问题是以下帖子的扩展:select largest N of a column of each groupby group using pandas 让我们使用相同的df和所选答案中提出的解决方法.基本上,我正在尝试进行2次groupby操作并选择每组的nlargest N.但是,正如您在下面看到的,我得到其中一个操作的错误. 鉴于原始帖子在代码中发现了一个错误(see here),我想知道是否有另一个错误或同一个错误的另一个表现? 不幸的是,在这些问题得到修复和解决之前,我仍处于工作中.我们能不...

python – Pandas:将TimeGrouper与另一个Groupby参数结合使用【代码】

我有以下DataFrame:df = pd.DataFrame({ 'Branch' : 'A A A A A B'.split(), 'Buyer': 'Carl Mark Carl Joe Joe Carl'.split(), 'Quantity': [1,3,5,8,9,3], 'Date' : [ DT.datetime(2013,1,1,13,0), DT.datetime(2013,1,1,13,5), DT.datetime(2013,10,1,20,0), DT.datetime(2013,10,2,10,0), DT.datetime(2013,12,2,12,0), DT.datetime(2013,12,2,14,0), ]})from pandas.tseries.resample...

python – Pandas Groupby Agg函数中的列顺序【代码】

是否有自动方法来维护返回的数据帧的列(‘C’,’B’,’A’)的顺序?g = df.groupby(['people']) g['people'].agg({'C' : len,'B' : len,'A' : len,})这将返回A,B,C而不是C,B,A的列. 我只能找到示例,但不能找到agg函数本身的文档. 这似乎是一种解决方法:g = df.groupby(['people']) g['people'].agg({'C' : len,'B' : len,'A' : len,}).reindex_axis(['C','B','A'], axis=1)解决方法:OrderedDict与pandas-0.18.0-py2.7令人惊讶地工...

python – 为什么itertools.groupby()不起作用?【代码】

参见英文答案 > itertools.groupby() not grouping correctly 3个我已经检查了一些关于groupby()的主题,但我没有得到我的例子的错误:students = [{'name': 'Paul', 'mail': '@gmail.com'},{'name': 'Tom', 'mail': '@yahoo.com'},{'name': 'Jim', 'mail': 'gmail.com'},{'name': 'Jules', 'mail': '@something.com'},{'name': 'Gregory', 'mail': '@gmail.com'},{'name': 'Kathr...

python – Pandas groupby多列,多列列表【代码】

我有以下数据:Invoice NoStockCode Description Quantity CustomerID Country 536365 85123A WHITE HANGING HEART T-LIGHT HOLDER 6 17850 United Kingdom 536365 71053 WHITE METAL LANTERN 6 17850 United Kingdom 536365 84406B CREAM CUPID HEARTS COAT HANGER 8 17850 United Kingdom我正在尝试做一...

python – Pandas Groupby应用函数来计算大于零的值【代码】

Pandas Groupby应用函数来计算大于零的值 我以下列方式使用groupby和agg:df.groupby('group')['a'].agg({'mean' : np.mean, 'std' : np.std})我想在同一列[‘a’]中计算零以上的值 以下行按我的意愿计算,sum(x > 0 for x in df['a'])但是在申请groupby时我无法正常工作. 下面是一个将pandas计算应用于groupby的示例,我尝试过:df.groupby('group')['a'].apply(sum(x > 0 for x in df['a']))但是我收到一条错误消息:AttributeErro...

python – pandas中有.groupby对面的“ungroup by”操作吗?【代码】

假设我们采用熊猫数据帧……name age family 0 john 1 1 1 jason 36 1 2 jane 32 1 3 jack 26 2 4 james 30 2然后做一个groupby()……group_df = df.groupby('family') group_df = group_df.aggregate({'name': name_join, 'age': pd.np.mean})然后做一些聚合/汇总操作(在我的例子中,我的函数name_join聚合名称):def name_join(list_names, concat='-'):return concat.join(l...

python – 使用groupby的原位转换pandas【代码】

是否可以使用groupby语句将DataFrame改为inplace?import pandas as pd dt = pd.DataFrame({"LETTER": ["a", "b", "c", "a", "b"],"VALUE" : [10 , 12 , 13, 0, 15]}) def __add_new_col(dt_):dt_['NEW_COL'] = dt_['VALUE'] - dt_['VALUE'].mean()return dt_ passdt.groupby("LETTER").apply(__add_new_col)LETTER VALUE NEW_COL 0 a 10 5.0 1 b 12 -1.5 2 c 13 0.0 3 a ...

Python Pandas:Groupby Sum和Concatenate字符串【代码】

示例Pandas Dataframe:ID Name COMMENT1 COMMENT2 NUM 1 dan hi hello 1 1 dan you friend 2 3 jon yeah nope 3 2 jon dog cat .5 3 jon yes no .1我正在尝试创建一个按ID和NAME分组的数据框,它连接COMMENT1和COMMENT2,它们也总和了NUM. 这就是我要找的东西:ID Name COMMENT1 COMMENT2 NUM 1 dan hi you hello friend 3 3 jon yeah yes nop...

python – pandas groupby:每组的前3个值【代码】

在pandas groupby: TOP 3 values in each group and store in DataFrame中发布了一个新的更通用的问题,并在那里得到了解决方案. 在这个例子中,我创建了一个数据帧df,其中一些随机数据间隔5分钟.我想创建一个数据帧gdf(分组df),其中列出了每小时的3个最高值. 即:来自这一系列的价值观VAL TIME 2017-12-08 00:00:00 29 2017-12-08 00:05:00 56 2017-12-08 00:10:00 82 2017-12-08 00:15:00 13 2017-12-...

python – Pandas在DataFrame groupby上的百分比计数【代码】

我有一个DataFrame(mydf)沿着以下几行:Index Feature ID Stuff1 Stuff2 1 True 1 23 12 2 True 1 54 12 3 False 0 45 67 4 True 0 38 29 5 False 1 32 24 6 False 1 59 39 7 True 0 37 32 8 False 0 76 65 9 False 1 32 12 10 True 0 23 15 ..n True 1 ...

分组 - 相关标签