更多【如何通过多级行对python数据框进行分组？】教程文章相关的互联网学习教程文章

【如何通过多级行对python数据框进行分组？】教程文章相关的互联网学习教程文章

python – 按索引对列表中的列表元素进行分组【代码】

我试图获取一个列表列表,并返回一个列表列表,其中包含原始列表列表索引中的每个元素.我知道那个措辞严厉.这是一个例子. 说我有以下列表列表：[[1,2,3], [4,5,6], [7,8,9]]我想得到另一个列表列表,其中每个列表是特定索引处每个元素的列表.例如：[[1,2,3], [4,5,6], [7,8,9]] becomes [[1,4,7], [2,5,8], [3,6,9]]因此,返回列表中的第一个列表包含每个原始列表的第一个索引处的所有元素,依此类推.我被卡住了,不知道如何做到这一点.任...

通过Python查找和分组字谜【代码】

input: ['abc', 'cab', 'cafe', 'face', 'goo'] output: [['abc', 'cab'], ['cafe', 'face'], ['goo']]问题很简单：它由字谜组成.订单无关紧要. 当然,我可以通过C(这是我的母语)来做到这一点.但是,我想知道这可以通过Python在一行中完成.编辑：如果不可能,可能是2或3行.我是Python的新手. 为了检查两个字符串是否是字谜,我使用了排序.>>> input = ['abc', 'cab', 'cafe', 'face', 'goo'] >>> input2 = [''.join(sorted(x)) for x i...

python – 按一列分组,在pandas中查找另一列的和和最大值【代码】

我有这样的数据帧：Name id col1 col2 col3 cl4 PL 252 0 747 3 53 PL2 252 1 24 2 35 PL3 252 4 75 24 13 AD 889 53 24 0 95 AD2 889 23 2 0 13 AD3 889 0 24 3 6 BG 024 12 89 53 66 BG1 024 43 16 13 0 BG2 024 5 32 101 4 现在我需要按ID进行分组,并且对于列col1和col4找到每...

python – 在django中分组【代码】

如何在django的trunk版本中通过查询创建简单的组？我需要类似的东西SELECT name FROM mytable GROUP BY name实际上我想要做的只是获取具有不同名称的所有条目.解决方法:如果您需要所有不同的名称,请执行以下操作：Foo.objects.values('name').distinct()你会得到一个字典列表,每个字典都有一个名字键.如果您需要其他数据,只需将更多属性名称作为参数添加到.values()调用中.当然,如果添加可能在具有相同名称的行之间变化的属性,则会...

python – 对numpy中的分区索引进行分组argmax / argmin【代码】

Numpy的ufuncs有一个reduceat方法,它在一个数组中的连续分区上运行它们.所以不要写：import numpy as np a = np.array([4, 0, 6, 8, 0, 9, 8, 5, 4, 9]) split_at = [4, 5] maxima = [max(subarray for subarray in np.split(a, split_at)]我可以写：maxima = np.maximum.reduceat(a, np.hstack([0, split_at]))两者都将在切片a [0：4],[4：5],[5:10]中返回最大值,为[8,0,9]. 我想要一个类似的函数来执行argmax,注意我只想在每个分...

python – 将所有可能的点组合分组,分为m组【代码】

我想将所有可能的点组合分组为r组.Points = [A,B,C,D……..] Total n points一次取m的这些点的组合将是列表ll = list(itertools.combinations(points,m))如何进一步将其分组为r组,使得每组的第i个元素没有相似的点. 例如,Points = [A,B,C,D] m = 2 and r = 2 l = [[A,B],[A,C],[A,D],[B,C],[B,D],[C,D]]所以小组会Group 1 = [[A,B],[A,C],[A,D]] and corresponding to it Group 2 =[[C,D],[B,D],[B,C]]注意：组1和组2的第i个索引中...

python – 扩展由pandas中的多个列分组的平均值【代码】

我有一个数据框,我想计算扩展平均值超过一列(quiz_score),但需要按两个不同的列(userid和week)进行分组.数据如下所示：data = {"userid": ['1','1','1','1','1','1','1','1', '2','2','2','2','2','2','2','2'],"week": [1,1,2,2,3,3,4,4, 1,2,2,3,3,4,4,5],\ "quiz_score": [12, 14, 14, 15, 9, 15, 11, 14, 15, 14, 15, 13, 15, 10, 14, 14]}>>> df = pd.DataFrame(data, columns = ['userid', 'week', 'quiz_score']) >>> dfus...

Python Dataframe 分组排序和 Modin【代码】

Python Dataframe 分组排序和 Modin 1、按照其中一列进行排序在dataframe中，按照其中的一列排序：比如q值倒排 (1)rank方法data[new_rank] = data.groupby(house_code)[q_score_new].rank(ascending=False, method=dense)(2)sort_values方法data.sort_values([q_score_new], ascending=False).groupby([house_code]).cumcount() + 1 2、按照其中多列进行排序在dataframe中，按照其中的多列排序：比如q值倒排、经纪人ucid正排 s...

python – Argparse通过子分组进行独占【代码】

目前我的代码的argparse给出了以下内容：usage: ir.py [-h] [-q | --json | -d ]Some textoptional arguments:-h, --help show this help message and exit-q gene query terms (e.g. mcpip1)--json output in JSON format, use only with -q-d , --file_to_index file to index 我想要它做的是以下内容： > -q应该与-d互斥>和–json应该只使用-q 怎么回事呢？这是我的argparse代码...

python – 分组后的变化率Pandas Data Frame【代码】

我是python pandas的新手,并且一直试图使用pct_change()来获得回报率.我想通过feedcode获得每月变化率.这是我目前的代码：In [134]: df3 = pd.read_csv(r'C:\Users\sector_set.csv') df3.set_index('Date', inplace= True) df3= pd.DataFrame(df3,columns = ['Feed','Close']) # filter specific col? grouped = df3.groupby('Feed') #group by Feedcode df3 = grouped.resample('BM', how=lambda x:x[-1]) #ending of every mont...

Python – 熊猫.按字段分组并将值合并到一行中【代码】

我想知道如何按字段对数据框进行分组,然后将组连接在一行中,优先考虑非空值.这是一个按ID分组的示例：解决方法:我想你可以在groupby和sum使用replace：print df.replace('null', '').groupby('id').sum().replace('', 'null')A B C id 1 a r s 2 q d null 3 w b null如果值类型为null不是字符串,请使用fillna：print df.fillna('').groupby('id').sum().replace('', 'null')A B C id ...

python – 按一列的值排序,保持行按另一列的值分组【代码】

我生成了两个(数百个)df,然后连接起来,然后我想按顺序排列具有相同列D名称的行：In [120]: df_list[0] Out[120]:A B C D 0 0.564678 0.598355 0.606693 MA0835 1 0.066291 0.063587 0.662292 MA0835 2 0.000000 0.000000 0.010758 MA0835 3 0.000000 0.000000 0.097895 MA0835 4 0.000000 0.000000 0.136468 MA0835In [121]: df_list[1] Out[121]:A B C D 0 ...

python – 分组,大熊猫【代码】

select df.id, count(distinct airports) as num from df group by df.id having count(distinct airports) > 3我试图在Python熊猫中做相同的上述操作.我尝试过滤器,nunique,agg的不同组合,没有任何工作.有什么建议？例如：DFdf id airport 1 lax 1 ohare 2 phl 3 lax 2 mdw 2 lax 2 sfw 2 tpe所以我希望结果如下：id num 2 5解决方法:您可以在boolean indexing或query中...

python – 我可以在列表(或字典)理解中对元素进行分组/聚合吗？【代码】

我有一个元组列表,如下所示：[(1, "red")(1, "red,green")(1, "green,blue")(2, "green")(2, "yellow,blue") ]我正在尝试汇总数据,以便我可以获得以下dict输出：{1: ["red", "green", "blue"]2: ["green", "yellow", "blue"] }注意事项是：将颜色串组合为主键(数字),然后拆分为列表,并进行去除(例如使用set). 我也想反过来,按颜色分组：{"red": [1],"green": [1, 2]"yellow": [2]"blue": [1, 2] }我可以通过循环遍历所有元组来清楚...

python – 将Pandas的“findall”结果列表拆分为多个项目,按uniques分组【代码】

我已经下载了我的Twitter档案,我正在尝试对我最常谈话的人做一些分析. 推文CSV列如下所示：tweet_id,in_reply_to_status_id,in_reply_to_user_id,retweeted_status_id,retweeted_status_user_id,timestamp,source我使用read_csv()将tweets.csv文件导入名为“indata”的数据框中. 然后,为了获得推文中提到的所有@handles的列表,我使用了以下内容：handles = indata['text'].str.findall('@[a-zA-Z0-9_-]*')结果：timestamp ... 2013...

上一页
1
...
7
8
9
10
11
...
12
下一页
共 12 页
共 175 条