【python-如何在散景中以条形图绘制“分组依据”数据框】教程文章相关的互联网学习教程文章

python – 按小时分组pandas数据帧的问题【代码】

首先,我的数据集如下所示我想做的是通过pickup_datetime小时对列进行分组.我在here找到了相关的问题,但由于某种原因,解决方案似乎不起作用.我在下面列出了我的尝试. 我首先开始这样做:df["dropoff_datetime"] = pd.to_datetime(df["dropoff_datetime"]) df["pickup_datetime"] = pd.to_datetime(df["pickup_datetime"])test = df.groupby(df.hour).sum()我收到以下错误:AttributeError: 'DataFrame' object has no attribute 'ho...

Python - Django - ORM 聚合查询和分组查询【图】

models.py:from django.db import models# 出版社 class Publisher(models.Model):id = models.AutoField(primary_key=True)name = models.CharField(max_length=64, null=False, unique=True)def __str__(self):return "<Publisher object: {}>".format(self.name)# 书籍 class Book(models.Model):id = models.AutoField(primary_key=True)title = models.CharField(max_length=64, null=False, unique=True)price = models.Dec...

python – 对类似字符串进行分组【代码】

我正在尝试分析一堆搜索术语,这么多个人,他们并没有说太多.也就是说,我想对条款进行分组,因为我认为类似的术语应该具有相似的效果.例如,Term Group NBA Basketball 1 Basketball NBA 1 Basketball 1 Baseball 2这是一个人为的例子,但希望它能解释我想要做的事情.那么,做我所描述的最好的方法是什么?我认为nltk可能会有这样的东西,但我对它几乎不熟悉. 谢谢解决方法:您需要对这些术语进行...

是否有一种使用Python Matplotlib在分组箱图上显示样本大小的好方法【代码】

我可以使用groupby获取大小信息并将文本添加到相应的位置.但我不禁想到有更好的方法,因为这看起来很平凡,很多人都希望看到…… 为了说明,以下代码将生成分组的boxplotimport pandas as pd df = pd.DataFrame(rand(100, 1), columns=['value']) df.ix[:23, 'class']='A' df.ix[24:, 'class']='B' df.boxplot(column='value', by='class')我想要的是显示每个A类和B类的样本大小,分别为24和76.它可能看起来像传说或在盒子附近的某个地...

python – 按Sum分组为新列名【代码】

我正在执行功能,我按ID分组,并使用此代码为python汇总与这些ID相关联的$值:df = df.groupby([' Id'], as_index=False, sort=False)[["Amount"]].sum();但它没有重命名列.因此,我尝试这样做:`df = df.groupby([' Id'], as_index=False, sort=False)`[["Amount"]].sum();.reset_index(name ='Total Amount')但它给了我错误,TypeError:reset_index()得到了一个意外的关键字参数’name’ 所以我最后在这篇文章后尝试这样做:Python ...

python – 按Pandas列的总和值分组【代码】

我迷失在Pandas doc中,试图找出一种方法,通过列总和的值将DataFrame分组. 例如,假设我有以下数据:In [2]: dat = {'a':[1,0,0], 'b':[0,1,0], 'c':[1,0,0], 'd':[2,3,4]}In [3]: df = pd.DataFrame(dat)In [4]: df Out[4]: a b c d 0 1 0 1 2 1 0 1 0 3 2 0 0 0 4我希望将a,b和c列分组,因为它们的总和等于1.结果DataFrame的列标签等于它总和的列的总和.像这样 :1 9 0 2 2 1 1 3 2 0 4有什么想法让我朝着好的...

python – 如何按排序顺序对列表中的项进行分组?【代码】

我有一些列表,包括这样的元组one = [(4, 'a'), (3, 'b'), (2, 'c'), (3, 'd'), (5, 'e'), (6, 'f')]我想基于该整数对列表1上的项目进行分组,以创建具有这样的输出的新数组final = [(g1, 2, ['c']), (g2, 3, ['b','d']), (g3, 4, ['a']), (g4, 5, ['e']), (g5, 6, ['f'])]我不知道在创建最终列表. python是如何做到的?任何想法,将不胜感激.谢谢. 注意:g1,g2等只是一些带增量的字符串.解决方法:由于您希望对输出进行排序,因此可以根...

python – 根据列表中的内容对列表中的项进行分组【代码】

我有一个看起来像这样的数组:array1 = [[4000,"Mark",5],[4100,"George",3],[4000,"Mark",2],[4200,"Steve",4],[4100,"George",2],[4000,"Mark",1]]我想知道如何重新格式化这个数组看起来像这样:array2 = [[4000,"Mark",[5,2,1]],[4100,"George",[3,2]],[4200,"Steve",4]]解决方法:您可以使用有序字典(collections.OrderedDict)将前2个项目作为键存储,将常用数字作为值存储在列表中:>>> from collections import OrderedDict >>...

python – 通过对两个连续的零进行条件检查进行分组来创建子列表【代码】

我有一个清单:lst = [0, -7, 0, 0, -8, 0, 0, -4, 0, 0, 0, -6, 0, -4, -29, -10, 0, -16, 0, 0, 2, 3, 0, 18, -1, -2, 0, 0, 0, 0, 0, 0, 21, 10, -10, 0, -12, 3, -5, -10]我希望在值后跟两个连续的零时创建带有条件中断的子列表组. 所以我的中间清单会喜欢newlst = [-7,-8,-4,[-6,-4,-29,-10,-16],[2,3,18,-1,-2],[21,10,-10,-12,3,-5,-10]]而最终输出将是子列表的总和:[-7,-8,-4,-65,18,-3]我尝试在枚举的for循环中使用索引号...

python – 关于pandas的问题:扩展多值列,反转和分组【代码】

我正在研究大熊猫对NLP和文本挖掘进行一些简单的计算,但我不太清楚如何去做. 假设我有以下数据框,关联人名和性别:import pandas people = {'name': ['John Doe', 'Mary Poppins', 'Jane Doe', 'John Cusack'], 'gender': ['M', 'F', 'F', 'M']} df = pandas.DataFrame(people)对于我想要的所有行: >确定名字>确定从人名衍生的3-shingles(包含在单词中的3个字母的序列)的列表>确定,对于每个木瓦,有多少男性和女性包含在他们的名字...

python – 分组和组合字符串【代码】

为了简化我的问题,我创建了一个小型DataFrame,如下所示:Type From To A "H1" "U1" A "H9" "I8" A "H1" "IL" B "P2" "P8" B "P2" "P7" C "P9" "O8" C "P9" "I0" C "P7" "O8"在对字符串进行分组和汇编之后,我们应该得到以下期望的结果:Type From To A "H1" "U1, IL" A "H9" "I8" B "P2" "P8, P7" C "P9" "O8, I0" C "P7" "O8"我使用拆分和聚合函数做了它.对于任何想法或...

python – 在Pandas中,在groupby之后,分组列已经消失了【代码】

我有以下名为ttm的数据框:usersidid clienthostid eventSumTotal LoginDaysSum score 0 12 1 60 3 1728 1 11 1 240 3 1331 3 5 1 5 3 125 4 6 1 16 2 216 2 10 3 ...

Python:将分组均值分配给1-D数组【代码】

假设我有2个数组:x = [2, 4, 1, 7, 3, 9, 2, 5, 5, 1] flag = [0, 1, 0, 2, 1, 1, 2, 0, 0, 2]标志数组指示x的每个元素属于哪个“组”.如何用x的所有元素的平均值替换x的每个元素(比如标志值k),其对应的标志值也是k? 经过这样的转换后,x看起来像:x = [3.25, 5.33, 3.25, 3.33, 5.33, 5.33, 3.33, 3.25, 3.25, 3.33](我可以使用循环来实现这一点,但效率很低.)解决方法:一种选择是使用熊猫:import pandas as pd x = [2,...

python – 在for循环中对数据进行分组【代码】

我需要循环遍历已排序的数据集,将该排序属性的所有结果分组为块,这些块对于该属性都具有相同的值.然后我在那块结果上运行一些操作. 对不起,这有点令人困惑,示例可能是描述我正在做的更好的方式: 我有一个像这样结构化的数据集,除了“数据”字符串实际上是对象并包含大量其他数据.[ [1, "data1"], [1, "data2"], [2, "moredata"], [2, "stuff"], [2, "things"], [2, "foo"], [3, "bar"], [4, "baz"] ]我想要发生的是将数据分组为4个...

python – 有效地按元素分组【代码】

可以说我有lags = [0, 30, 60, 90, 120, 150, 180, np.inf]和list = [[500, 800, 1000, 200, 1500], [220, 450, 350, 1070, 1780], [900, 450, 1780, 1450, 100], [340, 670, 830, 1370, 1420], [850, 630, 1230, 1670, 910]]angle = [[50, 80, 100, 20, 150], [22, 45, 35, 107, 178], [90, 45, 178, 145, 10], [34, 67, 83, 137, 142], [85, 63, 123, 167, 91]]我想将每个元素放在列表中,并根据其值将其存储在不同的单独数组中;f...

分组 - 相关标签