【python – 将累积平均函数应用于分组对象】教程文章相关的互联网学习教程文章

python – 查找非零元素的索引并按值分组【代码】

我在python中编写了一个代码,它使用numpy矩阵作为输入,并返回按相应值分组的索引列表(即output [3]返回值为3的所有索引).但是,我缺乏编写矢量化代码的知识,必须使用ndenumerate来完成.此操作仅花费大约9秒,这太慢了. 我的第二个想法是使用numpy.nonzero如下:for i in range(1, max_value):current_array = np.nonzero(input == i)# save in an array这需要5.5秒,所以这是一个很好的改进,但仍然很慢.有没有循环或优化方式来获得每个...

python – 在SFrame中分组而不安装graphlab【代码】

如何在SFrame中使用groupby操作,无需安装graphlab. 我想做一些聚合,但在互联网的所有例子中,我看到聚合函数来自Graphlab. 喜欢:import graphlab.aggregate as agguser_rating_stats = sf.groupby(key_columns='user_id',operations={'mean_rating': agg.MEAN('rating'),'std_rating': agg.STD('rating')})在上面的例子中,我如何使用numpy.mean而不是agg.MEAN?解决方法:sframe包包含与graphlab包相同的聚合模块,因此您不需要求助于...

python – 通过从3D数组中采样和分组来创建热图【代码】

我有一些像这样存在的实验数据:x = array([1, 1.12, 1.109, 2.1, 3, 4.104, 3.1, ...]) y = array([-9, -0.1, -9.2, -8.7, -5, -4, -8.75, ...]) z = array([10, 4, 1, 4, 5, 0, 1, ...])如果方便的话,我们可以假设数据存在为3D数组甚至是pandas DataFrame:df = pd.DataFrame({'x': x, 'y': y, 'z': z})解释是,对于每个位置x [i],y [i],某个变量的值是z [i].这些不是均匀采样的,因此将存在一些“密集采样”的部分(例如,在x中介于...

在python中拆分大括号分组字符串【代码】

欣赏单行习语的帮助,有效地完成以下任务. 我有一个字符串,其中的组用大括号分隔,如下所示:{1:xxxx}{2:xxxx}{3:{10:xxxx}}{4:xxxx\r\n:xxxx}.... 如何将其转换为字典格式?dict={1:'xxx',2:'xxxx',3:'{10:xxxx}'},4:'xxxx\r\n:xxxx'} 解决方法:我就是这样做的:raw = """{1:xxxx}{2:xxxx}{3:{10:xxxx}}{4:'xxxx\r\n:xxxx'}"""def parse(raw):# split into chunks by '}{' and remove the outer '{}'parts = raw[1:-1].split('}{'...

python – Pandas将每小时数据分组为日期索引的每日总和【代码】

我正在编写一个代码,该代码每小时收集一小时的数据,并将其分为24小时的总和.我的问题是,我希望索引读取日期/年,我只是得到1-30的索引. 我正在使用的代码是df = df.iloc[:,16:27].groupby([lambda x: x.day]).sum()我得到的输出的例子DateTime data 1 1772.031568 2 19884.42243 3 28696.72159 4 24906.20355 5 9059.120325我希望输出的例子DateTime data 1/1/2017...

python – 使用pandas对组进行分组和比较【代码】

我的数据看起来像:Identifier Category1 Category2 Category3 Category4 Category5 1000 foo bat 678 a.x ld 1000 foo bat 78 l.o op 1000 coo cat 678 p.o kt 1001 coo sat 89 a.x hd 1001 foo bat 78 l.o op 1002 foo b...

在Python 3中使用相同的值对字典列表进行分组【代码】

给出一个词典列表:players= [{ "name": 'matt', 'school': 'WSU', 'homestate': 'CT', 'position': 'RB' },{ "name": 'jack', 'school': 'ASU', 'homestate': 'AL', 'position': 'QB' },{ "name": 'john', 'school': 'WSU', 'homestate': 'MD', 'position': 'LB' },{ "name": 'kevin', 'school': 'ALU', 'homestate': 'PA', 'position': 'LB' },{ "name": 'brady', 'school': 'UM', 'homestate': 'CA', 'position': 'QB' }, ]如何...

python – 如何按频率对行进行分组?【代码】

我想知道有多少人在评估1次,2到3次,超过3次的人群中推出了1,2,3,4和5等级.例如,进行1次评估的人群包含ID为2和4的人.在该组中,总共有一个评估5和一个评估1.df =ID_PERSON EVALUATION_GRADE 1 2 1 2 1 3 1 5 2 5 3 2 3 5 3 1 4 1 5 2 5 1 5 1结果应该是这个:result =FREQUENCY_GROUP ...

python – groupby是否自动分组pandas中的所有非数字列?【代码】

我有一个下面的数据集示例(仅显示前几行,但有193行):country,beer_servings,spirit_servings,wine_servings,total_litres_of_pure_alcohol,continent Afghanistan,0,0,0,0.0,Asia Albania,89,132,54,4.9,Europe Algeria,25,0,14,0.7,Africa Andorra,245,138,312,12.4,Europe Angola,217,57,45,5.9,Africa Antigua & Barbuda,102,128,45,4.9,North America ...当我运行这个:drinks.groupby(‘continent’).head() 我找回了30行的数...

python – Pandas:如何在行上使用多个级别对count进行分组?【代码】

我有以下数据框|----|----| | A | B | | a1 | b1 | | a2 | b1 | | a1 | b2 | | a2 | b3 |我希望按每A计算B并获得以下结果:|----|----|-------| | A | B | Count | | a1 | b1 | 1 | | | b2 | 1 | | | b3 | NaN | | a2 | b1 | 1 | | | b2 | NaN | | | b3 | 1 |我通常使用df.groupby([B])[A] .count()执行此操作,但在这种情况下使用有点数据透视表对我来说很困惑 提前致谢. UPDT: df.info()<cl...

python – Pandas数据帧:按A分组,B取nlargest,输出C.【代码】

根据B中的值,每个A的前两个C值是多少?df = pd.DataFrame({'A': ["first","second","second","first","second","first","third","fourth","fifth","second","fifth","first","first","second","third","fourth","fifth"],'B': [1,1,1,2,2,3,3,3,3,4,4,5,6,6,6,7,7],'C': ["a", "b", "c", "d","e", "f", "g", "h","i", "j", "k", "l","m", "n", "o", "p", "q"]})我在尝试x = df.groupby(['A'])['B'].nlargest(2)Afifth 16 710 ...

python – 将一个DataFrame分组到一个新的DataFrame中,并将一个范围作为索引【代码】

参见英文答案 > Converting a Pandas GroupBy object to DataFrame 8个我有一个问题,在这个例子中简化了.考虑一下这个Pandas DataFrame,df_a:df_a=pd.DataFrame([['1001',34.3,'red'],['1001',900.04,'red'],['1001',776,'red'],['1003',18.95,'green'],['1004',321.2,'blue']],columns=['id','amount','name'])id amount name 0 1001 34.30 red 1 1001 900.04 red 2 10...

python – 如何在pandas中的多个列上进行分组和聚合【代码】

我在pandas中有以下数据帧ID Balance ATM_drawings Value1 100 50 345 1 150 33 2332 100 100 333 2 100 100 234我想要所需格式的数据ID Balance_mean Balance_sum ATM_Drawings_mean ATM_drawings_sum 1 75 250 41.5 83 2 200 ...

python – 如何对大型数据集进行分组【代码】

我有简单的文本文件,包含两列,都是整数1 5 1 12 2 5 2 341 2 12等等.. 我需要按第二个值对数据集进行分组,这样输出就会.5 1 2 12 1 2 341 2现在问题是该文件在34 Gb附近非常大在大小上,我尝试编写一个python脚本将它们组合成一个字典,其值为整数数组,但它仍然需要太长时间. (我想要花费大量时间来分配数组(‘i’)并在追加时扩展它们. 我现在正计划编写一个猪脚本,我计划在伪分布式hadoop机器上运行(亚马逊EC3高内存大型实例).data ...

在Python中表达小部件的分层分组有什么好方法?【代码】

这是一个Python风格的问题 – 我的Python代码有效,我只是在寻找一种编码约定的建议,这将使代码更容易阅读/理解/调试. 具体来说,我正在开发一个Python类,它允许调用者将小部件添加到自定义GUI.为了设置GUI,用户将编写一个方法,将小部件(命名或匿名)添加到小部件区域,以便小部件形成树(在GUI中很常见). 为了允许用户设置窗口小部件树而不必为每个容器窗口小部件命名(然后在每次添加子窗口小部件时显式引用该父窗口小部件),我的API支持...

分组 - 相关标签