【python – 在SFrame中分组而不安装graphlab】教程文章相关的互联网学习教程文章

python_pandas DAY_18(4)分组计算【代码】

学习内容 pandas分组计算 Tips:分组求和步骤 1)分组 2)应用 3)合并 重点 1.一般分组 import pandas as pd import numpy as npdf = pd.DataFrame(np.random.randint(10, 20, (4, 2)),index=['a', 'b', 'c', 'd'],columns=["one", "two"]) print(df) print(df["one"].groupby(df['two']))#这个关键字分组只能按列分组one two a 11 12 b 16 14 c 15 16 d 12 13 <pandas.core.groupby.generic.SeriesGroupBy obje...

049字符异位词分组(python)【代码】【图】

简单题见242 升级版为49 ython中通过Key访问字典,当Key不存在时,会引发‘KeyError’异常。为了避免这种情况的发生,可以使用collections类中的defaultdict()方法来为字典提供默认值。class Solution(object):def groupAnagrams(self, strs):ans = collections.defaultdict(list)for i in strs:ans[tuple(sorted(i))].append(i)return ans.values()2020-01-10 10:56:57

python-Django模板系统:如何解决此循环/分组/计数?【代码】

我有一个文章列表,每个文章都属于一个部分.class Section(models.Model):name = models.CharField(max_length=200)def __unicode__(self):return self.nameclass Article(models.Model):section = models.ForeignKey(Section)headline = models.CharField(max_length=200)# ...我想显示按部分分组的文章.Sponsorships, Advertising & Marketing 1. Nike To Outfit All 18 Univ. Of Memphis Athletic Teams 2. Phil Jackson Questio...

python-Matplotlib数字分组(小数点分隔符)【代码】

基本上,当使用matplotlib生成图时,y轴上的比例会达到数百万.如何打开数字分组(即1000000显示为1,000,000)或打开小数点分隔符?解决方法:我认为没有内置函数可以执行此操作. (这就是我在读完您的Q之后的想法;我只是检查了一下,但在文档中找不到一个). 无论如何,轻松推出自己的游戏. (下面是一个完整的示例,即,它将生成一个带有坐标滴答标签的轴的mpl图-尽管创建自定义刻度标签只需要五行代码-该函数需要三行代码(包括import语句)用...

python-DateField()数据的Django每月/四方分组【代码】

我有一个django模型,其中包含一个DateField()属性:class Table():date = models.DateField()value = models.FloatField()我正在写一个视图,按周,月,季度和年份对数据进行分组.我已经对编码进行了硬编码,从而很简单地获得了每月的价值-通过将当月的所有价值相加并指定有多少条目来进行计算-但我觉得必须有一种更优雅的方式来做到这一点. 我的目标是这样的:get_monthly(Table.objects.all()) >>> [123, 412, 123, 534, 234, 423, 3...

python-分组属性的优雅方法【代码】

我想对一个类的实例的属性进行分组,以使遍历属于一个组的所有属性变得容易.显而易见的答案是将所有这些内容放入列表或字典中,但是那样我将无法将它们作为对象的属性来访问,因此我更愿意这样做. 一些代码应该清楚我想要什么.在这里,我实际上有一个列表和实际属性.class Vectors(object):def __init__(self, v1, v2, v3):self.v1 = v1self.v2 = v2self.v3 = v3self.rotatable = ['v2', 'v3']def rotate(self, angle):for v in self.r...

python-带条件的外键分组和排序【代码】

我有一些Django模型记录人们的收听习惯(有点像Last.fm),如下所示:class Artist(models.Model):name = models.CharField()class Song(models.Model):artist = models.ForeignKey(Artist)title = models.CharField()class SongPlay(models.Model):song = models.ForeignKey(Song)user = models.ForeignKey(User)time = models.DateTimeField()class User(models.Model):# doesn't really matter!我想要一个用户页面,在这里可以显示他...

python-分组的熊猫DataFrames:如何将scipy.stats.sem应用于它们?【代码】

我知道我可以通过执行以下操作来应用numpy方法: dataList是DataFrames的列表(相同的列/行).testDF = (concat(dataList, axis=1, keys=range(len(dataList))).swaplevel(0, 1, axis=1).sortlevel(axis=1).groupby(level=0, axis=1))testDF.aggregate(numpy.mean) testDF.aggregate(numpy.var)等等.但是,如果我想计算均值(sem)的标准误差怎么办? 我试过了:testDF.aggregate(scipy.stats.sem)但它给出了一个令人困惑的错误.有人知道...

python-按熊猫中的多个日期对数据进行分组【代码】

我有一些包含日期的数据,例如:1979-02-15 1979-02-15 1979-02-17 1979-02-17我想按年份,月份和日期对数据进行分组,以便数据看起来像1979 02 151979-02-15 1979-02-151979 02 171979-02-17 1979-02-17我已经找到了功能grouped = df.groupby(lambda x: x.year)但这仅允许按年份分组.因此,我的问题是如何按日期对熊猫进行多级分组?解决方法:您可以将多个密钥作为列表传递给groupby:from pandas import * from numpy.random import ...

python-用numpy将数组分组到嵌套结构【代码】

假设我有一个像这样的numpy数组(更大,每个日期的重复次数不同):data = np.array([ ["2011-01-01", 24, 554, 66], ["2011-01-01", 44, 524, 62], ["2011-01-04", 23, 454, 32], ["2011-01-04", 22, 45, 42], ["2011-01-04", 14, 364, 12] ])现在,我想按日期将列分组为一个更扁平的结构:[ ["2011-01-01", [[24, 554, 66], [44, 524, 62]]],["2011-01-04", [[23, 454, 32], [22, 4...

python-用熊猫将数据分组为单独的批次【代码】

我正在尝试创建一个函数,该函数在DataFrame上添加一列,该列为一组时间数据创建批号.我假设一旦水平低于/高于1000,我们便清空(然后重新填充)该批次,因此它是新批次.这意味着我可以按批号将数据分组以进行进一步分析. 我的数据看起来像df_test = pd.DataFrame( { 'Time' : [1300, 1400, 1500, 1600, 1700, 1800],'Level' : [ 200, 1300, 1500, 200, 1500, 1400],'Data' : range(6) })Data Level Time 0 0 200 1300 1 ...

python-熊猫用给定分组的平均值替换nan【代码】

我有一个形式的大数据集:period_id gic_subindustry_id operating_mgn_fym5 operating_mgn_fym4 317 201509 25101010 13.348150 11.745965 682 201509 20101010 10.228725 10.473917 903 201509 20101010 NaN 17.700966 1057 201509 50101010 27.858305 ...

python pandas数据框上的条件总和被分组在多列上【代码】

为了说明我的问题,我有一个示例数据框df = pd.DataFrame({'key1': [0, 0, 0, 0, 1, 1, 1, 1, 1, 1], 'key2': ['a', 'b', 'b', 'c', 'a', 'a', 'a', 'b', 'b', 'c'], 'key3': [10, 5, 15, 10, 5, 10, 20, 10, 20, 5], 'zdata': [2, 4, 2, 4, 3, 5, 6, 5, 5, 6]})什么时候df1 = df.groupby(['key1', 'key2', 'key3']) df1 = df1.agg({'zdata' : [np.mean]})产生zdatamean key1 key2 key3 0 a 10 2b 5 4...

如何使用Python在一个时间段内对行进行分组【代码】

我有一些交易的数据框.我想根据项目和时间列的值对这些交易进行分组:目标是对彼此相差1小时以内的项目进行分组.因此,我们在下一次观察时(不在观察前一个小时之内)开始一个新组(请参阅DataFrame B中的列开始时间). 这是数据:我想将A转换为B.A= item time result A 2016-04-18 13:08:25 Y A 2016-04-18 13:57:05 N A 2016-04-18 14:00:12 N A 2016-04-18 23:45:50 Y A 2016-04-20 16:53:48 Y A 20...

Python Pandas groupby并使用分组明智的计算来更改新列ala dplyr【代码】

我对R dplyr进行数据分析非常熟悉,并且正在尝试将用dplyr编写的一些代码转换为pandas.我所拥有的数据由ID列和DATE所标识的人员使用该产品.我正在尝试找出将以下R dplyr代码转换为python pandas代码的最佳方法.基本上,我将ID列分组,过滤某种类型的产品,然后添加一列(对于该组中的每一行),添加该人的最短(首次使用)日期和最长(最后使用)日期和产品.最后,我还要添加一列来计算上次使用日期和首次使用日期之间的天数.数据如下:ID PRO...

GRAPH - 相关标签