【Python:如何从pandas系列中获取字典中的值】教程文章相关的互联网学习教程文章

python pandas复数【代码】

我正在使用pandas,它可以非常有效地按照我需要的方式对数据进行排序/过滤. 此代码工作正常,直到我将最后一列更改为复数;现在我收到一个错误.return self._cython_agg_general(‘mean’) raise DataError(‘No numerictypes to aggregate’) pandas.core.groupby.DataError: No numeric typesto aggregate错误是指我的第八列(复数),因为我想要平均值我找不到将对象转换为复数的方法(据我所知,大熊猫现在支持复数). 这是我使用的代码...

python – 在Pandas中使用multiIndexing时显示所有索引值【代码】

我希望在查看我的DataFrame时,我会看到multiIndex的所有值,包括后续行对其中一个级别具有相同索引的时间.这是一个例子:arrays = [['20', '50', '20', '20'],['N/A', 'N/A', '10', '30']] tuples = list(zip(*arrays)) index = pd.MultiIndex.from_tuples(tuples, names=['Jim', 'Betty']) pd.DataFrame([np.random.rand(1)]*4,index=index)输出是:0 Jim Betty 20 N/A 0.954973 50 ...

python – 合并两个数据帧而不重复pandas【代码】

我正在尝试合并两个数据框,一个包含列:customerId,全名和电子邮件,另一个数据框包含列:customerId,amount和date.我想让第一个数据帧成为主数据帧,并包含其他数据帧信息,但仅限于customerIds匹配时;我试过做:merge = pd.merge(df, df2, on='customerId', how='left')但是生成的数据框包含大量重复并且看起来不对:customerId full name emails amount date 0 002963338 Star shine star.shine@cdw.com $2,910.94 20...

python – 格式化pandas数据帧索引日期【代码】

我有一个数据框,我从下面的代码,但我无法将日期索引转换为dd / mm / yyyydf= pandas.read_html(base_url, header=0, index_col='Date', parse_dates=True)[0] df.index = pandas.to_datetime(df.index, dayfirst=True)这是结果Col1 Col2 Date 2017-02-10 val1 val1 2017-02-09 val2 val2 2017-02-08 val3 val3 2017-02-07 val4 val4 我已经厌倦了我在stackoverflow上...

python – 在Pandas中分配列时处理SettingWithCopyWarning【代码】

参见英文答案 > How to deal with SettingWithCopyWarning in Pandas? 13个我有一个DataFrame,我想用包含上一行数据的列进行扩展. 这个脚本完成了这项工作:#!/usr/bin/env python3import numpy as np import pandas as pdn = 2df = pd.DataFrame({'A': [1,2,3,4,5], 'B': [0,1,1,0,0]}, columns=['A', 'B'])df2 = df[df['B'] == 0] print(df2)for i in range(1, n+1):df2['A_%d' % i] = df2['...

python – 使用groupby的原位转换pandas【代码】

是否可以使用groupby语句将DataFrame改为inplace?import pandas as pd dt = pd.DataFrame({"LETTER": ["a", "b", "c", "a", "b"],"VALUE" : [10 , 12 , 13, 0, 15]}) def __add_new_col(dt_):dt_['NEW_COL'] = dt_['VALUE'] - dt_['VALUE'].mean()return dt_ passdt.groupby("LETTER").apply(__add_new_col)LETTER VALUE NEW_COL 0 a 10 5.0 1 b 12 -1.5 2 c 13 0.0 3 a ...

Python Pandas:Groupby Sum和Concatenate字符串【代码】

示例Pandas Dataframe:ID Name COMMENT1 COMMENT2 NUM 1 dan hi hello 1 1 dan you friend 2 3 jon yeah nope 3 2 jon dog cat .5 3 jon yes no .1我正在尝试创建一个按ID和NAME分组的数据框,它连接COMMENT1和COMMENT2,它们也总和了NUM. 这就是我要找的东西:ID Name COMMENT1 COMMENT2 NUM 1 dan hi you hello friend 3 3 jon yeah yes nop...

python – 如何让pandas Timestamp偏移一定的月份?【代码】

假设我有一个pandas Timestamp对象t1.import pandas a pd t1=pd.Timestamp('2013-04-01 00:00:00')如何获得另一个熊猫时间戳,从t1偏移k个月?解决方法:你可以使用relativedelta:In [135]: k=2 t1 + pd.datetools.relativedelta(months=k)Out[135]: Timestamp('2013-06-01 00:00:00')或DateOffset:In [136]: k=2 t1 + pd.DateOffset(months=k)Out[136]: Timestamp('2013-06-01 00:00:00')感谢@AlexRiley建议编辑,relativedelta已被...

python – 从pandas dataframe中删除非工作日行【代码】

我有一个数据框,其中包含df中小麦的第二个时间序列数据.df = wt["WHEAT_USD"]2016-05-02 02:00:00+02:00 4.780 2016-05-02 02:01:00+02:00 4.777 2016-05-02 02:02:00+02:00 4.780 2016-05-02 02:03:00+02:00 4.780 2016-05-02 02:04:00+02:00 4.780 Name: closeAsk, dtype: float64当我绘制数据时,由于周末,它有令人烦恼的水平线.有没有简单的方法可以简单地从数据框本身中删除非工作日. 就像是df = df.BDays()解决...

python – 跨pandas行/回归线应用公式【代码】

我正在尝试跨数据框的行应用公式以获得行中数字的趋势. 以下示例适用于使用.apply的部分.df = pd.DataFrame(np.random.randn(10, 4), columns=list('ABCD')) axisvalues=list(range(1,len(db.columns)+1))def calc_slope(row):return scipy.stats.linregress(df.iloc[row,:], y=axisvalues)calc_slope(1) # this worksdf["New"]=df.apply(calc_slope,axis=1) # this fails *- "too many values to unpack"*感谢您的任何帮助解决方法...

python – pandas groupby:每组的前3个值【代码】

在pandas groupby: TOP 3 values in each group and store in DataFrame中发布了一个新的更通用的问题,并在那里得到了解决方案. 在这个例子中,我创建了一个数据帧df,其中一些随机数据间隔5分钟.我想创建一个数据帧gdf(分组df),其中列出了每小时的3个最高值. 即:来自这一系列的价值观VAL TIME 2017-12-08 00:00:00 29 2017-12-08 00:05:00 56 2017-12-08 00:10:00 82 2017-12-08 00:15:00 13 2017-12-...

python – 在pandas数据帧上使用布尔过滤器时的KeyError【代码】

当来自一个数据帧的日期时间对象在另一个数据帧的日期时间对象范围内时,尝试组合两个数据帧. 继续得到:KeyError:’不能使用单个bool索引到我发布的第二个块中的这行代码的setitem’.gametaxidf.loc[arrivemask, 'relevant'] = 1我假设它会发生在下一行,同样的命令也是如此. 这是给我带来麻烦的部分:with open('/Users/benjaminprice/Desktop/TaxiCombined/Data/combinedtaxifiltered.csv', 'w') as csvfile: fieldnames1 = ['in...

python – pandas和numpy之间std的不同结果【代码】

我试图从平均值中减去列中的每个元素并除以标准偏差.我以两种不同的方式(numeric_data1和numeric_data2)完成了它:import pandas as pd data = pd.read_csv("https://s3.amazonaws.com/demo-datasets/wine.csv") numeric_data = data.drop("color", 1) numeric_data1 = ((numeric_data - numeric_data.mean()) /numeric_data.std()) numeric_data2 = ((numeric_data - np.mean(numeric_data, axis=0)) /np.std(numeric_data, axis=...

python – Pandas:根据另一个DF选择DF行【代码】

我有两个数据帧(很长,每个有数百或数千行).其中一个名为df1,包含一个时间序列,间隔为10分钟.例如:date value 2016-11-24 00:00:00 1759.199951 2016-11-24 00:10:00 992.400024 2016-11-24 00:20:00 1404.800049 2016-11-24 00:30:00 45.799999 2016-11-24 00:40:00 24.299999 2016-11-24 00:50:00 159.899994 2016-11-24 01:00:00 82.499999 2016-11-24 01:10:00 37.400003 2016-11-...

python – Pandas在DataFrame groupby上的百分比计数【代码】

我有一个DataFrame(mydf)沿着以下几行:Index Feature ID Stuff1 Stuff2 1 True 1 23 12 2 True 1 54 12 3 False 0 45 67 4 True 0 38 29 5 False 1 32 24 6 False 1 59 39 7 True 0 37 32 8 False 0 76 65 9 False 1 32 12 10 True 0 23 15 ..n True 1 ...

字典 - 相关标签