【python-浮动到百分比样式错误的Pandas dataframe列】教程文章相关的互联网学习教程文章

python-Pandas Dataframe中分组依据中的多个聚合【代码】

SQL : Select Max(A) , Min (B) , C from Table group by C 我想在数据框上的熊猫中执行相同的操作.我离得更近了:DF2= DF1.groupby(by=['C']).max() 我在哪里得到两列的最大值,在分组时如何做多个操作.解决方法:试试agg()函数:import numpy as np import pandas as pddf = pd.DataFrame(np.random.randint(0,5,size=(20, 3)), columns=list('ABC')) print(df)print(df.groupby('C').agg({'A': max, 'B':min}))输出:A B C 0 ...

python-在Pandas中用系列连接一个DataFrame【代码】

有人可以解释一下这个熊猫的concat代码有什么问题,为什么数据框仍然为空?我使用的是Python散布,据我所知它以前一直在工作.解决方法:您要使用以下形式:result = pd.concat([dataframe, series], axis=1)pd.concat(…)不会“插入”到原始数据帧中,但是会返回连接结果,因此您需要在某个地方分配连接,例如:>>> import pandas as pd >>> s = pd.Series([1,2,3]) >>> df = pd.DataFrame() >>> df = pd.concat([df, s], axis=1) # We ...

python-拆分DataFrame的奇数行而不使用double iloc【代码】

测试df:import pandas as pddf = pd.DataFrame({'A':[1,2,3,7,8,4],'B':[4,5,6,1,4,6],'C':[7,8,9,2,7,3],'D':[4,5,2,1,0,6]})df.set_index(['A','B'], inplace=True) print (df)C D A B 1 4 7 4 2 5 8 5 3 6 9 2 7 1 2 1 8 4 7 0 4 6 3 6按奇数行拆分:print (df.iloc[::2])C D A B 1 4 7 4 3 6 9 2 8 4 7 0我需要再次拆分-df1的最后一行,所有其他行到df2:df1 = df.iloc[-2::2] df2 = df.iloc[...

python-通过映射将3列添加到DataFrame【代码】

是否可以在一张地图中向此小DataFrame添加3个新列?import datetime as dt import pandas as pd from pandas import *df = pd.DataFrame({'myDate':['2006-02-12','2007-07-20','2009-05-19']})def convert_date(val): d, m, y = val.split('-')return int(d), int(y), int(m)df[['day', 'year','month']] = df.myDate.map(convert_date)解决方法:我认为您可以转换列myDate to_datetime,然后使用dt.year、dt.month和dt.day:d...

python-如何透视pandas DataFrame列以创建二进制“值表”?【代码】

我有以下熊猫数据框:import pandas as pd df = pd.read_csv("filename.csv")df A B C D E 0 a 0.469112 -0.282863 -1.509059 cat 1 c -1.135632 1.212112 -0.173215 dog 2 e 0.119209 -1.044236 -0.861849 dog 3 f -2.104569 -0.494929 1.071804 bird 4 g -2.224569 -0.724929 2.234213 elephant ...我想基于列E中的分类值的标识创建更多列,以使数据框如下所示...

python-pandas DataFrame:如何使用自定义方式剪切数据框?【代码】

我想使用自己的规则将一个DataFrame切成几个数据框.>>> data = pd.DataFrame({'distance':[1,2,3,4,5,6,7,8,9,10],'values':np.arange(0,1,0.1)}) >>> datadistance values 0 1 0.0 1 2 0.1 2 3 0.2 3 4 0.3 4 5 0.4 5 6 0.5 6 7 0.6 7 8 0.7 8 9 0.8 9 10 0.9我将根据距离列的值剪切数据.例如,有一些b...

python-熊猫:根据日期范围和ID在Dataframe中添加金额【代码】

不久前,我问了一个问题(here),有关如何通过比较另一个数据框中的日期来查找数据框中的列总和.但是,我现在想做类似的事情,但要包含一个ID,该ID可能与另一个ID的日期完全相同. 这是我的代码:df_a = pd.DataFrame({'end':pd.to_datetime(['1/15/2016','1/15/2016','3/15/2016','5/15/2016','5/15/2016','7/15/2016']),'ID':[1,2,1,2,1,1]})df_a['start'] = df_a.groupby('ID')['end'].shift().fillna(0) df_a = df_a[['start','end',...

python-以任何方式在Pandas DataFrame查询中强制转换类型吗?【代码】

假设我有一个3列的数据框,都为浮点型,将其命名为DT1.现在,如果我想通过查询DT1从DT1创建另一个数据帧,请说第二个称为DT2.DT2 = DT1.query(‘(column1/column2) == (column3/column2)’)仅当方程式的两边完全匹配时,此方法才有效.如果我只想比较两侧的整数结果怎么办? 喜欢:DT2 = DT1.query(‘(column1/column2).astype(int) == (column3/column2)’).astype(int)上面的示例不起作用,有解决方案吗? PS:DT2 = DT1.loc(‘(DT1[col...

python-Pandas DataFrame在groupby中删除行【代码】

我有一个包含三列的日期,广告商和ID的DataFrame.我首先对数据进行了分组,以查看某些广告商的体积是否太小(例如,count()小于500).然后,我想将这些行放入组表中.df.groupby(['Date','Advertiser']).ID.count()结果如下:Date Advertiser2016-01 A 50000B 50C 4000D 240002016-02 A 6800B 7800C 1232016-03 ...

python-如何在Pandas Dataframe中查找特定值【代码】

我已经以csv格式在熊猫中导入了数据.谁能告诉我如何在我拥有的其中一列中找到280以上的值,并将其放入另一个数据框中.到目前为止,我已经完成了以下代码:import numpy as np import pandas as pd df = pd.read_csv('...csv')数据的一部分就像所附的图片:enter image description here解决方法:您需要boolean indexing:df1 = df[df[2] > 280]如果需要还选择仅列添加loc:s = df.loc[df[2] > 280, 2]样品:df = pd.DataFrame({0:[1,...

python-在Pandas DataFrame中构建复杂的子集【代码】

我正在使用GroupBy,但仍然需要一些帮助.假设我有一个带有列Group的DataFrame,为对象提供了组编号,一些参数R和球坐标RA和Dec.这是一个模拟DataFrame:df = pd.DataFrame({ 'R' : (-21.0,-21.5,-22.1,-23.7,-23.8,-20.4,-21.8,-19.3,-22.5,-24.7,-19.9),'RA': (154.362789,154.409301,154.419191,154.474165,154.424842,162.568516,8.355454,8.346812,8.728223,8.759622,8.799796),'Dec': (-0.495605,-0.453085,-0.481657,-0.6148...

python-如何在Pandas DataFrame的几列中进行一键编码以供以后与Scikit-Learn一起使用【代码】

说我有以下数据import pandas as pd data = {'Reference': [1, 2, 3, 4, 5],'Brand': ['Volkswagen', 'Volvo', 'Volvo', 'Audi', 'Volkswagen'],'Town': ['Berlin', 'Berlin', 'Stockholm', 'Munich', 'Berlin'],'Mileage': [35000, 45000, 121000, 35000, 181000],'Year': [2015, 2014, 2012, 2016, 2013]} df = pd.DataFrame(data)我想在其上对“品牌”和“镇”两列进行一次热编码,以训练分类器(例如使用Scikit-Learn)并预测年份...

python-Pandas DataFrame中两个非数字列之间的相关性【代码】

我从表中的SQL查询中获取数据到熊猫数据框.数据如下:group phone_brand 0 M32-38 小米 1 M32-38 小米 2 M32-38 小米 3 M29-31 小米 4 M29-31 小米 5 F24-26 OPPO 6 M32-38 酷派 7 M32-38 小米 8 M32-38 vivo 9 F33-42 三星 10 M29-31 华为 11 F33-42 华为 ...

python-如何从自定义值创建DataFrame【代码】

我正在阅读一个文本文件,每一行都有多个值.我正在根据需求使用函数解析来解析它们.def parse(line):............return line[0],line[2],line[5]我想创建一个数据框,每行为一行,三个调整后的值为列df = pd.DataFrame()with open('data.txt') as f:for line in f:df.append(line(parse(line)))当我运行上面的代码时,我将所有值作为单个列获取.是否有可能以正确的表格格式获取它.解决方法:您不应该以循环方式附加到DataFrame,否则效率...

Python-Pandas-DataFrame-根据条件将单个列分解为多个布尔列【代码】

早上好, 根据某种条件(在这种情况下包含str),是否有任何Python方式将具有布尔标志的数据框列分解为多列? 假设我有这个:Position Letter 1 a 2 b 3 c 4 b 5 b我想实现这一目标:Position Letter is_a is_b is_C 1 a TRUE FALSE FALSE 2 b FALSE TRUE FALSE 3 c FALSE FALSE TRUE 4 b FALS...

错误 - 相关标签