【python – pandas dataframe,按值复制】教程文章相关的互联网学习教程文章

python – Pandas Dataframe对象在不同的​​数据类型上输入fillna异常【代码】

我有一个Pandas Dataframe,不同的列有不同的dtypes.例如. df.dtypes返回以下内容.Date datetime64[ns] FundID int64 FundName object CumPos int64 MTMPrice float64 PricingMechanism object各种奶酪列都缺少价值.使用NaN值对其执行组操作会导致问题.用.fillna()方法摆脱它们是显而易见的选...

python – Pandas:使用MultiIndex将DataFrame转换为dict【代码】

另一个新手熊猫问题.我想将DataFrame转换为字典,但其方式与DataFrame.to_dict()函数提供的方式不同.按示例说明:df = pd.DataFrame({'co':['DE','DE','FR','FR'],'tp':['Lake','Forest','Lake','Forest'],'area':[10,20,30,40],'count':[7,5,2,3]}) df = df.set_index(['co','tp'])之前:area count co tp DE Lake 10 7Forest 20 5 FR Lake 30 2Forest 40 3后:{('DE', 'Lake', 'area'): 10,...

python – 在复制之后但在编辑副本之前编辑原始DataFrame更改副本【代码】

我试图了解如何复制pandas数据框.当我在python中分配对象的副本时,我不习惯更改影响该对象副本的原始对象.例如:x = 3 y = x x = 4 print(y) 3虽然x随后被更改,但y保持不变.相反,当我将pandas df分配给副本df1后对其进行更改时,副本也会受到原始DataFrame更改的影响.import pandas as pd import numpy as npdef minusone(x):return int(x) - 1df = pd.DataFrame({"A": [10,20,30,40,50], "B": [20, 30, 10, 40, 50], "C": [32, 234...

python – 在pandas dataframe中创建一个新列作为另一列的函数【代码】

我的pandas数据框有一个现有的列“div”,它有一个字符串.我想创建一个新列(‘newcol’),其值等于div中字符串的第一个字符. 我试图指定这几种方法,但它不起作用. results [‘newcol’] = results [‘div’]给我完整的字符串(如预期的那样)而不是第一个字符. 结果[‘newcol’] =结果[‘Div’].值[0]和结果[‘newcol’] =结果[‘Div’] [0]使每行中的newcol等于第一行的’Div’字符串. 结果[‘newcol’] = str(结果[‘Div’])和结果[‘...

python – NetworkX From_Pandas_dataframe【代码】

我对NetworkX有一个错误,说’模块’没有属性’from_pandas_dataframe’. 我有一个名为nflroster的数据框格式为:Index . . . Player Team Year0 . . . Player1 Team1 20141 . . .Player2 Team1 20142 . . . Player3 Team2 2014 . . . . . . . .所以根据这里的文档networkx documentation,以下这一行应该有效G = n...

python – 由pandas dataframe中的另一个列内容填充NaN列【代码】

我有一个数据框,其中一列有很多NaN值.当NaN在列中时,我需要通过另一个列值更新这些值.One Two 0 10 211 11 NaN2 12 25我想要这样的结果One Two0 10 211 11 **11**2 12 25请帮助我在第二列中进行切片合成,并让Nafill检测从第一列复制值. 这是创建第一个矩阵的代码:df = pd.DataFrame({'One' : [10, 11, 12], 'Two' : [21, np.NAN, 25]})解决方法:您可以使用该列使用fillna:In [4]: df[...

python – Pandas DataFrame apply()ValueError:解压缩的值太多(预期2)【代码】

我刚刚开始探索Python,虽然我很兴奋,但我似乎远非Python思维. 以下是一种方法示例,其中包含“次优”一词.虽然这对我相对较小的数据集来说已经足够了,但我想知道如何更好地编写它?import pandas as pd from pandas import DataFrame# create sample log data frame lg = pd.DataFrame(['Access violation at address 00A97...','Try to edit the splines or change...','Access violation at address 00F2B...','Please make sure ...

python – 从Dataframe – Pandas中的所有列的列名中删除最后两个字符【代码】

我使用用户ID密钥加入具有相同列/列名称的两个数据帧(a,b),并且在加入时,我必须提供后缀字符,以便创建它.以下是我使用的命令,a.join(b,how='inner', on='userId',lsuffix="_1")如果我不使用这个后缀,我会收到错误.但我不希望列名更改,因为这会导致运行其他分析时出现问题.所以我想从结果数据帧的所有列名中删除这个“_1”字符.任何人都可以建议我删除Pandas数据帧中所有列的最后两个字符的有效方法吗? 谢谢解决方法:这个片段应该完...

python – 如何计算Pandas Dataframe中变量的唯一组合【代码】

我正在使用pandas来计算数据帧中变量集的唯一组合.我目前正在使用.groupby()函数,但我认为我缺少它的一部分功能. 示例代码:import pandas df = pd.DataFrame([['A','C','G'],['A','C','H'],['A','D','G'],['A','D','H'],['B','E','I'],['B','F','I']], columns=['a','b','c']) dfa b c 0 A C G 1 A C H 2 A D G 3 A D H 4 B E I 5 B F I我想知道,对于每个独特的价值a,它有多少不同的b?在此示例中,所需输出为...

python – 设置pandas Dataframe Boxplot()的y轴刻度,3个偏差?【代码】

我正在尝试每月制作一个箱线图表区域,不同的箱形图按行业分组(并标记),然后让Y轴使用我指定的比例. 在一个完美的世界中,这将是动态的,我可以将轴设置为与整体平均值的一定数量的标准偏差.我可以使用其他类型的动态设置y轴,但我希望它是所有创建的“月度”分组箱图的标准.我不知道处理这个问题的最佳方法是什么,并且对智慧开放 – 我所知道的是现在使用的数字对于图表来说是有意义的. 我已经尝试过所有类型的代码,并且在轴的缩放方面...

python – 在seaborn中绘制两列dataFrame【代码】

我正在尝试在seaborn中创建一个条形图,显示数据框中每行(因子)的两个变量(权重,方差)的值.这是我的数据:Factor Weight VarianceGrowth 10% 0.15Value 20% 0.35这是我的代码:fig=plt.figure(figsize=(10,10))ax1=fig.add_subplot(221)sns.barplot(x=df.index, y=df[['Weight', 'Variance']], ax=ax1)每次我无法调试时,上面会抛出一个错误.我想要实现的是有一个图,每个因子显示两个彩色条;一种颜色的重量(例如...

python – Pandas Dataframe – 多级索引/列【代码】

我在组织数据帧时遇到了一些困难.我认为这很简单,但我已经坚持了这么久: 这是df1:Output Energy, (Wh/h) Lights (Wh) Lights+Media (Wh) Total Usage (h) Hour 1 0.0 0.0 0.0 0.0 2 0.0 0.0 0.0 0.0 3 ...

Python列表到dataframe – AssertionError【代码】

我在python中有一个列表列表.我试图将其转换为数据帧.例如=foo = [[1,2,3...],[a,b,c...],[aa,bb,cc...] ]这3个列表中的每一个都包含100个元素.我尝试了以下转换为数据帧 – df = pandas.DataFrame(foo, columns=headers) // where headers is ['id', 'fname', 'lname'] df = pandas.DataFrame(foo, columns=[foo[0], foo[1], foo[2]])但是我收到这个错误 – AssertionError: 3 columns passed, passed data had 100 columns解决方...

python – 在Pandas DataFrame列中替换n个连续值【代码】

假设我有以下DataFrame dfdf = pd.DataFrame({"a" : [1,2,2,2,2,2,2,2,2,3,3,4,4,4,4,4,4,4,4,4,4,4,4,4,4,4,4,4,4,5,5,5], "b" : [3,3,3,3,3,3,3,4,4,4,4,5,5,5,5,5,5,5,5,5,5,5,5,5,5,5,5,5,6,6,7,7], "c" : [4,4,4,4,4,4,4,4,4,4,4,4,4,4,4,4,4,4,5,5,5,1,2,2,2,2,2,2,2,2,3,3]})而且我希望替换连续重复10次以上任意列(可能有数百列)的4号,其中10 4个,其余5个. 因此,例如,12个连续4个将被替换为10个4和2个5. 我如何用熊猫实现这...

python – Pandas DataFrame合并选择更高的值【代码】

我有两个这样的DataFrame:1 2 3 0 61.579 0.000000 47.279861 1 0.000 0.000000 0.000000 2 62.700 9.180000 48.479861 3 56.100 40.180000 71.679861 4 73.100 50.930000 71.679861 5 88.300 37.930000 36.479861 我需要合并它们每次选择更高的值.所有值都是浮点数.有任何想法吗?我必须循环DataFrames?解决方法:首先需要concat,然后需要groupby和最大聚合:df1 = pd.DataFram...