【python – 比较多个列以获取两个Pandas Dataframe中不同的行】教程文章相关的互联网学习教程文章

python – 将项添加到空pandas DataFrame【代码】

我想以下列方式动态扩展空的pandas DataFrame:df=pd.DataFrame() indices=['A','B','C'] colums=['C1','C2','C3'] for colum in colums:for index in indices:#df[index,column] = anyValue其中索引和列都可以具有事先不知道的任意大小,即我不能提前创建具有正确大小的DataFrame. 我可以使用哪种熊猫功能#df[index,column] = anyValue?解决方法:我想你可以使用loc:df = pd.DataFrame()df.loc[0,1] = 10 df.loc[2,8] = 100 print...

python – 重塑Pandas DataFrame【代码】

我有以下DataFrameA 0 2012-01-13 10:00:06 1 2012-01-13 11:09:04 2 2012-01-13 12:07:05 3 2012-01-13 13:03:04 4 2012-01-16 10:00:10 5 2012-01-16 11:09:04 6 2012-01-16 12:01:05 7 2012-01-16 13:09:04 8 2012-01-17 10:01:04 9 2012-01-17 11:05:06 10 2012-01-17 12:01:05 11 2012-01-17 13:04:04其中索引是0,1,..等 有没有办法根据当天转置数据?例如,新的DataFrame应如下所示:A B ...

python – 如何在Pandas中的.csv文件中写入DataFrame时删除索引列?【代码】

参见英文答案 > Pandas to_csv call is prepending a comma 1个我的DataFrame包含两列名为“a”,“b”的列.现在,当我创建此DataFrame的csv文件时:df.to_csv(‘myData.csv’)当我在一个excel文件中打开它时,有一个额外的列,索引出现在列’a’和’b’旁边,但我不希望这样.我只希望列’a’和’b’出现在Excel工作表中. 有没有办法做到这一点?解决方法:尝试,df.to_csv('myData.csv',index=False)

在python pandas dataframe中找出一行值与剩余行值的差异【代码】

初始数据帧:df = Index Nature Interval 0 0 1 0.000000 1 1 1 0.999627 2 2 1 1.000607 3 3 1 1.000612参赛作品总数约为700,000. 有没有办法找到“Interval”列中的一个元素与同一列中所有剩余元素之间的差异,并且必须对剩余的数据帧执行相同的操作. 我找到了解决此问题的方法.片段是df["Potential"] = df["Interval"].apply(l...

使用dict(python3)重新索引pandas DataFrame【代码】

有没有办法,不使用循环,使用dict重新索引DataFrame?这是一个例子:df = pd.DataFrame([[1,2], [3,4]]) dic = {0:'first', 1:'second'}我想对df应用一些有效的东西来获得:0 1 first 1 2 second 3 4速度很重要,因为我正在处理的实际DataFrame中的索引具有大量的唯一值.谢谢解决方法:你需要rename功能:df.rename(index=dic)# 0 1 #first 1 2 #second 3 4修改了dic来得到结果:dic = {0:’first’,1:’second’...

python – 如何在pandas中将n * m DataFrame与1 * m DataFrame相乘?【代码】

我有2个pandas DataFrame,我想成倍增加:frame_score: Score1 Score2 0 100 80 1 -150 20 2 -110 70 3 180 99 4 125 20frame_weights: Score1 Score2 0 0.6 0.4我试过了:import pandas as pd import numpy as npframe_score = pd.DataFrame({'Score1' : [100, -150, -110, 180, 125], 'Score2' : [80, 20, 70, 99, 20]})frame_weights = pd.DataFrame({'Score1': [0.6],...

python – Pandas:按列中的观察数量扩展DataFrame【代码】

Stata具有函数expand,其将行添加到对应于特定列中的值的数据库.例如: 我有:df = pd.DataFrame({"A":[1, 2, 3], "B":[3,4,5]})A B 0 1 3 1 2 4 2 3 5我需要的:df2 = pd.DataFrame({"A":[1, 2, 3, 2, 3, 3], "B":[3,4,5, 4, 5, 5]})A B 0 1 3 1 2 4 2 3 5 3 2 4 4 3 5 6 3 5df.loc [0,’A’]中的值为1,因此没有额外的行添加到DataFrame的末尾,因为B = 3只应该发生一次. df.loc [1,’A’]中的值为2,因此在Data...

python – 将一个DataFrame分组到一个新的DataFrame中,并将一个范围作为索引【代码】

参见英文答案 > Converting a Pandas GroupBy object to DataFrame 8个我有一个问题,在这个例子中简化了.考虑一下这个Pandas DataFrame,df_a:df_a=pd.DataFrame([['1001',34.3,'red'],['1001',900.04,'red'],['1001',776,'red'],['1003',18.95,'green'],['1004',321.2,'blue']],columns=['id','amount','name'])id amount name 0 1001 34.30 red 1 1001 900.04 red 2 10...

python – Pandas Dataframe替换系列中的值【代码】

我正在尝试根据条件选择更新my_df,如:my_df[my_df['group'] == 'A']['rank'].fillna('A+')但是,这不是持久性……例如:my_df仍然有NaN或NaT ……我不知道如何在in_place中执行此操作.请告知如何将更新保留到my_df.解决方法:创建布尔掩码并分配给筛选的列级别:my_df = pd.DataFrame({'group':list('AAAABC'),'rank':['a','b',np.nan, np.nan, 'c',np.nan],'C':[7,8,9,4,2,3]})print (my_df)group rank C 0 A a 7 1 A...

python – 从pandas dataframe中删除重复的列索引【代码】

我正在寻找一个解决方案来删除我的数据框中的重复列索引 – 我需要做的是逐行添加重复列中的值,然后只保留这些列中的一个与总和值df = pd.DataFrame(np.array([[0,0,0,1,0,0,0], [0,1,0,0,0,0,0],[0,0,0,0,0,0,1]]), columns=[1,1,2,2,2,3,3], index=[1,2,3])1 1 2 2 2 3 3 1 0 0 0 1 0 0 0 2 0 1 0 0 0 0 0 3 0 0 0 0 0 0 1应该成为1 2 3 1 0 1 0 2 1 0 0 3 0 0 1解决方法:由于缺少数据,对...

在Python pandas中将DataFrame添加到Panel【代码】

我想创建具有不同数据帧的面板,我尝试编写一个函数来返回此面板.我使用一些已编写的函数createNewDf(i),它根据给定的数值从现有数据返回dataFrame.def panelCreation():dp1 = Panel({})for i in range(1,3):name = 'X' + str(i)name = createNewDf(i)dp1.update(name) # This does not workreturn dp1我找不到代替dp1.update(name)的方法名称解决方法:如何从DataFrame的字典中创建Panel?In [10]: dd = {}In [11]: for i in ...

python – 给定边缘分割DataFrame的最佳方法【代码】

假设我有以下DataFrame:a b 0 A 1.516733 1 A 0.035646 2 A -0.942834 3 B -0.157334 4 A 2.226809 5 A 0.768516 6 B -0.015162 7 A 0.710356 8 A 0.151429鉴于“边缘B”,我需要将它分组;这意味着这些团体将是:a b 0 A 1.516733 1 A 0.035646 2 A -0.942834 3 B -0.1573344 A 2.226809 5 A 0.768516 6 B -0.0151627 A 0.710356 8 A 0.151429那是.任何时候我在’a’列中找到’B’我...

python – 使用相同的列,不同的索引级别对齐DataFrame【代码】

我有两个pandas DataFrames – weight在Land Use列上有一个简单的Index.浓度具有土地利用和参数的MultiIndex.import pandas from io import StringIOconc_string = StringIO("""Land Use,Parameter,1E,1N,1S,2 Airfield,BOD5 (mg/l),0.418,0.118,0.226,1.063 Airfield,Ortho P (mg/l),0.002,0.001,0.001,0.002 Airfield,TSS (mg/l),1.773,11.47,0.862,0.183 Airfield,Zn (mg/l),0.001,0.001,4.95E-05,0.001 "Commercial",BOD5 (m...

删除Python Pandas DataFrame中的重复项不会删除重复项【代码】

我有删除重复项的问题.我的程序基于一个生成元组(x,y)的循环,然后将其用作图中的节点.节点的最终数组/矩阵是:[[ 1. 1. ] [ 1.12273268 1.15322175] [..........etc..........] [ 0.94120695 0.77802849] **[ 0.84301344 0.91660517]** [ 0.93096269 1.21383287] **[ 0.84301344 0.91660517]** [ 0.75506418 1.0798641 ]]数组的长度是22.现在,我需要删除重复的条目(参见**).所以我用过:def urows(array):df...

python – Pivoting pandas DataFrame – AssertionError:索引长度与值不匹配【代码】

我有一个pandas.DataFrame,它不会像我期望的那样转动.虽然pivot_table正确地安排了所有事情,但它使用聚合函数来实现这一目标的事实令人反感.另外,pivot_table似乎返回一个不必要的复杂对象而不是一个平面数据框. 请考虑以下示例import pandas as pd df = pd.DataFrame({'firstname':['Jon']*3+['Amy']*2,'lastname':['Cho']*3+['Frond']*2,'vehicle':['bike', 'car', 'plane','bike','plane'],'weight':[81.003]*3+[65.6886]*2,'sp...