【python – 复制一些行并更改pandas中的某些值】教程文章相关的互联网学习教程文章

在Python Pandas Dataframe中动态添加列的数据处理【代码】

我有以下问题.可以说这是我的CSVid f1 f2 f3 1 4 5 5 1 3 1 0 1 7 4 4 1 4 3 1 1 1 4 6 2 2 6 0 ..........因此,我有可以按ID分组的行.我想创建如下的csv作为输出.f1 f2 f3 f1_n f2_n f3_n f1_n_n f2_n_n f3_n_n f1_t f2_t f3_t 4 5 5 3 1 0 7 4 4 1 4 6 因此,我希望能够选择要转换为列的行数(始终从id的第一行开始).在这种情况下,我抓了3行.然后,我还将跳过一个或多个行(在这...

python-在Pandas DataFrame中跨多个列的映射方法【代码】

我有一个Pandas数据框,其中的值是列表:import pandas as pdDF = pd.DataFrame({'X':[[1, 5], [1, 2]], 'Y':[[1, 2, 5], [1, 3, 5]]}) DFX Y 0 [1, 5] [1, 2, 5] 1 [1, 2] [1, 3, 5]我想检查X中的列表是否是Y中列表的子集.对于单个列表,我们可以使用set(x).issubset(set(y))进行此操作.但是,我们将如何在Pandas数据列中执行此操作? 到目前为止,我想到的唯一一件事就是使用单个列表作为解决方法,然后将结果转换回Pa...

使用Python中的Pandas,为每个组选择最高价值的行【代码】

对于Pandas,适用于以下数据集author1,category1,10.00 author1,category2,15.00 author1,category3,12.00 author2,category1,5.00 author2,category2,6.00 author2,category3,4.00 author2,category4,9.00 author3,category1,7.00 author3,category2,4.00 author3,category3,7.00我想为每个作者获得最高价值author1,category2,15.00 author2,category4,9.00 author3,category1,7.00 author3,category3,7.00(抱歉,我是熊猫菜鸟.)解决...

将一个csv文件中的值匹配到另一个csv文件中,然后使用pandas / python替换整列【代码】

考虑以下示例: 我有一个Movielens-的数据集 u.item.csvID|MOVIE NAME (YEAR)|REL.DATE|NULL|IMDB LINK|A|B|C|D|E|F|G|H|I|J|K|L|M|N|O|P|Q|R|S| 1|Toy Story (1995)|01-Jan-1995||http://us.imdb.com/M/title-exact?Toy%20Story%20(1995)|0|0|0|1|1|1|0|0|0|0|0|0|0|0|0|0|0|0|0 2|GoldenEye (1995)|01-Jan-1995||http://us.imdb.com/M/title-exact?GoldenEye%20(1995)|0|1|1|0|0|0|0|0|0|0|0|0|0|0|0|0|1|0|0 3|Four Rooms (1995...

python pandas-使用for循环编辑多个DataFrame【代码】

考虑以下2个列表,包含3个字典和3个空DataFramedict0={'actual': {'2013-02-20 13:30:00': 0.93}} dict1={'actual': {'2013-02-20 13:30:00': 0.85}} dict2={'actual': {'2013-02-20 13:30:00': 0.98}} dicts=[dict0, dict1, dict2]df0=pd.DataFrame() df1=pd.DataFrame() df2=pd.DataFrame() dfs=[df0, df1, df2]我想通过使用以下行来递归地修改循环中的3个数据框:for df, dikt in zip(dfs, dicts):df = df.from_dict(dikt, orien...

python-根据Pandas DataFrame中的其他列值在列之间移动行值【代码】

我有一个熊猫数据框,上面列出了生物名称及其对抗生素的敏感性.我希望根据以下规则将所有生物整合到下面的数据框架中的一栏中. >如果ORG1 == A,则什么都不做;>如果ORG1!= A和ORG2 == A,则将ORG2值移至ORG1列>如果ORG1!= A和ORG3 == A,请将ORG3值移至ORG1列 如果满足条件2,并将ORG2的值移至ORG1列,则还将AS20 *中的列值移至AS10 *中. 同样,如果满足条件3,并将ORG3值移动到ORG1列,则也将AS30 *中的列值移动到AS10 *中. 我自己根据上...

python-Pandas:“ item”已被弃用【代码】

到目前为止,我在这里使用了以下代码行:max_total_gross = event_data["max_total_gross"].loc[event_data["event_id"] == event_id].item()自从我更新了熊猫以来,我收到了未来的警告:/opt/conda/lib/python3.7/site-packages/ipykernel_launcher.py:12:FutureWarning: item has been deprecated and will be removed in afuture version if sys.path[0] == ”:我试图用这种方式修复它,但是结果不一样:event_data.loc[event_da...

Python Pandas:根据位置而非索引值替换值【代码】

这是我的df:In[12]: df = pd.DataFrame(data = list("aabbcc"), columns = ["s"], index=range(11,17)) In[13]: df Out[13]: s 11 a 12 a 13 b 14 b 15 c 16 c现在,根据索引值替换值:In[14]: df.loc[11, "s"] = 'A' In[15]: df Out[15]: s 11 A 12 a 13 b 14 b 15 c 16 c In[16]: df.ix[12, "s"] = 'B' In[17]: df Out[17]: s 11 A 12 B 13 b 14 b 15 c 16 c是否可以基于位置而不是索引值执行相同的操作,类似...

python-Pandas版本之间的MultiIndex / Reshaping差异【代码】

我有一个使用以下代码的DataFrame:import pandas as pd import numpy as npindex = pd.DatetimeIndex(['2017-05-04', '2017-05-05', '2017-05-08', '2017-05-09','2017-05-10'], dtype='datetime64[ns]',name = 'date', freq='B') columns = pd.MultiIndex(levels=[['HSBA LN Equity', 'UCG IM Equity', 'ISP IM Equity'], ['LAST PRICE', 'HIGH', 'LOW']],labels=[[0, 0, 0, 1, 1, 1, 2, 2, 2], [0, 1, 2, 0, 1, 2, 0, 1, 2]]) d...

无法在python pandas中获得未堆积的条形图【代码】

真奇怪我只是似乎无法在python pandas中获得未堆积的条形图(与pandas官方指南不同).这些条似乎只是重叠,而不是横向放置.任何线索,为什么会这样?df.plot(kind='bar',stacked=False, figsize=(20,15), alpha=0.4)这是图像的链接: 这是样本dfOLS Ridge Lasso EN BN 0.008935 0.013937 0.000000 0.000000 BO 0.037947 0.034341 0.021778 0.021771 BP 0.205764 0.190278 0.184766 0....

使用Python dict替换/清除Pandas DataFrame中的数据【代码】

我有一个看起来像的Dataframe(table2)57 INVERNESS 361 INVERNESS 533 INVERNESS 535 INVERNESS KERRY DOWNS 758 INVERNESS GREEN 807 INVERNESS 970 INVERNESS POINT 971 INVERNESS等等.. 我需要使用Dict映射/替换名称(我在Excel工作表中具有该名称)当我将翻译表读入Pandas时,我得到的DF看起来像NSUBDIVISION SUBDIVI...

python-如何在pandas DataFrame上绘制带有一些包含字符串的列的平行坐标?【代码】

我想绘制一个熊猫DataFrame的平行坐标,该DataFrame包含带有数字的列和其他包含字符串作为值的列. 问题描述 我有以下测试代码可用于绘制带有数字的平行坐标:import pandas as pd import matplotlib.pyplot as plt from pandas.tools.plotting import parallel_coordinatesdf = pd.DataFrame([["line 1",20,30,100], ["line 2",10,40,90],["line 3",10,35,120]], columns=["element","var 1","var 2","var 3"]) parallel_coor...

python-像以前的版本一样,将pandas 0.13.0“ print dataframe”更改为print dataframe【代码】

在新版的熊猫0.13.0中,数据框df使用以下格式打印在一长串数字中:df要么print df而不是像以前那样的概述,现在只能使用df.info()是否可以将默认的“ df”或“ print df”命令更改为显示:In [12]: df.info() <class 'pandas.core.frame.DataFrame'> DatetimeIndex: 4319 entries, 2010-02-18 00:00:00 to 2010-03-13 23:15:00 Data columns (total 2 columns): QInt 4319 non-null values QHea 4319 non-null values dtypes...

python-Pandas Dataframe-基于两列但大于0的行找到最小值【代码】

我有一个包含3列的数据框:x,y,时间.有几千行. 我想做的是检索具有最少时间的行,但我希望最小值不应该为0. 例如x y time 240 1 28.5 240 2 19.3 240 240 0 240 19 9.7到目前为止,我已经尝试过以下操作:df.loc[df['time'] > 0].min() # this gives me a series and I want a row # x 225.000000 # y 0.000000 # time 1.066606df['time'].drop_duplicates().nsmallest(1) # 225 0.0我也尝...

python-Pandas wide_to_long,id变量需要唯一地标识每一行【代码】

可以说我有一个这样的数据框ID,Time1,Value1,Time2,Value2,Time3,Value3 1,2,1.1,3,1.2,4,1.3 1,5,2.1,6,2.2,7,2.3预期的数据帧是这样的ID,Time,Value 1,2,1.1 1,3,1.2 1,4,1.3 1,5,2.1 1,6,2.2 1,7,2.3如果该行具有唯一的ID,则在这种情况下pd.wide_to_long可以完美地工作.df = pd.wide_to_long(df, ['Time',Value],'ID','value', sep='', suffix='.+') .reset_index() .sort_values(['ID', 'Time']) .drop('value', axis...