【python – 为什么pandas.DataFrame.update会更改更新数据帧的dtypes?】教程文章相关的互联网学习教程文章

python-创建具有唯一索引的Pandas Dataframe【代码】

是否可以创建一个具有唯一索引或列的数据框,类似于在mysql中创建唯一键,如果尝试添加重复索引,它将返回错误? 还是我唯一的选择来创建一个if语句并在附加数据之前检查数据框中的值? 编辑: 看来我的问题有点不清楚.对于唯一列,我的意思是我们不能在列中包含非唯一值. 用df.append(new_row, verify_integrity=True)我们可以检查所有列,但是如何只检查一两个列呢?解决方法:您可以使用df.append(..., verify_integrity=True)维护唯一...

python-Pandas Dataframe-带条件/行迭代/上一行计算的最小函数【代码】

我有一个数据框,其中有一些记录的开始和结束日期:import pandas as pddf = pd.DataFrame({'Key': ['A', 'A', 'A', 'A', 'B', 'B', 'B', 'B' ], 'StartDate': ['01/01/2015', '01/01/2016', '06/01/2016','10/01/2017', '01/01/2015', '01/01/2016', '07/15/2016','10/01/2017'], 'EndDate': ['12/30/2015', '05/31/2016', '09/30/2017', '12/31/2018', '12/30/2015', '05/31/2016', '09/30/2017', '12/31/2018']}) df = df[['Key'...

python-Pandas DataFrame,1、2、3和NaN值的默认数据类型【代码】

d = {'one' : pd.Series([1, 2, 3], index=['a', 'b', 'c']),'two' : pd.Series([1, 2, 3, 4], index=['a', 'b', 'c', 'd'])} df = pd.DataFrame(d) print df ['one']输出:a 1.0b 2.0c 3.0d NaNName: one, dtype: float64该值设置为floatd = {'one' : pd.Series([1, 2, 3], index=['a', 'b', 'c']),'two' : pd.Series([1, 2, 3], index=['a', 'b', 'c'])}df = pd.DataFrame(d) print df ['one']输出:a 1b 2c ...

重塑熊猫DataFrame Python 3.x【代码】

我有这样的大熊猫:df = cid pid purl tid turl sid surl c1 p1 urlp1 t1 urlt1 s1 urls1 c1 p1 urlp1 t1 urlt1 s2 urls2 c1 p1 urlp1 t1 urlt1 s3 urls3 c2 p2 urlp2 t2 urlt2 s5 urls5 c2 p2 urlp2 t2 urlt2 s6 urls6我想要的是这样的结果:cid uid url c1 p1 urlp1 c1 t1 ...

python-在熊猫DataFrame中将某些值替换为NaN时,如何避免数据类型转换?【代码】

我有一个熊猫DataFrame,我需要基于过滤器将某些值替换为NaN.这样做时,我面临数据类型的更改.如何避免这种数据类型转换? 玩具示例代码import pandas as pd import numpy as np df = pd.Series([False, True, False, True]) filter = pd.Series([True, True, False, False]) df[filter] = np.nan我希望df也具有True和False值,来自NaN.但是,如下面的输出所示,将True值转换为1,将False值转换为0.>>> df 0 NaN 1 NaN 2 0.0 3 ...

将列表转换为DataFrame并在DataFrame列内拆分嵌套字典-Python 3.6【代码】

我想将List转换为DataFrame并在DataFrame列内拆分嵌套字典,下面是我的代码.import pandasd = [{"key":1000000, "name":"Aelf", "level":0, "hasData":"true", "fields":{"id":"elf"}}] pd.DataFrame(d)我想将“字段”拆分为新列“ id”key name level hasData fields id 1000000 Aelf 0 true {'id': 'elf'} elf解决方法:您可以将join与pop tolist结合使用:d = [{"key":1000000, "name":"Aelf", "level":0, "hasDa...

在Python Pandas Dataframe中动态添加列的数据处理【代码】

我有以下问题.可以说这是我的CSVid f1 f2 f3 1 4 5 5 1 3 1 0 1 7 4 4 1 4 3 1 1 1 4 6 2 2 6 0 ..........因此,我有可以按ID分组的行.我想创建如下的csv作为输出.f1 f2 f3 f1_n f2_n f3_n f1_n_n f2_n_n f3_n_n f1_t f2_t f3_t 4 5 5 3 1 0 7 4 4 1 4 6 因此,我希望能够选择要转换为列的行数(始终从id的第一行开始).在这种情况下,我抓了3行.然后,我还将跳过一个或多个行(在这...

python-将DataFrame嵌套到JSON【代码】

我是JSON格式文件的新手. 我有一个Pandas DataFrame:import pandas as pddf = pd.DataFrame([["A", "2014/01/01", "2014/01/02", "A", -0.0061, "A"],["A", "2015/07/11", "2015/08/21", "A", 1.50, "A"],["C", "2016/01/01", "2016/01/05", "U", 2.75, "R"],["D", "2013/05/19", "2014/09/30", "Q", -100.0, "N"],["B", "2015/08/22", "2015/09/01", "T", 10.0, "R"]],columns=["P", "Start", "End", "Category", "Value", "Grou...

python-在Pandas DataFrame中跨多个列的映射方法【代码】

我有一个Pandas数据框,其中的值是列表:import pandas as pdDF = pd.DataFrame({'X':[[1, 5], [1, 2]], 'Y':[[1, 2, 5], [1, 3, 5]]}) DFX Y 0 [1, 5] [1, 2, 5] 1 [1, 2] [1, 3, 5]我想检查X中的列表是否是Y中列表的子集.对于单个列表,我们可以使用set(x).issubset(set(y))进行此操作.但是,我们将如何在Pandas数据列中执行此操作? 到目前为止,我想到的唯一一件事就是使用单个列表作为解决方法,然后将结果转换回Pa...

python-基于ANY列值从Dataframe删除行【代码】

这个问题已经在这里有了答案: > Drop a row in a Pandas Dataframe if any column contains a certain value, in said row 2个我有一个数据框:Plate | MeanV1 | MeanV2 | MeanV3 ...etc ----------------------------------------------- 0 1 | 3.2 | 4.8 | 6.8 | 1 1 | 3.1 | 10000 | 10000 | 2 2 | 2.8 | 4.6 | 6.1 | 3 ...

python-熊猫:将DataFrame的最后一行除以第一行【代码】

这个问题类似于Python: Pandas Divide DataFrame by first row 我有一个看起来像这样的DataFrame:1125400 5430095 1095751 2013-04-02 98.91 NaN 5626.79 2013-04-03 99.29 NaN 5727.53 2013-04-04 99.79 NaN 5643.75 2013-04-07 100.55 NaN 5630.78 2013-04-08 100.65 NaN 5633.77我想将最后一行的值除以第一行的值,以获得随时间变化的百分比差异.解决方法:只需取第一行和最后一行...

python pandas-使用for循环编辑多个DataFrame【代码】

考虑以下2个列表,包含3个字典和3个空DataFramedict0={'actual': {'2013-02-20 13:30:00': 0.93}} dict1={'actual': {'2013-02-20 13:30:00': 0.85}} dict2={'actual': {'2013-02-20 13:30:00': 0.98}} dicts=[dict0, dict1, dict2]df0=pd.DataFrame() df1=pd.DataFrame() df2=pd.DataFrame() dfs=[df0, df1, df2]我想通过使用以下行来递归地修改循环中的3个数据框:for df, dikt in zip(dfs, dicts):df = df.from_dict(dikt, orien...

python-根据Pandas DataFrame中的其他列值在列之间移动行值【代码】

我有一个熊猫数据框,上面列出了生物名称及其对抗生素的敏感性.我希望根据以下规则将所有生物整合到下面的数据框架中的一栏中. >如果ORG1 == A,则什么都不做;>如果ORG1!= A和ORG2 == A,则将ORG2值移至ORG1列>如果ORG1!= A和ORG3 == A,请将ORG3值移至ORG1列 如果满足条件2,并将ORG2的值移至ORG1列,则还将AS20 *中的列值移至AS10 *中. 同样,如果满足条件3,并将ORG3值移动到ORG1列,则也将AS30 *中的列值移动到AS10 *中. 我自己根据上...

使用Python dict替换/清除Pandas DataFrame中的数据【代码】

我有一个看起来像的Dataframe(table2)57 INVERNESS 361 INVERNESS 533 INVERNESS 535 INVERNESS KERRY DOWNS 758 INVERNESS GREEN 807 INVERNESS 970 INVERNESS POINT 971 INVERNESS等等.. 我需要使用Dict映射/替换名称(我在Excel工作表中具有该名称)当我将翻译表读入Pandas时,我得到的DF看起来像NSUBDIVISION SUBDIVI...

python-如何在pandas DataFrame上绘制带有一些包含字符串的列的平行坐标?【代码】

我想绘制一个熊猫DataFrame的平行坐标,该DataFrame包含带有数字的列和其他包含字符串作为值的列. 问题描述 我有以下测试代码可用于绘制带有数字的平行坐标:import pandas as pd import matplotlib.pyplot as plt from pandas.tools.plotting import parallel_coordinatesdf = pd.DataFrame([["line 1",20,30,100], ["line 2",10,40,90],["line 3",10,35,120]], columns=["element","var 1","var 2","var 3"]) parallel_coor...