【Python:如何从pandas系列中获取字典中的值】教程文章相关的互联网学习教程文章

基于多个条件Python Pandas删除行【代码】

我想在满足几个条件时删除行: 例如,生成一个随机DataFrame:import pandas as pd import numpy as np df = pd.DataFrame(np.random.randn(10, 4), columns=['one', 'two', 'three', 'four']) print df表的一个实例如下所示:one two three four 0 -0.225730 -1.376075 0.187749 0.763307 1 0.031392 0.752496 -1.504769 -1.247581 2 -0.442992 -0.323782 -0.710859 -0.502574 3 -0.948055 -0.224910 -1.337001...

python – Pandas df.to_csv(“file.csv”encode =“utf-8”)仍为减号提供垃圾字符【代码】

我已经阅读了关于Pandas’to_csv(……等等)的Python 2限制的内容.我打了吗?我在使用Python 2.7.3 当它们出现在字符串中时,这会产生≥和 – 的垃圾字符.除此之外,出口是完美的.df.to_csv("file.csv", encoding="utf-8") 有没有解决方法? df.head()是这样的:demography Adults ≥49 yrs Adults 18?49 yrs at high risk|| state Alabama 32.7 ...

python – pandas使用新列名称作为字符串进行分配【代码】

我最近发现了熊猫“assign” method,我发现它非常优雅.我的问题是新列的名称被指定为关键字,因此它不能包含空格或破折号.df = DataFrame({'A': range(1, 11), 'B': np.random.randn(10)}) df.assign(ln_A = lambda x: np.log(x.A))A B ln_A 0 1 0.426905 0.000000 1 2 -0.780949 0.693147 2 3 -0.418711 1.098612 3 4 -0.269708 1.386294 4 5 -0.274002 1.609438 5 6 -0.500792 1.791759 6 7 1...

python – 结合两个具有相同索引的Pandas数据帧【代码】

参见英文答案 > What are the ‘levels’, ‘keys’, and names arguments for in Pandas’ concat function? 1个我有两个具有相同索引但不同列的数据帧.如何将它们组合成具有相同索引但包含所有列的一个? 我有:A 1 10 2 11B 1 20 2 21我需要以下输出:A B 1 10 20 2 11 21解决方法: pandas.concat([df1, df2], axis=1)

python – 防止pandas在read_csv中自动推断类型【代码】

我有一个#-separated文件有三列:第一列是整数,第二列看起来像浮点数,但不是,第三列是字符串.我尝试使用pandas.read_csv将其直接加载到python中In [149]: d = pandas.read_csv('resources/names/fos_names.csv', sep='#', header=None, names=['int_field', 'floatlike_field', 'str_field'])In [150]: d Out[150]: <class 'pandas.core.frame.DataFrame'> Int64Index: 1673 entries, 0 to 1672 Data columns: int_field ...

使用python / pandas在Excel上创建颜色渐变的最简单方法?【代码】

所以我有使用pandas的ExcelWriter输出到excel文件的数据.将整个数据输出到Excel文件后,使用Python以编程方式应用条件格式的最简单方法是什么? 我希望能够在Excel工作表中选择(在Excel中)所有已填充的单元格并单击“条件格式”>等效(通过Python).颜色标度.最终结果是基于值的渐变颜色,如果你愿意的话,是“热图”. 这就是我正在做的生成数据:writer = ExcelWriter('Data' + today +'.xls') ... processing data ... df.to_excel(w...

python – pandas plot dataframe barplot with category by category【代码】

我想用pandas绘制一个不同颜色的条形图,用于列中的类别. 这是一个简单的例子:(索引是可变的)df:value group variable a 10 1 b 9 1 c 8 1 d 7 2 f 6 2 g 5 3 h 4 3我想制作一个带有着色组的条形图.我还想指定颜色.在我的原始数据集中,我有很多goups.有人可以帮我吗?解决方法:只...

如何在iPython笔记本中预览大型pandas DataFrame的一部分?【代码】

我刚开始使用IPython笔记本中的pandas并遇到以下问题:当从CSV文件读取的DataFrame较小时,IPython Notebook会在一个漂亮的表视图中显示它.当DataFrame很大时,这样的东西就是输出:In [27]:evaluation = readCSV("evaluation_MO_without_VNS_quality.csv").filter(["solver", "instance", "runtime", "objective"])In [37]:evaluationOut[37]:<class 'pandas.core.frame.DataFrame'> Int64Index: 333 entries, 0 to 332 Data column...

python – pandas:如果满足3列条件,则更新值【代码】

我有这样的数据帧:In[1]: df Out[1]:A B C D 1 blue red square NaN 2 orange yellow circle NaN 3 black grey circle NaN我想在满足3个条件时更新D列.例如:df.ix[ np.logical_and(df.A=='blue', df.B=='red', df.C=='square'), ['D'] ] = 'succeed'它适用于前两个条件,但它不适用于第三个条件,因此:df.ix[ np.logical_and(df.A=='blue', df.B=='red', df.C=='tri...

python pandas pivot_table在一列中计算频率【代码】

我仍然是Python pandas的pivot_table的新手,想要问一种方法来计算一列中的值的频率,该列也链接到另一列ID. DataFrame如下所示.import pandas as pd df = pd.DataFrame({'Account_number':[1,1,2,2,2,3,3],'Product':['A', 'A', 'A', 'B', 'B','A', 'B']})对于输出,我想得到如下内容:ProductA B Account_number 1 2 02 1 23 1 1到目前为止,我尝试了这段代码:df.pivot_tabl...

python – Pandas:通过多列查找另一个DataFrame中不存在的行【代码】

与此python pandas: how to find rows in one dataframe but not in another?相同但有多列 这是设置:import pandas as pddf = pd.DataFrame(dict(col1=[0,1,1,2],col2=['a','b','c','b'],extra_col=['this','is','just','something'] ))other = pd.DataFrame(dict(col1=[1,2],col2=['b','c'] ))现在,我想从df中选择其他行中不存在的行.我想通过col1和col2进行选择 在SQL中我会这样做:select * from df where not exists (select...

Pandas / Python:根据另一列中的值设置一列的值【代码】

我需要根据Pandas数据帧中另一列的值设置一列的值.这是逻辑:if df['c1'] == 'Value':df['c2'] = 10 else:df['c2'] = df['c3']我无法做到这一点,我只想创建一个具有新值的列(或更改现有列的值:任何一个适合我). 如果我尝试运行上面的代码或者如果我将其作为函数编写并使用apply方法,我会得到以下内容:ValueError: The truth value of a Series is ambiguous. Use a.empty, a.bool(), a.item(), a.any() or a.all().解决方法:一种...

python – pandas数据帧的最大大小【代码】

我正在尝试使用pandas read_csv或read_stata函数读取一个有点大的数据集,但我一直在遇到内存错误.数据帧的最大大小是多少?我的理解是,只要数据适合内存,数据帧就应该没问题,这对我来说应该不是问题.还有什么可能导致内存错误? 对于上下文,我试图在Survey of Consumer Finances 2007中读取,包括ASCII格式(使用read_csv)和Stata格式(使用read_stata).该文件大约为200MB作为dta,大约1.2GB作为ASCII,并且在Stata中打开它告诉我,有220...

python – 在pandas中设置多列索引【代码】

我像这样制作数据帧.df = pd.DataFrame({'class' : ['A', 'A', 'A', 'A', 'A', 'B', 'B', 'B', 'B', 'B'],'number' : [1,2,3,4,5,1,2,3,4,5],'math' : [90, 20, 50, 30, 57, 67, 89, 79, 45, 23],'english' : [40, 21, 68, 89, 90, 87, 89, 54, 21, 23] })我想通过使用一些pandas方法将索引转换为此.(例如set_index,stack ,,,)df1 = pd.DataFrame(np.random.randint(1, 100, (5, 4)),columns = [['A', 'A', 'B', 'B'],['english', ...

python – 获取一个pandas数据帧的行的索引作为整数【代码】

例如,假设一个简单的数据帧A B 0 1 0.810743 1 2 0.595866 2 3 0.154888 3 4 0.472721 4 5 0.894525 5 6 0.978174 6 7 0.859449 7 8 0.541247 8 9 0.232302 9 10 0.276566在给定条件的情况下,如何检索行的索引值?例如:dfb = df [df [‘A’] == 5] .index.values.astype(int)返回[4],但我想得到的只是4.这在代码后面引起了我的麻烦. 基于某些条件,我希望记录满足该条件的索引,然后选择之间的...

字典 - 相关标签