【python – 复制一些行并更改pandas中的某些值】教程文章相关的互联网学习教程文章

Python Pandas与另一个数据框的最接近索引匹配【代码】

df.index = 10,100,1000df2.index = 1,2,11,50,101,500,1001 Just sample我需要通过这些条件匹配df2与df的最接近索引 > df2.index必须> df.index>只有一个最接近的值 例如输出df | df2 10 | 11 100 | 101 1000 | 1001现在我可以使用for循环了,它非常慢 我用new_df2来保留索引,而不是df2new_df2 = pd.DataFrame(columns = ["value"]) for col in df.index:for col2 in df2.index:if(col2 > col):new_df2.loc[c...

python pandas dataframe唯一值,将“ L”附加到数据值【代码】

我正在作为CGI运行python文件,正在将CSV读取到熊猫数据帧中.问题是,当我尝试获取仅具有整数值的列的唯一值时,我在数据值上附加了一个附加的“ L”. 这是代码.def Main():formData = cgi.FieldStorage()fileName = str(formData.getvalue('file'))field = str(formData.getvalue('field'))df = fileRead.readFile(fileName)unique = pd.unique(df[field])print unique.tolist()这是输出:[1L, 2L, 3L, 4L, 5L, 6L, 7L, 8L, 9L, 10L,...

如何使用Pandas在Python中取得多年平均值【代码】

我有一个庞大的数据集,其中包含来自80年来多个位置(经纬度)的数据.我正在尝试计算整个时间范围内每个站点的a列和b列的10年平均值.以下是数据表的示例.Lat Long Year Month Day a b 46.90625 -115.46875 1950 01 01 0.0000 1.1335 46.90625 -115.46875 1950 01 02 0.0000 1.1276 46.90625 -115.46875 1950 01 03 0.0000 1.1213这是我尝试过的示例,但不断迷失方向.fname = output1 df = pandas.read_ta...

python-对Pandas DataFrame使用逻辑索引或布尔索引的正确语法是什么?【代码】

我要使用逻辑索引来修改Pandas DataFrame(版本0.15.2)中的值,如本post所述.我一直收到以下警告:A value is trying to be set on a copy of a slice from a DataFrame. Try using .loc[row_indexer,col_indexer] = value insteadSee the the caveats in the documentation: http://pandas.pydata.org/pandas-docs/stable/indexing.html#indexing-view-versus-copyself.obj[item_labels[indexer[info_axis]]] = value这是一个示例进...

python-为列表中的元素过滤Pandas DataFrame【代码】

这个问题已经在这里有了答案: > Filter dataframe rows if value in column is in a set list of values 7个我有一个熊猫DataFrame,其中包含值和其他信息.我希望能够提取仅属于一种信息的值.我不知道将要查询哪些值和多少个值.因此,有可能仅一次调用带有附加信息“ foo”的值,有时调用带有附加信息“ bar”和“ baz”的值,因此使用简化的DataFrameimport pandas as pd...

python-减少pandas DataFrame中的列数【代码】

我正在尝试在seaborn中创建一个小提琴图.输入是pandas DataFrame,它看起来是为了沿x轴分离数据,我需要在单个列上进行区分.我目前有一个DataFrame,它具有几个传感器的浮点值:>>>df.columns Index('SensorA', 'SensorB', 'SensorC', 'SensorD', 'group_id')也就是说,每个Sensor [A-Z]列均包含一堆数字:>>>df['SensorA'].head() 0 0.072706 1 0.072698 2 0.072701 3 0.072303 4 0.071951 Name: SensorA, dtype: floa...

python-Pandas DataFrame列值重新映射【代码】

假设以下DataFrame:df = pd.DataFrame({'id': [8,16,23,8,23], 'count': [5,8,7,1,2]}, columns=['id', 'count'])id count 0 8 5 1 16 8 2 23 7 3 8 1 4 23 2…是否有一些Pandas魔术可以让我重新映射ID,以使ID顺序排列?寻找类似的结果:id count 0 0 5 1 1 8 2 2 7 3 0 1 4 2 2原始ID [8,16,23]被重新映射为[0,1,2] 注意:重新映射不必保持ID的原始顺序.例...

根据多行在python中修改pandas数据框【代码】

我正在Pandas / Python中使用DataFrame,每一行都有一个ID(不是唯一的),我想修改数据框,为具有多个匹配ID的每一行添加一个具有第二名称的列.Starting with:ID Name Rate 0 1 A 65.5 1 2 B 67.3 2 2 C 78.8 3 3 D 65.0 4 4 E 45.3 5 5 F 52.0 6 5 G 66.0 7 6 H 34.0 8 7 I 2.0Trying to get to:ID Name Rate Secondname 0 1 A 65.5 None 1 2 B 67.3 ...

python-Pandas Dataframe中分组依据中的多个聚合【代码】

SQL : Select Max(A) , Min (B) , C from Table group by C 我想在数据框上的熊猫中执行相同的操作.我离得更近了:DF2= DF1.groupby(by=['C']).max() 我在哪里得到两列的最大值,在分组时如何做多个操作.解决方法:试试agg()函数:import numpy as np import pandas as pddf = pd.DataFrame(np.random.randint(0,5,size=(20, 3)), columns=list('ABC')) print(df)print(df.groupby('C').agg({'A': max, 'B':min}))输出:A B C 0 ...

python-将嵌套的json转换为pandas数据框【代码】

我正在尝试将嵌套的json数组转换为熊猫数据框. 列表格式的数据如下所示:[{u'analysis': {u'active': u'Y',u'dpv_cmra': u'N',u'dpv_footnotes': u'AAN1',u'dpv_match_code': u'D',u'dpv_vacant': u'N',u'footnotes': u'H#'},u'candidate_index': 0,u'components': {u'city_name': u'City',u'delivery_point': u'Variable',u'delivery_point_check_digit': u'8',u'plus4_code': u'Variable',u'primary_number': u'Variable',u'stat...

python-在Pandas中用系列连接一个DataFrame【代码】

有人可以解释一下这个熊猫的concat代码有什么问题,为什么数据框仍然为空?我使用的是Python散布,据我所知它以前一直在工作.解决方法:您要使用以下形式:result = pd.concat([dataframe, series], axis=1)pd.concat(…)不会“插入”到原始数据帧中,但是会返回连接结果,因此您需要在某个地方分配连接,例如:>>> import pandas as pd >>> s = pd.Series([1,2,3]) >>> df = pd.DataFrame() >>> df = pd.concat([df, s], axis=1) # We ...

Python / Pandas-更新一组记录的数据【代码】

我正在尝试更新一些数据,但是我需要更新的数据是我用来选择唯一记录的列的一部分.import pandas as pddata = [{'subid':'123','grade':'K'},{'subid':'123','grade':'3rd'}, {'subid':'123','grade':'6th'}, {'subid':'456','grade':'1st'},{'subid':'456','grade':'3rd'},{'subid':'456','grade':'5th'}] df = pd.DataFrame(data) df我正在尝试使用str.replacedf['grade'][df['subid']== '456'].str.replace('3rd','4th')我得到以...

Python Pandas自合并以合并笛卡尔积,以产生所有组合和总和【代码】

我是Python的新手,似乎它具有很大的灵活性,并且比传统的RDBMS系统快. 建立一个非常简单的过程以创建随机的幻想团队.我来自RDBMS背景(Oracle SQL),对于这种数据处理来说似乎并不是最佳选择. 我使用从csv文件读取的熊猫制作了一个数据框,现在有一个包含两列的简单数据框-Player,Salary:` Name Salary 0 Jason Day 11700 1 Dustin Johnson 11600 2 Rory McIlroy 11400 3 ...

python-如何透视pandas DataFrame列以创建二进制“值表”?【代码】

我有以下熊猫数据框:import pandas as pd df = pd.read_csv("filename.csv")df A B C D E 0 a 0.469112 -0.282863 -1.509059 cat 1 c -1.135632 1.212112 -0.173215 dog 2 e 0.119209 -1.044236 -0.861849 dog 3 f -2.104569 -0.494929 1.071804 bird 4 g -2.224569 -0.724929 2.234213 elephant ...我想基于列E中的分类值的标识创建更多列,以使数据框如下所示...

python-pandas DataFrame:如何使用自定义方式剪切数据框?【代码】

我想使用自己的规则将一个DataFrame切成几个数据框.>>> data = pd.DataFrame({'distance':[1,2,3,4,5,6,7,8,9,10],'values':np.arange(0,1,0.1)}) >>> datadistance values 0 1 0.0 1 2 0.1 2 3 0.2 3 4 0.3 4 5 0.4 5 6 0.5 6 7 0.6 7 8 0.7 8 9 0.8 9 10 0.9我将根据距离列的值剪切数据.例如,有一些b...