【python – 复制一些行并更改pandas中的某些值】教程文章相关的互联网学习教程文章

python-使用元组作为pandas系列中的索引【代码】

我的任务很简单.本质上,我想创建一个熊猫系列并将元组值用作索引.例如,series_tmp = pd.Series() series_tmp[(0,'a')] = 1我想做的是,我想在pd.Series中再创建一行,其索引为(0,’a’),其值为1. 上面的代码得到错误:KeyError: '[0 1] not in index'有什么帮助吗? 我了解多索引,但无济于事.因为我需要像(‘a’,(2,’c’),’d’)这样非常复杂的元组作为键. 结论:感谢所有精彩的答案!要添加以元组为索引的行,我们应该这样做:serie...

python-找不到Pycharm pandas_datareader【代码】

我正在用python创建一个股票交易监控器,并且在pandas_datareader模块上遇到了问题.该代码中的原始模块为pandas.io.data,但已进行了修订,因为pandas不再支持该模块.这是代码;import pandas as pd import pandas_datareader as web import datetimestart = datetime.datetime(2016, 1, 1) end = datetime.date.today()apple = web.DataReader("AAPL", "yahoo", start, end)type(apple)该代码带有错误.Traceback (most recent cal...

Python-Pandas-DataFrame-根据条件将单个列分解为多个布尔列【代码】

早上好, 根据某种条件(在这种情况下包含str),是否有任何Python方式将具有布尔标志的数据框列分解为多列? 假设我有这个:Position Letter 1 a 2 b 3 c 4 b 5 b我想实现这一目标:Position Letter is_a is_b is_C 1 a TRUE FALSE FALSE 2 b FALSE TRUE FALSE 3 c FALSE FALSE TRUE 4 b FALS...

python-分组内的Pandas groupby排序保留了多个聚合【代码】

我想在groupby返回的组中应用排序和限制,如this question.但是,我有多个聚合,并且我希望所有聚合都保留在结果中. 这是一个简单的示例:products = ["A", "B", "C", "D"] stores = ["foo", "bar", "baz"] n = 30product_list = [products[i] for i in np.random.randint(0, len(products), n)] store_list = [stores[i] for i in np.random.randint(0, len(stores), n)] rating_list = np.random.random(n) * 5 sales_list = np.ran...

python-创建具有唯一索引的Pandas Dataframe【代码】

是否可以创建一个具有唯一索引或列的数据框,类似于在mysql中创建唯一键,如果尝试添加重复索引,它将返回错误? 还是我唯一的选择来创建一个if语句并在附加数据之前检查数据框中的值? 编辑: 看来我的问题有点不清楚.对于唯一列,我的意思是我们不能在列中包含非唯一值. 用df.append(new_row, verify_integrity=True)我们可以检查所有列,但是如何只检查一两个列呢?解决方法:您可以使用df.append(..., verify_integrity=True)维护唯一...

python-Pandas Dataframe-带条件/行迭代/上一行计算的最小函数【代码】

我有一个数据框,其中有一些记录的开始和结束日期:import pandas as pddf = pd.DataFrame({'Key': ['A', 'A', 'A', 'A', 'B', 'B', 'B', 'B' ], 'StartDate': ['01/01/2015', '01/01/2016', '06/01/2016','10/01/2017', '01/01/2015', '01/01/2016', '07/15/2016','10/01/2017'], 'EndDate': ['12/30/2015', '05/31/2016', '09/30/2017', '12/31/2018', '12/30/2015', '05/31/2016', '09/30/2017', '12/31/2018']}) df = df[['Key'...

基于pandas / python中多个列中的字符串的列中的总和【代码】

我有一个4列的数据框.这些列中的3列包含字符串值(人的名字),第4列包含int值(完成工作的薪水). 字符串值也不是唯一的,同一字符串将在每一列中显示多次,但每行最多显示一次.data = {'worker1': ['Sam', 'Jack', 'Matt', 'Paul', 'Tim'],'worker2': ['Alex', 'Amy', 'Sam', 'Alice', 'Amanda'], 'worker3': ['Alice', 'Aaron', 'Tony', 'Jack', 'Sam'],'earnings': [4564552, 4573547, 3567567, 6357653, 7648576]}df = pd.DataFrame(...

python-来自groupby的Pandas累积差异【代码】

我需要从MultiIndex级别的开始算起差,从级别的开始算出衰减.我的示例输入和输出将如下所示:values place time A a 120b 100c 90d 50 B e 11f 12g 10h 9valuesA a NaNb -20c -30d -70 B e Nanf +1g -1h -2我可以使用grouby获取...

python-将HTML标签删除应用到Pandas列【代码】

我需要从pandas列中的所有HTML标记中删除并仅保留描述. 我已经删除了一列的标签,但是需要将它们应用于其他列-这就是我曾经做过的事情; 输入: df.description [1] 输出:'<p>Das Ziel der <a href="http://swa-muc.de">Software Architektur München Gruppe</a> ist es, Menschen, die sich mit Software-Architektur auseinandersetzen wollen, in und um München regelm??ig zusammenzubringen, und einen pers?nlichen Erfahru...

python-在pandas中转换列的值【代码】

我有以下格式的csvUsed CPU Used Memory Hard CPU Hard Memory1 4Gi 50 24Gi0 0 0 02 4Gi 4 8Gi2 4Gi 4 8Gi0 0 100m 128Mi51550m 39528Mi 56 47Gi它们是字符串值.在此表中,51550m表示我需要转换为核心的千毫. 39528Mi是兆字节,我需要将其转换为gibibyte(左右).我想知道如何才能明智...

python-Pandas DataFrame,1、2、3和NaN值的默认数据类型【代码】

d = {'one' : pd.Series([1, 2, 3], index=['a', 'b', 'c']),'two' : pd.Series([1, 2, 3, 4], index=['a', 'b', 'c', 'd'])} df = pd.DataFrame(d) print df ['one']输出:a 1.0b 2.0c 3.0d NaNName: one, dtype: float64该值设置为floatd = {'one' : pd.Series([1, 2, 3], index=['a', 'b', 'c']),'two' : pd.Series([1, 2, 3], index=['a', 'b', 'c'])}df = pd.DataFrame(d) print df ['one']输出:a 1b 2c ...

python-根据另一列中的值替换pandas df中的值【代码】

我试图替换多列中的值,如果另一列中的值等于特定值.对于以下df,如果Col A为== ABC,我想替换所有整数将为空值import pandas as pddf = pd.DataFrame({ 'B' : [10,20,30,40,50],'A' : ['ABC','DEF','XYZ','ABC','DEF'], 'C' : [1,1,1,1,1], })输出:B A C 0 10 ABC 1 1 20 DEF 1 2 30 XYZ 1 3 40 ABC 1 4 50 DEF 1因此,当A等于ABC时,我想替换Col B,C中的整数.我已经试过了mask = ...

python-从pandas数据框中添加一些行到下一个,然后将其删除【代码】

我有一个带有很多列的pandas数据框,其中一些在周末具有价值. 我现在正尝试删除所有周末行,但需要将我删除的值添加到下周一的相应行中.Thu: 4 Fri: 5 Sat: 2 Sun: 1 Mon: 4 Tue: 3需要成为Thu: 4 Fri: 5 Mon: 7 Tue: 3我已经想出了如何仅对工作日进行切片(使用df.index.dayofweek),但是在进行此操作之前无法想到一种巧妙的聚合方法. 这是一些虚拟代码开始:index = pd.date_range(datetime.datetime.now().date() -datetime.timedel...

python-Numpy和Pandas通过Bin重复值【代码】

我有一个具有升序组号的Dataframe或Numpy数组,我想分配一个每组重复的值列表(与唯一组数相等的长度).ID - Group 0 - 0 1 - 0 2 - 1 3 - 1 4 - 1 5 - 2 6 - 2 7 - 3要分配的值:[4, 2, 7, 8] # 4 maps to group 0, 2 maps to group 1 etc输出:ID - Group - Val 0 - 0 - 4 1 - 0 - 4 2 - 1 - 2 3 - 1 - 2 4 - 1 - 2 5 - 2 - 7 6 - 2 - 7 7 - 3 - 8赞赏任...

python-将字典项转换为pandas数据框的行,其中键是元组,值是整数【代码】

我有以下字典:d = {("Sam","Scotland","23") : 25,("Oli","England","23") : 28,("Ethan","Wales","18") : 19}我想将其转换为如下所示的熊猫数据框:Name Country Age Count Sam Scotland 23 25 Oli England 23 28 Ethan Wales 18 19我试图这样做:df = pd.DataFrame.from_items(d.items(),orient="index",columns=["Name","Country","Age","Count"])但是我得到这个错误:ValueError...