【python – 复制一些行并更改pandas中的某些值】教程文章相关的互联网学习教程文章

Python Pandas read_csv如何解析微秒【代码】

我有以毫秒为单位的csv文件.Time,Bid2014-03-03 23:30:30:224323224323,0.89252014-03-03 23:30:30:224390224390,0.8925252014-03-03 23:30:30:224408224408,0.8925252014-03-03 23:30:30:364299364299,0.892525如何使用read_csv()或其他函数将微秒解析为时间索引read_json也许? 谢谢!解决方法:在@Jeff的评论之后,您可以执行以下操作:In [29]: import pandas as pd # specifically set the Time column to object dtype df = pd...

带有Pandas的Python 2.7:如何恢复两个数据帧的非相交部分?【代码】

我有两个数据帧,第二个是第一个的子集.现在如何查找第二个数据帧中未包含的第一个数据帧的部分?例如:new_dataframe_1A B C D 1 a b c d 2 e f g h 3 i j k l 4 m n o pnew_dataframe_2A B C D 1 a b c d 3 i j k lnew_dataframe_3 = not intersection of new_dataframe_1 and new_dataframe_2A B C D 2 e f g h 4 m n o p谢谢你的帮助! 编辑...

python-同时使用pandas和PyTables(3.1.1),重新打开一个已经打开的文件【代码】

我同时使用了pandas和pytables(3.1.1).问题是我已经用pytables打开了HDF5文件,并且当我尝试用熊猫创建新的HDF5Store时hdf5store = HDFStore(...)我收到以下错误:File "/home/travis/virtualenv/python2.7_with_system_site_packages/local/lib/python2.7/site-packages/pandas/io/pytables.py", line 281, in __init__self.open(mode=mode, warn=False)File "/home/travis/virtualenv/python2.7_with_system_site_packages/local/...

python-将Yearday列的CSV数据读取到Pandas中作为日期时间【代码】

我已经将CSV数据与年份作为列之一,而不是通常的月份和日期.我花了一个小时,这是我唯一可以做的事情:将所有浮点列转换为整数,打印为字符串,然后使用自定义解析例程将字符串转换为datetime:from pylab import * import pandas as pd import datetime as dt from StringIO import StringIOcsv = '''Latitude, Longitude, Hours, Minutes, Seconds, YearDay, Year, CruiseID 41.942880, -70.292217, 23, 54, 20, 253, 2011, 11015 41...

python-数据框中两列的Pandas diff()功能

我有一个数据框,其中A列是活动的开始时间,B列是该活动的结束时间,每行代表一个活动(行按时间顺序排列).我想计算一个活动结束与下一个活动开始之间的时间差,即df [i 1] [A]-df [i] [B]. 是否有Pandas函数来执行此操作(我唯一可以找到的是diff(),但这似乎只适用于单列).解决方法:您可以先移动A列: df [‘A’].shift(-1)-df [‘B’]

python-在pandas中随机化/混排数据框中的行【代码】

我目前正在尝试找到一种方法来将数据帧中的项目逐行随机化.我在pandas(shuffling/permutating a DataFrame in pandas)的逐行排列/排列中发现了该线程,但是出于我的目的,有没有办法做类似的事情import pandas as pddata = {'day': ['Mon', 'Tues', 'Wed', 'Thurs', 'Fri'],'color': ['Blue', 'Red', 'Green', 'Yellow', 'Black'],'Number': [11, 8, 10, 15, 11]}dataframe = pd.DataFrame(data)Number color day 0 11 ...

python-绘制表格并显示Pandas Dataframe【代码】

我想以表格格式在屏幕上显示我的Pandas数据框:df = pd.DataFrame({'apples': 10, 'bananas': 15, 'pears': 5}, [0])我不确定该怎么做.我知道pd.DataFrame.plot()有一些显示表格的选项,但只能与图形一起显示.我只想在屏幕上显示表格(即数据框).谢谢! 编辑: 这是使用pandas plot函数创建表格的屏幕截图.我只想要底部表格部分,而不想要图表.我还想要表格图的弹出窗口. 编辑2: 我设法在数据上显示了以下内容:plt.figure() y = [0]...

python-如何在Pandas中对当前行与上一行和下一行进行迭代比较?【代码】

在Pandas中,是否有一些聪明的方法或Pythonic的方法来执行以下操作?for index, row in pd.DataFrame().iterrows():if (row[previous_index]>=row and row[next_index]>=row):row=(row[previous_index]+row[next_index])/2解决方法:这是您使用rolling_apply为Series实施此方法的方法.尚不清楚您的比较如何在DataFrame的整个行上进行.In [5]: s = Series([1,2,3,2,5])In [6]: def f(rows):if (rows[0] >= rows[1]) and (rows[2] >= r...

在Python中,Pandas.如何通过WOM-“每月一周”对数据帧进行子集化?【代码】

我希望能够按月的一周对df进行子集化,类似于您对星期几或一个月中的某天所做的操作.sample = df[df.index.month == 12] 那么有什么办法可以做到这一点?sample = df[df.index.WOM == 1]我知道,如果我在上面键入这行,则会得到AttributeError:’Index’对象没有属性’WOM’,仅供参考以了解我想要做什么. 谢谢解决方法:您可以查看.weekofyear的值,并在月初查看相同的值,这两个值之差应为一个月中的星期.例如:>>> days = ['2014-02-0...

python-循环中的pandas子图【代码】

我有这段代码可以很好地在1行和6列中绘制出我的图我尝试将其绘制为23或32失败我在熊猫的.plot()实现中缺少什么吗? fig, axes = plt.subplots(nrows=1, ncols=6) spfvL = [6, 11, 22, 33, 44, 55] for j, i in enumerate(spfvL):df['spfv' + str(i)] = pd.rolling_std(df['r VIX'], i)*np.sqrt(252)res = smf.ols(formula='spfv'+ str(i)+' ~ Q(\'VIX Index\')', data=df).fit()df['pred'+ str(i)] = better_predict(res, df)df.lo...

Python Pandas Matplotlib图由单列中定义的类型值着色【代码】

我有以下格式的数据:import pandas as ps table={'time':[1,2,3,4,5,1,2,3,4,5,1,2,3,4,5], 'data':[1,1,2,2,2,1,2,3,4,5,1,2,2,2,3], 'type':['a','a','a','a','a','b','b','b','b','b','c','c','c','c','c']} df=ps.DataFrame(table,columns=['time','data','type']我想将数据绘制成一条线连接的时间的函数,但我希望每一条线都是唯一类型的单独颜色.在此示例中,结果将是三行:每种类型a,b和c的data(time)行.任何指导表示赞...

带有逗号十进制参数的Pandas(Python)to_clipboard【代码】

如何将DataFrame复制到_cliboard并将其粘贴到excel中,并用逗号作为小数点? 在R中,这很简单.write.table(obj, 'clipboard', dec = ',')但是我无法在熊猫to_clipboard中弄清楚. 我尝试更改未成功:import locale locale.setlocale(locale.LC_ALL, '')1252西班牙语 或df.to_clipboard(float_format =’%,%’) 提前致谢解决方法:有一些不同的方法可以实现此目的.首先,可以使用float_format和您的语言环境,尽管用法不是那么简单(但是...

Python-Pandas-从其他列数据创建“首次失败”列【代码】

我有一个表示一系列零件的故障数据的数据框,显示了3个测试(A,B,C)中的哪一项通过(0)或失败(1).A B C 1 0 1 1 2 0 0 0 3 1 0 0 4 0 0 1 5 0 0 0 6 0 1 0 7 1 1 0 8 1 1 1我想在数据框中添加最后一列,以显示每个零件的首次失败(FF),如果没有失败则显示默认值(P).A B C | FF 1 0 1 1 | B 2 0 0 0 | P 3 1 0 0 | A 4 0 0 1 | C 5 0 0 ...

Python Pandas:.apping是否永久使用?【代码】

我有一个通过解析大小为1.4G的CSV创建的DataFrame’clicks’.我正在尝试使用Apply函数创建一个“已购买”的新列.clicks['bought'] = clicks['session'].apply(getBoughtItemIDs)在getBoughtItemIDs中,我正在检查’buys’数据框是否具有所需的值,如果是,请返回将它们串联的字符串. getBoughtItemIDs中的第一行永远占用.有什么方法可以使其更快?def getBoughtItemIDs(val):boughtSessions = buys[buys['session'] == val].valuesout...

python-pandas.tslib.Timestamp日期匹配【代码】

我试图找到一种方法来检查item_date是否包含今天的日期.但是,即使我对其进行硬编码,也不会打印True.有人知道如何解决吗?for item_date in buy_crossing_dates:print item_dateprint type(item_date)if item_date == '2015-03-25 00:00:00':print 'True'结果:2015-03-25 00:00:00 <class 'pandas.tslib.Timestamp'>解决方法:在熊猫系列时间戳中检查今天日期的两个选项…import pandas as pd# option 1 - compare using python dat...