【python – 比较多个列以获取两个Pandas Dataframe中不同的行】教程文章相关的互联网学习教程文章

python-应用dataframe方法后numpy数组末尾的额外数据类型【代码】

我将以下代码应用于numpy数组:mad_array = [] for j in data:df = pd.DataFrame(j)print(j)mad_array.append(df.mad())print(mad_array) 输出数组如下所示:[0 10.0 dtype: float64, 0 18.875 dtype: float64, 0 18.375 dtype: float64]有没有一种方法可以去除输出中附加的0(不确定来自何处)和数据类型属性,因此我的输出数组如下所示:[10.0 18.875 18.375]我不确定这是numpy还是DataFrame的行为.解决方法:您可以使用d...

python-根据其他列值创建Pandas Dataframe行【代码】

我有一个包含三列的数据框:order_no product quantity 0 5bf69f 3 0 5beaba 2 1 5bwq21 1 1 5bf69f 1我想如果数量值大于1则创建行,如下所示:order_no product quantity 0 5bf69f 1 0 5bf69f 1 0 5bf69f 1 0 5beaba 1 0 5beaba 1 1 5bwq21 1 1 5bf69f 1解决方法:首先是必要的唯一索引值,因此必要...

在pd.dataframe中找到一组连续常量值的干净pythonic方法是什么?【代码】

我正在寻找一种方法来标记pd.dataframe(例如df)中连续恒定的连续常数值(例如n). 我已经编写了一些代码,如果该值与n / 2个下一个数据点和n / 2个前一个数据点的差为零,则将通过该代码进行标记.n = 5 # the minimum number of sequential constant values #to create a adatframe example df=pd.DataFrame(np.random.randn(25), index=pd.date_range(start='2010-1-1',end='2010-1-2',freq='H'), columns=['value'])#to mod...

python-MultiIndex列DataFrame的成对差异【代码】

我有一个带有MultiIndex列的DataFrame,如下所示:columnIdx1 = ["M1", "M2", "M3", "M4"] columnIdx2 = ["pos", "neg"] df = pd.DataFrame(data=np.random.randn(1000, 8), columns=pd.MultiIndex.from_product([columnIdx1, columnIdx2]))然后,我使用df.mean()计算此平均值,得出相同的列,但只有一行. A:M1 M2 M3 M4 pos neg pos neg pos neg pos neg1 8 2 7 3 6 4 5现在,我想像这样计算每...

python-从pandas DataFrame返回最后一个有效(非null)值【代码】

假设我有一个数据框看起来像:a b 0 11 A 1 -2 A 2 3 A 3 NA A 4 0.5 B 5 NA B 6 -9 B我可以按“ b”创建组.有没有一种快速的方法来获取每个组的“ a”中的最后一个非NA值?在这种情况下,A组为3,B组为-9. (在这种情况下,序列“ a”按照给定的顺序排序,但可能并非如此.可能还有另一列“ c”,据此定义了“最后一个”.) 我通过查看grouped.groups字典来编写自己的循环代...

python-根据列中的最大值过滤DataFrame-熊猫【代码】

使用熊猫,我有一个看起来像这样的DataFrame:Hour Browser Metric1 Metric2 Metric3 2013-08-18 00 IE 1000 500 3000 2013-08-19 00 FF 2000 250 6000 2013-08-20 00 Opera 3000 450 9000 2001-03-21 00 Chrome/29 3000 450 9000 2013-08-21 00 Chrome/29 3000 450 9000 2014-01-22 00 Chrome/29 3000 ...

在使用python / pandas DataFrame计算值之前验证行【代码】

我是python和pandas的新手,在尝试了几种方法之后,我希望根据我的分析目标,就结构该数据集的最佳方法,向所有人提出一些建议. 给定以下DataFrame:id event timestamp 1 "page 1 load" 1/1/2014 0:00:01 1 "page 1 exit" 1/1/2014 0:00:31 2 "page 2 load" 1/1/2014 0:01:01 2 "page 2 exit" 1/1/2014 0:01:31 3 "page 3 load" 1/1/2014 0:02:01 3 "page 3 exit" 1/1/2014 0:02:31 4 "p...

python-使用DataFrame.Plot在同一图形上绘制多个图【代码】

虽然我可以在图表上获得多条线,在图表上具有多条柱形,但是我无法使用相同的PeriodIndex在同一张图表上获得一条线和条形. 伪代码如下…# play data n = 100 x = pd.period_range('2001-01-01', periods=n, freq='M') y1 = (Series(np.random.randn(n)).diff() + 5).tolist() y2 = (Series(np.random.randn(n)).diff()).tolist() df = pd.DataFrame({'bar':y2, 'line':y1}, index=x)# let's plot plt.figure() ax = df['bar'].plot(k...

python-绘制表格并显示Pandas Dataframe【代码】

我想以表格格式在屏幕上显示我的Pandas数据框:df = pd.DataFrame({'apples': 10, 'bananas': 15, 'pears': 5}, [0])我不确定该怎么做.我知道pd.DataFrame.plot()有一些显示表格的选项,但只能与图形一起显示.我只想在屏幕上显示表格(即数据框).谢谢! 编辑: 这是使用pandas plot函数创建表格的屏幕截图.我只想要底部表格部分,而不想要图表.我还想要表格图的弹出窗口. 编辑2: 我设法在数据上显示了以下内容:plt.figure() y = [0]...

python pandas dataframe唯一值,将“ L”附加到数据值【代码】

我正在作为CGI运行python文件,正在将CSV读取到熊猫数据帧中.问题是,当我尝试获取仅具有整数值的列的唯一值时,我在数据值上附加了一个附加的“ L”. 这是代码.def Main():formData = cgi.FieldStorage()fileName = str(formData.getvalue('file'))field = str(formData.getvalue('field'))df = fileRead.readFile(fileName)unique = pd.unique(df[field])print unique.tolist()这是输出:[1L, 2L, 3L, 4L, 5L, 6L, 7L, 8L, 9L, 10L,...

python-将多个DataFrame列合并为一个【代码】

我正在尝试使用一个动态数目的a_P列来转换一个DataFrame像这样a1_P a2_P weight 0 33297.81 17407.93 14733.23 1 58895.18 43013.57 86954.04 变成新的DataFrame,看起来像这样(按P排序)P weight 0 17407.93 14733.23 1 33297.81 14733.23 2 43013.57 86954.04 3 58895.18 86954.04 所以到目前为止我正在尝试的是names = ["a1", "a2"] p = pd...

python-对Pandas DataFrame使用逻辑索引或布尔索引的正确语法是什么?【代码】

我要使用逻辑索引来修改Pandas DataFrame(版本0.15.2)中的值,如本post所述.我一直收到以下警告:A value is trying to be set on a copy of a slice from a DataFrame. Try using .loc[row_indexer,col_indexer] = value insteadSee the the caveats in the documentation: http://pandas.pydata.org/pandas-docs/stable/indexing.html#indexing-view-versus-copyself.obj[item_labels[indexer[info_axis]]] = value这是一个示例进...

python-为列表中的元素过滤Pandas DataFrame【代码】

这个问题已经在这里有了答案: > Filter dataframe rows if value in column is in a set list of values 7个我有一个熊猫DataFrame,其中包含值和其他信息.我希望能够提取仅属于一种信息的值.我不知道将要查询哪些值和多少个值.因此,有可能仅一次调用带有附加信息“ foo”的值,有时调用带有附加信息“ bar”和“ baz”的值,因此使用简化的DataFrameimport pandas as pd...

python-减少pandas DataFrame中的列数【代码】

我正在尝试在seaborn中创建一个小提琴图.输入是pandas DataFrame,它看起来是为了沿x轴分离数据,我需要在单个列上进行区分.我目前有一个DataFrame,它具有几个传感器的浮点值:>>>df.columns Index('SensorA', 'SensorB', 'SensorC', 'SensorD', 'group_id')也就是说,每个Sensor [A-Z]列均包含一堆数字:>>>df['SensorA'].head() 0 0.072706 1 0.072698 2 0.072701 3 0.072303 4 0.071951 Name: SensorA, dtype: floa...

python-Pandas DataFrame列值重新映射【代码】

假设以下DataFrame:df = pd.DataFrame({'id': [8,16,23,8,23], 'count': [5,8,7,1,2]}, columns=['id', 'count'])id count 0 8 5 1 16 8 2 23 7 3 8 1 4 23 2…是否有一些Pandas魔术可以让我重新映射ID,以使ID顺序排列?寻找类似的结果:id count 0 0 5 1 1 8 2 2 7 3 0 1 4 2 2原始ID [8,16,23]被重新映射为[0,1,2] 注意:重新映射不必保持ID的原始顺序.例...