首页 / PYTHON / python-嵌套的小计“所有”行与熊猫pivot_table

python-嵌套的小计“所有”行与熊猫pivot_table

内容导读

互联网集市收集整理的这篇技术教程文章主要介绍了python-嵌套的小计“所有”行与熊猫pivot_table，小编现在分享给大家，供广大互联网技能从业者学习和参考。文章包含7833字，纯文字阅读大概需要12分钟。

内容图文

我有一些看起来像这样的长格式数据(请参见下面的重新创建)：

>>> df
   section subsection   name topic     score
0        A          W  zwphf     a  0.802427
1        A          W  jcyyc     a  0.404077
2        A          W  kucem     a  0.367319
3        A          X  ldbxz     a  0.554260
4        A          X  vkcqh     a  0.265864
5        A          X  cvksn     a  0.548099
6        B          Y  spghx     a  0.472612
7        B          Y  cqokn     a  0.577504
8        B          Y  wjsxg     a  0.815309
9        B          Z  holoo     a  0.459850
10       B          Z  lnihf     a  0.667877
11       B          Z  wirhq     a  0.138879
12       A          W  zwphf     b  0.673711
13       A          W  jcyyc     b  0.507962
14       A          W  kucem     b  0.546055
15       A          X  ldbxz     b  0.148214
16       A          X  vkcqh     b  0.773320
17       A          X  cvksn     b  0.791990
18       B          Y  spghx     b  0.487480
19       B          Y  cqokn     b  0.252534
20       B          Y  wjsxg     b  0.237767
21       B          Z  holoo     b  0.432981
22       B          Z  lnihf     b  0.317932
23       B          Z  wirhq     b  0.614401

我想对节子节名称主题进行分组,再对主题进行拆栈,但还要显示间歇性嵌套的“全部”小计行：

>>> result                                                                                                                                         
   section subsection   name         a         b
0        A        All    All  0.490341  0.573542
1        A          W    All  0.524608  0.575909
2        A          W  jcyyc  0.404077  0.507962
3        A          W  kucem  0.367319  0.546055
4        A          W  zwphf  0.802427  0.673711
5        A          X    All  0.456074  0.571174
6        A          X  cvksn  0.548099  0.791990
7        A          X  ldbxz  0.554260  0.148214
8        A          X  vkcqh  0.265864  0.773320
9        B        All    All  0.522005  0.390516
10       B          Y    All  0.621808  0.325927
11       B          Y  cqokn  0.577504  0.252534
12       B          Y  spghx  0.472612  0.487480
13       B          Y  wjsxg  0.815309  0.237767
14       B          Z    All  0.422202  0.455104
15       B          Z  holoo  0.459850  0.432981
16       B          Z  lnihf  0.667877  0.317932
17       B          Z  wirhq  0.138879  0.614401

突出显示新行可能更容易将其可视化：

最初的分组依据本身,不包括小计,如下所示：

>>> df.groupby(['section', 'subsection', 'name', 'topic'])['score'].mean().unstack('topic')
topic                            a         b
section subsection name                     
A       W          jcyyc  0.404077  0.507962
                   kucem  0.367319  0.546055
                   zwphf  0.802427  0.673711
        X          cvksn  0.548099  0.791990
                   ldbxz  0.554260  0.148214
                   vkcqh  0.265864  0.773320
B       Y          cqokn  0.577504  0.252534
                   spghx  0.472612  0.487480
                   wjsxg  0.815309  0.237767
        Z          holoo  0.459850  0.432981
                   lnihf  0.667877  0.317932
                   wirhq  0.138879  0.614401

但是我不确定如何在[‘section’,’topic’]和[‘section’,’subsection’,’topic’]上使用边距来获取groupby ops的小计.

重新创建df：

import pandas as pd
data = [['A', 'W', 'zwphf', 'a', 0.80242702],
        ['A', 'W', 'jcyyc', 'a', 0.40407741],
        ['A', 'W', 'kucem', 'a', 0.36731944],
        ['A', 'X', 'ldbxz', 'a', 0.55426007],
        ['A', 'X', 'vkcqh', 'a', 0.26586396],
        ['A', 'X', 'cvksn', 'a', 0.54809939],
        ['B', 'Y', 'spghx', 'a', 0.47261223],
        ['B', 'Y', 'cqokn', 'a', 0.57750357],
        ['B', 'Y', 'wjsxg', 'a', 0.81530899],
        ['B', 'Z', 'holoo', 'a', 0.45985020],
        ['B', 'Z', 'lnihf', 'a', 0.66787651],
        ['B', 'Z', 'wirhq', 'a', 0.13887864],
        ['A', 'W', 'zwphf', 'b', 0.67371101],
        ['A', 'W', 'jcyyc', 'b', 0.50796174],
        ['A', 'W', 'kucem', 'b', 0.54605544],
        ['A', 'X', 'ldbxz', 'b', 0.14821402],
        ['A', 'X', 'vkcqh', 'b', 0.77331968],
        ['A', 'X', 'cvksn', 'b', 0.79198960],
        ['B', 'Y', 'spghx', 'b', 0.48747995],
        ['B', 'Y', 'cqokn', 'b', 0.25253355],
        ['B', 'Y', 'wjsxg', 'b', 0.23776694],
        ['B', 'Z', 'holoo', 'b', 0.43298050],
        ['B', 'Z', 'lnihf', 'b', 0.31793156],
        ['B', 'Z', 'wirhq', 'b', 0.61440056]]
df = pd.DataFrame(data,
                  columns=['section', 'subsection', 'name', 'topic', 'score'])

要重新创建预期结果：

import numpy as np

result = np.array([['A', 'All', 'All', 0.490341219, 0.573541919],
                   ['A', 'W', 'All', 0.52460796, 0.5759094],
                   ['A', 'W', 'jcyyc', 0.404077415, 0.5079617479999999],
                   ['A', 'W', 'kucem', 0.36731944, 0.546055442],
                   ['A', 'W', 'zwphf', 0.8024270240000001, 0.673711011],
                   ['A', 'X', 'All', 0.45607447700000003, 0.571174437],
                   ['A', 'X', 'cvksn', 0.548099391, 0.791989603],
                   ['A', 'X', 'ldbxz', 0.554260074, 0.148214029],
                   ['A', 'X', 'vkcqh', 0.265863967, 0.77331968],
                   ['B', 'All', 'All', 0.5220050279999999, 0.390515513],
                   ['B', 'Y', 'All', 0.621808268, 0.325926816],
                   ['B', 'Y', 'cqokn', 0.577503576, 0.252533557],
                   ['B', 'Y', 'spghx', 0.472612233, 0.487479951],
                   ['B', 'Y', 'wjsxg', 0.815308995, 0.237766941],
                   ['B', 'Z', 'All', 0.42220178799999997, 0.455104209],
                   ['B', 'Z', 'holoo', 0.459850205, 0.43298050200000004],
                   ['B', 'Z', 'lnihf', 0.667876511, 0.317931565],
                   ['B', 'Z', 'wirhq', 0.13887864800000002, 0.61440056]], dtype=object)
result = pd.DataFrame(result, columns=['section', 'subsection', 'name', 'a', 'b'])

解决方法:

你需要：

s = df.groupby(['section', 'subsection', 'name', 'topic'])['score'].mean().unstack('topic')

s1 = (s.mean(level=0)
       .assign(subsection = 'All', name='All')
       .set_index(['subsection','name'], append=True))
s2 = (s.mean(level=[0, 1])
       .assign(name='All')
       .set_index(['name'], append=True))

s = pd.concat([s, s1, s2]).sort_index()

但是如果需要子方法不确定上面的解决方案是否正确(均值的方法),更好的是：

s1 = df.groupby(['section','topic'])['score'].mean().unstack('topic').assign(subsection = 'All', name='All').set_index(['subsection','name'], append=True)
s2 = df.groupby(['section','subsection','topic'])['score'].mean().unstack('topic').assign(name='All').set_index(['name'], append=True)

s = pd.concat([s, s1, s2]).sort_index()
print (s)
topic                            a         b
section subsection name                     
A       All        All    0.490341  0.573542
        W          All    0.524608  0.575909
                   jcyyc  0.404077  0.507962
                   kucem  0.367319  0.546055
                   zwphf  0.802427  0.673711
        X          All    0.456074  0.571174
                   cvksn  0.548099  0.791990
                   ldbxz  0.554260  0.148214
                   vkcqh  0.265864  0.773320
B       All        All    0.522005  0.390516
        Y          All    0.621808  0.325927
                   cqokn  0.577504  0.252534
                   spghx  0.472612  0.487480
                   wjsxg  0.815309  0.237767
        Z          All    0.422202  0.455104
                   holoo  0.459850  0.432980
                   lnihf  0.667877  0.317932
                   wirhq  0.138879  0.614401

编辑：

如果需要订购-此处全部可用,可以使用订购的类别：

cat1 = ['tot'] + df['subsection'].unique().tolist()
cat2 = ['tot'] + df['name'].unique().tolist()

df['subsection'] = pd.Categorical(df['subsection'], categories=cat1, ordered=True)
df['name'] = pd.Categorical(df['name'], categories=cat2, ordered=True)

s = df.groupby(['section', 'subsection', 'name', 'topic'])['score'].mean().unstack('topic')
s1 = (df.groupby(['section','topic'])['score'].mean()
        .unstack('topic').assign(subsection = 'tot', name='tot')
        .set_index(['subsection','name'], append=True))

s2 = (df.groupby(['section','subsection','topic'])['score'].mean()
        .unstack('topic')
        .assign(name='tot')
        .set_index(['name'], append=True))

s = pd.concat([s, s1, s2]).sort_index()

print (s)
topic                            a         b
section subsection name                     
A       tot        tot    0.490341  0.573542
        W          tot    0.524608  0.575909
                   zwphf  0.802427  0.673711
                   jcyyc  0.404077  0.507962
                   kucem  0.367319  0.546055
        X          tot    0.456074  0.571174
                   ldbxz  0.554260  0.148214
                   vkcqh  0.265864  0.773320
                   cvksn  0.548099  0.791990
B       tot        tot    0.522005  0.390516
        Y          tot    0.621808  0.325927
                   spghx  0.472612  0.487480
                   cqokn  0.577504  0.252534
                   wjsxg  0.815309  0.237767
        Z          tot    0.422202  0.455104
                   holoo  0.459850  0.432980
                   lnihf  0.667877  0.317932
                   wirhq  0.138879  0.614401

内容总结

以上是互联网集市为您收集整理的python-嵌套的小计“所有”行与熊猫pivot_table全部内容，希望文章能够帮你解决python-嵌套的小计“所有”行与熊猫pivot_table所遇到的程序开发问题。如果觉得互联网集市技术教程内容还不错，欢迎将互联网集市网站推荐给程序员好友。

内容备注

版权声明：本文内容由互联网用户自发贡献，该文观点与技术仅代表作者本人。本站仅提供信息存储空间服务，不拥有所有权，不承担相关法律责任。如发现本站有涉嫌侵权/违法违规的内容，请发送邮件至 gblab@vip.qq.com 举报，一经查实，本站将立刻删除。

内容手机端

扫描二维码推送至手机访问。

本文链接：https://qyyshop.com/info/669394.html

来源：【匿名】

【上一篇】python-xgboost预报_proba：如何做概率和标签之间的映射【下一篇】浅谈PHP运行Python脚本的方法

更多 ►

【python-嵌套的小计“所有”行与熊猫pivot_table】教程文章相关的互联网学习教程文章

Table of Contents - Python 2.x

异常异常类的继承关系日志　　标准日志模块Hello WorldLogging Configuration原文：http://www.cnblogs.com/huey/p/6100508.html

python selenium error “Geckodriver executable needs to be in PATH”

ERROR：Geckodriver executable needs to be in PATH我用的是ubuntu 16.04解决办法：下载 geckodriver （github下载链接）解压缩 tar zxvf geckodriver-v0.15.0-linux64.tar.gz ##解压出来的是一个单文件##执行 copy geckodriver /usr/bin再次运行无此错误本文出自 “净空蓝星” 博客，请务必保留此出处http://jingkonglanxing.blog.51cto.com/1152128/1904514原文：http://jingkonglanxing.blog.51cto.com/1152128/190451...

centOS升级python2至python3过程中遇到configure: error: no acceptable C compiler found in $PATH

今天安装了一个centos 6.9 ,查看默认python版本是2.6，所以准备升级，按着以前在ubuntu上的升级步骤：(1) wget http://www.python.org/ftp/python/3.3.0/Python-3.3.0.tgz(2) tar -xzvf Python-3.3.0.tgz(3) mkdir /usr/local/python(4) ./configure --prefix=/usr/local/python3 在第四步出现了一个提示：提示：configure: error: no acceptable C compiler found in $PATH 原来是缺少C编译器，需要安装GCC套件，于是采...

Python3.6安装报错 configure: error: no acceptable C compiler found in $PATH【代码】

安装python的时候出现如下的错误:[root@master ~]#./configure --prefix=/usr/local/python3.6 checking build system type... i686-pc-linux-gnu checking host system type... i686-pc-linux-gnu checking for --enable-universalsdk... no checking for --with-universal-archs... 32-bit checking MACHDEP... linux checking for --without-gcc... no checking for gcc... no checking for cc... no checking for cl.exe... no...

AttributeError：模块’tensorflow.python.training.checkpointable’没有属性’CheckpointableBase’【代码】

我一直致力于学习人工智能以及如何用Python编写代码.我正在研究一个项目,我决定更新一些Python的软件包,这些软件包不是新的工作,然后发生了一些事情,我无法编译代码.我删除了Anaconda3并重新设置但没有工作.我一直在看这个问题,我写的是一个话题.如果有人帮助我,我会感到高兴得到一些帮助.>>> import tensorflow as tfFile "C:\Users\AliGalip\Anaconda3Yeni\lib\site-packages\tensorflow\__init__.py", line 24, in <module>from...

python实用库学习PrettyTable的详细说明

python实用库：PrettyTable 学习PrettyTable说明PrettyTable 是python中的一个第三方库，可用来生成美观的ASCII格式的表格，十分实用。以下为官方介绍：A simple Python library for easily displaying tabular data in a visually appealing ASCII table format.PrettyTable is a simple Python library designed to make it quick and easy to represent tabular data in visually appealing ASCII tables. It was inspired by t...

通过Loadtable命令将数据文件加载到SybaseIQ数据库里面的Python

CREATE TABLE poc_app.sys_ftp_cfg ( ftp_id varchar(100) NOT NULL, --话单文件名标记 ftp_cycle_id varchar(1) NOT NULL, --话单文件名周期 ftp_stage_filepath varchar(255) NOT NULL, --话单处理后路径 ftp_stage_filereg varchar(100) NOT NULL, --话单CREATE TABLE poc_app.sys_ftp_cfg (ftp_id varchar(100) NOT NULL, --话单文件名标记ftp_cycle_id varchar(1) NOT NULL, --话单文...

gyp ERR! stack Error : can't find python executable "python",you can set the PYTHON e

vue中安装node-sassnpm install node-sass --save-dev1出现上面图中问题解决办法：vscode里，打开终端，输入下面的内容先输入（在管理员模式下打开） npm install --global --production windows-build-tools1否则会提示： Please restart thie script from a administrative PowerShell!1再输入 npm install --global node-gyp 原文链接：https://blog.csdn.net/caicsama/article/details/103679242

Python 全栈系列64 - 使用Flask+DataTables+Mongo搭建交互式表格【代码】【图】

说明差不多凑齐7颗龙珠，可以在前端做一个交互式的表格页面了。主要用于快速的检索和录入数据。 1 datatables: 提供了自动的分页、检索，以及渲染单元格样式2 icheck: 提供了行的checkbox3 awesomefont: 提供小图标，看起来方便4 jquery: 控制前后端的数据交互以及前端页面的修改5 flask: 提供后端的数据处理6 mongo: 提供非结构化的字典存储，方便修改7 modal: 提供更友好的编辑提示使用场景：提供快速的录入构建图结构的入口。...

Python - Django 执行 migrate 操作时异常: django.db.utils.OperationalError: (1051, "Unknown table &#039【代码】

问题场景: 当执行 python manage.py migrate 操作时, 报错 (1051, "Unknown table xxx"), 这时数据库中是没有 xxx 这个表的解决: 1. 先将 models.py 中你更新失败的表给注释掉 2. 注释掉后执行python manage.py makemigrationspython manage.py migrate --fake3. 上面执行成功后再将 models.py 中的表注释取消 4. 取消注释后执行python manage.py makemigrationspython manage.py migrate

Mutable and immutable data types in Python

Introduction (Objects, Values, and Types) All the data in a Python code is represented by objects or by relations between objects. Every object has an identity, a type, and a value. IdentityAn object’s identity never changes once it has been created; you may think of it as the objects address in memory. The is operator compares the identity of two objects; the id() function returns an integer rep...

Python reportlab table 设置cellstyle枚举,设置单元格padding【代码】

可以设置cellsyle 的选项：def _setCellStyle(cellStyles, i, j, op, values):#new = CellStyle('<%d, %d>' % (i,j), cellStyles[i][j])#cellStyles[i][j] = new## modify in place!!!new = cellStyles[i][j]if op == 'FONT':n = len(values)new.fontname = values[0]if n>1:new.fontsize = values[1]if n>2:new.leading = values[2]else:new.leading = new.fontsize*1.2elif op in ('FONTNAME', 'FACE'):new.fontname = values[0]...

【转】【python】【web-based与executable和embeddable】【软件版本GA、RC、beta等含义】

web-based与executable和embeddable 的区别： https://www.jianshu.com/p/1e423ae36c51 软件版本GA、RC、beta等含义： https://blog.csdn.net/gnail_oug/article/details/79998154 python3.6.8安装地址： https://www.python.org/downloads/release/python-368rc1/ python包下载： https://pypi.org/project/numpy/一、引言： python版本下载时，不知道选择哪个版本，以及不同名词之间的意思。二、官方目录web-based与executab...

Python prettytable美化你的输出【代码】

看代码： #!/usr/bin/python # -*- coding:utf-8 -*-import prettytable as pt from prettytable import from_csv from prettytable import from_db_cursor import MySQLdb import os import timedef creatept():tb = pt.PrettyTable()tb.field_names = ["City name", "Area", "Population", "Annual Rainfall"]tb.add_row(["Adelaide",1295, 1158259, 600.5])tb.add_row(["Brisbane",5905, 1857594, 1146.4])tb.add_row(["Darwi...

[Python] iupdatable包：Status 模块使用介绍【代码】

常用状态做的一个集合，方便用在函数返回值中区分不同状态结果。简单举例：from iupdatable import Statusdef fun():print("do something")abc = Trueif abc:return Status.okelse:return Status.failed 该类的完整代码：from enum import IntEnumclass Status(IntEnum):ok = 0success = 1empty = -10null = -11none = -12undefined = -13unknown = -14failed = -20retry = -21exit = -22passed = 20checked = 21marked = 22fl...

首页 / PYTHON / python-嵌套的小计“所有”行与熊猫pivot_table

python-嵌套的小计“所有”行与熊猫pivot_table

内容导读

内容图文

内容总结

内容备注

内容手机端

【python-嵌套的小计“所有”行与熊猫pivot_table】教程文章相关的互联网学习教程文章

Table of Contents - Python 2.x

python selenium error “Geckodriver executable needs to be in PATH”

centOS升级python2至python3过程中遇到configure: error: no acceptable C compiler found in $PATH

Python3.6安装报错 configure: error: no acceptable C compiler found in $PATH【代码】

AttributeError：模块’tensorflow.python.training.checkpointable’没有属性’CheckpointableBase’【代码】

python实用库学习PrettyTable的详细说明

通过Loadtable命令将数据文件加载到SybaseIQ数据库里面的Python

gyp ERR! stack Error : can't find python executable "python",you can set the PYTHON e

Python 全栈系列64 - 使用Flask+DataTables+Mongo搭建交互式表格【代码】【图】

Python - Django 执行 migrate 操作时异常: django.db.utils.OperationalError: (1051, "Unknown table &#039【代码】

Mutable and immutable data types in Python

Python reportlab table 设置cellstyle枚举,设置单元格padding【代码】

【转】【python】【web-based与executable和embeddable】【软件版本GA、RC、beta等含义】

Python prettytable美化你的输出【代码】

[Python] iupdatable包：Status 模块使用介绍【代码】

PYTHON - 相关标签

TABLE - 相关标签

嵌套 - 相关标签

PYTHON - 技术教程分类

PYTHON - 最新教程

PYTHON - 最热教程