首页 / PYTHON / python – 具有相同列和索引的多个数据帧的平均值

python – 具有相同列和索引的多个数据帧的平均值

内容导读

互联网集市收集整理的这篇技术教程文章主要介绍了python – 具有相同列和索引的多个数据帧的平均值，小编现在分享给大家，供广大互联网技能从业者学习和参考。文章包含1177字，纯文字阅读大概需要2分钟。

内容图文

我有几个数据帧.它们中的每一个都具有相同的列和相同的索引.对于每个索引,我想平均每列中的值(如果这些是矩阵,我只是将它们相加并除以矩阵的数量).

这是一个例子.

v1 = pd.DataFrame([['ind1', 1, 2, 3], ['ind2', 4, 5, 6]], columns=['id', 'c1', 'c2', 'c3']).set_index('id')
v2 = pd.DataFrame([['ind1', 2, 3, 4], ['ind2', 6, 1, 2]], columns=['id', 'c1', 'c2', 'c3']).set_index('id')
v3 = pd.DataFrame([['ind1', 1, 2, 1], ['ind2', 1, 1, 3]], columns=['id', 'c1', 'c2', 'c3']).set_index('id')

在实际情况中,索引和列可以按不同的顺序排列.

对于这种情况,结果将是

(ind1,c1的值是(1 1 2)/ 3,对于ind2,c2是(1 5 1)/ 3,依此类推).

目前我用循环做这个：

dfs = [v1, v2, v3]
cols= ['c1', 'c2', 'c3']

data = []
for ind, _ in dfs[0].iterrows():
    vals = [sum(df.loc[ind][col] for df in dfs) / float(len(dfs)) for col in cols]
    data.append([ind] + vals)

pd.DataFrame(data, columns=['id'] + cols).set_index('id')

,但对于包含大量列的大型数据帧来说,这显然效率低下.那么如何在没有循环的情况下实现这一点

解决方法:

连接数据帧后,可以在索引级别使用groupby.mean：

pd.concat([v1, v2, v3]).groupby(level=0).mean()

            c1        c2        c3
id                                
ind1  1.333333  2.333333  2.666667
ind2  3.666667  2.333333  3.666667

内容总结

以上是互联网集市为您收集整理的python – 具有相同列和索引的多个数据帧的平均值全部内容，希望文章能够帮你解决python – 具有相同列和索引的多个数据帧的平均值所遇到的程序开发问题。如果觉得互联网集市技术教程内容还不错，欢迎将互联网集市网站推荐给程序员好友。

内容备注

版权声明：本文内容由互联网用户自发贡献，该文观点与技术仅代表作者本人。本站仅提供信息存储空间服务，不拥有所有权，不承担相关法律责任。如发现本站有涉嫌侵权/违法违规的内容，请发送邮件至 gblab@vip.qq.com 举报，一经查实，本站将立刻删除。

内容手机端

扫描二维码推送至手机访问。

本文链接：https://qyyshop.com/info/745421.html

来源：【匿名】

【上一篇】python – 独立于其他命令每5分钟运行一部分代码【下一篇】浅谈PHP运行Python脚本的方法

更多 ►

【python – 具有相同列和索引的多个数据帧的平均值】教程文章相关的互联网学习教程文章

零基础学python-8.3 列表的索引、分片和矩阵

索引：注意：如果超出长度，则报错如果索引为负数，则取数的方向反转>>> aList=['123',123,123.0] >>> aList[0] '123' >>> aList[2] 123.0 >>> aList[-2] 123 >>> aList[-3] '123' >>> aList[3] Traceback (most recent call last):File "<pyshell#25>", line 1, in <module>aList[3] IndexError: list index out of range分片：注意：如果是负数，取值会出现变化>>> aList=['123',123,123.0] >>> aList[0:1] ['123'] >>> aList[1:...

Python 中使用 for、while 循环打印杨辉三角练习（列表索引练习）。

Python中使用for while循环打印杨辉三角练习（列表索引练习）。杨辉三角是一个由数字排列成的三角形数表，一般形式如下： 1 1 1 1 2 1 1 3 3 1 1 4 6 4 1 1 5 10 10 5 1 1 6 15 20 15 6 1 .......................杨辉三角最本质的特征是，它的两条斜边都是由数字1组成的，而其余的数则是等于它肩上的两个数之和。方法一： __author__ = ‘Brad‘ n = int(input(‘请输入你想打印杨辉三角的行数：‘) newline = [1] ...

Python3基础 time 索引值访问元组中的年月日时分秒【代码】

???? Python : 3.7.0?????? OS : Ubuntu 18.04.1 LTS?????? IDE : PyCharm 2018.2.4????? Conda : 4.5.11???typesetting : Markdowncode""" @Author : 行初心 @Date : 18-10-2 @Blog : www.cnblogs.com/xingchuxin @Gitee : gitee.com/zhichengjiu """ import timedef main():my_time = time.localtime()print(my_time[0], "年")print(my_time[1], "月")print(my_time[2], "日")print(my_time[3], "时")print(my_time[4]...

python爬虫索引越界【图】

使用BeautifulSoup进行定位提取的时候，因为数据是一个列表，所以会使用到索引，但是经常会提示索引越界，这其实就是在我们匹配的时候，太过大意，如上：注意td和tr，tr说的是行，td是精确到元素的，所以后面的find_all很重要，td换成tr在执行后面的时候，匹配到的数据一定不一样现在的索引是按照td标签的倒数第二个元素，如果换成tr那就是倒数第二行了原文：http://www.cnblogs.com/feifang/p/7118028.html

用Python中的字典来处理索引统计的方法【代码】

最近折腾索引引擎以及数据统计方面的工作比较多, 与 Python 字典频繁打交道, 至此整理一份此方面 API 的用法与坑法备案. 索引引擎的基本工作原理便是倒排索引, 即将一个文档所包含的文字反过来映射至文档; 这方面算法并没有太多花样可言, 为了增加效率, 索引数据尽可往内存里面搬, 此法可效王献之习书法之势, 只要把十八台机器内存全部塞满, 那么基本也就功成名就了. 而基本思路举个简单例子, 现在有以下文档 (分词已经完成) 以...

乐哥学AI_Python(二)：Numpy索引，切片，常用函数【代码】【图】

Numpy的索引和切片ndarray对象的内容可以通过索引和切片查看和修改。索引：ndarray对象中的元素索引基于0开始切片：对数组里某个片段区域的描述数组的切片也可以理解为原始数组的局部视图，都是指向内存中的原始数组，所以不同于列表复制，切片上的修改都会直接反映到原始数组上。索引切片的实例代码演示： Numpy常用函数的代码演示：Numpy的置换函数transpose、T和swapaxes演示与区别T适用于一、二维数组arr = np.arange(12).res...

IR中python 写倒排索引与查询处理

学习信息检索课程，老师让写一个倒排索引与查询处理的程序，于是抱着试试的心态自学python写了出来。整个没有什么太大的算法技巧，唯一的就是查询处理那里递归函数正反两次反复查找需要多调试下。数据结构：#-*-coding:utf-8-*- #!/usr/bin/python''' 数据结构建立索引 mydir 文档列表 onedoc 每一个文档 mydoc 当前查询的文档mywords 建立索引的字典 myindex 0 文档下标 1 单词下标 2 次数 3... wordcntdict中的个数 doccnt...

【Python web 开发】联合唯一索引【图】

唯一联合索引：以商品收藏为例：同一个不能连续收藏同一个商品id这时候我们就要把数据库中的两个字段 user 和good 设置成唯一联合索引还有第二种方法：就是在validate里面也可以设置django rest framwork api guide 原文：https://www.cnblogs.com/yuanyuan2017/p/10123356.html

第三百四十一节，Python分布式爬虫打造搜索引擎Scrapy精讲—编写spiders爬虫文件循环抓取内容—【代码】【图】

第三百四十一节，Python分布式爬虫打造搜索引擎Scrapy精讲—编写spiders爬虫文件循环抓取内容— 编写spiders爬虫文件循环抓取内容Request()方法，将指定的url地址添加到下载器下载页面，两个必须参数，　　参数：　　url=‘url‘ 　　callback=页面处理函数　　使用时需要yield Request() parse.urljoin()方法，是urllib库下的方法，是自动url拼接，如果第二个参数的url地址是相对路径会自动与第一个参数拼接# -*- coding: utf-...

『Python』爬行搜索引擎结果获得指定主机所有二级域名【代码】【图】

0x 00 前言　　　　前天自己在玩的时候，自己通过百度搜索主机的二级域名感觉好麻烦，自已要一页页的去翻　　　　而且人工识别是否是重复的二级域名也够蛋疼的，正好最近在学正则表达式，权当练手了0x 00 代码# coding=utf-8 # author:Anka9080 import urllib import urllib2 import cookielib import reurl = ‘http://www.haosou.com/s?src=360sou_newhome&q=site:tjut.edu.cn&pn=1‘ req = urllib2.Request(url) res = urllib2....

Django3.0.4执行使用haystack时手动生成初始索引 python manage.py rebuild_index 报错:ImportError: cannot import name 'six' from 'django.utils'

原因django 3.x 系列删除了six. 解决办法第一步:安装sixpip3 install six第二步cd #进入家目录cd /home/zhouchen/.virtualenvs/meiduo5/lib/python3.6/site-packagescp six.py django/utils #将six.py拷贝进django/utils/目录下第三步# 将site-packages/haystack/inputs.py 中from django.utils.encoding import force_text, python_2_unicode_compatible# 改为from django.utils.encoding import force_textfrom django.utils.six...

《Python编程从0到1》笔记4——你分得清“索引和切片”吗？【代码】【图】

Python为序列类型（sequence types）[1]提供了独特的索引（indexing）和切片（slicing）机制以访问序列的某个元素或某一部分。[1] 如list, tuple, range, str, bytes, bytearray, memoryview1．索引在前文中已经展示过使用索引访问字符串、列表、元组的方法。像大多数其他编程语言一样，Python的索引从0开始（长度为N的序列，索引序号从0到N-1。除此之外，Python通过引入负数索引的方法，使得从尾部开始访问序列的写法很简洁。最...

四十六 Python分布式爬虫打造搜索引擎Scrapy精讲—elasticsearch(搜索引擎)scrapy写入数据到elasticsearch中【代码】【图】

前面我们讲到的elasticsearch(搜索引擎)操作，如：增、删、改、查等操作都是用的elasticsearch的语言命令，就像sql命令一样，当然elasticsearch官方也提供了一个python操作elasticsearch(搜索引擎)的接口包，就像sqlalchemy操作数据库一样的ORM框，这样我们操作elasticsearch就不用写命令了，用elasticsearch-dsl-py这个模块来操作，也就是用python的方式操作一个类即可 elasticsearch-dsl-py下载下载地址：https://github.com/ela...

使用Python操作Elasticsearch数据索引的教程【代码】

Elasticsearch是一个分布式、Restful的搜索及分析服务器，Apache Solr一样，它也是基于Lucence的索引服务器，但我认为Elasticsearch对比Solr的优点在于：轻量级：安装启动方便，下载文件之后一条命令就可以启动； Schema free：可以向服务器提交任意结构的JSON对象，Solr中使用schema.xml指定了索引结构；多索引文件支持：使用不同的index参数就能创建另一个索引文件，Solr中需要另行配置；分布式：Solr Cloud的配置...

python 搜索引擎Whoosh中文文档和代码

中文文档链接：https://mr-zhao.gitbooks.io/whoosh/content/%E5%A6%82%E4%BD%95%E7%B4%A2%E5%BC%95%E6%96%87%E6%A1%A3.html　　　　　　https://mr-zhao.gitbooks.io/whoosh/content/如何索引文档.html?q= 代码：回头放github上去原文：http://www.cnblogs.com/renfanzi/p/7195970.html

PYTHON - 技术教程分类

Python3 教程 Python3 简介 Python3 环境搭建 Python3 基础语法 Python3 基本数据类型 Python3 解释器 Python3 注释 Python3 运算符 Python3 数字(Number) Python3 字符串 Python3 列表 Python3 元组 Python3 字典 Python3 集合 Python3 编程第一步 Python3 条件控制 Python3 循环语句 Python3 迭代器与生成器 Python3 函数 Python3 数据结构 Python3 模块 Python3 输入和输出 Python3 File Python3 OS Python3 错误和异常 Python3 面向对象 Python3 命名空间/作用域 Python3 标准库概览 Python3 实例 Python3 CGI编程 Python3 MySQL(PyMySQL) Python3 网络编程 Python3 SMTP发送邮件 Python3 多线程 Python3 日期和时间 Python3 内置函数 Python3 MongoDB Python3 urllib python 全部

PYTHON - 最热教程

python如何统计字符串中字母个数？使用Python进行微信公众号开发（三）回...Python+PyQT5的子线程更新UI界面的实例 python时间戳怎么获得？如何获得当前时...vscode调试python时提示无法将“conda”...python接口自动化全局变量access_token...python收取邮件(腾讯企业邮箱)python如何绘制降水图详解python并发获取snmp信息及性能测试...怎么卸载Python3.6？

首页 / PYTHON / python – 具有相同列和索引的多个数据帧的平均值

python – 具有相同列和索引的多个数据帧的平均值

内容导读

内容图文

内容总结

内容备注

内容手机端

【python – 具有相同列和索引的多个数据帧的平均值】教程文章相关的互联网学习教程文章

零基础学python-8.3 列表的索引、分片和矩阵

Python 中使用 for、while 循环打印杨辉三角练习（列表索引练习）。

Python3基础 time 索引值访问元组中的年月日时分秒【代码】

python爬虫索引越界【图】

用Python中的字典来处理索引统计的方法【代码】

乐哥学AI_Python(二)：Numpy索引，切片，常用函数【代码】【图】

IR中python 写倒排索引与查询处理

【Python web 开发】联合唯一索引【图】

第三百四十一节，Python分布式爬虫打造搜索引擎Scrapy精讲—编写spiders爬虫文件循环抓取内容—【代码】【图】

『Python』爬行搜索引擎结果获得指定主机所有二级域名【代码】【图】

Django3.0.4执行使用haystack时手动生成初始索引 python manage.py rebuild_index 报错:ImportError: cannot import name 'six' from 'django.utils'

《Python编程从0到1》笔记4——你分得清“索引和切片”吗？【代码】【图】

四十六 Python分布式爬虫打造搜索引擎Scrapy精讲—elasticsearch(搜索引擎)scrapy写入数据到elasticsearch中【代码】【图】

使用Python操作Elasticsearch数据索引的教程【代码】

python 搜索引擎Whoosh中文文档和代码

PYTHON - 相关标签

数据 - 相关标签

PYTHON - 技术教程分类

PYTHON - 最新教程

PYTHON - 最热教程