首页 / PYTHON / pandas数据处理基础之筛选指定行或者指定列的数据

pandas数据处理基础之筛选指定行或者指定列的数据

内容导读

互联网集市收集整理的这篇技术教程文章主要介绍了pandas数据处理基础之筛选指定行或者指定列的数据，小编现在分享给大家，供广大互联网技能从业者学习和参考。文章包含2332字，纯文字阅读大概需要4分钟。

内容图文

这篇文章主要介绍了pandas数据处理基础之筛选指定行或者指定列的数据的相关资料,需要的朋友可以参考下

pandas主要的两个数据结构是：series（相当于一行或一列数据机构）和DataFrame（相当于多行多列的一个表格数据机构）。

本文为了方便理解会与excel或者sql操作行或列来进行联想类比

1.重新索引：reindex和ix

上一篇中介绍过数据读取后默认的行索引是0,1，2,3...这样的顺序号。列索引相当于字段名(即第一行数据)，这里重新索引意思就是可以将默认的索引重新修改成自己想要的样子。

1.1 Series

比方说：data=Series([4,5,6],index=['a','b','c'])，行索引为a,b,c。

我们用data.reindex(['a','c','d','e'])修改索引后则输出：

pandas数据处理基础之筛选指定行或者指定列的数据 - 文章图片

可以理解成我们用reindex设了索引后，根据索引去原来data里面匹配对应的值，没匹配上的就是NaN。

1.2 DataFrame

（1）行索引修改：DataFrame行索引同Series

（2）列索引修改：列索引用reindex(columns=['m1','m2','m3']),用参数columns来指定对列索引进行修改。修改逻辑类似行索引，也是相当于用新列索引去匹配原来的数据，没匹配上的置NaN

例：

pandas数据处理基础之筛选指定行或者指定列的数据 - 文章图片

（3）同时对行和列索引进行修改可以用

pandas数据处理基础之筛选指定行或者指定列的数据 - 文章图片

2.丢弃指定轴上的列（通俗的说法就是删除行或者列）:drop

通过索引进行选择删除哪一行或者哪一列

data.drop(['a','c']) 相当于delete table a where xid='a' or xid='c'

data.drop('m1',axis=1)相当于delete table a where yid='m1'

3.选取和过滤（通俗的说就是sql中按照条件筛选查询）

python中因为有行列索引，在做数据的筛选会比较方便

3.1 Series

（1）按照行索引进行选择如

pandas数据处理基础之筛选指定行或者指定列的数据 - 文章图片

obj['b']相当于select * from tb where xid='b'obj['b','a','c']相当于select * from tb where xid in ('a','b','c')，且结果按照b ,a ,c 的顺序排列后进行展示，这是与sql的区别obj[0:1]和obj['a':'b']的区别如下：

#前者是不包含末端，后者是包含了末端

pandas数据处理基础之筛选指定行或者指定列的数据 - 文章图片

（2）按照值的大小进行筛选obj[obj>-0.6]相当于在obj数据中找出值比-0.6大的记录进行展示

pandas数据处理基础之筛选指定行或者指定列的数据 - 文章图片

3.2 DataFrame

（1）选择单行用ix或者xs：

如筛选索引为b的那条行记录用以下三种方式

pandas数据处理基础之筛选指定行或者指定列的数据 - 文章图片

（2）选择多行:

筛选索引为a,b的两条行记录的方式

pandas数据处理基础之筛选指定行或者指定列的数据 - 文章图片

#以上不能直接写成data[['a','b']]

data[0:2]表示从第一行到第二行的记录。第一行默认从0开始数，不包含末端的2。

（3）选择单列

筛选m1列的所有行记录数据

pandas数据处理基础之筛选指定行或者指定列的数据 - 文章图片

（4）选择多列

筛选m1,m3两个列，所有行记录的数据

pandas数据处理基础之筛选指定行或者指定列的数据 - 文章图片

ix[:,['m1','m2']]前面的：表示所有的行都筛选进来。

（5）根据值的大小条件筛选行或者列

如筛选出某一列值大于4的所有记录相当于select * from tb where 列名>4

pandas数据处理基础之筛选指定行或者指定列的数据 - 文章图片

（6）如果筛选某列值大于4的所有记录，且只需展示部分列的情况时

pandas数据处理基础之筛选指定行或者指定列的数据 - 文章图片

行用条件进行筛选，列用[0,2]筛选第一列和第三列的数据

内容总结

以上是互联网集市为您收集整理的pandas数据处理基础之筛选指定行或者指定列的数据全部内容，希望文章能够帮你解决pandas数据处理基础之筛选指定行或者指定列的数据所遇到的程序开发问题。如果觉得互联网集市技术教程内容还不错，欢迎将互联网集市网站推荐给程序员好友。

内容备注

版权声明：本文内容由互联网用户自发贡献，该文观点与技术仅代表作者本人。本站仅提供信息存储空间服务，不拥有所有权，不承担相关法律责任。如发现本站有涉嫌侵权/违法违规的内容，请发送邮件至 gblab@vip.qq.com 举报，一经查实，本站将立刻删除。

内容手机端

扫描二维码推送至手机访问。

本文链接：https://qyyshop.com/info/426668.html

来源：【匿名】

【上一篇】用python处理图片实现图像中的像素访问【下一篇】浅谈PHP运行Python脚本的方法

更多 ►

【pandas数据处理基础之筛选指定行或者指定列的数据】教程文章相关的互联网学习教程文章

python - pandas或者sklearn中如何将字符形式的标签数字化

参考：http://www.php.cn/wenda/91257.html　　　　https://www.cnblogs.com/king-lps/p/7846414.html　　　　http://blog.csdn.net/kancy110/article/details/75043202原文：http://www.cnblogs.com/rrttp/p/8110329.html

Python——pandas数据处理（python programming）【图】

原文：https://www.cnblogs.com/caiyishuai/p/10685128.html

用Python的pandas框架操作Excel文件中的数据教程【代码】

引言本文的目的，是向您展示如何使用pandas 来执行一些常见的Excel任务。有些例子比较琐碎，但我觉得展示这些简单的东西与那些你可以在其他地方找到的复杂功能同等重要。作为额外的福利，我将会进行一些模糊字符串匹配，以此来展示一些小花样，以及展示pandas是如何利用完整的Python模块系统去做一些在Python中是简单，但在Excel中却很复杂的事情的。有道理吧？让我们开始吧。为某行添加求和项我要介绍的第一项任务是把某几列相加...

Python pandas Date【代码】【图】

Pandas主要有4中与时间相关的类型。Timestamp, Period, DatetimeIndex,PeriodIndex.import pandas as pd import numpy as np # #Timestamp pd.Timestamp(‘9/1/2016 10:05AM‘) #output: Timestamp(‘2016-09-01 10:05:00‘) # #Period pd.Period(‘1/2016‘) #output: Period(‘2016-01‘, ‘M‘) pd.Period(‘3/5/2016‘) #output: Period(‘2016-03-05‘, ‘D‘) # #DatetimeIndex t1 = pd.Series(list(‘abc‘), [pd.Timestamp...

Python 2.7_pandas连接MySQL数据处理_20161229【代码】【图】

在我本地Mysql_local_db数据库建立了一个pandas数据表用来对pandas模块的学习1、创建表CREATE TABLE pandastest( 城市 VARCHAR(255), 用户ID INT(19), 订单日期 DATE, 金额 DECIMAL(19,4), 金额区间 VARCHAR(255), 订单数 INT(19), 上次订单日期 DATE, 距上次订单天数 INT(19), 上次金额 DECIMAL(19,4), 距上次订单间隔区间 VARCHAR(255), 品类数 INT(19), KEY city (城市), KEY res_id(用户ID) )ENGINE=INNODB DEFAULT CHARSET=ut...

python pandas stack和unstack函数【代码】【图】

在用pandas进行数据重排时，经常用到stack和unstack两个函数。stack的意思是堆叠，堆积，unstack即“不要堆叠”，我对两个函数是这样理解和区分的。　　常见的数据的层次化结构有两种，一种是表格，一种是“花括号”，即下面这样的l两种形式： store1store2store3street1123street2456 　　表格在行列方向上均有索引（类似于DataFrame），花括号结构只有“列方向”上的索引（类似于层次化的Seri...

python 计算均值、方差、标准差 Numpy，Pandas【代码】

Python 中的 numpy 包和 pandas 包都能够计算均值、方差等，本文总结一下它们的用法。1. Numpy 计算均值、方差、标准差一般的均值可以用 numpy 中的 mean 方法求得：>>> import numpy as np >>> a = [5, 6, 16, 9] >>> np.mean(a) 9.0numpy 中的 average 方法不仅能求得简单平均数，也可以求出加权平均数。average 里面可以跟一个 weights 参数，里面是一个权数的数组，例如：>>> np.average(a) >>> 9.0 >>> np.average(a, weight...

python学习-使用pandas 按照行数分割表格【代码】【图】

问题一张excel表格，大概1万行，需要录入系统系统每次最多只能录入500行表格数据，一旦超过500行，就会录入失败需要把1万行的数据按照500行分割，形成20个表格，这样才能录入系统思路使用pandas得到总行数，比如10002行，分割表格的时候，要保留一行表头第一张表，是1-500行，第二张表是 501-1000，以此类推最后一张表应该是1000-10002行，生成的表格数量是10000/500+1,21张生成的表格按照顺序保存到一个目录中写一个函数，可以按照...

python学习笔记（四）：pandas基础【代码】

pandas 基础seriseimport pandas as pd from pandas import Series, DataFrame obj = Series([4, -7, 5, 3]) obj0 4 1 -7 2 5 3 3 dtype: int64obj.valuesarray([ 4, -7, 5, 3], dtype=int64)obj.indexRangeIndex(start=0, stop=4, step=1)obj[[1,3]] # 跳着选取数据1 -7 3 3 dtype: int64obj[1:3]1 -7 2 5 dtype: int64pd.isnull(obj)0 False 1 False 2 False 3 False dtype: boolreindex可以...

python数据分析之pandas库的DataFrame应用【代码】【图】

DataFrame是一个表格型的数据结构，它含有一组有序的列，每列可以是不同的值类型（数值，字符串，布尔型）。DateFrame既有行索引也有列索引，可以被看作为由Series组成的字典。构建DataFrame：1.1、直接传入一个由等长列表或numpy数组组成的字典‘‘‘ Created on 2016-8-10 @author: xuzhengzhu ‘‘‘from pandas import *data={‘state‘:[‘ohio‘,‘ohio‘,‘ohio‘,‘nevada‘,‘nevada‘],‘year‘:[2000,2001,2002,2001,20...

python_执行报错_No module named 'pandas'【图】

程序中代码如下：报错：根据链接（ http://www.pianshen.com/article/6871295514/ ）中指导，解决过程如下：File --> Settings --> Project （ Project Interpreter ） --> 点击其中加号 --> 搜索 pandas ，然后点击安装。 '' ref='nofollow'>python_执行报错_No module named 'pandas'原文：https://www.cnblogs.com/lyj0123/p/11773733.html

python—pandas读取excel与写入excel【代码】

import pandas as pdimport openpyxl#将excel数据读取，输出格式为dataframe格式path = r‘/Users/**/PycharmProjects/class/pyclass1/others/file/学生信息表.xlsx‘#sheet_name可填写1）excel中表单序号从0开始2）表单名data = pd.read_excel(path,sheet_name=‘基础信息‘)#data.head()print(data)#将dataframe格式数据写入excel表path=r‘/Users/**/PycharmProjects/class/pyclass1/others/file/学生信息表2.xlsx‘data.to_exc...

Python数据分析与机器学习-Pandas_1【代码】

import pandas food_info = pandas.read_csv("food_info.csv") print(type(food_info)) print (food_info.dtypes)<class 'pandas.core.frame.DataFrame'> NDB_No int64 Shrt_Desc object Water_(g) float64 Energ_Kcal int64 Protein_(g) float64 Lipid_Tot_(g) float64 Ash_(g) float64 Carbohydrt_(g) float64 Fiber_TD_(g) float64 Sugar_Tot_(g)...

Python 使用Pandas读取Excel的学习笔记【代码】【图】

这里介绍Python中使用Pandas读取Excel的方法一、软件环境： OS：Win7 64位 Python 3.7二、文件准备 1、项目结构： 2、在当前实验文件夹下建立一个Source文件夹，里面放待读取的Excel文件 3、待读取的Excel文件名：Book1.xlsx，Sheet Name:Sheet1 内容示例：三、代码参考代码中已进行了注释说明，这里就不重复说明了。1、第一行作为列名处理，数据的第1行实际是从Excel的第2行开始，数据的最大行数...

利用Python进行数据分析：【Pandas】（Series+DataFrame）【代码】【图】

一、pandas简单介绍 1、pandas是一个强大的Python数据分析的工具包。2、pandas是基于NumPy构建的。3、pandas的主要功能　　--具备对其功能的数据结构DataFrame、Series 　　--集成时间序列功能　　--提供丰富的数学运算和操作　　--灵活处理缺失数据4、安装方法：pip install pandas5、引用方法：import pandas as pd二、Series Series是一种类似于一位数组的对象，由一组数据和一组与之相关的数据标签（索引）组成。创建方式：...

PYTHON - 技术教程分类

Python3 教程 Python3 简介 Python3 环境搭建 Python3 基础语法 Python3 基本数据类型 Python3 解释器 Python3 注释 Python3 运算符 Python3 数字(Number) Python3 字符串 Python3 列表 Python3 元组 Python3 字典 Python3 集合 Python3 编程第一步 Python3 条件控制 Python3 循环语句 Python3 迭代器与生成器 Python3 函数 Python3 数据结构 Python3 模块 Python3 输入和输出 Python3 File Python3 OS Python3 错误和异常 Python3 面向对象 Python3 命名空间/作用域 Python3 标准库概览 Python3 实例 Python3 CGI编程 Python3 MySQL(PyMySQL) Python3 网络编程 Python3 SMTP发送邮件 Python3 多线程 Python3 日期和时间 Python3 内置函数 Python3 MongoDB Python3 urllib python 全部

PYTHON - 最热教程

python如何统计字符串中字母个数？使用Python进行微信公众号开发（三）回...Python+PyQT5的子线程更新UI界面的实例 python时间戳怎么获得？如何获得当前时...vscode调试python时提示无法将“conda”...python接口自动化全局变量access_token...python收取邮件(腾讯企业邮箱)python如何绘制降水图详解python并发获取snmp信息及性能测试...怎么卸载Python3.6？

首页 / PYTHON / pandas数据处理基础之筛选指定行或者指定列的数据

pandas数据处理基础之筛选指定行或者指定列的数据

内容导读

内容图文

内容总结

内容备注

内容手机端

【pandas数据处理基础之筛选指定行或者指定列的数据】教程文章相关的互联网学习教程文章

PYTHON - 技术教程分类

PYTHON - 最新教程

PYTHON - 最热教程