python（re模块）

内容导读

互联网集市收集整理的这篇技术教程文章主要介绍了python（re模块），小编现在分享给大家，供广大互联网技能从业者学习和参考。文章包含4587字，纯文字阅读大概需要7分钟。

内容图文

正则就是模糊匹配

元字符（. ^ $ * + ? { } [ ] | ( ) \ ）

. (通配符，出了\n其他都可以匹配出来)，一个点只代表一个符号

            import
             re
s=re.findall(‘alex‘,"qweralexxcvbn")
print(s)

l=re.findall(‘a..x‘,"qweralexxcvbn")
print(l)

^ 表示以什么开头

            import
             re
s=re.findall(‘^a..x‘,"qweralexxcvb")
print(s)

l=re.findall(‘^q..r‘,"qweralexxcvbn")
print(l)

$表示以什么结尾

            import
             re
s=re.findall(‘a..x$‘,"qweralexxcvb")
print(s)

l=re.findall(‘a..x$‘,"qwerxcvbnalex")
print(l)

重复符号

*紧挨着的字符字符，表示重复很0到无穷次

            import
             re
s=re.findall(‘alex*‘,"qweraaaaaaalecvb")
print(s)

            import
             re
s=re.findall(‘alex*‘,"qweraaaaaaalexxxxxcvb")
print(s)

+表示重复很1到无穷次

            import
             re
s=re.findall(‘alex+‘,"qweraaaaaaalexxxxxcvb")
print(s)

l=re.findall(‘alex+‘,"qwerxcvbnale")
print(l)

？表示重复0次或者1次

            import
             re
s=re.findall(‘alex?‘,"qweraaaaaaalexxcvb")
print(s)

l=re.findall(‘alex?‘,"qwerxcvbnale")
print(l)

{ }重复次数自己定义

{0，}等价*

{1，}等价+

{0，1}等价于？

            #
             -*- coding: utf-8 -*-
            import
             re

            #
            重复5次
s=re.findall(‘alex{5}‘,"qweraaaaaaalexxxxxxxcvb")
print(s)
#重复1到6次
l=re.findall(‘alex{1,6}‘,"qwerxcvbnalexxxxxx")
print(l)

以上匹配都是贪婪匹配，加上？就是惰性匹配

            #
             -*- coding: utf-8 -*-
            import
             re

s=re.findall(‘alex*?‘,"qweraaaaaaalexxxxxxxcvb")
print(s)

[ ] 中括号，字符集，起一个或的作用，中括号里没有特殊字符

            #
             -*- coding: utf-8 -*-
            import
             re

s=re.findall(‘a[b,d]c‘,"qwerabcadclexa,ccvb")
print(s)

特殊情况

1，范围

            #
             -*- coding: utf-8 -*-
            import
             re

s=re.findall(‘a[a-z]‘,"qwerabcadclexa,ccvb")
print(s)

            #
             -*- coding: utf-8 -*-
            import
             re

            #
            [a-z]字符集重复
s=re.findall(‘a[a-z]*‘,"abc")
print(s)

            #
             -*- coding: utf-8 -*-
            import
             re

            #
            [a-z]字符集重复
s=re.findall(‘a[1-9]*‘,"a12cd")
print(s)

^在中括号里表示非

            #
             -*- coding: utf-8 -*-
            import
             re

            #
            不属于[a-z]全部匹配
s=re.findall(‘a[^a-z]*‘,"aQWERT12cdabcd")
print(s)

小应用

            #
             -*- coding: utf-8 -*-
            import
             re

            #
            \( \)表示括号（转义）,*表示多个字符
s=re.findall(‘\([^()]*\)‘,"4+(3-(1+1))")
print(s)

\d匹配所有数字

            #
             -*- coding: utf-8 -*-
            import
             re

s=re.findall(‘\d+‘,"14+(13-(11+1))")
print(s)

\D匹配所有非数字部分

            #
             -*- coding: utf-8 -*-
            import
             re

s=re.findall(‘\D+‘,"14+(13-(11+1))")
print(s)

\s匹配任意空白字符

            #
             -*- coding: utf-8 -*-
            import
             re

s=re.findall(‘\s+‘,"14+(13-(11+1)) abcd")
print(s)

\S匹配任意非空白字符

            #
             -*- coding: utf-8 -*-
            import
             re

s=re.findall(‘\S+‘,"14+(13-(11+1)) abcd")
print(s)

\w匹配任意数字与字符

            #
             -*- coding: utf-8 -*-
            import
             re

s=re.findall(‘\w+‘,"14+(13-(11+1)) abcd")
print(s)

\W匹配任意非数字与字符

            #
             -*- coding: utf-8 -*-
            import
             re

s=re.findall(‘\W+‘,"14+(13-(11+1)) abcd")
print(s)

\b匹配特殊字符边界空格，#，&等

小应用

            #
             -*- coding: utf-8 -*-
            import
             re

            #
            没有特指
l=re.findall(‘www.baidu‘,"www1baidu")
print(l)

s=re.findall(‘www\.baidu‘,"www.baidu")
print(s)

转义字符

r 表示原生字符串,正则表达式里使用"\"作为转义字符，这就可能造成反斜杠困扰。假如你需要匹配文本中的字符"\"，那么使用编程语言表示的正则表达式里将需要4个反斜杠"\\"：前两个和后两个分别用于在编程语言里转义成反斜杠，转换成两个反斜杠后再在正则表达式里转义成一个反斜杠。

            #
             -*- coding: utf-8 -*-
            import
             re

            #
            拿不出来
s=re.findall(‘i\b‘,"hello i am bob")
print(s)

l=re.findall(‘i\\b‘,"hello i am bob")
print(l)

r=re.findall(r‘i\b‘,"hello i am bob")
print(r)

            #
             -*- coding: utf-8 -*-
            import
             re

s=re.findall(‘b\\\\l‘,"ab\lcdef")
print(s)

l=re.findall(r‘b\\l‘,"ab\lcdef")
print(l)

a|b 表示a或b

            #
             -*- coding: utf-8 -*-
            import
             re

s=re.findall(‘ab|h‘,"abcdef")
print(s)

l=re.findall(‘ab|h‘,"abcdhef")
print(l)

re.search()与re.findall()区别

            #
             -*- coding: utf-8 -*-
            import
             re

            #
            返回一个列表
s=re.findall(‘ab.‘,"abcdeabf")
print(s)
#返回一个对象
l=re.search(‘ab.‘,"abcdheabf")
print(l)

re.search()匹配成功取出来

            #
             -*- coding: utf-8 -*-
            import
             re

l=re.search(‘ab.‘,"abcdheabf").group()
print(l)

元字符分组

            #
             -*- coding: utf-8 -*-
            import
             re

s=re.search("(?P<name>[a-z]+)(?P<age>\d+)","bob23alex22").group("name")
print(s)

l=re.search("(?P<name>[a-z]+)(?P<age>\d+)","bob23alex22").group("age")
print(l)

re.match()用法

re.match()用法同re.search（）一样，但只在字符串开始处进行匹配

            #
             -*- coding: utf-8 -*-
            import
             re

l=re.match(‘bo‘,"bob23alex22").group()
print(l)

re.split()用法

            #
             -*- coding: utf-8 -*-
            import
             re

            #
            按空格分
l=re.split(‘‘,‘hello abc|def‘)
print(l)

#按空格或\分
m=re.split(‘[ |]‘,‘hello abc|def‘)
print(m)

#先按a分割，得空和bcd,结果再按b分割
n=re.split(‘[ab]‘,‘abcd‘)
print(n)

re.sub()用法（替换，3个参数）

            #
             -*- coding: utf-8 -*-
            import
             re

            #
            数字替换为A
l=re.sub(‘\d‘,‘A‘,‘a1b2c3d4‘)
print(l)
#数字替换为A，且仅从前往后替换2次
m=re.sub(‘\d‘,‘A‘,‘a1b2c3d4‘,2)
print(m)

#全部替换并且统计次数
n=re.subn(‘\d‘,‘A‘,‘a1b2c3d4‘)
print(n)

re.compile（）用法

            #
             -*- coding: utf-8 -*-
            import
             re

l=re.compile(‘\d+‘)
n=l.findall(‘qwe123asd456zxc‘)
print(n)

re.finditer（）用法，将结果保存为迭代器，节省空间

            #
             -*- coding: utf-8 -*-
            import
             re

n=re.finditer(‘\d‘,‘a1b2c3d4e5f6‘)
print(next(n).group())
print(next(n).group())
print(next(n).group())

补充

            #
             -*- coding: utf-8 -*-
            import
             re

            #
            不会显示完整结果
n=re.findall(‘www\.(baidu|163)\.com‘,‘www.baidu.com‘)
print(n)
#去优先级
n=re.findall(‘www\.(?:baidu|163)\.com‘,‘www.baidu.com‘)
print(n)

原文：https://www.cnblogs.com/2018-1025/p/10223684.html

内容总结

以上是互联网集市为您收集整理的python（re模块）全部内容，希望文章能够帮你解决python（re模块）所遇到的程序开发问题。如果觉得互联网集市技术教程内容还不错，欢迎将互联网集市网站推荐给程序员好友。

内容备注

版权声明：本文内容由互联网用户自发贡献，该文观点与技术仅代表作者本人。本站仅提供信息存储空间服务，不拥有所有权，不承担相关法律责任。如发现本站有涉嫌侵权/违法违规的内容，请发送邮件至 gblab@vip.qq.com 举报，一经查实，本站将立刻删除。

内容手机端

扫描二维码推送至手机访问。

本文链接：https://qyyshop.com/info/1223044.html

来源：【匿名】

【上一篇】【Linux.Python】Python进程后台启动【下一篇】浅谈PHP运行Python脚本的方法

更多 ►

【python（re模块）】教程文章相关的互联网学习教程文章

正则就是模糊匹配元字符（. ^ $ * + ? { } [ ] | ( ) \ ）. (通配符，出了\n其他都可以匹配出来)，一个点只代表一个符号import re s=re.findall(‘alex‘,"qweralexxcvbn") print(s)l=re.findall(‘a..x‘,"qweralexxcvbn") print(l)^ 表示以什么开头import re s=re.findall(‘^a..x‘,"qweralexxcvb") print(s)l=re.findall(‘^q..r‘,"qweralexxcvbn") print(l)$表示以什么结尾import re s=re.findall(‘a..x$‘,"qweralexxcvb")...

python:模块【代码】【图】

一模块介绍1、什么是模块？#常见的场景：一个模块就是一个包含了一组功能的python文件,比如spam.py，模块名为spam，可以通过import spam使用。#在python中，模块的使用方式都是一样的，但其实细说的话，模块可以分为四个通用类别：　1 使用python编写的.py文件2 已被编译为共享库或DLL的C或C++扩展3 把一系列模块组织到一起的文件夹（注：文件夹下有一个__init__.py文件，该文件夹称之为包）4 使用C编写并链接到python解释器的内置...

python中的commands模块

commands模块用于调用shell命令有3中方法：commands.getstatus() 返回执行状态commands.getoutput() 返回执行结果commands.getstatusoutput() 返回一个元组，执行状态和执行结果其他执行shell命令的方法还有：1.os.system(cmd)2.os.popen(cmd) 原文：http://www.cnblogs.com/liyiran/p/4223153.html

python常用模块与正则表达式【代码】【图】

一，正则表达式1，在线测试工具：http://tool.chinaz.com/regex/字符组：在正则表达式中用[ ]表示，在python中是列表简单的正则表达式[ ]中数字是0-9，a-z，A-Z匹配时只能匹配一个数字，正则单纯的只认识数字，字母，字符等，没有复数，小数乱七八糟,以数字为例简写时只能是0-9，不能是9-0表示数字的字符组：[13466872],[0123456789],简写[0-9],[2-8]****[0-9a-zA-Z]除其他，只包含数字，字母范围，一次只能匹配一个。简单例子：[0...

mysql python pymysql模块获取插入的最后一条数据的自增ID lastrowid()方法【代码】

调用游标下的lastrowid 可以获取插入之前的表里id字段存放到哪个自增idcursor.lastrowidmysql> select * from userinfo; +----+-------+-----+ | id | name | pwd | +----+-------+-----+ | 1 | mike | 123 | | 2 | jack | 456 | | 3 | alex | 555 | | 4 | peter | 989 | | 5 | app | 123 | | 6 | tom | 556 | +----+-------+-----+ 6 rows in set (0.03 sec)我再用脚本插入三条记录自增id就是从 7开始，获取我插入...

python模块Configparser读取 ini(cfg,txt)等配置文件【代码】【图】

一个ini文件的组成；一个ini文件是由多个section组成，每个section中以key=vlaue形式存储数据；示例# 安装 pip install ConfigParser# 1.导包 import configparser config = configparser.ConfigParser() # 类实例化# 定义文件路径 path = r‘D:\Python_Script\new_framework\source_file\broswer_config.ini‘# 2.读取文件内容 # 第一种读取ini文件方式,通过read方法 config.read(path) value = config[‘select‘][‘url‘] prin...

解决Python中由于logging模块误用导致的内存泄露【代码】

首先介绍下怎么发现的吧, 线上的项目日志是通过 logging 模块打到 syslog 里, 跑了一段时间后发现 syslog 的 UDP 连接超过了 8W, 没错是 8 W. 主要是 logging 模块用的不对我们之前有这么一个需求, 就是针对每一个连接日志输出当前连接的信息, 所以每一个连接就创建了一个日志实例, 并分配一个 Formatter, 创建日志实例为了区分其他连接所以我就简单粗暴的用了当前对象的 id 来作为日志名称: import loggingclass Connection(obj...

python errno 模块与linux中errno.h中的值的对应关系【代码】

Linux/include/uapi/asm-generic/errno.h 1 #ifndef _ASM_GENERIC_ERRNO_H2 #define _ASM_GENERIC_ERRNO_H3 4 #include <asm-generic/errno-base.h>5 6 #define EDEADLK 35 /* Resource deadlock would occur */7 #define ENAMETOOLONG 36 /* File name too long */8 #define ENOLCK 37 /* No record locks available */9 #define ENOSYS 38 /* Function not implemented */10 ...

python 常用内建模块（1） base64【代码】

Base64是一种用64个字符来表示任意二进制数据的方法。用记事本打开exe、jpg、pdf这些文件时，我们都会看到一大堆乱码，因为二进制文件包含很多无法显示和打印的字符，所以，如果要让记事本这样的文本处理软件能处理二进制数据，就需要一个二进制到字符串的转换方法。Base64是一种最常见的二进制编码方法。Base64的原理很简单，首先，准备一个包含64个字符的数组：[‘A‘, ‘B‘, ‘C‘, ... ‘a‘, ‘b‘, ‘c‘, ... ‘0‘, ‘1‘...

python学习笔记(十二) - 常用内建模块

一.collections1. namedtuplenamedtuple是一个函数，它用来创建一个自定义的tuple对象，并且规定了tuple元素的个数，并可以用属性而不是索引来引用tuple的某个元素。from collections import namedtuple Point = namedtuple('Point', ['x', 'y']) p = Point(1, 2) print p.x print p.y2.dequedeque是为了实现高效插入和高效删除操作的双向列表，适合用于队列和栈from collections import deque q = deque(['a', 'b', 'c']) q.appen...

003dayPython学习初始模块和字节码

一、注释： 1、单行注释 # 被注释的内容 2、多行注释 """ 被注释的内容 """二、模块我们在编程的时候，往往是一个主.py文件，多个功能文件，当用到某个功能的时候将其导入到主文件中这些以.py结尾的功能文件，我们可以将其称之为模块模块分为系统模块和自定义模块系统模块是系统中本身就有的，像sys、time等模块而自定义模块就是我们自己写的.py文件导入模块用 imp...

python中的模块及路径【代码】

python在import module的时候是按照以下顺序去import一个module的：1. 首先判断这个module是不是built-in即内建模块，　如果是则引入内建模块，如果不是则在一个称为sys.path的list中寻找2. sys.path在python脚本执行时动态生成，包括以下3个部分：　　a.脚本执行的位置，即当前路径　　b.环境变量中的PYTHONPATH, 即.bash_profile 　　c.安装python时的依赖位置 import sysfor i in sys.path: print(i)D:\python_study\we...

1Python标准库系列之模块介绍【代码】

Python标准库系列之模块介绍Python的模块其实就是封装了一个或者多个功能的代码集合，以便于重用，模块可以是一个文件也可以是一个目录，目录的形式称作包。模块分类内置模块内置模块可以理解成当你安装好python环境之后，直接可以使用import导入的就是内置模块，默认模块路径为：C:\Python35\lib，你也可以通过以下方式获取内置模块的路径： # 导入sys模块 >>> import sys # 最后一个目录就是内置模块的路径 >>> for n in sys....

Python 爬虫常用模块【代码】

1、fake_useragentpip install fake_useragent 2、图展示pip install pyechartspip install pyecharts-snapshot 原文：https://www.cnblogs.com/cbugs/p/9803203.html

Python爬虫连载10-Requests模块、Proxy代理【代码】【图】

一、Request模块1.HTTP for Humans,更简洁更友好2.继承了urllib所有的特征3.底层使用的是urllib34.?开源地址：https://github.com/requests/requests5.中文文档?：https://requests.readthedocs.io/zh_CN/latest/6.先安装这个包:pip install requests7.get请求（1）requests.get()（2）requests.request("get",url)（3）可以带有headers和params参数8.get返回内容 import requests?#两种请求 url = "http://www.baidu.com/s?"rsp =...

首页 / PYTHON / python（re模块）

python（re模块）

内容导读

内容图文

内容总结

内容备注

内容手机端

【python（re模块）】教程文章相关的互联网学习教程文章

python（re模块）【代码】

python:模块【代码】【图】

python中的commands模块

python常用模块与正则表达式【代码】【图】

mysql python pymysql模块获取插入的最后一条数据的自增ID lastrowid()方法【代码】

python模块Configparser读取 ini(cfg,txt)等配置文件【代码】【图】

解决Python中由于logging模块误用导致的内存泄露【代码】

python errno 模块与linux中errno.h中的值的对应关系【代码】

python 常用内建模块（1） base64【代码】

python学习笔记(十二) - 常用内建模块

003dayPython学习初始模块和字节码

python中的模块及路径【代码】

1Python标准库系列之模块介绍【代码】

Python 爬虫常用模块【代码】

Python爬虫连载10-Requests模块、Proxy代理【代码】【图】

模块 - 相关标签

PYTHON - 技术教程分类

PYTHON - 最新教程

PYTHON - 最热教程