Python正则表达式

内容导读

互联网集市收集整理的这篇技术教程文章主要介绍了Python正则表达式，小编现在分享给大家，供广大互联网技能从业者学习和参考。文章包含3091字，纯文字阅读大概需要5分钟。

内容图文

python正则表达式的实现主要是通过python的re库，re库是python的标准库，所以无须安装

1.正则表达式的常用操作符

操作符	说明	实例
.	表示任何单个字符
[ ]	字符集，对单个字符给出取值范围	[abc]表示a、b、c，[a‐z]表示a到z单个字符
[^ ]	非字符集，对单个字符给出排除范围	[^abc]表示非a或b或c的单个字符
*	前一个字符0次或无限次扩展	abc* 表示ab、abc、abcc、abccc等
+	前一个字符1次或无限次扩展	abc+ 表示abc、abcc、abccc等
?	前一个字符0次或1次扩展	abc? 表示ab、abc
\|	左右表达式任意一个	abc\|def表示abc、def
{m}	扩展前一个字符m次	ab{2}c表示abbc
{m,n}	扩展前一个字符m至n次（含n）	ab{1,2}c表示abc、abbc
^	匹配字符串开头	^abc表示abc且在一个字符串的开头
$	匹配字符串结尾	abc$表示abc且在一个字符串的结尾
( )	分组标记，内部只能使用	操作符\|(abc)表示abc，(abc\|def)表示abc、def
\d	数字，等价于[0‐9]
\w	单词字符，等价于[A‐Za‐z0‐9_]

2.re库的使用

主要功能函数

函数	说明
re.search()	在一个字符串中搜索匹配正则表达式的第一个位置，匹配成功返回match对象，否则返回None
re.match()	从一个字符串的开始位置起匹配正则表达式，匹配成功返回match对象，否则返回None
re.findall()	搜索字符串，以列表类型返回全部能匹配的子串
re.split()	将一个字符串按照正则表达式匹配结果进行分割，返回列表类型
re.finditer()	搜索字符串，返回一个匹配结果的迭代类型，每个迭代元素是match对象
re.sub()	在一个字符串中替换所有匹配正则表达式的子串，返回替换后的字符串

更详细的说明请参考Python re文档

例如：

re.search(pattern,string,flags=0)

其中：

pattern : 正则表达式的字符串或原生字符串表示
string : 待匹配字符串
flags : 正则表达式使用时的控制标记

常用标记	说明
re.I或re.IGNORECASE	忽略正则表达式的大小写，[A‐Z]能够匹配小写字符
re.M或re.MULTILINE	正则表达式中的^操作符能够将给定字符串的每行当作匹配开始
re.S或re.DOTALL	正则表达式中的.操作符能够匹配所有字符，默认匹配除换行外的所有字符

>>> import re
>>> m = re.search(r'[1-9]\d{5}', 'abc1234567')
>>> if m:
...     m.group(0)
...
'123456'

还有一种写法是这样的

>>> import re
>>> t = re.compile(r'[1-9]\d{5}')
>>> m = t.search('abc1234567')
>>> if m:
...     m.group(0)
...
'123456'

第二种写法的好处是：当要对一个正则表达式进行多次字符串匹配时，可以只编译一次，匹配多次，可以提升效率

3.Match对象

属性	说明
.string	待匹配的文本
.re	匹配时使用的patter对象（正则表达式）
.pos	正则表达式搜索文本的开始位置
.endpos	正则表达式搜索文本的结束位置
.group()	获得匹配后的字符串
.start()	匹配字符串在原始字符串的开始位置
.end()	匹配字符串在原始字符串的结束位置
.span()	返回(.start(), .end())

4.re库的贪婪匹配

re库默认采用贪婪匹配，即输出匹配长的子串

例如

>>> match = re.search(r'PY.*N', 'PYANBNCNDN')   
>>> match.group(0)   
'PYANBNCNDN'

那么，如何输出最小的匹配呢

可以在.*后面加个?，就像这样

>>> match = re.search(r'PY.*?N', 'PYANBNCNDN')   
>>> match.group(0) 
'PYAN'

还有一些其他的操作符

操作符	说明
*?	前一个字符0次或无限次扩展，小匹配
+?	前一个字符1次或无限次扩展，小匹配
??	前一个字符0次或1次扩展，小匹配
{m,n}?	扩展前一个字符m至n次（含n），最小匹配

正则表达式说明

函数	说明
sub(pattern,repl,string)	把字符串中的所有匹配表达式pattern中的地方替换成repl
[^**]	表示不匹配此字符集中的任何一个字符
\u4e00-\u9fa5	汉字的unicode范围
\u0030-\u0039	数字的unicode范围
\u0041-\u005a	大写字母unicode范围
\u0061-\u007a	小写字母unicode范围
\uAC00-\uD7AF	韩文的unicode范围
\u3040-\u31FF	日文的unicode范围

关注公众号：

Python正则表达式 - 文章图片

内容总结

以上是互联网集市为您收集整理的Python正则表达式全部内容，希望文章能够帮你解决Python正则表达式所遇到的程序开发问题。如果觉得互联网集市技术教程内容还不错，欢迎将互联网集市网站推荐给程序员好友。

内容备注

版权声明：本文内容由互联网用户自发贡献，该文观点与技术仅代表作者本人。本站仅提供信息存储空间服务，不拥有所有权，不承担相关法律责任。如发现本站有涉嫌侵权/违法违规的内容，请发送邮件至 gblab@vip.qq.com 举报，一经查实，本站将立刻删除。

内容手机端

扫描二维码推送至手机访问。

本文链接：https://qyyshop.com/info/635298.html

来源：【匿名】

【上一篇】Python正则表达式--实例秘籍【下一篇】正则表达式语法

更多 ►

【Python正则表达式】教程文章相关的互联网学习教程文章

()和[] 有本质的区别() 内的内容表示的是一个子表达式，()本身不匹配任何东西，也不限制匹配任何东西，只是把括号内的内容作为同一个表达式来处理，例如(ab){1,3} ,就表示ab一起连续出现最少1次，最多3次。如果没有括号，ab{1,3}就表示紧跟的b出现最少1次，最多3次[] 表示匹配的字符在[] 中，并且只能出现一次，并且特殊字符写在[]会被当成普通字符来匹配。例如[(a)],会匹配 ( a ) 这三个字符原文：https://www.cnblogs.com/whl4...

Delphi 正则表达式语法(9): 临界匹配 - 也叫"预搜索"与"反向预搜索"【代码】

Delphi 正则表达式语法(9): 临界匹配 - 也叫"预搜索"与"反向预搜索"//匹配右边var reg: TPerlRegEx; begin reg := TPerlRegEx.Create(nil); reg.Subject := ‘Delphi 6; Delphi 7; Delphi 2007; Delphi Net‘; reg.RegEx := ‘Delphi (?=2007)‘; // ?= reg.Replacement := ‘◆‘; reg.ReplaceAll; ShowMessage(reg.Subject); //返回: Delphi 6; Delphi 7; ◆2007; Delphi Net FreeAndNil(reg); end;//不匹配右边v...

wdVBA正则表达式提取题目【代码】

Public Sub GetContents()Dim Reg As ObjectDim Matches As ObjectDim OneMatch As ObjectDim Index As LongDim TimeStart As VariantTimeStart = VBA.TimerSet Reg = CreateObject("Vbscript.RegExp")With Reg.Pattern = "^\s*?((?:[^\r]*?\d+题[^\r]?\s*?[^\r]*?\s*?)?\d*[\.，、．](?:[^\r\n]*?\r?[\r\n]+?){1,4}?)\s*?" & _"(A[\.，、．].*?)\s+?" & _"(B[\.，、．].*?)\s+?" & _"(C[\.，、．].*?)\s+?" & _"(D[\.，、．].*?)...

用正则表达式批量删除注释（//abc和/abc/）【代码】

1 前言功能：批量去除注释代码，适合采用//或者/**/类型的注释，Java，Javascript，Golang，C/C++等在submlime测试通过2 代码# 删除//abc... 行 \/\/.* # 删除 /*abc*/ \/\*(\s|.)*?\*\/ # 去除空行 ^(\s*)\n 3 参考　[1] https://www.cnblogs.com/iLoveMyD/p/3508276.html原文：https://www.cnblogs.com/fanbi/p/13086519.html

JAVA正则表达式 Pattern和Matcher

1.简介： java.util.regex是一个用正则表达式所订制的模式来对字符串进行匹配工作的类库包。它包括两个类：Pattern和Matcher Pattern 一个Pattern是一个正则表达式经编译后的表现模式。 Matcher 一个Matcher对象是一个状态机器，它依据Pattern对象做为匹配模式对字符串展开匹配检查。首先一个Pattern实例订制了一个所用语法与PERL的类似的正则表达式经编译后的模式，然后一个Matcher实例在这个给定的Pattern实例的模式控制下进行...

oracle between、 all、 in 和 exists的区别，模糊查询、4个正则表达式【代码】

--条件比较 /* ＝，！＝,<>，<,>,<=,>=, any,some,all is null,is not null between x and y in（list），not in（list） exists（sub－query） like _ ,%,escape ‘\‘ _\% escape ‘\’ */--any some 只要满足其中的任何一个即可 SELECT E.ENAME ,E.JOB,E.SAL FROM EMP E WHERE E.SAL > ANY(1000,2000,3000) SELECT E.ENAME ,E.JOB,E.SAL FROM EMP E WHERE E.SAL > SOME(1000,2000,3000)--all 满足所有的 SELECT E.ENAME ,E....

python常用模块与正则表达式【代码】【图】

一，正则表达式1，在线测试工具：http://tool.chinaz.com/regex/字符组：在正则表达式中用[ ]表示，在python中是列表简单的正则表达式[ ]中数字是0-9，a-z，A-Z匹配时只能匹配一个数字，正则单纯的只认识数字，字母，字符等，没有复数，小数乱七八糟,以数字为例简写时只能是0-9，不能是9-0表示数字的字符组：[13466872],[0123456789],简写[0-9],[2-8]****[0-9a-zA-Z]除其他，只包含数字，字母范围，一次只能匹配一个。简单例子：[0...

正则表达式

一、校验数字的表达式 1 数字：^[0-9]*$ 2 n位的数字：^\d{n}$ 3 至少n位的数字：^\d{n,}$ 4 m-n位的数字：^\d{m,n}$ 5 零和非零开头的数字：^(0|[1-9][0-9]*)$ 6 非零开头的最多带两位小数的数字：^([1-9][0-9]*)+(.[0-9]{1,2})?$ 7 带1-2位小数的正数或负数：^(\-)?\d+(\.\d{1,2})?$ 8 正数、负数、和小数：^(\-|\+)?\d+(\.\d+)?$ 9 有两位小数的正实数：^[0-9]+(.[0-9]{2})?$ 10 有1~3位小数的正实数：^[0-9]+(.[0-9]{...

常用正则表达式【代码】

/*** 手机号码验证** @param mobileNumbel 传入的手机号码** @return 格式正确返回YES 错误返回 NO*/ + (BOOL) isMobile:(NSString *)mobileNumbel {/*** 手机号码* 移动：134[0-8],135,136,137,138,139,150,151,157,158,159,182,187,188* 联通：130,131,132,152,155,156,185,186* 电信：133,1349,153,180,189,181(增加)* 新增：14_,17_*/NSString * MOBIL = @"^1(3[0-9]|4[0-9]|5[0-35-9]|7[0-9]|8[025-9])\\d{8}$";/**10 ...

常用正则表达式

带区号的电话号码：/^(\d{3}-|\d{4}-)(\d{8}|\d{7})$/匹配中文字符： /[\u4e00-\u9fa5]/国内邮政编码： /^\d{6}$/国内手机号码： /^1((3|5|8){1}\d{1}|70)\d{8}$/ （匹配 13x/15x/18x/170 号段，如有遗漏请自行添加）//...原文：http://www.cnblogs.com/miaosha5s/p/5899865.html

Python笔记_第四篇_高阶编程_正则表达式_2.正则表达式入门【代码】

1. 匹配单个字符和数字：. --->> 匹配除换行符以外的任意字符。[0123456789] --->> []字符集合，表示匹配方括号中所包含的任意一个字符。[Thomas] --->> []字符集合，表示匹配方括号中所包含的任意一个字符。匹配‘T‘,‘h‘...任意一个字符。[a-z] --->> - 匹配任意小写字母[A-Z] --->> - 匹配任意大写字母[0-9] --->> 匹配任意数字，类似于[0123456789][0-9a-zA-Z] --->> 匹配任意的数字和字母（包含大小写）[0-9a-zA-Z_] --->> ...

re模块_正则表达式【代码】

1# @Time : 2019/11/15 0015 20:45 2# @Author : CallmeV 3import re4 5 ret = re.findall(‘w..l‘,‘hello world hello woll‘)# . 代指除换行符以外的所有字符，且只能代指一个 6print(‘. is >>>‘,ret)7 8 ret = re.findall(‘^h...o‘,‘,,,hello world‘)# ^ 只对字符串的开头进行匹配 9print(‘^ is >>>‘,ret) 1011 ret = re.findall(‘a..x$‘,‘skajalexdshajauyx‘) # $ 只对结束时匹配12print(‘$ is >>>‘,ret) 1314...

正则表达式，看完这篇应该八九不离十了吧【代码】

提起正则表达式，新手可能都会脑袋一懵，什么呀！完全不懂呀，别急，静下心来，看完这篇你应该就八九不离十了首先我们得清楚正则表达构成第一部分，基础部分，包含正则表达的几个基本函数和最底层的方法，话不多说，上码import res = ‘许诺正在使用python学习正则表达式‘result = re.match(‘许诺‘, s) # .match表示从头开始匹配，这里可以实现print(result)result = re.match(‘python‘, s) # .match表示从头开始匹配，这里...

在C#中使用正则表达式自动匹配并获取所需要的数据

转自：http://my.oschina.net/bv10000/blog/111736正则表达式能根据设置匹配各种数据（比如：e-mail地址，电话号码，身份中号码等等）。正则表达式功能强大，使用灵活，C#，Java，JavaScript等多种语言都支持正则表达式。在互联网上“抓取数据”更是少不了使用正则表达式。今天我要说的是在C#中使用正则表达式自动匹配并获取所需要的数据。从下面是某个IP查询网站返回查询结果的一个部分（字符串），现在就是要从这个字符串中获取...

常用正则表达式

class="easyui-validatebox easyui-textbox" 如果为easyui-combobox ，首位则不能为0手机号：validType="Composite_validation[‘^\\d{11}$‘,‘请输入11电话号码‘]" 车牌号：‘^([a-zA-Z0-9\u4e00-\u9fa5]+)$‘ 原文：http://www.cnblogs.com/jdw12306/p/6708523.html

正则 - 最热教程

java正则表达式匹配所有数字，包括带小...UltraEdit正则表达式搜索替换小技巧 php正则表达式，允许有数字，字母，和标...jquery取字符串中数字的正则_jquery 分享正则表达式注册表验证和一些常用的...php正则表达式的特殊字符含义_PHP教程 SwiftUI iOS 超酷组件之支持文本分割炸...java网页爬虫正则表达式 java-检查字符串是否仅包含字母空格和引...python 正则表达式与JSON-JSON

首页 / 正则 / Python正则表达式

Python正则表达式

内容导读

内容图文

关注公众号：

内容总结

内容备注

内容手机端

【Python正则表达式】教程文章相关的互联网学习教程文章

正则表达式

Delphi 正则表达式语法(9): 临界匹配 - 也叫"预搜索"与"反向预搜索"【代码】

wdVBA正则表达式提取题目【代码】

用正则表达式批量删除注释（//abc和/abc/）【代码】

JAVA正则表达式 Pattern和Matcher

oracle between、 all、 in 和 exists的区别，模糊查询、4个正则表达式【代码】

python常用模块与正则表达式【代码】【图】

正则表达式

常用正则表达式【代码】

常用正则表达式

Python笔记_第四篇_高阶编程_正则表达式_2.正则表达式入门【代码】

re模块_正则表达式【代码】

正则表达式，看完这篇应该八九不离十了吧【代码】

在C#中使用正则表达式自动匹配并获取所需要的数据

常用正则表达式

PYTHON - 相关标签

正则表达式 - 相关标签

正则 - 最新教程

正则 - 最热教程