首页 / 正则 / python --> 正则表达式

python --> 正则表达式

内容导读

互联网集市收集整理的这篇技术教程文章主要介绍了python --> 正则表达式，小编现在分享给大家，供广大互联网技能从业者学习和参考。文章包含4766字，纯文字阅读大概需要7分钟。

内容图文

在python中使用正则表达式，需要导入 re 模块

一、元字符，包括 [] {} | ? * + . ^ $ \ ()

　　. 号：通配符，一个点号就代表一个字符，一般情况下不能通配换行符 \n

　　* 号：控制前面的一个字符或是组，重复出现0至n次

　　+号：控制前面的一个字符或是组，重复出现1至n次

　　？号：控制前面的一个字符或是组，重复出现0或1次

　　{}号：内部加数字参数，固定重复次数，也可以写为 {3，5} 代表重复3/4/5次都ok

　　()号：把内部封装一起作为一组，一个整体

　　^号：控制开头

　　$号：控制结尾，

　　\号：后面跟元字符，去掉元字符的特殊含义，后面跟普通字符，赋予普通字符特殊意义，跟数字，引用序号对应的组所匹配到的字符串

　　　　\d：匹配任何十进制数字，相当于类[0-9]

　　　　\D:匹配任何非数字字符，相当于类[^0-9]

　　　　\s:匹配任何空白字符，相当于类[\t\n\r\f\v]

　　　　\S:匹配任何非空字符，相当于类[^\t\n\r\f\v]

　　　　\w:匹配任何字母数字字符，相当于类[0-9a-zA-Z]

　　　　\W:匹配任何非字母数字字符，相当于类[^0-9a-zA-Z]

　　　　\b:匹配一个单词边界，也就是指单词与空格间的位置　　　

　　[]号：字符集，中括号里的内容之间存在或者的关系，取其一；放在字符集里的元字符失去意义，变为普通字符，^放在字符集里表示‘非’的意思；\d等在字符集里意义不变

　　| 号：代表‘或’，选其一

二、函数

　　re.match(pattern,string,flag = 0)：从字符串的开头进行匹配

　　　　flag = 0 参数，可修改为 re.I 使匹配对大小写不敏感；re.S 使可以匹配出任意字符，包括换行符\n；re.M 多行匹配，会影响^ $

　　re.search(pattern,string,flag)：浏览全部字符串，逐个字符匹配，匹配第一个符合规则的字符串

　　match 和 search 匹配的结果都是一个对象，对匹配到的对象进行处理，有如下方法

　　　　.group() 返回匹配到的字符串整体，括号内默认参数为0，如设置为1，则代表返回匹配到的第一组的结果

　　　　.groups() 获取匹配到的分组结果，只匹配pattern里组里的内容，以元组形式显示

　　　　.groupdict() 获取匹配到的结果，以字典形式显示，对于格式有要求，固定格式为 (?P<key名字>value)

                1 origin = ‘hey everybody,say hello to the wonderful world!‘2 res = re.search(‘(?P<key1>h).+(lo)‘,origin)
3print(res.group(2))
4print(res.group())
5print(res.groups())
6print(res.groupdict())

View Code

　　　　.start()返回匹配开始的位置

　　　　.end()返回匹配结束的位置

　　　　.span()返回包含匹配（开始，结束）的位置

origin = ‘hey everybody,say hello to the wonderful world!‘
res = re.search(‘(?P<key1>h).+(lo)‘,origin)
print(res.group(2))
print(res.group())
print(res.groups())
print(res.groupdict())
print(res.start())
print(res.end())
print(res.span())
# 会涉及到正则表达式的贪婪模式，下文讲述

　　re.findall(pattern,string,flag) 将匹配到的所有内容以字符串形式作为元素，放到一个列表中；如果pattern中出现了组，即（），那么就按照所有的限制条件去匹配，但是仅将组里匹配出的内容返回给列表；如果规则里只有1个组，那么得到的列表里元素就是字符串，如果存在多个组，那得到的列表的元素为元组，每个元组的元素是字符串

             1
            import
             re

             2 origin = ‘hello alex,again alex,bye acd‘ 3 res = re.findall(‘a(\w*)‘,origin)
 4print(res)
 5 res = re.findall(‘a(\w*)x‘,origin)
 6print(res)
 7 res = re.findall(‘(a)(\w*)(x)‘,origin)
 8print(res)
 910# 结果如下11 [‘lex‘, ‘gain‘, ‘lex‘, ‘cd‘]
12 [‘le‘, ‘le‘]
13 [(‘a‘, ‘le‘, ‘x‘), (‘a‘, ‘le‘, ‘x‘)]

　　　　几种特别注意情况

　　　　① 嵌套分组括号，执行完一遍外层，再执行一边内层，结果都返回

            1
            import
             re

            2 origin = ‘ethan‘3 res = re.findall(‘(e)(\w*(a))(n)‘,origin)
4print(res)
56#结果如下78 [(‘e‘, ‘tha‘, ‘a‘, ‘n‘)]

　　　　②判断字符串中空元素个数，得到结果列表元素为空，个数比字符串长度多1

            import
             re
origin = ‘ethan‘
res = re.findall(‘‘,origin)
print(res)

# 结果如下
[‘‘, ‘‘, ‘‘, ‘‘, ‘‘, ‘‘]

　　　　③其他特殊情况，涉及分组个数与重复次数

            import
             re
origin = ‘ethan‘
res = re.findall(‘(\w)*‘,origin)
print(res)
n =re.findall(‘(\dasd)*‘,‘1asd2asdp3asd98k3f‘)
print(n)

# 虽然可以重复0-n次，但是实际分组只有1组，默认返回贪婪模式下最后一组结果
[‘n‘, ‘‘]
[‘2asd‘, ‘‘, ‘3asd‘, ‘‘, ‘‘, ‘‘, ‘‘, ‘‘, ‘‘]

　　re.sub(pattern,repl,string,max=0) 替换掉字符串内容

　　re.subn() 最后会显示替换掉的次数，结果为元组形式，替换后的字符串为元素

             1
            import
             re

             2 origin = ‘goodday,goodbye,good morning,oh my god‘ 3 res = re.sub(‘g\w+d‘,‘have‘,origin)
 4print(res)
 5 res = re.sub(‘g\w+d‘,‘have‘,origin,3)
 6print(res)
 7 res = re.subn(‘g\w+d‘,‘have‘,origin)
 8print(res)
 910#结果如下1112haveay,havebye,have morning,oh my have
13haveay,havebye,have morning,oh my god
14 (‘haveay,havebye,have morning,oh my have‘, 4)

　　re.split(pattern,string,maxsplit,flag) 按规则分割字符串

　　　　①分割规则里不包含组，那么分割出的结果里不包含分割规则 ②分割规则里包含组，那么分割出来的结果会包含组内容 ③如果分割规则处在string末尾或开始，那么会包含空内容成为元素

             1
            import
             re

             2 origin = ‘one1two2three3‘ 3 res = re.split(‘\d+‘,origin)
 4print(res)
 5 6 stri = ‘nice to meet you ethan,but goodbye now‘ 7 res = re.split(‘e(\w+)an‘,stri)
 8print(res)
 9 res = re.split(‘ethan‘,stri)
10print(res)
1112#结果如下1314 [‘one‘, ‘two‘, ‘three‘, ‘‘]
15 [‘nice to meet you ‘, ‘th‘, ‘,but goodbye now‘]
16 [‘nice to meet you ‘, ‘,but goodbye now‘]

　　re.compile(pattern,flags) 将规则编译到obj里，下次再使用此规则时直接调用obj的方法，适用于重复多次使用的规则

             1
            import
             re

             2 obj = re.compile(‘e(\w+)n‘)
 3 origin = ‘nice to see you ethan,but byebye now‘ 4 res = obj.findall(origin)
 5print(res)
 6 res = obj.split(origin)
 7print(res)
 8 9#结果如下1011 [‘tha‘]
12 [‘nice to see you ‘, ‘tha‘, ‘,but byebye now‘]

　　re.finditer(pattern,string,flags) 生成迭代对象，需要进行for循环，才能得到对象，需要对象的.group(),.groups(),.groupdict()的方法得到具体值

             1
            import
             re

             2 rigin = ‘alex,goodday‘ 3 res = re.finditer(‘a(\w*)(?P<key1>x)‘,origin)
 4print(res)
 5for i in res:
 6print(i,i.group(),i.groups(),i.groupdict())
 7 8# 结果如下 9 <callable_iterator object at 0x000000DA49F7CB38>
10 <_sre.SRE_Match object; span=(0, 4), match=‘alex‘> alex (‘le‘, ‘x‘) {‘key1‘: ‘x‘}

三、贪婪模式与非贪婪模式
　　默认情况下，所有匹配均为贪婪模式，除非对匹配方式进行了设置，例如

             1
            import
             re

             2 origin = ‘a23018319cdnk‘ 3 res = re.search(‘a(\d+)‘,origin).group()
 4print(res)
 5 res = re.search(‘a(\d+?)‘,origin).group()
 6print(res)
 7 8#显示结果如下 9a23018319
10 a2

　　但是在组两边都有限制条件的时候，非贪婪模式也会失效，例如

            import
             re
res = re.search(‘a(\d+?)‘,origin).group()
print(res)
res = re.search(‘a(\d+?)c‘,origin).group()
print(res)

#结果如下
a2
a23018319c

四、原生字符r ,使用时表示在python中存在特殊意义的字符，失去特殊意义，只体现其普通意义，而re模块中的则不受影响　

正则表达式' ref='nofollow'>python --> 正则表达式

原文：http://www.cnblogs.com/ethancui/p/5582446.html

内容总结

以上是互联网集市为您收集整理的python --> 正则表达式全部内容，希望文章能够帮你解决python --> 正则表达式所遇到的程序开发问题。如果觉得互联网集市技术教程内容还不错，欢迎将互联网集市网站推荐给程序员好友。

内容备注

版权声明：本文内容由互联网用户自发贡献，该文观点与技术仅代表作者本人。本站仅提供信息存储空间服务，不拥有所有权，不承担相关法律责任。如发现本站有涉嫌侵权/违法违规的内容，请发送邮件至 gblab@vip.qq.com 举报，一经查实，本站将立刻删除。

内容手机端

扫描二维码推送至手机访问。

本文链接：https://qyyshop.com/info/1068622.html

来源：【匿名】

【上一篇】正则表达式概述【下一篇】正则表达式语法

更多 ►

【python --> 正则表达式】教程文章相关的互联网学习教程文章

java中正则表达式用Pattern计算字符串的结果（四则运算）；分成有括号和没括号；当然也可以采用逆波兰式

import java.util.regex.Matcher; import java.util.regex.Pattern; public class Arithmetic { /** * 利用Pattern计算字符串的结果（四则运算），当然也可以采用逆波兰式 * @param args */public static void main(String[] args) {// TODO Auto-generated method stub/*String str="2+3*(5*(12-6))";Pattern pa=Pattern.compile("\$([^\\(\$]*)\\)");// \$为左括号 \$右括号，表示在括号内没有其他括号，然后用括号括起来...

正则表达式学习

绪：以下内容仅仅是本人学习正则表达式时候的简单记录，欢迎拍砖指正正则表达式就是记录文本规则的代码：描述一组字符串特征的模式=============================================================================绪---通配符(wildcard)：仅作用于命令行command line中参数argument里的路径path上 * --任意的字符串 ? --任意单一字符 [list] --匹配list中的任...

记录三条重要的正则表达式【代码】

1. <script\s+\S+comment.js[\s\S]*?</script>结果可以匹配出包含comment.js的script标签的内容，比如：输入：...<script>document.documentElement.className=document.documentElement.className.replace(/\bno-js\b/,‘js‘);if(window.Shopify&&window.Shopify.designMode)document.documentElement.className+=‘ in-theme-editor‘;if((‘ontouchstart‘inwindow)||window.DocumentTouch&&documentinstanceofDocumentTouch)d...

C++ 正则表达式【代码】

//1.当函数返回string时候的注意点: string Fun() {return string("szn"); }const char* pStr = Fun().c_str(); //如上代码，pStr = "" 而非 "szn"，原因:返回的string变量被析构了//2.正则表达式组件: regex:用于表示一个正则表达式 regex_match:将一个字符序列与一个正则表达式匹配 regex_search:寻找第一个与正则表达式匹配的子序列 regex_replace:使用给定格式替换一个正则表达式 sregex_iterator:迭代器适配器，调用regex_sea...

过目不忘JS正则表达式【代码】

原文:过目不忘JS正则表达式正则表达式，有木有人像我一样，学了好几遍却还是很懵圈，学的时候老明白了，学完了忘光了。好吧，其实还是练的不够，所谓温故而知新，可以为师矣，今天就随我来复习一下这傲娇的正则表达式吧。为啥要有正则表达式呢？其实就是因为计算机笨（这话不是我说的），比如123456@qq.com，我们一看就是邮箱，可是计算机不认识啊，所以我们就要用一些计算机认识的语言，来制定好规则，告诉它符...

正则表达式应用【图】

查找替换换行符号^段落标志符号 ^p原文：http://www.cnblogs.com/lynclynn/p/5194566.html

正则表达式排除某字符串的行【代码】

正则表达式排除某字符串的行 ^(?!.*trigger$".+"$).*$ 原文：https://www.cnblogs.com/wolbo/p/11353186.html

正则表达式基本语法

正则表达式是一种文本模式，包括普通字符（例如，a 到 z 之间的字母）和特殊字符（称为“元字符”）。模式描述在搜索文本时要匹配的一个或多个字符串。1.正则表达式基本语法两个特殊的符号‘^‘和‘$‘。他们的作用是分别指出一个字符串的开始和结束。例子如下："^The"：表示所有以"The"开始的字符串（"There"，"The cat"等）；"of despair$"：表示所以以"of despair"结尾的字符串；"^abc$"：表示开始和结尾都是"abc"的字符串——呵...

JS利用正则表达式替换字符串中的内容

//从字符串‘Is this a cat is‘中剪去‘is‘: var str=‘Is this a cat is‘; var subStr=new RegExp(‘is‘);//创建正则表达式对象 var result=str.replace(subStr,"");//把‘is‘替换为空字符串 console.log(result);//Is th a cat is var subStr=new RegExp(‘is‘,‘i‘);//创建正则表达式对象,不区分大小写 var result=str.replace(subStr,"");//把‘is‘替换为空字符串 console.log(result);//this a cat is va...

JS正则表达式验证是否为11位有效手机号码,【图】

https://blog.csdn.net/nongweiyilady/article/details/74007124 最近在做注册登陆页面，都要涉及到验证11位有效手机号码，这里贴出代码，希望能帮到有这个开发需求的朋友。[javascript] view plaincopyfunction isPoneAvailable($poneInput) { var myreg=/^[1][3,4,5,7,8][0-9]{9}$/; if (!myreg.test($poneInput.val())) { return false; } else { return true;...

常用的正则表达式总结

正则表达式用于字符串处理、表单验证等场合，实用高效。现将一些常用的表达式收集于此，以备不时之需。匹配中文字符的正则表达式： [\u4e00-\u9fa5]评注：匹配中文还真是个头疼的事，有了这个表达式就好办了匹配双字节字符(包括汉字在内)：[^\x00-\xff]评注：可以用来计算字符串的长度（一个双字节字符长度计2，ASCII字符计1）匹配空白行的正则表达式：\n\s*\r评注：可以用来删除空白行匹配HTML标记的正则表达式：<(\S*?)[^>]*>.*?...

java中常用的正则表达式及示例

转义字符想要匹配某些具体的特殊符号，比如+[.?^{|\，需要在前面加上一个转义字符\ 。比如通过 \. 去匹配.号。元字符：由于元字符一般会放在字符串中，所以需要转义，也就是\会变成 \\ 。. .可以匹配除换行符之外的任何单字符。比如.*表示任意个非换行符\n的字符。而.l+.则表示以任意非\n开始，中间包含至少一个l字符，并且以任意非\n字符结束。^和$ ^匹配字符串的开始位置。而$匹配字符串的结尾位置。^cat : 字符串以c开头紧接着...

js正则表达式

概念正则表达式是对字符串操作的一种逻辑公式，就是用事先定义好的一些特定字符、及这些特定字符的组合，组成一个“规则字符串”，这个“规则字符串”用来表达对字符串的一种过滤逻辑。简介正则表达式是对字符串（包括普通字符（例如，a 到 z 之间的字母）和特殊字符（称为“元字符”））操作的一种逻辑公式，就是用事先定义好的一些特定字符、及这些特定字符的组合，组成一个“规则字符串”，这个“规则字符串”用来表达对字...

VBS教程：正则表达式简介 -字符匹配【代码】

字符匹配句点 (.) 匹配一个字符串中任何单个的打印或非打印字符，除了换行符 (\n) 之外。下面的 Visual Basic Scripting Edition 正则表达式可以匹配 ‘aac‘、‘abc‘、‘acc‘、‘adc‘如此等等，同样也可以匹配 ‘a1c‘、‘a2c‘、a-c‘以及 a#c‘： /a.c/等价的 VBScript 正则表达式为："a.c"如果试图匹配一个包含文件名的字符串，其中句点 (.) 是输入字符串的一部分，则可以在正则表达式中的句点前面加上一个反斜杠 (\) 字符来...

正则表达式

1.string s="@张三 @李四 ";获取“张三”和“李四”MatchCollection mc = Regex.Matches(s, @"@(?<truename>\S+)[ |　]");for (int i = 0; i < mc.Count; i++) //在输入字符串中找到所有匹配 {var trueName=mc[i].Groups["truename"].Value); } 2.string s="张三：say something<br/>李四：say something<br/>替换成"<a name=‘AtTrueName‘>张三</a>：say something<br/><a name=‘AtTrueName‘>李四</a>：...

正则 - 最热教程

java正则表达式匹配所有数字，包括带小...UltraEdit正则表达式搜索替换小技巧 php正则表达式，允许有数字，字母，和标...jquery取字符串中数字的正则_jquery 分享正则表达式注册表验证和一些常用的...php正则表达式的特殊字符含义_PHP教程 SwiftUI iOS 超酷组件之支持文本分割炸...python 正则表达式与JSON-JSON java-检查字符串是否仅包含字母空格和引...java网页爬虫正则表达式

首页 / 正则 / python --> 正则表达式

python --> 正则表达式

内容导读

内容图文

内容总结

内容备注

内容手机端

【python --> 正则表达式】教程文章相关的互联网学习教程文章

java中正则表达式用Pattern计算字符串的结果（四则运算）；分成有括号和没括号；当然也可以采用逆波兰式

正则表达式学习

记录三条重要的正则表达式【代码】

C++ 正则表达式【代码】

过目不忘JS正则表达式【代码】

正则表达式应用【图】

正则表达式排除某字符串的行【代码】

正则表达式基本语法

JS利用正则表达式替换字符串中的内容

JS正则表达式验证是否为11位有效手机号码,【图】

常用的正则表达式总结

java中常用的正则表达式及示例

js正则表达式

VBS教程：正则表达式简介 -字符匹配【代码】

正则表达式

正则表达式 - 相关标签

正则 - 最新教程

正则 - 最热教程