正则表达式_合集下(后续还会有补充)

内容导读

互联网集市收集整理的这篇技术教程文章主要介绍了正则表达式_合集下(后续还会有补充)，小编现在分享给大家，供广大互联网技能从业者学习和参考。文章包含5187字，纯文字阅读大概需要8分钟。

内容图文

            re中引用分组匹配字符串

            
                import
                 re


                #
                 能够完成对正确的字符串的匹配
ret = re.match("<[a-zA-Z]*>\w*</[a-zA-Z]*>", "<html>hh</html>")
print(ret.group())

# 如果遇到非正常的html格式字符串，匹配出错</htmlbalabala>会一起输出
ret = re.match("<[a-zA-Z]*>\w*</[a-zA-Z]*>", "<html>hh</htmlbalabala>")
#
print(ret.group())

# 正确的理解思路：如果在第一对<>中是什么，按理说在后面的那对<>中就应该是什么# 通过引用分组中匹配到的数据即可，但是要注意是元字符串，即类似 r""这种格式
ret = re.match(r"<([a-zA-Z]*)>\w*</\1>", "<html>hh</html>")
# </\1>匹配第一个规则print(ret.group())

# 因为2对<>中的数据不一致，所以没有匹配出来
test_label = "<html>hh</htmlbalabala>"
ret = re.match(r"<([a-zA-Z]*)>\w*</\1>", test_label)
if ret:
    print(ret.group())
else:
    print("%s 这是一对不正确的标签" % test_label)
    
‘‘‘
<html>hh</html>
<html>hh</htmlbalabala>
<html>hh</html>
<html>hh</htmlbalabala> 这是一对不正确的标签
‘‘‘

            re中引用分组匹配字符串_2

            
                import
                 re

labels = ["<html><h1>www.itcast.cn</h1></html>", "<html><h1>www.itcast.cn</h2></html>"]

for label in labels:
    ret = re.match(r"<(\w*)><(\w*)>.*</\2></\1>", label)
    # <\2>和第二个匹配一样的内容if ret:
        print("%s 是符合要求的标签" % ret.group())
    else:
        print("%s 不符合要求" % label)
‘‘‘
<html><h1>www.itcast.cn</h1></html> 是符合要求的标签
<html><h1>www.itcast.cn</h2></html> 不符合要求
‘‘‘

            re中提取区号和电话号码

            
                import
                 re
ret = re.match("([^-]*)-(\d+)","010-1234-567")
# 除了 - 的所有字符
# 对最后一个-前面的所有字符进行分组,直到最后一个数字为止print(ret.group( ))
print(ret.group(1))#返回-之前的数据,不一定是最后一个-之前print(ret.group(2))

            re中的贪婪

            
                import
                 re
s= "This is a number 234-235-22-423"
r=re.match(".+(\d+-\d+-\d+-\d+)",s)
# .+ 尽量多的匹配任意字符,匹配到-前一个数字之前
# . 匹配任意字符print(type(r))
print(r.group())
print(r.group(0))
print(r.group(1))

r=re.match(".+?(\d+-\d+-\d+-\d+)",s)
print(r.group())
print(r.group(1))#到数字停止贪婪‘‘‘
<class ‘re.Match‘>
This is a number 234-235-22-423
This is a number 234-235-22-423
4-235-22-423
This is a number 234-235-22-423
234-235-22-423
‘‘‘

            
                import
                 re

ret = re.match(r"aa(\d+)","aa2343ddd")
# 尽量多的匹配字符print(ret.group())

# 使用? 将re贪婪转换为非贪婪
ret = re.match(r"aa(\d+?)","aa2343ddd")
# 只输出一个数字print(ret.group())

‘‘‘
aa2343
aa2
‘‘‘

            re使用split切割字符串

            
                import
                 re

ret = re.split(r":| ","info:XiaoLan 22 Hany.control")
# |  或  满足一个即可print(ret)

str1 = ‘one,two,three,four‘
pattern = re.compile(‘,‘)
# 按照，将string分割后返回print(pattern.split(str1))
# [‘one‘, ‘two‘, ‘three‘, ‘four‘]
str2 = ‘one1two2three3four‘print(re.split(‘\d+‘,str2))
# [‘one‘, ‘two‘, ‘three‘, ‘four‘]

            re匹配中subn，进行替换并返回替换次数

            
                import
                 re

pattern = re.compile(‘\d+‘)
strs = ‘one1two2three3four‘print(pattern.subn(‘-‘,strs))
# (‘one-two-three-four‘, 3) 3为替换的次数

            re匹配中sub将匹配到的数据进行替换

            
                #
                 import re
                
#
                 ret = re.sub(r"\d+", ‘替换的字符串998‘, "python = 997")
                
#
                 # python = 替换的字符串998
                
#
                 print(ret)
                
#
                 # 将匹配到的数据替换掉，替换成想要替换的数据
                
#
                 re.sub("规则","替换的字符串","想要替换的数据")
                import
                 re


                def
                 add(temp):
    strNum = temp.group()
    # 匹配到的数据.group()方式print("原来匹配到的字符:",int(temp.group()))
    num = int(strNum) + 5 #字符串强制转换return str(num)

ret = re.sub(r"\d+", add, "python = 997")
# re.sub(‘正则规则‘,‘替换的字符串‘,‘字符串‘)print(ret)

ret = re.sub(r"\d+", add, "python = 99")
print(ret)

pattern = re.compile(‘\d‘)
str1 = ‘one1two2three3four‘print(pattern.sub(‘-‘,str1))
# one-two-three-fourprint(re.sub(‘\d‘,‘-‘,str1))
# one-two-three-four‘‘‘
原来匹配到的字符: 997
python = 1002
原来匹配到的字符: 99
python = 104
one-two-three-four
one-two-three-four
‘‘‘

            re匹配的小例子

            
                import
                 re

src="https://rpic.douyucdn.cn/appCovers/2016/11/13/1213973_201611131917_small.jpg"
ret = re.search(r"https://.*?\.jpg", src)

print(ret.group())


res = re.compile(‘[a-zA-Z]{1}‘)
strs = ‘123abc456‘print(re.search(res,strs).group( ))
print(re.findall(res,strs)) #findall返回列表元素对象不具有group函数
# print(re.finditer(res,strs)) #返回迭代器对象‘‘‘
https://rpic.douyucdn.cn/appCovers/2016/11/13/1213973_201611131917_small.jpg
a
[‘a‘, ‘b‘, ‘c‘]
‘‘‘

            匹配前一个字符出现m次

            
                import
                 re

src="https://rpic.douyucdn.cn/appCovers/2016/11/13/1213973_201611131917_small.jpg"
ret = re.search(r"https://.*?\.jpg", src)

print(ret.group())


res = re.compile(‘[a-zA-Z]{1}‘)
strs = ‘123abc456‘print(re.search(res,strs).group( ))
print(re.findall(res,strs)) #findall返回列表元素对象不具有group函数
# print(re.finditer(res,strs)) #返回迭代器对象‘‘‘
https://rpic.douyucdn.cn/appCovers/2016/11/13/1213973_201611131917_small.jpg
a
[‘a‘, ‘b‘, ‘c‘]
‘‘‘

            引用分组

            
                import
                 re

strs = ‘hello 123,world 456‘
pattern = re.compile(‘(\w+) (\d+)‘)
# for i in pattern.finditer(strs):
#     print(i.group(0))
#     print(i.group(1))
#     print(i.group(2))#当存在第二个分组时‘‘‘hello 123
hello
123
world 456
world
456
‘‘‘print(pattern.sub(r‘\2 \1‘,strs))
# 先输出第二组，后输出第一组print(pattern.sub(r‘\1 \2‘,strs))

            当findall遇到分组时，只匹配分组

            
                import
                 re
pattern = re.compile(‘([a-z])[a-z]([a-z])‘)
strs = ‘123abc456asd‘# print(re.findall(pattern,strs))
# [(‘a‘, ‘c‘), (‘a‘, ‘d‘)]返回分组匹配到的结果
result = re.finditer(pattern,strs)
for i in result:
    print(i.group( )) #match对象使用group函数输出print(i.group(0))#返回匹配到的所有结果print(i.group(1))#返回第一个分组匹配的结果print(i.group(2))#返回第二个分组匹配的结果
# <re.Match object; span=(3, 6), match=‘abc‘>
# <re.Match object; span=(9, 12), match=‘asd‘>
# 返回完整的匹配结果‘‘‘
abc
abc
a
c
asd
asd
a
d
‘‘‘

2020-05-07

原文：https://www.cnblogs.com/hany-postq473111315/p/12845485.html

内容总结

以上是互联网集市为您收集整理的正则表达式_合集下(后续还会有补充)全部内容，希望文章能够帮你解决正则表达式_合集下(后续还会有补充)所遇到的程序开发问题。如果觉得互联网集市技术教程内容还不错，欢迎将互联网集市网站推荐给程序员好友。

内容备注

版权声明：本文内容由互联网用户自发贡献，该文观点与技术仅代表作者本人。本站仅提供信息存储空间服务，不拥有所有权，不承担相关法律责任。如发现本站有涉嫌侵权/违法违规的内容，请发送邮件至 gblab@vip.qq.com 举报，一经查实，本站将立刻删除。

内容手机端

扫描二维码推送至手机访问。

本文链接：https://qyyshop.com/info/1146341.html

来源：【匿名】

【上一篇】正则表达式【下一篇】正则表达式语法

更多 ►

【正则表达式_合集下(后续还会有补充)】教程文章相关的互联网学习教程文章

绪：以下内容仅仅是本人学习正则表达式时候的简单记录，欢迎拍砖指正正则表达式就是记录文本规则的代码：描述一组字符串特征的模式=============================================================================绪---通配符(wildcard)：仅作用于命令行command line中参数argument里的路径path上 * --任意的字符串 ? --任意单一字符 [list] --匹配list中的任...

记录三条重要的正则表达式【代码】

1. <script\s+\S+comment.js[\s\S]*?</script>结果可以匹配出包含comment.js的script标签的内容，比如：输入：...<script>document.documentElement.className=document.documentElement.className.replace(/\bno-js\b/,‘js‘);if(window.Shopify&&window.Shopify.designMode)document.documentElement.className+=‘ in-theme-editor‘;if((‘ontouchstart‘inwindow)||window.DocumentTouch&&documentinstanceofDocumentTouch)d...

C++ 正则表达式【代码】

//1.当函数返回string时候的注意点: string Fun() {return string("szn"); }const char* pStr = Fun().c_str(); //如上代码，pStr = "" 而非 "szn"，原因:返回的string变量被析构了//2.正则表达式组件: regex:用于表示一个正则表达式 regex_match:将一个字符序列与一个正则表达式匹配 regex_search:寻找第一个与正则表达式匹配的子序列 regex_replace:使用给定格式替换一个正则表达式 sregex_iterator:迭代器适配器，调用regex_sea...

过目不忘JS正则表达式【代码】

原文:过目不忘JS正则表达式正则表达式，有木有人像我一样，学了好几遍却还是很懵圈，学的时候老明白了，学完了忘光了。好吧，其实还是练的不够，所谓温故而知新，可以为师矣，今天就随我来复习一下这傲娇的正则表达式吧。为啥要有正则表达式呢？其实就是因为计算机笨（这话不是我说的），比如123456@qq.com，我们一看就是邮箱，可是计算机不认识啊，所以我们就要用一些计算机认识的语言，来制定好规则，告诉它符...

正则表达式应用【图】

查找替换换行符号^段落标志符号 ^p原文：http://www.cnblogs.com/lynclynn/p/5194566.html

正则表达式排除某字符串的行【代码】

正则表达式排除某字符串的行 ^(?!.*trigger$".+"$).*$ 原文：https://www.cnblogs.com/wolbo/p/11353186.html

正则表达式基本语法

正则表达式是一种文本模式，包括普通字符（例如，a 到 z 之间的字母）和特殊字符（称为“元字符”）。模式描述在搜索文本时要匹配的一个或多个字符串。1.正则表达式基本语法两个特殊的符号‘^‘和‘$‘。他们的作用是分别指出一个字符串的开始和结束。例子如下："^The"：表示所有以"The"开始的字符串（"There"，"The cat"等）；"of despair$"：表示所以以"of despair"结尾的字符串；"^abc$"：表示开始和结尾都是"abc"的字符串——呵...

JS利用正则表达式替换字符串中的内容

//从字符串‘Is this a cat is‘中剪去‘is‘: var str=‘Is this a cat is‘; var subStr=new RegExp(‘is‘);//创建正则表达式对象 var result=str.replace(subStr,"");//把‘is‘替换为空字符串 console.log(result);//Is th a cat is var subStr=new RegExp(‘is‘,‘i‘);//创建正则表达式对象,不区分大小写 var result=str.replace(subStr,"");//把‘is‘替换为空字符串 console.log(result);//this a cat is va...

JS正则表达式验证是否为11位有效手机号码,【图】

https://blog.csdn.net/nongweiyilady/article/details/74007124 最近在做注册登陆页面，都要涉及到验证11位有效手机号码，这里贴出代码，希望能帮到有这个开发需求的朋友。[javascript] view plaincopyfunction isPoneAvailable($poneInput) { var myreg=/^[1][3,4,5,7,8][0-9]{9}$/; if (!myreg.test($poneInput.val())) { return false; } else { return true;...

常用的正则表达式总结

正则表达式用于字符串处理、表单验证等场合，实用高效。现将一些常用的表达式收集于此，以备不时之需。匹配中文字符的正则表达式： [\u4e00-\u9fa5]评注：匹配中文还真是个头疼的事，有了这个表达式就好办了匹配双字节字符(包括汉字在内)：[^\x00-\xff]评注：可以用来计算字符串的长度（一个双字节字符长度计2，ASCII字符计1）匹配空白行的正则表达式：\n\s*\r评注：可以用来删除空白行匹配HTML标记的正则表达式：<(\S*?)[^>]*>.*?...

java中常用的正则表达式及示例

转义字符想要匹配某些具体的特殊符号，比如+[.?^{|\，需要在前面加上一个转义字符\ 。比如通过 \. 去匹配.号。元字符：由于元字符一般会放在字符串中，所以需要转义，也就是\会变成 \\ 。. .可以匹配除换行符之外的任何单字符。比如.*表示任意个非换行符\n的字符。而.l+.则表示以任意非\n开始，中间包含至少一个l字符，并且以任意非\n字符结束。^和$ ^匹配字符串的开始位置。而$匹配字符串的结尾位置。^cat : 字符串以c开头紧接着...

js正则表达式

概念正则表达式是对字符串操作的一种逻辑公式，就是用事先定义好的一些特定字符、及这些特定字符的组合，组成一个“规则字符串”，这个“规则字符串”用来表达对字符串的一种过滤逻辑。简介正则表达式是对字符串（包括普通字符（例如，a 到 z 之间的字母）和特殊字符（称为“元字符”））操作的一种逻辑公式，就是用事先定义好的一些特定字符、及这些特定字符的组合，组成一个“规则字符串”，这个“规则字符串”用来表达对字...

VBS教程：正则表达式简介 -字符匹配【代码】

字符匹配句点 (.) 匹配一个字符串中任何单个的打印或非打印字符，除了换行符 (\n) 之外。下面的 Visual Basic Scripting Edition 正则表达式可以匹配 ‘aac‘、‘abc‘、‘acc‘、‘adc‘如此等等，同样也可以匹配 ‘a1c‘、‘a2c‘、a-c‘以及 a#c‘： /a.c/等价的 VBScript 正则表达式为："a.c"如果试图匹配一个包含文件名的字符串，其中句点 (.) 是输入字符串的一部分，则可以在正则表达式中的句点前面加上一个反斜杠 (\) 字符来...