首页 / 正则 / Python中正则表达式详解
Python中正则表达式详解
内容导读
互联网集市收集整理的这篇技术教程文章主要介绍了Python中正则表达式详解,小编现在分享给大家,供广大互联网技能从业者学习和参考。文章包含4207字,纯文字阅读大概需要7分钟。
内容图文
![Python中正则表达式详解](/upload/InfoBanner/zyjiaocheng/427/ae48b21844894541887dd42708f4a9f9.jpg)
正则表达式是用来简洁表达一组字符串的表达式,本文主要和大家分享Python 中正则表达式知识详解,希望能帮助到大家。
操作符 | 说明 | 实例 |
---|---|---|
. | 表示任何单个字符 | |
[ ] | 字符集,单个字符取值范围 | [abc] 表示a或b或c; [a-z]表示a到z单个字符 |
[^ ] | 非字符集,单个字符排除范围 | [^abc] 表示非a或非b或非c |
* | 前一个字符的0次或无限次扩展 | abc* 表示ab、abc、abcc、abccc... |
+ | 前一个字符的1次或无限次扩展 | abc+ 表示abc、abcc、abccc... |
? | 前一个字符的0次或1次扩展 | abc? 表示ab、abc |
| | 左右表示任意一个 | abc|def 表示abc或def |
{m} | 前一个字符的m次扩展 | ab{2} 表示abcc |
{m,n} | 前一个字符的m至n次扩展(含n) | ab{1,2} 表示abc、abcc |
^ | 匹配字符串开头 | ^abc 表示abc且在一个字符串的开头 |
$ | 匹配字符串结尾 | abc$ 表示abc且在一个字符串的结尾 |
( ) | 分组标记,内部只能使用|操作符 | (abc|def) 表示abc或def |
\d | 数字,等价于[0-9] | |
\w | 单词字符,等价于[A-Za-z0-9_] |
如果熟悉上面的操作符的话,下面的例子就不难了。
1.只能输入数字:^[0-9]*$
2.只能输入n位的数字:^\d{n}$
3.只能输入至少n位的数字:^\d{n,}$
4.只能输入m~n位的数字:^\d{m,n}$
5.只能输入零和非零开头的数字:^(0|[1-9][0-9]*)$
6.只能输入有两位小数的正实数:^[0-9]+(.[0-9]{2})?$
7.只能输入有1~3位小数的正实数:^[0-9]+(.[0-9]{1,3})?$
8.只能输入非零的正整数:^+?[1-9][0-9]*$
【Python3正则表达式】
函数 | 说明 |
---|---|
re.match() | 从字符串的起始位置匹配一个模式,如果起始位置匹配不成功的话,match()就返回none。 |
re.search() | 扫描整个字符串并返回第一个成功的匹配。 |
re.sub() | 用于替换字符串中的所有匹配正则表达式的子串,返回替换后的字符串 |
re.findall() | 搜索字符串,以列表形式返回全部能匹配的子串 |
re.split() | 将字符串按照正则表达式匹配结果进行切割,返回列表 |
re.finditer() | 搜索字符串,返回一个匹配结果的迭代类型,每个迭代元素是match对象 |
>>> match= re.findall(r'[1-9]\d{5}','100081BIT BIT10008676')>>> print(match) ['100081', '100086']>>> match = re.split(r'[1-9]\d{5}','100081BIT BIT10008676')>>> match ['', 'BIT BIT', '76']>>> match = re.split(r'[1-9]\d{5}','100081BIT BIT10008676',maxsplit=1)>>> match ['', 'BIT BIT10008676'] >>>for m in re.finditer(r'[1-9]\d{5}','100081BIT BIT10008676'): if m: print(m.group(0)) 100081100086
re.match与re.search的区别
re.match只匹配字符串的开始,如果字符串开始不符合正则表达式,则匹配失败,函数返回None;而re.search匹配整个字符串,直到找到一个匹配。
操作符 | 说明 | 实例 |
---|---|---|
. | 表示任何单个字符 | |
[ ] | 字符集,单个字符取值范围 | [abc] 表示a或b或c; [a-z]表示a到z单个字符 |
[^ ] | 非字符集,单个字符排除范围 | [^abc] 表示非a或非b或非c |
* | 前一个字符的0次或无限次扩展 | abc* 表示ab、abc、abcc、abccc... |
+ | 前一个字符的1次或无限次扩展 | abc+ 表示abc、abcc、abccc... |
? | 前一个字符的0次或1次扩展 | abc? 表示ab、abc |
| | 左右表示任意一个 | abc|def 表示abc或def |
{m} | 前一个字符的m次扩展 | ab{2} 表示abcc |
{m,n} | 前一个字符的m至n次扩展(含n) | ab{1,2} 表示abc、abcc |
^ | 匹配字符串开头 | ^abc 表示abc且在一个字符串的开头 |
$ | 匹配字符串结尾 | abc$ 表示abc且在一个字符串的结尾 |
( ) | 分组标记,内部只能使用|操作符 | (abc|def) 表示abc或def |
\d | 数字,等价于[0-9] | |
\w | 单词字符,等价于[A-Za-z0-9_] |
如果熟悉上面的操作符的话,下面的例子就不难了。
1.只能输入数字:^[0-9]*$
2.只能输入n位的数字:^\d{n}$
3.只能输入至少n位的数字:^\d{n,}$
4.只能输入m~n位的数字:^\d{m,n}$
5.只能输入零和非零开头的数字:^(0|[1-9][0-9]*)$
6.只能输入有两位小数的正实数:^[0-9]+(.[0-9]{2})?$
7.只能输入有1~3位小数的正实数:^[0-9]+(.[0-9]{1,3})?$
8.只能输入非零的正整数:^+?[1-9][0-9]*$
【Python3正则表达式】
函数 | 说明 |
---|---|
re.match() | 从字符串的起始位置匹配一个模式,如果起始位置匹配不成功的话,match()就返回none。 |
re.search() | 扫描整个字符串并返回第一个成功的匹配。 |
re.sub() | 用于替换字符串中的所有匹配正则表达式的子串,返回替换后的字符串 |
re.findall() | 搜索字符串,以列表形式返回全部能匹配的子串 |
re.split() | 将字符串按照正则表达式匹配结果进行切割,返回列表 |
re.finditer() | 搜索字符串,返回一个匹配结果的迭代类型,每个迭代元素是match对象 |
>>> match= re.findall(r'[1-9]\d{5}','100081BIT BIT10008676')>>> print(match) ['100081', '100086']>>> match = re.split(r'[1-9]\d{5}','100081BIT BIT10008676')>>> match ['', 'BIT BIT', '76']>>> match = re.split(r'[1-9]\d{5}','100081BIT BIT10008676',maxsplit=1)>>> match ['', 'BIT BIT10008676'] >>>for m in re.finditer(r'[1-9]\d{5}','100081BIT BIT10008676'): if m: print(m.group(0)) 100081100086
re.match与re.search的区别
re.match只匹配字符串的开始,如果字符串开始不符合正则表达式,则匹配失败,函数返回None;而re.search匹配整个字符串,直到找到一个匹配。
相关推荐:
关于js正则表达式详解
php正则表达式详解_PHP教程
非常重要的php正则表达式详解,php正则表达式详解
以上就是Python 中正则表达式详解的详细内容,更多请关注Gxl网其它相关文章!
内容总结
以上是互联网集市为您收集整理的Python中正则表达式详解全部内容,希望文章能够帮你解决Python中正则表达式详解所遇到的程序开发问题。 如果觉得互联网集市技术教程内容还不错,欢迎将互联网集市网站推荐给程序员好友。
内容备注
版权声明:本文内容由互联网用户自发贡献,该文观点与技术仅代表作者本人。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如发现本站有涉嫌侵权/违法违规的内容, 请发送邮件至 gblab@vip.qq.com 举报,一经查实,本站将立刻删除。
内容手机端
扫描二维码推送至手机访问。