首页 / PYTHON / python_ re模块学习

python_ re模块学习

内容导读

互联网集市收集整理的这篇技术教程文章主要介绍了python_ re模块学习，小编现在分享给大家，供广大互联网技能从业者学习和参考。文章包含3082字，纯文字阅读大概需要5分钟。

内容图文

字符匹配（普通字符，元字符）：

普通字符：大多数字符和字母都会和自身匹配
>> re.findall(‘alvin‘,‘yuanaleSxalexwupeiqi‘)
[‘alvin‘]
元字符：. ^ $ * + ? { } [ ] | ( ) \

元字符之. ^ $ * + ? { }

import re

ret=re.findall(‘a..in‘,‘helloalvin‘)
print(ret)#[‘alvin‘]

ret=re.findall(‘^a...n‘,‘alvinhelloawwwn‘)
print(ret)#[‘alvin‘]

ret=re.findall(‘a...n$‘,‘alvinhelloawwwn‘)
print(ret)#[‘awwwn‘]

ret=re.findall(‘a...n$‘,‘alvinhelloawwwn‘)
print(ret)#[‘awwwn‘]

ret=re.findall(‘abc*‘,‘abcccc‘)#贪婪匹配[0,+oo]  
print(ret)#[‘abcccc‘]

ret=re.findall(‘abc+‘,‘abccc‘)#[1,+oo]
print(ret)#[‘abccc‘]

ret=re.findall(‘abc?‘,‘abccc‘)#[0,1]
print(ret)#[‘abc‘]

ret=re.findall(‘abc{1,4}‘,‘abccc‘)
print(ret)#[‘abccc‘] 贪婪匹配

ret=re.findall(‘abc*?‘,‘abcccccc‘)
print(ret)#[‘ab‘]

元字符之字符集［］：

#--------------------------------------------字符集[]
ret=re.findall(‘a[bc]d‘,‘acd‘)
print(ret)#[‘acd‘]

ret=re.findall(‘[a-z]‘,‘acd‘)
print(ret)#[‘a‘, ‘c‘, ‘d‘]

ret=re.findall(‘[.*+]‘,‘a.cd+‘)
print(ret)#[‘.‘, ‘+‘]

#在字符集里有功能的符号: - ^ 
ret=re.findall(‘[1-9]‘,‘45dha3‘)
print(ret)#[‘4‘, ‘5‘, ‘3‘]

ret=re.findall(‘[^ab]‘,‘45bdha3‘)
print(ret)#[‘4‘, ‘5‘, ‘d‘, ‘h‘, ‘3‘]

ret=re.findall(‘[\d]‘,‘45bdha3‘)
print(ret)#[‘4‘, ‘5‘, ‘3‘]

元字符之转义符\

反斜杠后边跟元字符去除特殊功能,比如.
反斜杠后边跟普通字符实现特殊功能,比如\d

\d 匹配任何十进制数；它相当于类 [0-9]。
\D 匹配任何非数字字符；它相当于类 [^0-9]。
\s 匹配任何空白字符；它相当于类 [ \t\n\r\f\v]。
\S 匹配任何非空白字符；它相当于类 [^ \t\n\r\f\v]。
\w 匹配任何字母数字字符；它相当于类 [a-zA-Z0-9]。
\W 匹配任何非字母数字字符；它相当于类 [^a-zA-Z0-9]
\b 匹配一个特殊字符边界，比如空格，&，＃等

ret=re.findall(‘I\b‘,‘I am LIST‘)
print(ret)#[]
ret=re.findall(r‘I\b‘,‘I am LIST‘)
print(ret)#[‘I‘]

import re
ret=re.findall(‘c\l‘,‘abc\le‘)
print(ret)#[]
ret=re.findall(‘c\\l‘,‘abc\le‘)
print(ret)#[]
ret=re.findall(‘c\\\\l‘,‘abc\le‘)
print(ret)#[‘c\\l‘]
ret=re.findall(r‘c\\l‘,‘abc\le‘)
print(ret)#[‘c\\l‘]

#-----------------------------eg2:
#之所以选择\b是因为\b在ASCII表中是有意义的
m = re.findall(‘\bblow‘, ‘blow‘)
print(m)
m = re.findall(r‘\bblow‘, ‘blow‘)
print(m)

元字符之分组()

m = re.findall(r‘(ad)+‘, ‘add‘)
print(m)

ret=re.search(‘(?P<id>\d{2})/(?P<name>\w{3})‘,‘23/com‘)
print(ret.group())#23/com
print(ret.group(‘id‘))#23

元字符之｜

ret=re.search(‘(ab)|\d‘,‘rabhdg8sd‘)
print(ret.group())#ab
re模块下的常用方法

import re
#1
re.findall(‘a‘,‘alvin yuan‘)    #返回所有满足匹配条件的结果,放在列表里
#2
re.search(‘a‘,‘alvin yuan‘).group()  #函数会在字符串内查找模式匹配,只到找到第一个匹配然后返回一个包含匹配信息的对象,该对象可以
                                     # 通过调用group()方法得到匹配的字符串,如果字符串没有匹配，则返回None。

#3
re.match(‘a‘,‘abc‘).group()     #同search,不过尽在字符串开始处进行匹配

#4
ret=re.split(‘[ab]‘,‘abcd‘)     #先按‘a‘分割得到‘‘和‘bcd‘,在对‘‘和‘bcd‘分别按‘b‘分割
print(ret)#[‘‘, ‘‘, ‘cd‘]

#5
ret=re.sub(‘\d‘,‘abc‘,‘alvin5yuan6‘,1)
print(ret)#alvinabcyuan6
ret=re.subn(‘\d‘,‘abc‘,‘alvin5yuan6‘)
print(ret)#(‘alvinabcyuanabc‘, 2)

#6
obj=re.compile(‘\d{3}‘)
ret=obj.search(‘abc123eeee‘)
print(ret.group())#123

import re
ret=re.finditer(‘\d‘,‘ds3sy4784a‘)
print(ret)        #<callable_iterator object at 0x10195f940>

print(next(ret).group())
print(next(ret).group())
注意：

import re

ret=re.findall(‘www.(baidu|oldboy).com‘,‘www.oldboy.com‘)
print(ret)#[‘oldboy‘]     这是因为findall会优先把匹配结果组里内容返回,如果想要匹配结果,取消权限即可

ret=re.findall(‘www.(?:baidu|oldboy).com‘,‘www.oldboy.com‘)
print(ret)#[‘www.oldboy.com‘]

原文：http://blog.51cto.com/357712148/2139521

内容总结

以上是互联网集市为您收集整理的python_ re模块学习全部内容，希望文章能够帮你解决python_ re模块学习所遇到的程序开发问题。如果觉得互联网集市技术教程内容还不错，欢迎将互联网集市网站推荐给程序员好友。

内容备注

版权声明：本文内容由互联网用户自发贡献，该文观点与技术仅代表作者本人。本站仅提供信息存储空间服务，不拥有所有权，不承担相关法律责任。如发现本站有涉嫌侵权/违法违规的内容，请发送邮件至 gblab@vip.qq.com 举报，一经查实，本站将立刻删除。

内容手机端

扫描二维码推送至手机访问。

本文链接：https://qyyshop.com/info/1174494.html

来源：【匿名】

【上一篇】python lambda匿名函数【下一篇】浅谈PHP运行Python脚本的方法

更多 ►

【python_ re模块学习】教程文章相关的互联网学习教程文章

day1-Python高级自动化开发课程:模块一Python基础【代码】

1.开课介绍Alex LI （金角大王）CrazyEye堡垒机、Madking资产管理、TriAquae主机管理开源软件作者老男孩教育Python教学总监，51CTO2016年十大最受学员喜欢的讲师之一曾就职于松下、公安部、飞信、中金公司、华尔街英语、Nokia中国、Advent软件、汽车之家热爱Coding、旅游、电影、音乐、妹子2.Python长的领域：1）web开发 Django\Pyramid\Tornado\Bottle\Flask\WebPy2）网络编程 Twisted\Requests\Scrapy\Paramiko3）科学运算、人工...

python os.path模块

os.path.abspath(path) #返回绝对路径os.path.basename(path) #返回文件名os.path.commonprefix(list) #返回list(多个路径)中，所有path共有的最长的路径。os.path.dirname(path) #返回文件路径os.path.exists(path) #路径存在则返回True,路径损坏返回Falseos.path.lexists #路径存在则返回True,路径损坏也返回Trueos.path.expanduser(path) #把path中包含的"~"和"~user"转换成用户目录os.path.expandvars(path) #根据环境变量...

sys模块（sys模块是与python解释器交互的一个接口）【代码】

sys.argv 命令行参数List，第一个元素是程序本身路径 sys.exit(n) 退出程序，正常退出时exit(0),错误退出sys.exit(1) sys.version 获取Python解释程序的版本信息 sys.path 返回模块的搜索路径，初始化时使用PYTHONPATH环境变量的值 sys.platform 返回操作系统平台名称异常处理和status import sys try:sys.exit(1) except SystemExit as e:print(e)import sys print(sys.platform) print(...

第六章常用模块(3)：python常用模块(os,sys)【代码】

本篇我们来介绍一下os模块和sys模块。这两个模块的主要是和系统交互的一些功能。import os import sys1. os.os.getcwd() 得到当前工作目录，级当前python脚本工作的目录路径os.listdir() 返回指定目录下的所有文件和目录名os.remove() 用来删除一个文件os.removedirs(r‘c:\python‘) 删除多个目录os.system() 运行shell命令os.getenv(‘HOME‘) 读取操作系统环境变量HOME的值os.environ 返回操作系统所有的环境变量os.envi...

Python标准库---random模块的使用

更新时间：2019.09.111. 谈谈随机数：??我们经常会用到随机数，对它也并不陌生。但是谈到如何使用计算机来生成随机数的时候，我们便会发现，无论是多么先进的计算机都难以实现真正意义上完全随机的数。实际上，我们使用计算机生成的都是伪随机数。虽说是“伪”随机数，但也不能说它是假的随机数，而是应该归为有一定规律的随机数<img alt="技术分享图片" alt=‘诧异瞪眼睛‘ width=‘21px‘ height=‘19px‘ src=‘https://img201...

python的邮件模块smtplib&email【代码】【图】

import smtplib import string from email.mime.text import MIMETextdef send_mail(host, sender, sender_passwd, receiver, content_file, port="25"): # print "create smtp object" server = smtplib.SMTP() # print "conncect smtp server..." server.connect(host, port) # print "login smtp server..." server.login(sender, sender_passwd) # print "read content file..." fp = open(co...

python 带正则的search 模块【代码】

glob 是python 提供的一个支持正则表达式的查找文件的模块。实现上采用了os.listdir() 和 fnmatch.fnmatch(). 但是没有真的invoking a subshell.glob.glob(pathname)Return a possibly-empty list of path names that match pathname, which must be a string containing a path specification. pathname can be either absolute (like /usr/src/Python-1.5/Makefile) or relative (like ../../Tools/*/*.gif), and can contain ...

python常用模块【代码】【图】

模块：本质上就是一个.py文件模块分为三部分：内置模块、第三方模块、自定义模块一、time模块　　1.时间表示形式　　在python中，通常有三种方式来表示时间：　　（1）时间戳（timestamp）：时间戳表示的是从1970年1月1日00:00:00开始按秒计算的，是folat类型。　　（2）格式化的时间字符串（Format String）: ‘2017-06-21　　（3）结构化时间：共有9个元素共九个元素:(年，月，日，时，分，秒，一年中第几周，一年中第几天等）　...

多测师讲解python _re模块_高级讲师肖sir【代码】【图】

import re# 一、常用方法：# match()：从头匹配# search()：从整个文本搜索# findall()：找到所有符合的# split()：分割# sub()：替换# group()：结果转化为内容# groupdict()：结果转化为字典二、常用的正则表达式符号# ‘^‘匹配字符开头## ‘$‘匹配字符结尾## ‘*‘匹配*号前的字符0次或多次## ‘+‘匹配前一个字符1次或多次## ‘?‘匹配前一个字符1次或0次## ‘{m}‘匹配前一个字符m次## ‘{n,m}匹配前一个字符n到m次## ‘|‘...

python标准日志模块logging的使用方法

最近写一个爬虫系统，需要用到python的日志记录模块，于是便学习了一下。python的标准库里的日志系统从Python2.3开始支持。只要import logging这个模块即可使用。如果你想开发一个日志系统，既要把日志输出到控制台，还要写入日志文件，只要这样使用：复制代码代码如下:import logging# 创建一个loggerlogger = logging.getLogger(‘mylogger‘)logger.setLevel(logging.DEBUG)# 创建一个handler，用于写入日志文件fh = logging....

Python paramiko 模块【代码】

paramiko模块机遇SSH用于连接远程服务器并执行相关操作SSHClient用于连接远程服务器并执行基本命令基于用户名密码连接：import paramiko# 创建SSH对象 ssh = paramiko.SSHClient() # 允许连接不在know_hosts文件中的主机ssh.set_missing_host_key_policy(paramiko.AutoAddPolicy()) # 连接服务器 ssh.connect(hostname=‘host‘, port=port, username=‘user‘, password=‘password‘)# 执行命令 stdin, stdout, stderr = ssh.exe...

Python模块之optparse【代码】

参考：http://www.cnblogs.com/captain_jack/archive/2011/01/11/1933366.htmlhttps://docs.python.org/2/library/optparse.htmleg:# This is the blocking Get Poetry Now! client.import datetime, optparse, socketdef parse_args():usage = """usage: %prog [options] [hostname]:port ...This is the Get Poetry Now! client, blocking edition. Run it like this:python get-poetry.py port1 port2 port3 ...If you are in t...

python3常用模块--熟练使用【代码】【图】

阅读目录(Content)一、time与datetime模块二、random模块三、os模块四、sys模块打印进度条五、shutil模块六、json&pickle模块jsonpickle七、logging模块回到顶部(go to top)一、time与datetime模块在Python中，通常有这几种方式来表示时间：时间戳(timestamp)：通常来说，时间戳表示的是从1970年1月1日00:00:00开始按秒计算的偏移量。我们运行“type(time.time())”，返回的是float类型。格式化的时间字符串(Format String)结构化的...

python request模块学习【代码】

安装: pip install requests使用： import requests HTTP请求：GET、POST、PUT、DELETE、HEAD、OPTIONS1) get res = requests.get("https://github.com/timeline.json") 2) post res = requests.post("http://httpbin.org/post");3) put res = requests.put("http://httpbin.org/put");4) delete res = requests.delete("http://httpbin.org/delete");5) head res = requests.head("http://httpbin.org/get") ;6) options res =...

关于python logging模块读文档的几个心得

1. logger是分层级的，root是所有logger的祖先。2. root这个logger在执行logging.warning() 等一系列方法和basicConfig()的时候才会被初始化handler, 否则该logger是没有handler的。3.使用类似logging.getLogger(‘fdsfdsf’) 生成的logger是没有handler的，需要自己手动添加。4.某个logger如果依照propagate的配置propagate完之后，没有handler处理过，对于python 3.2及其之后的版本，则使用 logging.lastResort 所指向的handler。...

首页 / PYTHON / python_ re模块学习

python_ re模块学习

内容导读

内容图文

元字符之字符集［］：

元字符之转义符\

元字符之分组()

元字符之｜

内容总结

内容备注

内容手机端

【python_ re模块学习】教程文章相关的互联网学习教程文章

模块 - 相关标签

PYTHON - 技术教程分类

PYTHON - 最新教程

PYTHON - 最热教程