首页 / PYTHON / python-re模块基础学习

python-re模块基础学习

内容导读

互联网集市收集整理的这篇技术教程文章主要介绍了python-re模块基础学习，小编现在分享给大家，供广大互联网技能从业者学习和参考。文章包含5049字，纯文字阅读大概需要8分钟。

内容图文


import re
import json

# 第一种方法（很普遍的写法吧）
iphones = []
# with open('name.txt', 'r', encoding='utf-8')as f:
#     for i in f.readlines():
#         name, city, height, weight, iphone = i.split()
#         if iphone.startswith('1') and len(iphone) == 11:
#             iphones.append(iphone)
# print(iphones)

# 第二种方法（我只用了一行代码搞定）
f = open('name.txt', 'r', encoding='utf-8')
str_name = f.read()
f.close()

"""
re模块中匹配的语法
re.match 从头开始匹配（只匹配开头的字符）
re.search 匹配包含（全局匹配，但只匹配到一个）
re.findall 把所有匹配到的字符放到以列表中的元素返回（全局匹配，匹配到所有的返回）
re.split 以匹配到的字符当做列表分隔符（全局匹配，用匹配到的字符做分隔符）
re.sub 匹配字符并替换
re.fullmatch 全部匹配
"""

# re.match
a = '135adasdasdsad123'
# print(re.match('[0-9]{3}', a))  # 定义一个匹配规则，要寻找的字符串，但只匹配开头

b = '1adasdasdsad123,13'
# re.search
# print(re.search('[0-9]{2}',b)) # 12 定义一个匹配规则，要寻找的字符串，全局匹配但是找到一个就返回后面的不再查找匹配

# re.findall
c = '12adasdasdsad123,13'
# print(re.findall('[0-9]{2}', c))  # ['12', '12', '13']定义一个匹配规则，要寻找的字符串，全局匹配将所有满足规则的放在一个列表中并返回

d = '12adasdasdsad123,13'
# print(re.split(',', d))  # ['12adasdasdsad123', '13']
# print(re.split('[0-9]{2}', d))  # ['', 'adasdasdsad', '3,', '']
# 再看下字符串的split分割
# print(d.split(',')) # ['12adasdasdsad123', '13'] 按照精准的字符进行分割两个效果是一样的
# print(d.split('12')) #  ['', 'adasdasdsad', '3,13'] 但是re.split可以写规则啊，字符串的split只能准确的字符

#  re.sub
e = '12adasdasdsad123,13'
# print(re.sub('12','33',e))#33adasdasdsad333,13
# print(re.sub('ad','你好啊，我不好',e,count=1)) # 只替换一次，默认是替换全部


# re.fullmatch
f = '12'
# print(re.fullmatch('12',f)) # 匹配的字符与字符串完全一致才可以

"""
.       默认匹配除\n之外的任意一个字符，若指定flag DOTALL,则匹配任意字符，包括换行
^       匹配字符开头，若指定flags MULTILINE,这种也可以匹配上
$       匹配字符结尾， 若指定flags MULTILINE 
*       匹配*号前的字符0次或多次， 
+       匹配前一个字符1次或多次，
?       匹配前一个字符1次或0次 
{m}     匹配前一个字符m次 
{m}{n}  匹配前一个字符最少m次，最多n次 
|       匹配|左或|右的字符
(...)   分组匹配
'\A'     只从字符开头开始匹配 ，re.search("\Aabc","alexabc") 是匹配不到的，相当于re.match('abc',"alexabc") 或^
'\Z'    匹配字符结尾，同$
'\d'    匹配数字0-9
'\D'    匹配非数字
'\w'    匹配[A-Za-z0-9]
'\W'    匹配非[A-Za-z0-9]
's'     匹配空白字符、\t、\n、\r , re.search("\s+","ab\tc1\n3").group() 结果 '\t'
'(?P...)' 分组匹配 re.search("(?P[0-9]{4})(?P[0-9]{2})(?P[0-9]{4}
"""

# .
# print(re.search('.','abc')) # <re.Match object; span=(0, 1), match='a'>
# print(re.search('.','abc').group()) # a
# print(re.search('.','\nabc')) # <re.Match object; span=(1, 2), match='a'>

# ^
# print(re.search('^ab','abc'))  # <re.Match object; span=(0, 2), match='ab'>
# print(re.search('^ab','caaaabbbb')) #None 和re.match的作用是差不多的
# print(re.search('^[0-9]{2}[a-z]{1}','12c1d')) # <re.Match object; span=(0, 3), match='12c'> 0-9数字+0-9数字+a-z字母

# $
# print(re.search('45$','123456'))  # None
# print(re.search('45$','12345645'))

# ^ $
# print(re.search('^456$','456'))   #<re.Match object; span=(0, 3), match='456'> 以什么开头以什么结尾的
# print(re.search('^[0-9][a-z]$','1a')) #<re.Match object; span=(0, 2), match='1a'>
# print(re.search('^[0-9][a-z]$','1aaa')) #None

# *
# print(re.search('a*','aaa')) #<re.Match object; span=(0, 3), match='aaa'>
# print(re.search('[a-z]*[0-9]*','aaa45')) #<re.Match object; span=(0, 5), match='aaa45'> a-z出现多次，0-9出现多次


# +
# print(re.search('a+', 'aaa'))  # <re.Match object; span=(0, 3), match='aaa'>
# print(re.search('a+', 'bbb'))  # None

# ?
# print(re.search('a?', 'aaa'))  # <re.Match object; span=(0, 1), match='a'>
# print(re.search('a?', 'bbb'))  # <re.Match object; span=(0, 0), match=''>

# {m,n}
# print(re.search('a{3,5}', 'aaaaaaaa'))  # <re.Match object; span=(0, 5), match='aaaaa'>
# print(re.search('a{3,5}', 'aaaabaaaa'))  # <re.Match object; span=(0, 4), match='aaaa'>
# print(re.search('a{3,5}', 'aaabaaa'))  # <re.Match object; span=(0, 3), match='aaa'>
# print(re.search('a{3,5}', 'aabaa'))  # None

#|
# print(re.search('[0-9]|[a-z]','aaaa')) #<re.Match object; span=(0, 1), match='a'>
# print(re.search('[0-9]|[a-z]','1111')) #<re.Match object; span=(0, 1), match='1'>
# print(re.search('[0-9]|[a-z]','AAA')) #None


#()()()
print(re.search('([0-9])([a-z])','1aabbccdd11223344'))#<re.Match object; span=(0, 2), match='1a'>
s = '11022219900816XXXX'
ses = re.search('(?P<city>[0-9]{3})(?P<shiqu>[0-9]{3})(?P<year>[0-9]{4})(?P<month>[0-9]{2})(?P<day>[0-9]{2})',s)
print(ses.groupdict())




# print(re.findall('[0-9]{11}', str_name))  # findall是匹配到所有符合条件的，匹配的是数字，而且出现11位的数字，以列表形式返回

# '.'     默认匹配除\n之外的任意一个字符，若指定flag DOTALL,则匹配任意字符，包括换行
# a = re.search('.', '\n@aa')  # <re.Match object; span=(0, 1), match='@'>
# b = re.match('.', '\n@aa')  # None 从开头查找符合条件的返回，因为\n不符合所以返回none
# print(a)
# print(b)

内容总结

以上是互联网集市为您收集整理的python-re模块基础学习全部内容，希望文章能够帮你解决python-re模块基础学习所遇到的程序开发问题。如果觉得互联网集市技术教程内容还不错，欢迎将互联网集市网站推荐给程序员好友。

内容备注

版权声明：本文内容由互联网用户自发贡献，该文观点与技术仅代表作者本人。本站仅提供信息存储空间服务，不拥有所有权，不承担相关法律责任。如发现本站有涉嫌侵权/违法违规的内容，请发送邮件至 gblab@vip.qq.com 举报，一经查实，本站将立刻删除。

内容手机端

扫描二维码推送至手机访问。

本文链接：https://qyyshop.com/info/634679.html

来源：【匿名】

【上一篇】Selenium---Python3---弹框处理【下一篇】浅谈PHP运行Python脚本的方法

更多 ►

【python-re模块基础学习】教程文章相关的互联网学习教程文章

day1-Python高级自动化开发课程:模块一Python基础【代码】

1.开课介绍Alex LI （金角大王）CrazyEye堡垒机、Madking资产管理、TriAquae主机管理开源软件作者老男孩教育Python教学总监，51CTO2016年十大最受学员喜欢的讲师之一曾就职于松下、公安部、飞信、中金公司、华尔街英语、Nokia中国、Advent软件、汽车之家热爱Coding、旅游、电影、音乐、妹子2.Python长的领域：1）web开发 Django\Pyramid\Tornado\Bottle\Flask\WebPy2）网络编程 Twisted\Requests\Scrapy\Paramiko3）科学运算、人工...

python os.path模块

os.path.abspath(path) #返回绝对路径os.path.basename(path) #返回文件名os.path.commonprefix(list) #返回list(多个路径)中，所有path共有的最长的路径。os.path.dirname(path) #返回文件路径os.path.exists(path) #路径存在则返回True,路径损坏返回Falseos.path.lexists #路径存在则返回True,路径损坏也返回Trueos.path.expanduser(path) #把path中包含的"~"和"~user"转换成用户目录os.path.expandvars(path) #根据环境变量...

sys模块（sys模块是与python解释器交互的一个接口）【代码】

sys.argv 命令行参数List，第一个元素是程序本身路径 sys.exit(n) 退出程序，正常退出时exit(0),错误退出sys.exit(1) sys.version 获取Python解释程序的版本信息 sys.path 返回模块的搜索路径，初始化时使用PYTHONPATH环境变量的值 sys.platform 返回操作系统平台名称异常处理和status import sys try:sys.exit(1) except SystemExit as e:print(e)import sys print(sys.platform) print(...

第六章常用模块(3)：python常用模块(os,sys)【代码】

本篇我们来介绍一下os模块和sys模块。这两个模块的主要是和系统交互的一些功能。import os import sys1. os.os.getcwd() 得到当前工作目录，级当前python脚本工作的目录路径os.listdir() 返回指定目录下的所有文件和目录名os.remove() 用来删除一个文件os.removedirs(r‘c:\python‘) 删除多个目录os.system() 运行shell命令os.getenv(‘HOME‘) 读取操作系统环境变量HOME的值os.environ 返回操作系统所有的环境变量os.envi...

Python标准库---random模块的使用

更新时间：2019.09.111. 谈谈随机数：??我们经常会用到随机数，对它也并不陌生。但是谈到如何使用计算机来生成随机数的时候，我们便会发现，无论是多么先进的计算机都难以实现真正意义上完全随机的数。实际上，我们使用计算机生成的都是伪随机数。虽说是“伪”随机数，但也不能说它是假的随机数，而是应该归为有一定规律的随机数<img alt="技术分享图片" alt=‘诧异瞪眼睛‘ width=‘21px‘ height=‘19px‘ src=‘https://img201...

python的邮件模块smtplib&email【代码】【图】

import smtplib import string from email.mime.text import MIMETextdef send_mail(host, sender, sender_passwd, receiver, content_file, port="25"): # print "create smtp object" server = smtplib.SMTP() # print "conncect smtp server..." server.connect(host, port) # print "login smtp server..." server.login(sender, sender_passwd) # print "read content file..." fp = open(co...

python 带正则的search 模块【代码】

glob 是python 提供的一个支持正则表达式的查找文件的模块。实现上采用了os.listdir() 和 fnmatch.fnmatch(). 但是没有真的invoking a subshell.glob.glob(pathname)Return a possibly-empty list of path names that match pathname, which must be a string containing a path specification. pathname can be either absolute (like /usr/src/Python-1.5/Makefile) or relative (like ../../Tools/*/*.gif), and can contain ...

python常用模块【代码】【图】

模块：本质上就是一个.py文件模块分为三部分：内置模块、第三方模块、自定义模块一、time模块　　1.时间表示形式　　在python中，通常有三种方式来表示时间：　　（1）时间戳（timestamp）：时间戳表示的是从1970年1月1日00:00:00开始按秒计算的，是folat类型。　　（2）格式化的时间字符串（Format String）: ‘2017-06-21　　（3）结构化时间：共有9个元素共九个元素:(年，月，日，时，分，秒，一年中第几周，一年中第几天等）　...

多测师讲解python _re模块_高级讲师肖sir【代码】【图】

import re# 一、常用方法：# match()：从头匹配# search()：从整个文本搜索# findall()：找到所有符合的# split()：分割# sub()：替换# group()：结果转化为内容# groupdict()：结果转化为字典二、常用的正则表达式符号# ‘^‘匹配字符开头## ‘$‘匹配字符结尾## ‘*‘匹配*号前的字符0次或多次## ‘+‘匹配前一个字符1次或多次## ‘?‘匹配前一个字符1次或0次## ‘{m}‘匹配前一个字符m次## ‘{n,m}匹配前一个字符n到m次## ‘|‘...

python标准日志模块logging的使用方法

最近写一个爬虫系统，需要用到python的日志记录模块，于是便学习了一下。python的标准库里的日志系统从Python2.3开始支持。只要import logging这个模块即可使用。如果你想开发一个日志系统，既要把日志输出到控制台，还要写入日志文件，只要这样使用：复制代码代码如下:import logging# 创建一个loggerlogger = logging.getLogger(‘mylogger‘)logger.setLevel(logging.DEBUG)# 创建一个handler，用于写入日志文件fh = logging....

Python paramiko 模块【代码】

paramiko模块机遇SSH用于连接远程服务器并执行相关操作SSHClient用于连接远程服务器并执行基本命令基于用户名密码连接：import paramiko# 创建SSH对象 ssh = paramiko.SSHClient() # 允许连接不在know_hosts文件中的主机ssh.set_missing_host_key_policy(paramiko.AutoAddPolicy()) # 连接服务器 ssh.connect(hostname=‘host‘, port=port, username=‘user‘, password=‘password‘)# 执行命令 stdin, stdout, stderr = ssh.exe...

Python模块之optparse【代码】

参考：http://www.cnblogs.com/captain_jack/archive/2011/01/11/1933366.htmlhttps://docs.python.org/2/library/optparse.htmleg:# This is the blocking Get Poetry Now! client.import datetime, optparse, socketdef parse_args():usage = """usage: %prog [options] [hostname]:port ...This is the Get Poetry Now! client, blocking edition. Run it like this:python get-poetry.py port1 port2 port3 ...If you are in t...

python3常用模块--熟练使用【代码】【图】

阅读目录(Content)一、time与datetime模块二、random模块三、os模块四、sys模块打印进度条五、shutil模块六、json&pickle模块jsonpickle七、logging模块回到顶部(go to top)一、time与datetime模块在Python中，通常有这几种方式来表示时间：时间戳(timestamp)：通常来说，时间戳表示的是从1970年1月1日00:00:00开始按秒计算的偏移量。我们运行“type(time.time())”，返回的是float类型。格式化的时间字符串(Format String)结构化的...

python request模块学习【代码】

安装: pip install requests使用： import requests HTTP请求：GET、POST、PUT、DELETE、HEAD、OPTIONS1) get res = requests.get("https://github.com/timeline.json") 2) post res = requests.post("http://httpbin.org/post");3) put res = requests.put("http://httpbin.org/put");4) delete res = requests.delete("http://httpbin.org/delete");5) head res = requests.head("http://httpbin.org/get") ;6) options res =...

关于python logging模块读文档的几个心得

1. logger是分层级的，root是所有logger的祖先。2. root这个logger在执行logging.warning() 等一系列方法和basicConfig()的时候才会被初始化handler, 否则该logger是没有handler的。3.使用类似logging.getLogger(‘fdsfdsf’) 生成的logger是没有handler的，需要自己手动添加。4.某个logger如果依照propagate的配置propagate完之后，没有handler处理过，对于python 3.2及其之后的版本，则使用 logging.lastResort 所指向的handler。...

PYTHON - 技术教程分类

Python3 教程 Python3 简介 Python3 环境搭建 Python3 基础语法 Python3 基本数据类型 Python3 解释器 Python3 注释 Python3 运算符 Python3 数字(Number) Python3 字符串 Python3 列表 Python3 元组 Python3 字典 Python3 集合 Python3 编程第一步 Python3 条件控制 Python3 循环语句 Python3 迭代器与生成器 Python3 函数 Python3 数据结构 Python3 模块 Python3 输入和输出 Python3 File Python3 OS Python3 错误和异常 Python3 面向对象 Python3 命名空间/作用域 Python3 标准库概览 Python3 实例 Python3 CGI编程 Python3 MySQL(PyMySQL) Python3 网络编程 Python3 SMTP发送邮件 Python3 多线程 Python3 日期和时间 Python3 内置函数 Python3 MongoDB Python3 urllib python 全部

PYTHON - 最热教程

python如何统计字符串中字母个数？使用Python进行微信公众号开发（三）回...Python+PyQT5的子线程更新UI界面的实例 python时间戳怎么获得？如何获得当前时...vscode调试python时提示无法将“conda”...python接口自动化全局变量access_token...python收取邮件(腾讯企业邮箱)python如何绘制降水图详解python并发获取snmp信息及性能测试...怎么卸载Python3.6？

首页 / PYTHON / python-re模块基础学习

python-re模块基础学习

内容导读

内容图文

内容总结

内容备注

内容手机端

【python-re模块基础学习】教程文章相关的互联网学习教程文章

day1-Python高级自动化开发课程:模块一Python基础【代码】

python os.path模块

sys模块（sys模块是与python解释器交互的一个接口）【代码】

第六章常用模块(3)：python常用模块(os,sys)【代码】

Python标准库---random模块的使用

python的邮件模块smtplib&email【代码】【图】

python 带正则的search 模块【代码】

python常用模块【代码】【图】

多测师讲解python _re模块_高级讲师肖sir【代码】【图】

python标准日志模块logging的使用方法

Python paramiko 模块【代码】

Python模块之optparse【代码】

python3常用模块--熟练使用【代码】【图】

python request模块学习【代码】

关于python logging模块读文档的几个心得

PYTHON - 相关标签

PYTHON - 技术教程分类

PYTHON - 最新教程

PYTHON - 最热教程