首页 / 正则 / 在Python中进行多个连续的正则表达式替换.效率低下？

在Python中进行多个连续的正则表达式替换.效率低下？

内容导读

互联网集市收集整理的这篇技术教程文章主要介绍了在Python中进行多个连续的正则表达式替换.效率低下？，小编现在分享给大家，供广大互联网技能从业者学习和参考。文章包含1446字，纯文字阅读大概需要3分钟。

内容图文

首先 – 我的代码有效.它只是运行缓慢,我想知道我是否遗漏了一些能让它变得更有效率的东西.我正在使用python解析PDF(是的,我知道如果可能的话应该避免这种情况).

我的问题是我必须做几个相当复杂的正则表达式替换 – 当我说替换时,我的意思是删除.我已经做了那些首先删除最多数据的那些,以便下一个表达式不需要分析太多的文本,但这是我能想到的所有加速的东西.

我对python和正则表达式都很陌生,所以可以想象这可以做得更好.

谢谢阅读.

    regexPagePattern = r"(Wk)\d{1,2}.\d{2}(\d\.\d{1,2})"
    regexCleanPattern = r"(\(continued\))?((II)\d\.\d{1,2}|\d\.\d{1,2}(II)|\d\.\d{1,2})"
    regexStartPattern = r".*(II)(\s)?(INDEX OF CHARTS AFFECTED)"
    regexEndPattern = r"(II.)\d{1,5}\((P|T)\).*"
    contentRaw = re.sub(regexStartPattern,"",contentRaw)
    contentRaw = re.sub(regexEndPattern,"",contentRaw)
    contentRaw = re.sub(regexPagePattern,"",contentRaw)
    contentRaw = re.sub(regexCleanPattern,"",contentRaw)

解决方法:

我不确定你是否在循环内执行此操作.如果不是,则不适用以下内容.

如果多次使用模式,则应使用re.compile(…)进行编译.这样,模式只编译一次.速度的提升应该是巨大的.最小的例子：

>>> a="a b c d e f"
>>> re.sub(' ', '-', a)
'a-b-c-d-e-f'
>>> p=re.compile(' ')
>>> re.sub(p, '-', a)
'a-b-c-d-e-f'

另一个想法：使用re.split( … )而不是re.sub,并使用生成的数据片段对数组进行操作.我不完全确定它是如何实现的,但我认为re.sub会创建文本片段并最终将它们合并为一个字符串,这很昂贵.在最后一步之后,您可以使用“”.join(片段)加入数组.显然,如果您的模式在某处重叠,则此方法将不起作用.

在更改之前和之后获取程序的计时信息会很有趣.

内容总结

以上是互联网集市为您收集整理的在Python中进行多个连续的正则表达式替换.效率低下？全部内容，希望文章能够帮你解决在Python中进行多个连续的正则表达式替换.效率低下？所遇到的程序开发问题。如果觉得互联网集市技术教程内容还不错，欢迎将互联网集市网站推荐给程序员好友。

内容备注

版权声明：本文内容由互联网用户自发贡献，该文观点与技术仅代表作者本人。本站仅提供信息存储空间服务，不拥有所有权，不承担相关法律责任。如发现本站有涉嫌侵权/违法违规的内容，请发送邮件至 gblab@vip.qq.com 举报，一经查实，本站将立刻删除。

内容手机端

扫描二维码推送至手机访问。

本文链接：https://qyyshop.com/info/790937.html

来源：【匿名】

【上一篇】使用python正则表达式解析字符串,使用命名组和替换【下一篇】正则表达式语法

更多 ►

【在Python中进行多个连续的正则表达式替换.效率低下？】教程文章相关的互联网学习教程文章

正则表达式基础(一)

张孝祥正则表达式视频学习笔记。1.什么是正则表达式　　正则表达式由英文词组“regular expression”翻译而来，可以理解为是对文字进行模糊匹配的一种语言。　　用一些特殊的字符(元字符)来表述文字应该具有某种特征。2.元字符的定义　　正则表达式中有特殊含义的字符，用于描述文字的特征。　　例如“?”表示的是其前面的字符是可有可无的，比如abc?说明字符“c”是可有可无的，可以匹配abc和ab。3.子匹配　　正则表达式中用圆括号...

正则表达式【图】

1. 正则表达式基础1.1. 简单介绍正则表达式并不是Python的一部分。正则表达式是用于处理字符串的强大工具，拥有自己独特的语法以及一个独立的处理引擎，效率上可能不如str自带的方法，但功能十分强大。得益于这一点，在提供了正则表达式的语言里，正则表达式的语法都是一样的，区别只在于不同的编程语言实现支持的语法数量不同；但不用担心，不被支持的语法通常是不常用的部分。如果已经在其他语言里使用过正则表达式，只需要简单看...

初识JS正则表达式【图】

初识JS正则表达式看到的使用的正则表达式练习：http://www.cnblogs.com/wenanry/archive/2010/09/06/1819552.htmlPS：本文参考李炎恢JS笔记 http://pan.baidu.com/s/1c0o09na　　1.正则表达式：描述字符模式对象，ES的RegRxp类表示正则表达式。String和RegExp都定义了使用正则表达式进行强大的模式匹配和文本检索与替换的函数。　　2.创建正则表达式的两种方法(1)通过new RegExp对象 var box = new RegExp(‘box‘)//第一个参数字...

C#中使用正则表达式提取超链接地址的集中方法【代码】

一般在做爬虫或者CMS的时候经常需要提取 href链接或者是src地址。此时可以使用正则表达式轻松完成。Regex reg = new Regex(@"(?is)<a[^>]*?href=([‘""]?)(?<url>[^‘""\s>]+)\1[^>]*>(?<text>(?:(?!</?a\b).)*)</a>"); MatchCollection mc = reg.Matches(yourStr); foreach (Match m in mc) { richTextBox2.Text += m.Groups["url"].Value + "\n";//得到href值 ...

java中正则表达式用Pattern计算字符串的结果（四则运算）；分成有括号和没括号；当然也可以采用逆波兰式

import java.util.regex.Matcher; import java.util.regex.Pattern; public class Arithmetic { /** * 利用Pattern计算字符串的结果（四则运算），当然也可以采用逆波兰式 * @param args */public static void main(String[] args) {// TODO Auto-generated method stub/*String str="2+3*(5*(12-6))";Pattern pa=Pattern.compile("\$([^\\(\$]*)\\)");// \$为左括号 \$右括号，表示在括号内没有其他括号，然后用括号括起来...

正则表达式学习

绪：以下内容仅仅是本人学习正则表达式时候的简单记录，欢迎拍砖指正正则表达式就是记录文本规则的代码：描述一组字符串特征的模式=============================================================================绪---通配符(wildcard)：仅作用于命令行command line中参数argument里的路径path上 * --任意的字符串 ? --任意单一字符 [list] --匹配list中的任...

记录三条重要的正则表达式【代码】

1. <script\s+\S+comment.js[\s\S]*?</script>结果可以匹配出包含comment.js的script标签的内容，比如：输入：...<script>document.documentElement.className=document.documentElement.className.replace(/\bno-js\b/,‘js‘);if(window.Shopify&&window.Shopify.designMode)document.documentElement.className+=‘ in-theme-editor‘;if((‘ontouchstart‘inwindow)||window.DocumentTouch&&documentinstanceofDocumentTouch)d...

C++ 正则表达式【代码】

//1.当函数返回string时候的注意点: string Fun() {return string("szn"); }const char* pStr = Fun().c_str(); //如上代码，pStr = "" 而非 "szn"，原因:返回的string变量被析构了//2.正则表达式组件: regex:用于表示一个正则表达式 regex_match:将一个字符序列与一个正则表达式匹配 regex_search:寻找第一个与正则表达式匹配的子序列 regex_replace:使用给定格式替换一个正则表达式 sregex_iterator:迭代器适配器，调用regex_sea...

过目不忘JS正则表达式【代码】

原文:过目不忘JS正则表达式正则表达式，有木有人像我一样，学了好几遍却还是很懵圈，学的时候老明白了，学完了忘光了。好吧，其实还是练的不够，所谓温故而知新，可以为师矣，今天就随我来复习一下这傲娇的正则表达式吧。为啥要有正则表达式呢？其实就是因为计算机笨（这话不是我说的），比如123456@qq.com，我们一看就是邮箱，可是计算机不认识啊，所以我们就要用一些计算机认识的语言，来制定好规则，告诉它符...

正则表达式应用【图】

查找替换换行符号^段落标志符号 ^p原文：http://www.cnblogs.com/lynclynn/p/5194566.html

正则表达式排除某字符串的行【代码】

正则表达式排除某字符串的行 ^(?!.*trigger$".+"$).*$ 原文：https://www.cnblogs.com/wolbo/p/11353186.html

正则表达式基本语法

正则表达式是一种文本模式，包括普通字符（例如，a 到 z 之间的字母）和特殊字符（称为“元字符”）。模式描述在搜索文本时要匹配的一个或多个字符串。1.正则表达式基本语法两个特殊的符号‘^‘和‘$‘。他们的作用是分别指出一个字符串的开始和结束。例子如下："^The"：表示所有以"The"开始的字符串（"There"，"The cat"等）；"of despair$"：表示所以以"of despair"结尾的字符串；"^abc$"：表示开始和结尾都是"abc"的字符串——呵...

JS利用正则表达式替换字符串中的内容

//从字符串‘Is this a cat is‘中剪去‘is‘: var str=‘Is this a cat is‘; var subStr=new RegExp(‘is‘);//创建正则表达式对象 var result=str.replace(subStr,"");//把‘is‘替换为空字符串 console.log(result);//Is th a cat is var subStr=new RegExp(‘is‘,‘i‘);//创建正则表达式对象,不区分大小写 var result=str.replace(subStr,"");//把‘is‘替换为空字符串 console.log(result);//this a cat is va...

JS正则表达式验证是否为11位有效手机号码,【图】

https://blog.csdn.net/nongweiyilady/article/details/74007124 最近在做注册登陆页面，都要涉及到验证11位有效手机号码，这里贴出代码，希望能帮到有这个开发需求的朋友。[javascript] view plaincopyfunction isPoneAvailable($poneInput) { var myreg=/^[1][3,4,5,7,8][0-9]{9}$/; if (!myreg.test($poneInput.val())) { return false; } else { return true;...

常用的正则表达式总结

正则表达式用于字符串处理、表单验证等场合，实用高效。现将一些常用的表达式收集于此，以备不时之需。匹配中文字符的正则表达式： [\u4e00-\u9fa5]评注：匹配中文还真是个头疼的事，有了这个表达式就好办了匹配双字节字符(包括汉字在内)：[^\x00-\xff]评注：可以用来计算字符串的长度（一个双字节字符长度计2，ASCII字符计1）匹配空白行的正则表达式：\n\s*\r评注：可以用来删除空白行匹配HTML标记的正则表达式：<(\S*?)[^>]*>.*?...

替换 - 相关标签

替换函数

正则 - 最热教程

java正则表达式匹配所有数字，包括带小...UltraEdit正则表达式搜索替换小技巧 php正则表达式，允许有数字，字母，和标...jquery取字符串中数字的正则_jquery 分享正则表达式注册表验证和一些常用的...php正则表达式的特殊字符含义_PHP教程 SwiftUI iOS 超酷组件之支持文本分割炸...python 正则表达式与JSON-JSON java-检查字符串是否仅包含字母空格和引...java网页爬虫正则表达式

首页 / 正则 / 在Python中进行多个连续的正则表达式替换.效率低下？

在Python中进行多个连续的正则表达式替换.效率低下？

内容导读

内容图文

内容总结

内容备注

内容手机端

【在Python中进行多个连续的正则表达式替换.效率低下？】教程文章相关的互联网学习教程文章

正则表达式基础(一)

正则表达式【图】

初识JS正则表达式【图】

C#中使用正则表达式提取超链接地址的集中方法【代码】

java中正则表达式用Pattern计算字符串的结果（四则运算）；分成有括号和没括号；当然也可以采用逆波兰式

正则表达式学习

记录三条重要的正则表达式【代码】

C++ 正则表达式【代码】

过目不忘JS正则表达式【代码】

正则表达式应用【图】

正则表达式排除某字符串的行【代码】

正则表达式基本语法

JS利用正则表达式替换字符串中的内容

JS正则表达式验证是否为11位有效手机号码,【图】

常用的正则表达式总结

PYTHON - 相关标签

正则表达式 - 相关标签

替换 - 相关标签

正则 - 最新教程

正则 - 最热教程