首页 / 正则 / 为什么PLY对待正则表达式与Python / re不同？

为什么PLY对待正则表达式与Python / re不同？

内容导读

互联网集市收集整理的这篇技术教程文章主要介绍了为什么PLY对待正则表达式与Python / re不同？，小编现在分享给大家，供广大互联网技能从业者学习和参考。文章包含2595字，纯文字阅读大概需要4分钟。

内容图文

一些背景：

我正在编写一个解析器来从使用标记语言的站点检索信息.标准库作为wikitools,…对我来说不起作用,因为我需要更具体,并根据我的需要调整它们,这使我和问题之间存在一层复杂性. Python“简单”的正则表达式使我很难以透明的方式识别标记语言中不同“标记”之间的依赖关系 – 所以显然我需要在此旅程结束时到达PLY.

现在看来PLY通过正则表达式识别令牌与Python相比有所不同 – 但我找不到它的东西.我不想继续前进,以防我不明白PLY如何确定其词法分析器中的标记(否则我将无法控制我依赖的逻辑并在稍后阶段失败).

开始了：

import ply.lex as lex

text = r'--- 123456 ---'
token1 = r'-- .* --'
tokens = (
   'TEST',
)
t_TEST = token1

lexer = lex.lex(reflags=re.UNICODE, debug=1)
lexer.input(text)
for tok in lexer:
    print tok.type, tok.value, tok.lineno, tok.lexpos

结果是：

lex: tokens   = ('TEST',)
lex: literals = ''
lex: states   = {'INITIAL': 'inclusive'}
lex: Adding rule t_TEST -> '-- .* --' (state 'INITIAL')
lex: ==== MASTER REGEXS FOLLOW ====
lex: state 'INITIAL' : regex[0] = '(?P<t_TEST>-- .* --)'
TEST --- 123456 --- 1 0

最后一行是令人惊讶的 – 我预计第一行和最后一行 – 将丢失在 – 123456 —如果它与“搜索”相当(并且在与“匹配”相当的情况下没有任何内容).显然这很重要,因为那时 – 无法区分—(或=== from ===),即标题,编号,……无法区分.

那么为什么PLY对标准Python /正则表达式的行为有所不同？ (以及如何？ – 无法在文档中找到某些内容,或者在stackoverflow中找不到内容).

我猜这是我对PLY的理解,因为这个工具已经存在很长一段时间了,也就是说这种行为是我猜的意思.我能找到的唯一相关信息与different groups有关,但没有解释识别正则表达式本身的不同行为.我也没有在ply-hack中找到任何东西.

我忽略了一些愚蠢的简单吗？

为了比较,这里标准Python /正则表达式：

import re

text = r'--- 123456 ---'
token1 = r'-- .* --'

p = re.compile(token1)

m = p.search(text)
if m:
    print 'Match found: ', m.group()
else:
    print 'No match'

m = p.match(text)
if m:
    print 'Match found: ', m.group()
else:
    print 'No match'

得到：

Match found:  -- 123456 --
No match

(正如预期的那样,首先是“搜索”的结果,第二个是“匹配”)

我的设置：我正在使用spyder – 这是开始时的终端显示：

Python 2.7.5+ (default, Sep 19 2013, 13:49:51) 
[GCC 4.8.1] on linux2
Type "help", "copyright", "credits" or "license" for more information.

Imported NumPy 1.7.1, SciPy 0.12.0, Matplotlib 1.2.1
Type "scientific" for more details.

谢谢你的时间和帮助.

解决方法:

ply lexmatch regular expression has different groups than a usual re的答案也有帮助.在lex.py中：

c = re.compile("(?P<%s>%s)" % (fname,f.__doc__), re.VERBOSE | self.reflags)

注意VERBOSE标志.这意味着重新引擎会忽略regexp中的空白字符.所以r’ – .* – ‘实际上意味着r’ – .* – ‘,它确实完全匹配像’ – foobar —‘这样的字符串.有关更多详细信息,请参阅re.VERBOSE的文档.

内容总结

以上是互联网集市为您收集整理的为什么PLY对待正则表达式与Python / re不同？全部内容，希望文章能够帮你解决为什么PLY对待正则表达式与Python / re不同？所遇到的程序开发问题。如果觉得互联网集市技术教程内容还不错，欢迎将互联网集市网站推荐给程序员好友。

内容备注

版权声明：本文内容由互联网用户自发贡献，该文观点与技术仅代表作者本人。本站仅提供信息存储空间服务，不拥有所有权，不承担相关法律责任。如发现本站有涉嫌侵权/违法违规的内容，请发送邮件至 gblab@vip.qq.com 举报，一经查实，本站将立刻删除。

内容手机端

扫描二维码推送至手机访问。

本文链接：https://qyyshop.com/info/785619.html

来源：【匿名】

【上一篇】java – 正则表达式以任何顺序匹配【下一篇】正则表达式语法

更多 ►

【为什么PLY对待正则表达式与Python / re不同？】教程文章相关的互联网学习教程文章

java中正则表达式用Pattern计算字符串的结果（四则运算）；分成有括号和没括号；当然也可以采用逆波兰式

import java.util.regex.Matcher; import java.util.regex.Pattern; public class Arithmetic { /** * 利用Pattern计算字符串的结果（四则运算），当然也可以采用逆波兰式 * @param args */public static void main(String[] args) {// TODO Auto-generated method stub/*String str="2+3*(5*(12-6))";Pattern pa=Pattern.compile("\$([^\\(\$]*)\\)");// \$为左括号 \$右括号，表示在括号内没有其他括号，然后用括号括起来...

正则表达式学习

绪：以下内容仅仅是本人学习正则表达式时候的简单记录，欢迎拍砖指正正则表达式就是记录文本规则的代码：描述一组字符串特征的模式=============================================================================绪---通配符(wildcard)：仅作用于命令行command line中参数argument里的路径path上 * --任意的字符串 ? --任意单一字符 [list] --匹配list中的任...

记录三条重要的正则表达式【代码】

1. <script\s+\S+comment.js[\s\S]*?</script>结果可以匹配出包含comment.js的script标签的内容，比如：输入：...<script>document.documentElement.className=document.documentElement.className.replace(/\bno-js\b/,‘js‘);if(window.Shopify&&window.Shopify.designMode)document.documentElement.className+=‘ in-theme-editor‘;if((‘ontouchstart‘inwindow)||window.DocumentTouch&&documentinstanceofDocumentTouch)d...

C++ 正则表达式【代码】

//1.当函数返回string时候的注意点: string Fun() {return string("szn"); }const char* pStr = Fun().c_str(); //如上代码，pStr = "" 而非 "szn"，原因:返回的string变量被析构了//2.正则表达式组件: regex:用于表示一个正则表达式 regex_match:将一个字符序列与一个正则表达式匹配 regex_search:寻找第一个与正则表达式匹配的子序列 regex_replace:使用给定格式替换一个正则表达式 sregex_iterator:迭代器适配器，调用regex_sea...

过目不忘JS正则表达式【代码】

原文:过目不忘JS正则表达式正则表达式，有木有人像我一样，学了好几遍却还是很懵圈，学的时候老明白了，学完了忘光了。好吧，其实还是练的不够，所谓温故而知新，可以为师矣，今天就随我来复习一下这傲娇的正则表达式吧。为啥要有正则表达式呢？其实就是因为计算机笨（这话不是我说的），比如123456@qq.com，我们一看就是邮箱，可是计算机不认识啊，所以我们就要用一些计算机认识的语言，来制定好规则，告诉它符...

正则表达式应用【图】

查找替换换行符号^段落标志符号 ^p原文：http://www.cnblogs.com/lynclynn/p/5194566.html

正则表达式排除某字符串的行【代码】

正则表达式排除某字符串的行 ^(?!.*trigger$".+"$).*$ 原文：https://www.cnblogs.com/wolbo/p/11353186.html

正则表达式基本语法

正则表达式是一种文本模式，包括普通字符（例如，a 到 z 之间的字母）和特殊字符（称为“元字符”）。模式描述在搜索文本时要匹配的一个或多个字符串。1.正则表达式基本语法两个特殊的符号‘^‘和‘$‘。他们的作用是分别指出一个字符串的开始和结束。例子如下："^The"：表示所有以"The"开始的字符串（"There"，"The cat"等）；"of despair$"：表示所以以"of despair"结尾的字符串；"^abc$"：表示开始和结尾都是"abc"的字符串——呵...

JS利用正则表达式替换字符串中的内容

//从字符串‘Is this a cat is‘中剪去‘is‘: var str=‘Is this a cat is‘; var subStr=new RegExp(‘is‘);//创建正则表达式对象 var result=str.replace(subStr,"");//把‘is‘替换为空字符串 console.log(result);//Is th a cat is var subStr=new RegExp(‘is‘,‘i‘);//创建正则表达式对象,不区分大小写 var result=str.replace(subStr,"");//把‘is‘替换为空字符串 console.log(result);//this a cat is va...

JS正则表达式验证是否为11位有效手机号码,【图】

https://blog.csdn.net/nongweiyilady/article/details/74007124 最近在做注册登陆页面，都要涉及到验证11位有效手机号码，这里贴出代码，希望能帮到有这个开发需求的朋友。[javascript] view plaincopyfunction isPoneAvailable($poneInput) { var myreg=/^[1][3,4,5,7,8][0-9]{9}$/; if (!myreg.test($poneInput.val())) { return false; } else { return true;...

常用的正则表达式总结

正则表达式用于字符串处理、表单验证等场合，实用高效。现将一些常用的表达式收集于此，以备不时之需。匹配中文字符的正则表达式： [\u4e00-\u9fa5]评注：匹配中文还真是个头疼的事，有了这个表达式就好办了匹配双字节字符(包括汉字在内)：[^\x00-\xff]评注：可以用来计算字符串的长度（一个双字节字符长度计2，ASCII字符计1）匹配空白行的正则表达式：\n\s*\r评注：可以用来删除空白行匹配HTML标记的正则表达式：<(\S*?)[^>]*>.*?...

java中常用的正则表达式及示例

转义字符想要匹配某些具体的特殊符号，比如+[.?^{|\，需要在前面加上一个转义字符\ 。比如通过 \. 去匹配.号。元字符：由于元字符一般会放在字符串中，所以需要转义，也就是\会变成 \\ 。. .可以匹配除换行符之外的任何单字符。比如.*表示任意个非换行符\n的字符。而.l+.则表示以任意非\n开始，中间包含至少一个l字符，并且以任意非\n字符结束。^和$ ^匹配字符串的开始位置。而$匹配字符串的结尾位置。^cat : 字符串以c开头紧接着...

js正则表达式

概念正则表达式是对字符串操作的一种逻辑公式，就是用事先定义好的一些特定字符、及这些特定字符的组合，组成一个“规则字符串”，这个“规则字符串”用来表达对字符串的一种过滤逻辑。简介正则表达式是对字符串（包括普通字符（例如，a 到 z 之间的字母）和特殊字符（称为“元字符”））操作的一种逻辑公式，就是用事先定义好的一些特定字符、及这些特定字符的组合，组成一个“规则字符串”，这个“规则字符串”用来表达对字...

VBS教程：正则表达式简介 -字符匹配【代码】

字符匹配句点 (.) 匹配一个字符串中任何单个的打印或非打印字符，除了换行符 (\n) 之外。下面的 Visual Basic Scripting Edition 正则表达式可以匹配 ‘aac‘、‘abc‘、‘acc‘、‘adc‘如此等等，同样也可以匹配 ‘a1c‘、‘a2c‘、a-c‘以及 a#c‘： /a.c/等价的 VBScript 正则表达式为："a.c"如果试图匹配一个包含文件名的字符串，其中句点 (.) 是输入字符串的一部分，则可以在正则表达式中的句点前面加上一个反斜杠 (\) 字符来...

正则表达式

1.string s="@张三 @李四 ";获取“张三”和“李四”MatchCollection mc = Regex.Matches(s, @"@(?<truename>\S+)[ |　]");for (int i = 0; i < mc.Count; i++) //在输入字符串中找到所有匹配 {var trueName=mc[i].Groups["truename"].Value); } 2.string s="张三：say something<br/>李四：say something<br/>替换成"<a name=‘AtTrueName‘>张三</a>：say something<br/><a name=‘AtTrueName‘>李四</a>：...

正则 - 最热教程

java正则表达式匹配所有数字，包括带小...UltraEdit正则表达式搜索替换小技巧 php正则表达式，允许有数字，字母，和标...jquery取字符串中数字的正则_jquery 分享正则表达式注册表验证和一些常用的...php正则表达式的特殊字符含义_PHP教程 SwiftUI iOS 超酷组件之支持文本分割炸...python 正则表达式与JSON-JSON java-检查字符串是否仅包含字母空格和引...java网页爬虫正则表达式

首页 / 正则 / 为什么PLY对待正则表达式与Python / re不同？

为什么PLY对待正则表达式与Python / re不同？

内容导读

内容图文

内容总结

内容备注

内容手机端

【为什么PLY对待正则表达式与Python / re不同？】教程文章相关的互联网学习教程文章

java中正则表达式用Pattern计算字符串的结果（四则运算）；分成有括号和没括号；当然也可以采用逆波兰式

正则表达式学习

记录三条重要的正则表达式【代码】

C++ 正则表达式【代码】

过目不忘JS正则表达式【代码】

正则表达式应用【图】

正则表达式排除某字符串的行【代码】

正则表达式基本语法

JS利用正则表达式替换字符串中的内容

JS正则表达式验证是否为11位有效手机号码,【图】

常用的正则表达式总结

java中常用的正则表达式及示例

js正则表达式

VBS教程：正则表达式简介 -字符匹配【代码】

正则表达式

PYTHON - 相关标签

正则表达式 - 相关标签

正则 - 最新教程

正则 - 最热教程