Java 学习 - 正则表达式

内容导读

互联网集市收集整理的这篇技术教程文章主要介绍了Java 学习 - 正则表达式，小编现在分享给大家，供广大互联网技能从业者学习和参考。文章包含5833字，纯文字阅读大概需要9分钟。

内容图文

Java 学习 - 正则表达式

一.设计正则表达式的目的

正则表达式使用单个字符串来描述,匹配一系列匹配某个句法规则的字符串.在很多文本编辑器里,正则表达式通常被用来检索,替换那些匹配某个模式的文本. 许多程序设计语言都支持利用正则表达式进行字符串操作.与其说正则表达式是一个Java的库,倒不如说正则表达式是一个针对于字符串处理的语言.

二.正则表达式基本语法

在介绍正则表达式在Java中的使用方法之前,我们先介绍正则表达式的匹配方式. 毕竟,正则表达式并非Java所特有,应该更加注重正则表达式的功能,而非在Java中具体的实现方法.

模式串与文本串的概念

正则表达式用于判定文本串是否与给定的模式串匹配.这里介绍一下文本串与模式串的概念:

模式串是一个遵循某种规则的泛化的字符串, 其某些字符,字符串的长度可能不尽相同,一个模式串可能能够表示多种不同的文本串.
文本串是一个固定的字符串,文本串的每一个字符都是确定的.

模式串的格式

1.单个字符是一个模式串

Java 学习 - 正则表达式 - 文章图片

2.一个字符集是一个模式串

字符集的作用是检验由单个字符所构成的文本串是否与字符集中的字符满足一定关系

- 属于(simple classes)

[abc] // 可以匹配的文本串: "a","b","c"

- 不属于(negation)

[^abc] // 可以匹配的文本串: 除了"a","b","c"的任意单个字符

- 属于某一范围(range)

[a-zA-Z] // 可以匹配的文本串: "a" ~ "z" ,"A"~"Z" 任意单个字符

- 属于并集(union)

[a-d[m-p]] // 可以匹配的文本串: "a"~"d" ,"m" ~ "p" 任意单个字符

这里我有一点疑虑: union和range的区别是什么? 等后期更加理解后补充进来.

- 属于交集(intersection)

[a-z&&[def]] // 可以匹配的字符串: [a-z] 和 [def] 取交集是[def],因此能够匹配 "d","e","f"

- 属于差集(subtraction)

[a-z&&[^m-p]] // 可以匹配的字符串: [a-z] 和 [^m-p]取交集是 [a-l][q-z],因此能够匹配"a"~"l","q"~"z"

此外,Java中还提供一些被预定义好的字符集

还有一些预定义字符集看起来不太常用,这里不再介绍.

3.包含边界匹配器的模式串

所谓边界匹配器,其实是对一个模式串增添一些附加条件,例如"出现在文本串的开头","出现在文本串的结尾"

明确一个观念对于理解边界匹配器有很大的帮助

边界匹配器的宽度为0,不影响模式串的长度;或者说,包含边界匹配器的模式串长度与剔除边界匹配器的模式串长度应当一致

常见的边界匹配器:

Java 学习 - 正则表达式 - 文章图片

? 示例

^ 匹配文本串的开头

模式串

"^HelloWorld" // 所匹配的文本串: "HelloWorld"的部分,且必须满足"HelloWorld"在整个串的开头

匹配示例

#case1: "HelloWorld" // 匹配出 "HelloWorld"
#case2: "HeheHelloWorld" // 无匹配
#case3: "HelloWorldHehe" // 匹配出 "HelloWorld"

一个无意义的匹配:

"HelloWorld^" // 由于^匹配出文本串的开头位置,而"HelloWorld"永远不可能在开头位置之前,因此这个模式串永远不可能匹配成功

$ 匹配文本串的结尾

模式串

"HelloWorld$" // 所匹配的文本串

匹配示例

#case1: "HeheHelloWorld" // 匹配出 "HelloWorld"
#case2: "HelloWorldHehe" // 无匹配
#case3: "HelloWorld" // 匹配出"HelloWorld"

一个无意义的匹配:

"$HelloWorld"  // 由于$匹配出文本串的开头位置,而"HelloWorld"永远不可能在结尾位置之后,因此这个模式串永远不可能匹配成功

\b 匹配单词边界

单词边界的意义是: 一侧为单词字符,另一侧为非单词字符. 其中单词字符包括[字母，数字，下划线，汉字],非单词字符还包括空字符.

模式串

\bapple

匹配示例

#case1: "apple"  // 匹配出apple,因为a是一个单词字符,而a左边是一个空字符,\b的两侧满足一个为非单词字符,一个为单词字符
#case2: "bapple" // 无匹配,因为 \b的两侧为'b'和'a',均为非单词字符
#case3: " apple" // 匹配出"apple",因为\b的两侧分别为' '和'a'
#case4: "apple123456" 
// 匹配出apple,因为a是一个单词字符,而a左边是一个空字符,\b的两侧满足一个为非单词字符,一个为单词字符,而后续的"123456"不影响结果
#case5: " app" // 无匹配,虽然\b的两侧为' '和'a',但后续的"apple"无匹配

两个无意义的匹配

" \b apple"  // 因为\b两侧已经指定了必须为' '和' ',而它们都是非单词字符,不满足\b的条件,因此永远无法匹配成功
"a\bapple"   // 因为\b两侧已经指定了必须为'a'和'a',而它们都是单词字符,不满足\b的条件,因此永远无法匹配成功

4.包含贪婪量词的模式串(有回溯贪婪量词)

贪婪量词的"贪婪"意义: 尽可能地多匹配字符;如果一个字符串满足要求,继续向后检测,是否仍然符合要求,如果仍符合要求则继续匹配

应当注意的是,"满足要求"并非指仅仅满足X部分的要求,而是使得全局满足要求

贪婪量词的使用十分广泛,先看贪婪量词的常见类型

X? 表达可选择

模式串

"\d(.\d)?"

匹配示例

#case1: "1" // 匹配出"1"
#case2: "1.5" // 匹配出"1.5"
#case3: "1.25" // 匹配出"1.2"和"5" 
#case4: "13.2" // 匹配出"1"和"3.2"
#case4: ".25" // 匹配出"2"和"5"

X* 表达任意次

关于X*的用法,千万不要看网上大多数中文的翻译"零次或多次",这容易造成误解"一次不出现或出现次数至少为2". 官方文档给的定义是"zero or more times",表示的是可以出现任意次.

模式串

"xo*"

匹配示例

#case1: "x" // 匹配"x"
#case2: "xo" // 匹配"xo"
#case3: "xooo" // 匹配"xooo"

X+ 表达至少出现一次

这个用法比较浅显易懂,不再举例

X{n}

出现次数恰好为n

X{n,}

出现次数至少为n

X{n,m}

出现次数至少为n,至多为m

模式串

"xo{1,3}"

文本串

#case1: "x" // 无匹配
#case2: "xo" // 匹配出"xo"
#case3: "xoo" // 匹配出"xoo"
#case4: "xooo" // 匹配出"xooo"
#case5: "xoooo" // 匹配出"xooo"

5.包含节制量词的模式串

节制量词的"节制"意义: 尽可能地少匹配字符;如果一个字符串满足要求,立刻返回匹配的串,即使后续有更长的字符串,也不再匹配.

应当注意的是,"满足要求"并非指仅仅满足X部分的要求,而是使得全局满足要求

例如

模式串

"<a.*?>"

匹配

#case1: "<abbbb>" // 匹配出"<abbbb>"而非"<ab>". 表面上,这是因为"<ab>"本身并非文本串"<abbbb>"的连续子串;而如果从节制量词的实现方式来考虑,节制量词要求满足"<a.*?>"的全局要求,而非".*"的局部要求.

在贪婪量词的后面加'?'表达节制含义

6.包含占有量词的模式串(无回溯贪婪量词)

这个量词相对用的比较少,而且我上网查一些在线的正则测试工具,似乎并不支持占有量词

对于占有量词,应该结合其与贪婪量词的区别来理解.

模式串

"<ab*>" // 贪婪量词
"<ab*+>" // 占有量词

匹配示例

#case1: "<abbbbb>" // 贪婪量词匹配出"<abbbbb>",占有量词无匹配

贪婪量词	非贪婪量词	占有量词	匹配
X?	X??	X?+	匹配X 0次或1次
X*	X*?	X*+	匹配X 0次或无数次
X+	X+?	X++	匹配X 1次或无数次
X{n}	X{n}?	X{n}+	匹配X n次
X{n,}	X{n,}?	X{n,}+	匹配X 至少n次
X{n,m}	X{n,m}?	X{n,m}+	匹配X 至少n次至多m次

7.包含捕获组的模式串

 组和捕获
捕获组可以通过从左到右计算其开括号来编号,在表达式 ((A)(B(C))) 中,可以理解为bfs的过程
$1    =	((A)(B(C)))
$2    = (A)
$3    =	(B(C))
$4    =	(C)

Java 学习 - 正则表达式 - 文章图片

实际上,刚刚我们已经多次使用了捕获组,它和数学上括号的意义相同,即划分整体以及改变运算优先级

8. 包含逻辑运算符的模式串

剩下还有一些更加高级的操作,不再介绍.基本的正则表达式匹配语法介绍到此为止.

三.Java中使用正则表达式

引用

Class Pattern

正则表达式之字符边界

内容总结

以上是互联网集市为您收集整理的Java 学习 - 正则表达式全部内容，希望文章能够帮你解决Java 学习 - 正则表达式所遇到的程序开发问题。如果觉得互联网集市技术教程内容还不错，欢迎将互联网集市网站推荐给程序员好友。

内容备注

版权声明：本文内容由互联网用户自发贡献，该文观点与技术仅代表作者本人。本站仅提供信息存储空间服务，不拥有所有权，不承担相关法律责任。如发现本站有涉嫌侵权/违法违规的内容，请发送邮件至 gblab@vip.qq.com 举报，一经查实，本站将立刻删除。

内容手机端

扫描二维码推送至手机访问。

本文链接：https://qyyshop.com/info/622720.html

来源：【匿名】

【上一篇】Python逻辑正则表达式【下一篇】正则表达式语法

更多 ►

【Java 学习 - 正则表达式】教程文章相关的互联网学习教程文章

1. 分组 () 包裹的就是分组，可以得到结果，或者进行交换等整体操作2. 捕获 () 分组默认就是捕获组，(?:) 加上?:，就是非捕获组，只参与匹配，整体结果中会存在，消耗字符，分组不会在结果中，节约性能3. 环视 (?=) (?!) (?<=) (?<!) 有4种环视，分别可以正向和反向，匹配对应字符，字符只是参与匹配，整体结果中不出现，不消耗字符，分组不会出现在结果中4. 贪婪默认按符合的最长字符串匹配，就是贪婪模式。如果要换成非贪婪，只...

练习 : 正则表达式【代码】

一. 编程题1.写一个正则表达式判断一个字符串是否是ip地址规则：一个ip地址由4个数字组成，每个数字之间用.连接。每个数字的大小是0-255 255.189.10.37 正确 256.189.89.9 错误re_str1 = r'(((\d)|([1-9]\d)|((1\d{2})|(2(([0-4]\d)|(5[0-5])))))\.){3}((\d)|([1-9]\d)|((1\d{2})|(2(([0-4]\d)|(5[0-5])))))' while True:ip = input('请输入IP:')result = re.fullmatch(re_str1, ip)# print(result)if result:print('正确')else:pr...

正则表达式验证问题

<!DOCTYPE html><html><body><p>用户名正则表达式，4到16位（字母，数字，下滑线，减号）</p><p id="demo"></p><form action="" method="get"> <p>用户名: <input type="text" name="fname" required></p> <button onclick="myFunction1()">疯狂点我</button> <p>密码强度，最少6位，包括至少1个大写字母，1个小写字母，1个数字，1个特殊字符</p> <p>密码: <input type="password" name="lname" required></p> <button oncl...

JavaScript引用类型之RegExp类型(正则表达式)【代码】

ECMAScript中使用RegExp来支持正则表达式。使用下面类似Perl的语法,就可以创建一个正则表达式。var expression=/pattern/flags;如上代码：pattern ---pattern部分可以是任何简单或复杂的正则表达式,可以包含字符类、限定符、分组、向前查找以及反向引用。falgs ---每个正则表达式都可带有一个或多个标志(flags),用于标明正则表达式的行为;以下是正则表达式的匹配模式所支持的3个标志:g : 表示全局模式,即模式将被应用于所...

linux正则表达式和正则表达式的一些命令

正则表达式是处理一批繁杂的数据，做到快速搜索，快速匹配，快速替换删除等功能的一种需求。常用正则表达式的命令有grep，sed，awk（三剑客）vi，egrep。其中egrep和awk还支持扩展的正则表达式。下面先介绍一下这些命令。vi和vim在以后介绍。 grep： -v：排除匹配内容。 -i：忽略大小写。 -o：只输出匹配内容。 -n：在行首显示行号。 -e:扩展的正则表达式（=egrep）。 ...

Python 正则表达式验证是否为素数

CODE:import rewhile True:number = int(input('Input number (0 to quit): '))if number == 0:breaksubject = ''.join([str((1)) for a in range(number)])reobj = re.compile(r"^1?$|^(11+?)\1+$")if reobj.search(subject):print "number %s is not prime number!" % numberelse:print "number %s is a prime number!" % number RESULT: Input number (0 to quit): 8 number 8 is not prime number! Input number (0 to quit): ...

js正则表达式语法[转]

1. 正则表达式规则1.1 普通字符字母、数字、汉字、下划线、以及后边章节中没有特殊定义的标点符号，都是"普通字符"。表达式中的普通字符，在匹配一个字符串的时候，匹配与之相同的一个字符。举例1：表达式 "c"，在匹配字符串 "abcde" 时，匹配结果是：成功；匹配到的内容是："c"；匹配到的位置是：开始于2，结束于3。（注：下标从0开始还是从1开始，因当前编程语言的不同而可能不同）举例2：表达式 "bcd"，在匹配字符串...

正则表达式之数据验证与文本替换

一、数据验证用户名正则：4到16位（字母数字下划线减号）；密码强度正则：最少6位，包括至少1个，大写字母，1个小写字母，1个数字，1个特殊字符；EMAIL正则：；身份证号正则：；一、文本替换Paul ,paula ,paul ,spaulpaul replace Ringo；原文：https://www.cnblogs.com/abcdecsf/p/9866653.html

正则表达式【图】

正则表达式即另一种表单校验方法.RegExp对象是Regula Expression(正则表达式)的缩写,其作用是对字符串执行模式匹配.如:验证电子邮件地址,电话号码等字符串.1.定义正则表达式定义正则表达式有两种构造形式:普通方式;构造函数方式. a.普通方式: 语法: var reg = /表达式/(附加参数) (注:表达式-使用某些特殊字符来代表特殊的规则附加参数-用来扩展表达式的含义,主要包括三个参数 ☆ g-代表可以...

vim 使用正则表达式【代码】

任何一个现代编辑器或编程语言，如果不支持正则表达式，则可考虑立刻放弃，因为正则表达式不仅仅只是高效，还有点身份地位象征的意味。正则表达式指使用单个字符串来描述、匹配一系列符合某个句法规则的字符串。如果用vi而不懂正则表达式，则等于根本不会用。正则表达式是vi处理文本最有力的武器，稍微上点“档次”的编辑器或语言都支持正则表达式。花点时间学习正则表达式是跟普通程序员拉开距离的捷径。正则表达式至少可以做到...

JAVASE01---Unit02：正则表达式、 Object 、包装类

正则表达式不是java的东西，它是独立的一套体系，它可以描述字符串的规则，格式上的规则，通用匹配。java写了一套库来支持正则表达式，其他的语言也可以使用正则表达式，所以不是java的专利。Java核心APIJava SE 01 day02 ****************************************************************************API接受。开发工具：Ctrl+F 查找Regular expressions正则表达式Find：String（最简单的正则，字符串）Case sensitive大小写严...

正则表达式

正则表达式正则表达式的基础知识原子普通字符 “yue”即为三个原子y u e非打印字符原子表 [xyz]中xyz可以匹配[^xyz]除了xzy都可以匹配通用字符 \w \W \d \D \s \S元字符常见的元字符任意匹配元字符边界限制元字符限定符模式选择符模式单元模式修正贪婪模式与懒惰模式正则表达式常见函数re.match()函数从源字符开头开始检索re.search() 从全文检索全局匹配函数 re.compile()对正则表达式预编译编译后，使用findall()全部找出re....

shell下正则表达式与其工具grep【代码】【图】

一.grep相关知识1.grep grep (global search regular expression(RE) and print out the line,全面搜索正则表达式并把行打印出来)是一种强大的文本搜索工具，它能使用正则表达式搜索文本，并把匹配的行打印出来。2.grep工作原理 grep有两种模式：Basic和Extend模式。在Basic模式下，命令直接grep ，其中的？、+、{}、|、()都被解释为普通字符，如果要使用其的特殊意义，就必须对其用转义字符进行转义。在Extend模式...

正则表达式

一、正则表达式在文本处理中的常用：1.表达文本类型的特征（病毒、入侵等）　　2.同时查找或替换一组字符串　　3.匹配字符串的全部或部分（主要）　二、正则表达式的常用操作符操作符说明.表示任何单个字符[]给定单个字符的取值范围[^]限定字符的取值不能是括号里的字符*前一个字符扩展0次或者无限次+前一个字符扩展1次或无限次?前一个字符扩展0次或者1次|左右表达式中的任意一个{m}前一个字符扩展m次{m,n}前一个字符扩展m至n次^不...

正则表达式匹配不包含某些字符串【代码】

正则表达式匹配不包含某些字符串：　　^((?!@).)*$ //如果包含@字符串会被匹配处理publicstaticvoid main(String[] args){String reg = "^((?!@).)*$";System.out.println("gdfgfgdffgn".matches(reg));}　　字符串不包含@，返回true原文：https://www.cnblogs.com/senlinyang/p/8651884.html

正则 - 最热教程

java正则表达式匹配所有数字，包括带小...UltraEdit正则表达式搜索替换小技巧 php正则表达式，允许有数字，字母，和标...jquery取字符串中数字的正则_jquery 分享正则表达式注册表验证和一些常用的...php正则表达式的特殊字符含义_PHP教程 SwiftUI iOS 超酷组件之支持文本分割炸...java网页爬虫正则表达式 java-检查字符串是否仅包含字母空格和引...python 正则表达式与JSON-JSON

首页 / 正则 / Java 学习 - 正则表达式

Java 学习 - 正则表达式

内容导读

内容图文

Java 学习 - 正则表达式

一.设计正则表达式的目的

二.正则表达式基本语法

模式串与文本串的概念

模式串的格式

1.单个字符是一个模式串

2.一个字符集是一个模式串

3.包含边界匹配器的模式串

4.包含贪婪量词的模式串(有回溯贪婪量词)

5.包含节制量词的模式串

6.包含占有量词的模式串(无回溯贪婪量词)

7.包含捕获组的模式串

8. 包含逻辑运算符的模式串

三.Java中使用正则表达式

内容总结

内容备注

内容手机端

【Java 学习 - 正则表达式】教程文章相关的互联网学习教程文章

正则表达式 - 相关标签

JAVA - 相关标签

正则 - 最新教程

正则 - 最热教程