常用的多种语言支持的正则表达式 1.匹配中文字符的正则表达式: [\u4e00-\u9fa5] 2.匹配双字节字符(包括汉字在内):[^\x00-\xff] 评注:可以用来计算字符串的长度(一个双字节字符长度计2,ASCII字符计1) 3.匹配空白行的正则表达式:\n\s*\r 评注:可以用来删除空白行 4.匹配HTML标记的正则表达式:< (\S*?)[^>]*>.*?|< .*? /> 评注:网上流传的版本太糟糕,上面这个也仅仅能匹配部分,对于复杂的嵌套标记依旧无能为力 5.匹配首...
asp.net 获取网页Document时常会用到edited by:曹永思-博客园1、获取某个class的div内的标签获取<div class="imgList2">****</div>内的标签方法一:string g = " <div.*?class=\"imgList2\">(?<html>[\\s\\S]*?)</div>";Regex reg = new Regex(g, RegexOptions.None);MatchCollection mc = reg.Matches(strResult);string v = "";foreach (Match m in mc){v += m.Value + "\r\n";}View Code方法二(通用方法,获取指定前后内容之间的...
匹配中文字符的正则表达式: [\u4e00-\u9fa5] 评注:匹配中文还真是个头疼的事,有了这个表达式就好办了 匹配双字节字符(包括汉字在内):[^\x00-\xff] 评注:可以用来计算字符串的长度(一个双字节字符长度计2,ASCII字符计1) 匹配空白行的正则表达式:\n\s*\r 评注:可以用来删除空白行 匹配HTML标记的正则表达式:< (\S*?)[^>]*>.*?|< .*? /> 评注:网上流传的版本太糟糕,上面这个也仅仅能匹配部分,对于复杂的嵌套标记依旧无能...
RegularExpressionValidator控件表达式说明:
方括号“[ ]”用与定义可接受的字符。[abc123] 表示控件只能接受 a,b,c,1,2,3 这6个字符;
反集合符号 “ ^ ”用于定义不可以接受的字符。[^a-h] 表示控件除了 a 到 h 8个字符外,都可以接受;
花括号“{ }”定义必须输入的字符个数。{6}表示只能输入6个字符 ; {6,}表示必须输入6个以上,无上限 ; {2,6} 表示必须输入2至6个字符;但是花括号必须放在方括号后面,例如 [a-z]{4...
出处:RegExLib.com Regular Expression Cheat Sheet (.NET)元字符
说明^
匹配字符串的开始位置$
匹配字符串的结束位置.
匹配任意单个字符(换行符 \n 除外)|
交替{…}
指定要限定的数量[...]
指定要匹配的字符集(…)
对表达式进行逻辑分组*
匹配零或多个前面的表达式+
匹配一或多个前面的表达式?
匹配零或一个前面的表达式\
放在上面任何一个字符之前,表示匹配该字符本身。放在其他特殊字符后面,表示字符转义(见下面)字符转义...
如果全盘删除里面的 HTML 标签,可能会造成阅读上的困难(比如 a, img 这些标签), 最好是删除一部分,保留一部分. 正则表达式里,判断 包含某些字符串 是非常容易理解的,但是如何判断 不包含某些字符串 (是字符串,不是字符,是某些,不是某个) 确实是个费解的事. 代码如下:<(?!((/?\s?li)|(/?\s?ul)|(/?\s?a)|(/?\s?img)|(/?\s?br)|(/?\s?span)|(/?\s?b)))[^>]+> 这个正则是判断HTML标签不包含 li / ul / a / img / br / span / b 的,就...
方法一:使用正则表达式 代码如下://脏字典数据存放文件路径 private static string FILE_NAME="zang.txt"; //脏数据字典表,如:脏数据一|脏数据二|脏数据三 public static string dirtyStr=""; public ValidDirty() { if (HttpRuntime.Cache["Regex"]==null) { dirtyStr=ReadDic(); //用于检测脏字典的正则表达式 Regex validateReg= new Regex("^((?!"+dirtyStr+").(?<!"+dirtyStr+"))*$",RegexOptions.Compiled|RegexOptions....
代码如下:namespace WebCode { public partial class _default : System.Web.UI.Page { protected void Page_Load(object sender, EventArgs e) { String str = "这是一个测试文件<{config name=\"pagetitle1\"}>,一个标签的解析<{config name=\"pagetitle2\" count=\"2\"}>过程"; Label mylabel = new Label(); mylabel.ID = "display"; mylabel.Text = this.myReplace(str); Page.Form.Controls.Add(mylabel); } protected Stri...
1.简介: java.util.regex是一个用正则表达式所订制的模式来对字符串进行匹配工作的类库包。 它包括两个类:Pattern和Matcher Pattern 一个Pattern是一个正则表达式经编译后的表现模式。 Matcher 一个Matcher对象是一个状态机器,它依据Pattern对象做为匹配模式对字符串展开匹配检查。 首先一个Pattern实例订制了一个所用语法与PERL的类似的正则表达式经编译后的模式,然后一个Matcher实例在这个给定的Pattern实例的模式控制下进行...
比如以下的代码就是用来测试用正则表达式匹配从 0xff 到 0xffff 的字符。而值范围在 0 到 0xfe 的所有字符是不能被匹配的。 以下为引用的内容: 代码如下:Regex regex = new Regex(@"[/u00FF-/uFFFF]+"); // The characters, whoes value are smaller than 0xff, // are not expected to be matched. for (int i = 0; i <0xff; i++) { string s = new string(new char[] { (char)i }); Debug.Assert(!rege...
Regex 类 表示不可变的正则表达式。 命名空间:System.Text.RegularExpressions Regex 类包含若干 static(在 Visual Basic 中为 Shared)方法,使您无需显式创建 Regex 对象即可使用正 则表达式。在 .NET Framework 2.0 版中,将缓存通过调用静态方法而编译的正则表达式,而不会缓存通过调 用实例方法而编译的正则表达式。默认情况下,正则表达式引擎将缓存 15 个最近使用的静态正则表达式。因 此,在过度地依赖一组固定的正则表达...
正则表达式可以被看成是一个强大的通配符(通用匹配符号)。大多数人都应该很熟悉通配符,例如,当我们看到一个诸如“SAMS”的表达式,那么一个文本串中任何以SAMS开头的字符串都可以与这个表达式匹配。正则表达式提供了比这种通配符能力更强、控制规则更复杂、功能更完善的匹配机制。 本文将对.NET框架提供的支持正则表达式的类做一个概要介绍。要想获得有关正则表达式的更多知识,可参考《Regular Expression Pocket Referen...
/// <summary> /// 快速验证一个字符串是否符合指定的正则表达式。 /// </summary> /// <param name="_express">正则表达式的内容。</param> /// <param name="_value">需验证的字符串。</param> /// <returns>是否合法的bool值。</returns> public static bool QuickValidate(string _express, string _value) { if (_value == null) return false; System.Text.RegularExpressions.Regex myRegex = new System.Text.Regu...
实现代码
/// <summary>
/// 去除HTML标记
/// </summary>
/// <param name=”NoHTML”>包括HTML的源码 </param>
/// <returns>已经去除后的文字</returns>
public static string NoHTML(string Htmlstring)
{//删除脚本Htmlstring = Regex.Replace(Htmlstring, @"<script[^>]*?>.*?</script>", "",RegexOptions.IgnoreCase);//删除HTML Htmlstring = Regex.Replace(Htmlstring, @"<(.[^>]*)>", "",RegexOptions.IgnoreCase...
代码如下:<asp:RegularExpressionValidator id="FileUpLoadValidator" runat="server" ErrorMessage="Upload Jpegs and Gifs only." ValidationExpression="^(([a-zA-Z]:)|(\\{2}\w+)\$?)(\\(\w[\w].*))(.jpg|.JPG|.gif|.GIF)$" ControlToValidate="FileUpload1"> </asp:RegularExpressionValidator>