C#正则表达式语法解析_新达内Web前端培训

Web培训

400-996-5531

Web培训

C#正则表达式语法解析

发布：Web前端培训
来源：网络
时间：2015-05-26 15:54

C#正则表达式语法一、匹配单个字符 []——从中选择一个字符匹配

中间支持的类型：单词字符（[ae]）、非单词字符（[!?,;@#$*]）、字母范围（[A-Z]）、数字范围（[0]）

eg.正则表达式[ae]ffect

可匹配字符串 affect,effect

（此例中"[ae]"为元字符，"ffect"为字母文本）

注意：

1.要在字符类中匹配连字符，那么把连字符号作为第一个字符列出即可。

2.可以在单个正则表达式中包含多个字符类。

eg.[01][0-9]:[0-5][0-9][ap]m可以用来匹配如12:59pm格式的所有时间

^——排除某些字符(在[]中表此意，还可表示字符串的开头)

eg.正则表达式m[^a]t

可匹配字符串

不可匹配字符串 met,mit,m&t……mat

C#正则表达式语法二、

匹配特殊字符可以使用的特殊字符：

\t——匹配制表符 \r——匹配硬回车符 \f——匹配换页符 \n——匹配换行符描述表示字符类的元字符：

.——匹配任何除了\n以外的字符（或者在单行模式中的任何字符） \w——匹配任何单词字符（任何字母或数字）

\W——匹配任何非单词字符（除了字母和数字以外的任何字符） \s——匹配任何空白字符（包括空格、换行、制表符等）

\S——匹配任何非空白字符（除了空格、换行、制表符等的任何字符） \d——匹配任何数字字符（0～9的数字）

\D——匹配任何非数字字符（除了0～9以外的任何字符）表示字符串中字符位置： ^——匹配字符串的开头（或者多行模式下行的开头）。

$——匹配字符串的结尾，或者是字符串结尾“\n”之前的最后一个字符，或者是多行模式中的行结尾。

\A——匹配字符串的开头（忽略多行模式） \Z——匹配字符串的结尾或字符串结尾“\n”之前的最后一个字符（忽略多行模式）。

\z——匹配字符串的结尾。 \G——匹配当前搜索开始的位置。 \b——匹配单词的边界。 \B——匹配单词的非边界。

注意：

1.句点字符（.）特别有用。可以用它来表示任何一个字符。

eg.正则表达式01.17.84

可匹配字符串 01/17/84,01-17-84,011784,01.17.84

2.可以使用\b匹配单词的边界

eg.正则表达式

可匹配字符串 \blet\blet

不可匹配字符串letter,hamlet

3.\A和\z在确保字符串所包含的是某个表达式，而不是其他内容时很用。

eg.要判断Text控件是否包含单词"sophia"，而不含任何额外的字符、换行符或者空白。

\Asophia\z

4.句点字符(.)具有特殊的含义，若要表示字母字符本身的含义，在前面加一个反斜杠：\.

C#正则表达式语法三、

匹配二选一的字符序列

|——匹配二选一

eg.正则表达式col(o|ou)r

可匹配字符串 color,colour

注意：\b(bill|ted)和\bbill|ted是不同的。

后者还可以匹配"malted"因为\b元字符只应用于"bill"。

C#正则表达式语法四、

用量词匹配 *——匹配0次或多次 +——匹配1次或多次 ?——匹配0次或1次 {n}——恰好匹配n次 {n,}——至少匹配n次 {n,m}——至少匹配n次，

但不多于m次

eg.正则表达式brothers?

可匹配字符串 brother,brothers

eg.正则表达式\bp\d{3,5}

可匹配字符串 \b以p开头，且后跟3～5个数字结尾

注意：也可以把量词与（）一起使用，以便把该量词应用到整个字母序列。

eg.正则表达式(The)？schoolisbeautiful.

可匹配字符串 schoolisbeautiful,Theschoolisbeautiful.

C#正则表达式语法五、

识别正则表达式和贪婪有些量词是贪婪的（greedy）.他们会尽可能多的匹配字符。

如量词*匹配0个或多个字符。假设要匹配字符串中任何HTML标签。你可能会用如下正则表达式：

<.*>

现有字符串A<i>quantifier</i>canbe<big>greedy</big>

结果<.*>把<i>quantifier</i>canbe<big>greedy</big>都匹配上了。

要解决该问题，需要与量词一起使用一个特殊的非贪婪字符“？”，因此表达式变化如下：

<.*？>

这样就可以正确匹配<i>、</i>、<big>、</big>。

?能强制量词尽可能少地匹配字符，？还可以用在以下几个量词中：

*?——非贪婪的量词* +?——非贪婪的量词+ ??——非贪婪的量词? {n}?——非贪婪的量词{n} {n,}?——非贪婪的量词

{n,} {n,m}?——非贪婪的量词{n,m}

C#正则表达式语法六、

捕获和反向引用捕获组（capturegroup）就像是正则表达式中的变量。

捕获组可以捕获正则表达式中的字符模式，并且由正则表达式后面的编号或名称来引用改模式。

()——用来捕获其中的字符串

\数字——用编号来引用

eg.

正则表达式 (\w)(\w)\2\1

可匹配字符串abba

注意：

1.反向引用用来匹配html标签非常有效如<(\w+)></\1>可以匹配<table></table>等类似格式的标签。

2.默认情况下，只要使用圆括号，就会捕获圆括号内所包含的字符，可以使用n选项来禁用这个默认行为（在第7条里会详细介绍），

或者添加？：到圆括号中。eg.(?:sophia)或(?n:sophia)此时不会捕获sophia。

(?<捕获组名称>)\k<捕获组名称>——用名称来引用

eg.

正则表达式(？<sophia>\w)abc\k<sophia>

可匹配字符串 xabcx

注意：在替换模式中使用捕获组的格式略有不同，要用$1、$2等来按数值引用捕获，用${sophia}等名称来按名称引用捕获组

C#正则表达式语法七、

设置正则表达式的选项

eg.

stringstr="<h4>sophia</h4>"

RegExobjRegEx=newRegEx("<h(d)>(.*?)</h1>");

Response.Write(objRegEx.Replace(str,"<fontsize=$1>$2</font>"));

i——所执行的匹配是不区分大小写的（.net中的属性为IgnoreCase） m——指定多行模式（.net中的属性为Multiline）

n——只捕获显示命名或编号的组（.net中的属性为ExplicitCapture） c——编译正则表达式，这样会产生较快的执行速度，但启动会变慢（.net中的属性为Compiled）

s——指定单行模式（.net中的属性为SingleLine） x——消除非转义空白字符和注释（.net中的属性为IgnorePatternWhitespace）

r——搜索从右到左进行（.net中的属性为RightToLeft） -——表示禁用。

eg.(?im-r:sophia)允许不区分大小写匹配sophia，使用多行模式，但禁用了从右到左的匹配。

注意：

1.m会影响如何解析起始元字符（^）和结束元字符（$）。

在默认情况^和$只匹配整个字符串的开头，即使字符串包含多行文本。如果启用了m,那么它们就可以匹配每行文本的开头和结尾。

2.s会影响如何解析句点元字符（.）。通常一个句点能匹配除了换行符以外的所有字符。但在单行模式下，句点也能匹配一个换行符。

常用的C#正则表达式！

"^\d+$" //非负整数（正整数 + 0）

"^[0-9]*[1-9][0-9]*$" //正整数

"^((-\d+)|(0+))$" //非正整数（负整数 + 0）

"^-[0-9]*[1-9][0-9]*$" //负整数

"^-?\d+$" //整数

"^\d+(\.\d+)?$" //非负浮点数（正浮点数 + 0）

"^(([0-9]+\.[0-9]*[1-9][0-9]*)|([0-9]*[1-9][0-9]*\.[0-9]+)|([0-9]*[1-9][0-9]*))$" //正浮点数

"^((-\d+(\.\d+)?)|(0+(\.0+)?))$" //非正浮点数（负浮点数 + 0）

"^(-(([0-9]+\.[0-9]*[1-9][0-9]*)|([0-9]*[1-9][0-9]*\.[0-9]+)|([0-9]*[1-9][0-9]*)))$" //负浮点数

"^(-?\d+)(\.\d+)?$" //浮点数

"^[A-Za-z]+$" //由26个英文字母组成的字符串

"^[A-Z]+$" //由26个英文字母的大写组成的字符串

"^[a-z]+$" //由26个英文字母的小写组成的字符串

"^[A-Za-z0-9]+$" //由数字和26个英文字母组成的字符串

"^\w+$" //由数字、26个英文字母或者下划线组成的字符串

"^[\w-]+(\.[\w-]+)*@[\w-]+(\.[\w-]+)+$" //email地址

"^[a-zA-z]+://(\w+(-\w+)*)(\.(\w+(-\w+)*))*(\?\S*)?$" //url

/^(d{2}|d{4})-((0([1-9]{1}))|(1[1|2]))-(([0-2]([1-9]{1}))|(3[0|1]))$/ // 年-月-日

/^((0([1-9]{1}))|(1[1|2]))/(([0-2]([1-9]{1}))|(3[0|1]))/(d{2}|d{4})$/ // 月/日/年

"^([w-.]+)@(([[0-9]{1,3}.[0-9]{1,3}.[0-9]{1,3}.)|(([w-]+.)+))([a-zA-Z]{2,4}|[0-9]{1,3})(]?)$" //Emil

"(d+-)?(d{4}-?d{7}|d{3}-?d{8}|^d{7,8})(-d+)?" //电话号码

"^(d{1,2}|1dd|2[0-4]d|25[0-5]).(d{1,2}|1dd|2[0-4]d|25[0-5]).(d{1,2}|1dd|2[0-4]d|25[0-5]).(d{1,2}|1dd|2[0-4]d|25[0-5])$" //IP地址

YYYY-MM-DD基本上把闰年和2月等的情况都考虑进去了

^((((1[6-9]|[2-9]\d)\d{2})-(0?[13578]|1[02])-(0?[1-9]|[12]\d|3[01]))|(((1[6-9]|[2-9]\d)\d{2})-(0?[13456789]|1[012])-(0?[1-9]|[12]\d|30))|(((1[6-9]|[2-9]\d)\d{2})-0?2-(0?[1-9]|1\d|2[0-8]))|(((1[6-9]|[2-9]\d)(0[48]|[2468][048]|[13579][26])|((16|[2468][048]|[3579][26])00))-0?2-29-))$

C#正则表达式

图片 src[^>]*[^/].(?:jpg|bmp|gif)(?:\"|\')

中文 ^([\u4e00-\u9fa5]+|[a-zA-Z0-9]+)$

网址 "\<a.+?href=['""](?!http\:\/\/)(?!mailto\:)(?>foundAnchor>[^'"">]+?)[^>]*?\>"

匹配中文字符的正则表达式： [\u4e00-\u9fa5]

匹配双字节字符(包括汉字在内)：[^\x00-\xff]

匹配空行的正则表达式：\n[\s| ]*\r

匹配HTML标记的正则表达式：/<(.*)>.*<\/\1>|<(.*) \/>/

匹配首尾空格的正则表达式：(^\s*)|(\s*$)（像vbscript那样的trim函数）

匹配Email地址的正则表达式：\w+([-+.]\w+)*@\w+([-.]\w+)*\.\w+([-.]\w+)*

匹配网址URL的正则表达式：http://([\w-]+\.)+[\w-]+(/[\w- ./?%&=]*)?

---------------------------------------------------------------------------

以下是例子：

利用正则表达式限制网页表单里的文本框输入内容：

用正则表达式限制只能输入中文：onkeyup="value=value.replace(/[^\u4E00-\u9FA5]/g,'')" onbeforepaste="clipboardData.setData('text',clipboardData.getData('text').replace(/[^\u4E00-\u9FA5]/g,''))"

1.用正则表达式限制只能输入全角字符： onkeyup="value=value.replace(/[^\uFF00-\uFFFF]/g,'')" onbeforepaste="clipboardData.setData('text',clipboardData.getData('text').replace(/[^\uFF00-\uFFFF]/g,''))"

2.用正则表达式限制只能输入数字：onkeyup="value=value.replace(/[^\d]/g,'') "onbeforepaste="clipboardData.setData('text',clipboardData.getData('text').replace(/[^\d]/g,''))"

3.用正则表达式限制只能输入数字和英文：onkeyup="value=value.replace(/[\W]/g,'') "onbeforepaste="clipboardData.setData('text',clipboardData.getData('text').replace(/[^\d]/g,''))"

4.计算字符串的长度（一个双字节字符长度计2，ASCII字符计1）

String.prototype.len=function(){return this.replace([^\x00-\xff]/g,"aa").length;}

5.javascript中没有像vbscript那样的trim函数，我们就可以利用这个表达式来实现，如下：

String.prototype.trim = function()

{

return this.replace(/(^\s*)|(\s*$)/g, "");

}

利用正则表达式分解和转换IP地址：

6.下面是利用正则表达式匹配IP地址，并将IP地址转换成对应数值的Javascript程序：

function IP2V(ip)

{

re=/(\d+)\.(\d+)\.(\d+)\.(\d+)/g //匹配IP地址的正则表达式

if(re.test(ip))

{

return RegExp.$1*Math.pow(255,3))+RegExp.$2*Math.pow(255,2))+RegExp.$3*255+RegExp.$4*1

}

else

{

throw new Error("不是一个正确的IP地址!")

}

不过上面的程序如果不用正则表达式，而直接用split函数来分解可能更简单，程序如下：

var ip="10.100.20.168"

ip=ip.split(".")

alert("IP值是："+(ip[0]*255*255*255+ip[1]*255*255+ip[2]*255+ip[3]*1))

(?<=>)[^>]*(?=<)

预约申请免费试听课

填写下面表单即可预约申请免费试听！怕学不会？助教全程陪读，随时解惑！担心就业？一地学习，可全国推荐就业！

Web培训

C#正则表达式语法解析

预约申请免费试听课

正则表达式基础知识

C#正则表达式语法解析

Web相关推荐

相关栏目

开班时间