更多课程 选择中心


Web培训

400-111-8989

Web培训

C#正则表达式语法解析


C#正则表达式语法一、匹配单个字符 []——从中选择一个字符匹配

中间支持的类型:单词字符([ae])、非单词字符([!?,;@#$*])、字母范围([A-Z])、数字范围([0])

eg.正则表达式[ae]ffect

可匹配字符串 affect,effect

(此例中"[ae]"为元字符,"ffect"为字母文本)

注意:

1.要在字符类中匹配连字符,那么把连字符号作为第一个字符列出即可。

2.可以在单个正则表达式中包含多个字符类。

eg.[01][0-9]:[0-5][0-9][ap]m可以用来匹配如12:59pm格式的所有时间

^——排除某些字符(在[]中表此意,还可表示字符串的开头)

eg.正则表达式m[^a]t

可匹配字符串

不可匹配字符串 met,mit,m&t……mat

C#正则表达式语法二、

匹配特殊字符 可以使用的特殊字符:

\t——匹配制表符 \r——匹配硬回车符 \f——匹配换页符 \n——匹配换行符 描述表示字符类的元字符:

.——匹配任何除了\n以外的字符(或者在单行模式中的任何字符) \w——匹配任何单词字符(任何字母或数字) 

\W——匹配任何非单词字符(除了字母和数字以外的任何字符) \s——匹配任何空白字符(包括空格、换行、制表符等) 

\S——匹配任何非空白字符(除了空格、换行、制表符等的任何字符) \d——匹配任何数字字符(0~9的数字) 

\D——匹配任何非数字字符(除了0~9以外的任何字符) 表示字符串中字符位置: ^——匹配字符串的开头(或者多行模式下行的开头)。 

$——匹配字符串的结尾,或者是字符串结尾“\n”之前的最后一个字符,或者是多行模式中的行结尾。 

\A——匹配字符串的开头(忽略多行模式) \Z——匹配字符串的结尾或字符串结尾“\n”之前的最后一个字符(忽略多行模式)。 

\z——匹配字符串的结尾。 \G——匹配当前搜索开始的位置。 \b——匹配单词的边界。 \B——匹配单词的非边界。 

注意:

1.句点字符(.)特别有用。可以用它来表示任何一个字符。

eg.正则表达式01.17.84

可匹配字符串 01/17/84,01-17-84,011784,01.17.84

2.可以使用\b匹配单词的边界

eg.正则表达式

可匹配字符串 \blet\blet

不可匹配字符串letter,hamlet

3.\A和\z在确保字符串所包含的是某个表达式,而不是其他内容时很用。

eg.要判断Text控件是否包含单词"sophia",而不含任何额外的字符、换行符或者空白。

\Asophia\z

4.句点字符(.)具有特殊的含义,若要表示字母字符本身的含义,在前面加一个反斜杠:\.

C#正则表达式语法三、

匹配二选一的字符序列

|——匹配二选一

eg.正则表达式col(o|ou)r

可匹配字符串 color,colour

注意:\b(bill|ted)和\bbill|ted是不同的。

后者还可以匹配"malted"因为\b元字符只应用于"bill"。

C#正则表达式语法四、

用量词匹配 *——匹配0次或多次 +——匹配1次或多次 ?——匹配0次或1次 {n}——恰好匹配n次 {n,}——至少匹配n次 {n,m}——至少匹配n次,

但不多于m次 

eg.正则表达式brothers?

可匹配字符串 brother,brothers

eg.正则表达式\bp\d{3,5}

可匹配字符串 \b以p开头,且后跟3~5个数字结尾

注意:也可以把量词与()一起使用,以便把该量词应用到整个字母序列。

eg.正则表达式(The)?schoolisbeautiful.

可匹配字符串 schoolisbeautiful,Theschoolisbeautiful.

C#正则表达式语法五、

识别正则表达式和贪婪 有些量词是贪婪的(greedy).他们会尽可能多的匹配字符。

如量词*匹配0个或多个字符。假设要匹配字符串中任何HTML标签。你可能会用如下正则表达式:

<.*>

现有字符串A<i>quantifier</i>canbe<big>greedy</big>

结果<.*>把<i>quantifier</i>canbe<big>greedy</big>都匹配上了。

要解决该问题,需要与量词一起使用一个特殊的非贪婪字符“?”,因此表达式变化如下:

<.*?>

这样就可以正确匹配<i>、</i>、<big>、</big>。

?能强制量词尽可能少地匹配字符,?还可以用在以下几个量词中:

*?——非贪婪的量词* +?——非贪婪的量词+ ??——非贪婪的量词? {n}?——非贪婪的量词{n} {n,}?——非贪婪的量词

{n,} {n,m}?——非贪婪的量词{n,m} 

C#正则表达式语法六、

捕获和反向引用 捕获组(capturegroup)就像是正则表达式中的变量。

捕获组可以捕获正则表达式中的字符模式,并且由正则表达式后面的编号或名称来引用改模式。

()——用来捕获其中的字符串

\数字——用编号来引用

eg.

正则表达式 (\w)(\w)\2\1

可匹配字符串abba

注意:

1.反向引用用来匹配html标签非常有效如<(\w+)></\1>可以匹配<table></table>等类似格式的标签。

2.默认情况下,只要使用圆括号,就会捕获圆括号内所包含的字符,可以使用n选项来禁用这个默认行为(在第7条里会详细介绍),

或者添加?:到圆括号中。eg.(?:sophia)或(?n:sophia)此时不会捕获sophia。

(?<捕获组名称>)\k<捕获组名称>——用名称来引用

eg.

正则表达式(?<sophia>\w)abc\k<sophia>

可匹配字符串 xabcx

注意:在替换模式中使用捕获组的格式略有不同,要用$1、$2等来按数值引用捕获,用${sophia}等名称来按名称引用捕获组

C#正则表达式语法七、

设置正则表达式的选项

eg.

stringstr="<h4>sophia</h4>"

RegExobjRegEx=newRegEx("<h(d)>(.*?)</h1>"); 

Response.Write(objRegEx.Replace(str,"<fontsize=$1>$2</font>"));

i——所执行的匹配是不区分大小写的(.net中的属性为IgnoreCase) m——指定多行模式(.net中的属性为Multiline) 

n——只捕获显示命名或编号的组(.net中的属性为ExplicitCapture) c——编译正则表达式,这样会产生较快的执行速度,但启动会变慢(.net中的属性为Compiled) 

s——指定单行模式(.net中的属性为SingleLine) x——消除非转义空白字符和注释(.net中的属性为IgnorePatternWhitespace) 

r——搜索从右到左进行(.net中的属性为RightToLeft) -——表示禁用。 

eg.(?im-r:sophia)允许不区分大小写匹配sophia,使用多行模式,但禁用了从右到左的匹配。

注意:

1.m会影响如何解析起始元字符(^)和结束元字符($)。

在默认情况^和$只匹配整个字符串的开头,即使字符串包含多行文本。如果启用了m,那么它们就可以匹配每行文本的开头和结尾。

2.s会影响如何解析句点元字符(.)。通常一个句点能匹配除了换行符以外的所有字符。但在单行模式下,句点也能匹配一个换行符。

常用的C#正则表达式!

"^\d+$" //非负整数(正整数 + 0) 

"^[0-9]*[1-9][0-9]*$" //正整数 

"^((-\d+)|(0+))$" //非正整数(负整数 + 0) 

"^-[0-9]*[1-9][0-9]*$" //负整数 

"^-?\d+$" //整数 

"^\d+(\.\d+)?$" //非负浮点数(正浮点数 + 0) 

"^(([0-9]+\.[0-9]*[1-9][0-9]*)|([0-9]*[1-9][0-9]*\.[0-9]+)|([0-9]*[1-9][0-9]*))$" //正浮点数 

"^((-\d+(\.\d+)?)|(0+(\.0+)?))$" //非正浮点数(负浮点数 + 0) 

"^(-(([0-9]+\.[0-9]*[1-9][0-9]*)|([0-9]*[1-9][0-9]*\.[0-9]+)|([0-9]*[1-9][0-9]*)))$" //负浮点数 

"^(-?\d+)(\.\d+)?$" //浮点数 

"^[A-Za-z]+$" //由26个英文字母组成的字符串 

"^[A-Z]+$" //由26个英文字母的大写组成的字符串 

"^[a-z]+$" //由26个英文字母的小写组成的字符串 

"^[A-Za-z0-9]+$" //由数字和26个英文字母组成的字符串 

"^\w+$" //由数字、26个英文字母或者下划线组成的字符串 

"^[\w-]+(\.[\w-]+)*@[\w-]+(\.[\w-]+)+$" //email地址 

"^[a-zA-z]+://(\w+(-\w+)*)(\.(\w+(-\w+)*))*(\?\S*)?$" //url 

/^(d{2}|d{4})-((0([1-9]{1}))|(1[1|2]))-(([0-2]([1-9]{1}))|(3[0|1]))$/ // 年-月-日 

/^((0([1-9]{1}))|(1[1|2]))/(([0-2]([1-9]{1}))|(3[0|1]))/(d{2}|d{4})$/ // 月/日/年 

"^([w-.]+)@(([[0-9]{1,3}.[0-9]{1,3}.[0-9]{1,3}.)|(([w-]+.)+))([a-zA-Z]{2,4}|[0-9]{1,3})(]?)$" //Emil 

"(d+-)?(d{4}-?d{7}|d{3}-?d{8}|^d{7,8})(-d+)?" //电话号码 

"^(d{1,2}|1dd|2[0-4]d|25[0-5]).(d{1,2}|1dd|2[0-4]d|25[0-5]).(d{1,2}|1dd|2[0-4]d|25[0-5]).(d{1,2}|1dd|2[0-4]d|25[0-5])$" //IP地址 

YYYY-MM-DD基本上把闰年和2月等的情况都考虑进去了 

^((((1[6-9]|[2-9]\d)\d{2})-(0?[13578]|1[02])-(0?[1-9]|[12]\d|3[01]))|(((1[6-9]|[2-9]\d)\d{2})-(0?[13456789]|1[012])-(0?[1-9]|[12]\d|30))|(((1[6-9]|[2-9]\d)\d{2})-0?2-(0?[1-9]|1\d|2[0-8]))|(((1[6-9]|[2-9]\d)(0[48]|[2468][048]|[13579][26])|((16|[2468][048]|[3579][26])00))-0?2-29-))$

  

C#正则表达式 

图片 src[^>]*[^/].(?:jpg|bmp|gif)(?:\"|\') 

中文 ^([\u4e00-\u9fa5]+|[a-zA-Z0-9]+)$ 

网址 "\<a.+?href=['""](?!http\:\/\/)(?!mailto\:)(?>foundAnchor>[^'"">]+?)[^>]*?\>" 

匹配中文字符的正则表达式: [\u4e00-\u9fa5] 

匹配双字节字符(包括汉字在内):[^\x00-\xff] 

匹配空行的正则表达式:\n[\s| ]*\r 

匹配HTML标记的正则表达式:/<(.*)>.*<\/\1>|<(.*) \/>/ 

匹配首尾空格的正则表达式:(^\s*)|(\s*$)(像vbscript那样的trim函数) 

匹配Email地址的正则表达式:\w+([-+.]\w+)*@\w+([-.]\w+)*\.\w+([-.]\w+)* 

匹配网址URL的正则表达式:http://([\w-]+\.)+[\w-]+(/[\w- ./?%&=]*)? 

--------------------------------------------------------------------------- 

以下是例子: 

利用正则表达式限制网页表单里的文本框输入内容: 

用正则表达式限制只能输入中文:onkeyup="value=value.replace(/[^\u4E00-\u9FA5]/g,'')" onbeforepaste="clipboardData.setData('text',clipboardData.getData('text').replace(/[^\u4E00-\u9FA5]/g,''))" 

1.用正则表达式限制只能输入全角字符: onkeyup="value=value.replace(/[^\uFF00-\uFFFF]/g,'')" onbeforepaste="clipboardData.setData('text',clipboardData.getData('text').replace(/[^\uFF00-\uFFFF]/g,''))" 

2.用正则表达式限制只能输入数字:onkeyup="value=value.replace(/[^\d]/g,'') "onbeforepaste="clipboardData.setData('text',clipboardData.getData('text').replace(/[^\d]/g,''))" 

3.用正则表达式限制只能输入数字和英文:onkeyup="value=value.replace(/[\W]/g,'') "onbeforepaste="clipboardData.setData('text',clipboardData.getData('text').replace(/[^\d]/g,''))" 

4.计算字符串的长度(一个双字节字符长度计2,ASCII字符计1) 

String.prototype.len=function(){return this.replace([^\x00-\xff]/g,"aa").length;} 

5.javascript中没有像vbscript那样的trim函数,我们就可以利用这个表达式来实现,如下: 

String.prototype.trim = function() 

return this.replace(/(^\s*)|(\s*$)/g, ""); 

利用正则表达式分解和转换IP地址: 

6.下面是利用正则表达式匹配IP地址,并将IP地址转换成对应数值的Javascript程序: 

function IP2V(ip) 

re=/(\d+)\.(\d+)\.(\d+)\.(\d+)/g //匹配IP地址的正则表达式 

if(re.test(ip)) 

return RegExp.$1*Math.pow(255,3))+RegExp.$2*Math.pow(255,2))+RegExp.$3*255+RegExp.$4*1 

else 

throw new Error("不是一个正确的IP地址!") 

不过上面的程序如果不用正则表达式,而直接用split函数来分解可能更简单,程序如下: 

var ip="10.100.20.168" 

ip=ip.split(".") 

alert("IP值是:"+(ip[0]*255*255*255+ip[1]*255*255+ip[2]*255+ip[3]*1)) 

(?<=>)[^>]*(?=<)

预约申请免费试听课

填写下面表单即可预约申请免费试听! 怕学不会?助教全程陪读,随时解惑!担心就业?一地学习,可全国推荐就业!

上一篇:CSS基础语法
下一篇:正则表达式基础知识

正则表达式基础知识

C#正则表达式语法解析

  • 扫码领取资料

    回复关键字:视频资料

    免费领取 达内课程视频学习资料

Copyright © 2023 Tedu.cn All Rights Reserved 京ICP备08000853号-56 京公网安备 11010802029508号 达内时代科技集团有限公司 版权所有

选择城市和中心
黑龙江省

吉林省

河北省

贵州省

云南省

广西省

海南省