最全正则表达式学习

    xiaoxiao2021-03-26  7

    正则表达式可以:  1. 测试字符串的某个模式,例如可以对一个输入字符串进行测试,看该字符串是否存在一个电话号码的模式,这称为数据有效性验证 2. 替换文本,可以在文档中使用一个正则表达式来标识特定文字,然后可以全部将其删除,或者替换为别的文字 3. 根据模式匹配从字符串中提取一个子字符串,可以用来在文本或输入字段中查找特定文字

     

    正则表达式的常用字符及其含义

    正则表达式字符

    描述

     [……]

    匹配括号中的任何一个字符

     [^……]

    匹配不在括号中的任何一个字符(^为取反符)

     /w

    匹配任何一个字符(a~z、A~Z和0~9)

     /W

    匹配任何一个空白字符

     /s

    匹配任何一个非空白字符

     /S

    与任何非单词字符匹配

     /d

    匹配任何一个数字(0~9)

     /D

    匹配任何一个非数字(^0~9)

     [/b]

    匹配一个退格键字母

     {n,m}

    最少匹配前面表达式n次,最大为m次(n-m次数范围)

     {n,}

    最少匹配前面表达式n次(上限不定)

     {n}

    恰恰匹配前面表达式为n次

     ?

    匹配前面表达式0或1次,即{0,1}

     +

    至少匹配前面表达式1次,即{1,}

     *

    至少匹配前面表达式0次,即{0,}

     |

    匹配前面表达式或后面表达式(逻辑或)

     (…)

    在单元中组合项目

     ^

    匹配字符串的开头

     $

    匹配字符串的结尾

     /b

    匹配字符边界

     /B

    匹配非字符边界的某个位置

     

    几个常用的正则表达式

    /w+([-+.]/w+)*@/w+([-.]/w+)*/./w+([-.]/w+)*:验证电子邮件:HTTP:///S+/./S+:验证网址:/d{6}:验证邮政编码:[0-9]:表示0~9十个数字。/d*:表示任意个数字。/d{3,4}-/d{7,8}:表示中国大陆的固定电话号码。/d{2}-/d{5}:验证由两位数字、一个连字符再加5位数字组成的ID号。</s*(/S+)(/s[^>]*)?>[/s/S]*</s*///l/s*>:匹配HTML标记。/d{17}[/d|X]|/d{15}:身份证

    字符描述:

    /:将下一个字符标记为特殊字符或字面值。例如"n"与字符"n"匹配。"/n"与换行符匹配。序列"//"与"/"匹配,"/("与"("匹配。 ^ :匹配输入的开始位置。  $ :匹配输入的结尾。  * :匹配前一个字符零次或几次。例如,"zo*"可以匹配"zo"、"zoo"。  + :匹配前一个字符一次或多次。例如,"zo+"可以匹配"zoo",但不匹配"z"。  ? :匹配前一个字符零次或一次。例如,"n?ve?"可以匹配"never"中的"ve"。  .:匹配换行符以外的任何字符。  (pattern) 与模式匹配并记住匹配。匹配的子字符串可以从作为结果的

    Matches 集合中使用 Item [0]...[n]取得。如果要匹配括号字符(和 ),可使用"/(" 或 "/)"。  x|y:匹配 x 或 y。例如 "z|food" 可匹配 "z" 或 "food"。"(z|f)ood" 匹配 "zood" 或 "food"。  {n}:n 为非负的整数,匹配恰好n次。例如,"o{2}" 不能与 "Bob 中的 "o" 匹配,但是可以与"foooood"中的前两个o匹配。  {n,} :n 为非负的整数,匹配至少n次。例如,"o{2,}"匹配"foooood"中所有的o,"o{1,}"等价于"o+";"o{0,}"等价于"o*"。  {n,m} :m 和 n 为非负的整数。匹配至少 n 次,至多 m 次。例如,"o{1,3}" 匹配 "fooooood"中前三个o,"o{0,1}"等价于"o?"。  [xyz] :一个字符集,与括号中字符的其中之一匹配。例如,"[abc]" 匹配"plain"中的"a"。  [^xyz] :一个否定的字符集,匹配不在此括号中的任何字符。例如,"[^abc]" 可以匹配"plain"中的"p".  [a-z] :表示某个范围内的字符,与指定区间内的任何字符匹配。例如,"[a-z]"匹配"a"与"z"之间的任何一个小写字母字符。  [^m-z] :否定的字符区间,与不在指定区间内的字符匹配。例如,"[m-z]"与不在"m"到"z"之间的任何字符匹配。  /b :与单词的边界匹配,即单词与空格之间的位置。例如,"er/b" 与"never"中的"er"匹配,但是不匹配"verb"中的"er"。  /B :与非单词边界匹配,"ea*r/B"与"never early"中的"ear"匹配。  /d :与一个数字字符匹配,等价于[0-9]。  /D :与非数字的字符匹配,等价于[^0-9]。  /f :与分页符匹配。  /n :与换行符字符匹配。  /r :与回车字符匹配。  /s :与任何白字符匹配,包括空格、制表符、分页符等。等价于"[ /f/n/r/t/v]"。  /S :与任何非空白的字符匹配,等价于"[^ /f/n/r/t/v]"。  /t :与制表符匹配。  /v :与垂直制表符匹配。  /w :与任何单词字符匹配,包括下划线。等价于"[A-Za-z0-9_]"。  /W :与任何非单词字符匹配,等价于"[^A-Za-z0-9_]"。  /num :匹配 num个,其中 num 为一个正整数,引用回到记住的匹配。例如,"(.)/1"匹配两个连续的相同的字符。  /n:匹配 n,其中n 是一个八进制换码值。八进制换码值必须是 1, 2 或 3 个数字长。

    例如,"/11" 和 "/011" 都与一个制表符匹配。"/0011"等价于"/001" 与 "1"。八进制换码值不得超过 256。否则,只有前两个字符被视为表达式的一部分。允许在正则表达式中使用ASCII码。  /xn:匹配n,其中n是一个十六进制的换码值。十六进制换码值必须恰好为两个数字长。例如,"/x41"匹配"A"。"/x041"等价于"/x04" 和 "1"。允许在正则表达式中使用 ASCII 码。  好了,现在我们就举个例子来说明正则表达式的使用,以验证邮件。例如我们输入:test@yesky.com,当然我也会这样输入:xxx@yyy.com.cn;但是这样的则是非法,如:xxx@@com.cn或者@xxx.com.cn,等等,所以我们得归纳出合法的电子邮件地址应满足的条件:  1. 必须包含一个并且只有一个符号“@”  2. 第一个字符不得是“@”或者“.”  3. 不允许出现“@.”或者.@  4. 结尾不得是字符“@”或者“.”  根据以上的原则,我们就可以得到如下的模板: "^/w+((-/w+)|(/./w+))*/@[A-Za-z0-9]+((/.|-)[A-Za-z0-9]+)*/.[A-Za-z0-9]+$"

    接着,我们对其改进,可以得到这样的模板格式:"/w+([-+.]/w+)*@/w+([-.]/w+)*/./w+([-.]/w+)*"

     

    正则表达式的常见用法

    "^/d+$":非负整数(正整数 + 0)

    "^[0-9]*[1-9][0-9]*$":正整数

    "^((-/d+)|(0+))$"非正整数(负整数 + 0)

    "^-[0-9]*[1-9][0-9]*$":负整数

    "^-?/d+$"整数

    "^/d+(/./d+)?$"非负浮点数(正浮点数 + 0)

    "^(([0-9]+/.[0-9]*[1-9][0-9]*)|([0-9]*[1-9][0-9]*/.[0-9]+)|([0-9]*[1-9][0-9]*))$"正浮点数

    "^((-/d+(/./d+)?)|(0+(/.0+)?))$"非正浮点数(负浮点数 + 0)

    "^(-(([0-9]+/.[0-9]*[1-9][0-9]*)|([0-9]*[1-9][0-9]*/.[0-9]+)|([0-9]*[1-9][0-9]*)))$":负浮点数

    "^(-?/d+)(/./d+)?$"浮点数

    "^[A-Za-z]+$"由26个英文字母组成的字符串

    "^[A-Z]+$"由26个英文字母的大写组成的字符串

    "^[a-z]+$"由26个英文字母的小写组成的字符串

    "^[A-Za-z0-9]+$"由数字和26个英文字母组成的字符串

    "^/w+$"由数字、26个英文字母或者下划线组成的字符串

    "^[/w-]+(/.[/w-]+)*@[/w-]+(/.[/w-]+)+$"email地址

    "^[a-zA-z]+://(/w+(-/w+)*)(/.(/w+(-/w+)*))*(/?/S*)?$"url

    只能输入1个数字表达式^/d$描述匹配一个数字(^起始符,$结束符,下同)匹配的例子0,1,2,3不匹配的例子

    只能输入n个数字表达式^/d{n}$ 例如^/d{8}$描述匹配8个数字匹配的例子12345678,22223334,12344321不匹配的例子

    只能输入至少n个数字表达式^/d{n,}$ 例如^/d{8,}$描述匹配最少n个数字匹配的例子12345678,123456789,12344321不匹配的例子

    只能输入m到n个数字表达式^/d{m,n}$ 例如^/d{7,8}$描述匹配m到n个数字匹配的例子12345678,1234567不匹配的例子123456,123456789

    只能输入数字表达式^[0-9]*$描述匹配任意个数字匹配的例子12345678,1234567不匹配的例子E,清清月儿,http://blog.csdn.net/21aspnet

    只能输入某个区间数字表达式^[12-15]$描述匹配某个区间的数字匹配的例子12,13,14,15不匹配的例子

    只能输入0和非0打头的数字表达式^(0|[1-9][0-9]*)$描述可以为0,第一个数字不能为0,数字中可以有0匹配的例子12,10,101,100不匹配的例子01,清清月儿,http://blog.csdn.net/21aspnet

    只能输入实数表达式^[-+]?/d+(/./d+)?$描述匹配实数匹配的例子18,+3.14,-9.90不匹配的例子.6,33s,67-99

    只能输入n位小数的正实数表达式^[0-9]+(.[0-9]{n})?$以^[0-9]+(.[0-9]{2})?$为例描述匹配n位小数的正实数匹配的例子2.22不匹配的例子2.222,-2.22,http://blog.csdn.net/21aspnet

    只能输入m-n位小数的正实数表达式^[0-9]+(.[0-9]{m,n})?$以^[0-9]+(.[0-9]{1,2})?$为例描述匹配m到n位小数的正实数匹配的例子2.22,2.2不匹配的例子2.222,-2.2222,http://blog.csdn.net/21aspnet

    只能输入非0的正整数表达式^/+?[1-9][0-9]*$描述匹配非0的正整数匹配的例子2,23,234不匹配的例子0,-4,

    只能输入非0的负整数表达式^/-[1-9][0-9]*$描述匹配非0的负整数匹配的例子-2,-23,-234不匹配的例子0,4,

    只能输入n个字符表达式^.{n}$ 以^.{4}$为例描述匹配n个字符,注意汉字只算1个字符匹配的例子1234,12we,123清,清清月儿不匹配的例子0,123,123www,http://blog.csdn.net/21aspnet/

    只能输入英文字符表达式^.[A-Za-z]+$为例描述匹配英文字符,大小写任意匹配的例子Asp,WWW,不匹配的例子0,123,123www,http://blog.csdn.net/21aspnet/

    只能输入大写英文字符表达式^.[A-Z]+$为例描述匹配英文大写字符匹配的例子NET,WWW,不匹配的例子0,123,123www,

    只能输入小写英文字符表达式^.[a-z]+$为例描述匹配英文大写字符匹配的例子asp,csdn不匹配的例子0,NET,WWW,

    只能输入英文字符+数字表达式^.[A-Za-z0-9]+$为例描述匹配英文字符+数字匹配的例子1Asp,W1W1W,不匹配的例子0,123,123,www,http://blog.csdn.net/21aspnet/

    只能输入英文字符/数字/下划线表达式^/w+$为例描述匹配英文字符或数字或下划线匹配的例子1Asp,WWW,12,1_w不匹配的例子3#,2-4,w#$,http://blog.csdn.net/21aspnet/

    密码举例表达式^.[a-zA-Z] /w{m,n}$描述匹配英文字符开头的m-n位字符且只能数字字母或下划线匹配的例子 不匹配的例子 

    验证首字母大写表达式/b[^/Wa-z0-9_][^/WA-Z0-9_]*/b描述首字母只能大写匹配的例子Asp,Net不匹配的例子http://blog.csdn.net/21aspnet/

    验证网址(带?id=中文)VS.NET2005无此功能表达式

    ^http:([/w-]+(/.[/w-]+)+(//[/w-   .///?%&=/u4e00-/u9fa5]*)?)?$

    描述验证带?id=中文匹配的例子http://blog.csdn.net/21aspnet/ , http://blog.csdn.net?id=清清月儿不匹配的例子 

    验证汉字表达式^[/u4e00-/u9fa5]{0,}$描述只能汉字匹配的例子清清月儿不匹配的例子http://blog.csdn.net/21aspnet/

    验证QQ号表达式[0-9]{5,9}描述5-9位的QQ号匹配的例子10000,123456不匹配的例子10000w,http://blog.csdn.net/21aspnet/

    验证电子邮件(验证MSN号一样)表达式/w+([-+.']/w+)*@/w+([-.]/w+)*/./w+([-.]/w+)*描述注意MSN用非hotmail.com邮箱也可以匹配的例子aaa@msn.com不匹配的例子111@1.   http://blog.csdn.net/21aspnet/

    验证身份证号(粗验,最好服务器端调类库再细验证)表达式^[1-9]([0-9]{16}|[0-9]{13})[xX0-9]$描述 匹配的例子15或者18位的身份证号,支持带X的不匹配的例子http://blog.csdn.net/21aspnet/

    验证手机号(包含159,不包含小灵通)表达式^13[0-9]{1}[0-9]{8}|^15[9]{1}[0-9]{8}描述包含159的手机号130-139匹配的例子139XXXXXXXX不匹配的例子140XXXXXXXX,http://blog.csdn.net/21aspnet/

    验证电话号码号(很复杂,VS.NET2005给的是错的)表达式(不完美 )方案一 ((/(/d{3}/)|/d{3}-)|(/(/d{4}/)|/d{4}-))?(/d{8}|/d{7}) 方案二 (^[0-9]{3,4}/-[0-9]{3,8}$)|(^[0-9]{3,8}$)|(^/([0-9]{3,4}/)[0-9]{3,8}$)|(^0{0,1}13[0-9]{9}$)    支持手机号但也不完美描述

    上海:02112345678    3+8位 上海:021-12345678 上海:(021)-12345678 上海:(021)12345678 郑州:03711234567     4+7位 杭州:057112345678     4+8位 还有带上分机号,国家码的情况 由于情况非常复杂所以不建议前台做100%验证,到目前为止似乎也没有谁能写一个包含所有的类型,其实有很多情况本身就是矛盾的。 如果谁有更好 的验证电话的请留言

    匹配的例子 不匹配的例子 

    验证护照表达式

    (P/d{7})|G/d{8})

    描述验证P+7个数字和G+8个数字匹配的例子 不匹配的例子清清月儿, http://blog.csdn.net/21aspnet/

    验证IP表达式

    ^(25[0-5]|2[0-4][0-9]|[0-1]{1}[0-9]{2}|[1-9]{1}[0-9]{1}|[1-9])/.(25[0-5]|2[0-4][0-9]|[0-1]{1}[0-9]{2}|[1-9]{1}[0-9]{1}|[1-9]|0)/.(25[0-5]|2[0-4][0-9]|[0-1]{1}[0-9]{2}|[1-9]{1}[0-9]{1}|[1-9]|0)/.(25[0-5]|2[0-4][0-9]|[0-1]{1}[0-9]{2}|[1-9]{1}[0-9]{1}|[0-9])$

    描述验证IP匹配的例子192.168.0.1    222.234.1.4不匹配的例子

    验证域表达式

    ^[a-zA-Z0-9]+([a-zA-Z0-9/-/.]+)?/.(com|org|net|cn|com.cn|edu.cn|grv.cn|)$

    描述验证域匹配的例子csdn.net   baidu.com it.com.cn不匹配的例子192.168.0.1 

    验证信用卡表达式

    ^((?:4/d{3})|(?:5[1-5]/d{2})|(?:6011)|(?:3[68]/d{2})|(?:30[012345]/d))[ -]?(/d{4})[ -]?(/d{4})[ -]?(/d{4}|3[4,7]/d{13})$

    描述验证VISA卡,万事达卡,Discover卡,美国运通卡匹配的例子 不匹配的例子

    验证ISBN 国际标准书号表达式

    ^(/d[- ]*){9}[/dxX]$

    描述验证ISBN国际标准书号匹配的例子7-111-19947-2不匹配的例子

    验证GUID 全球唯一标识符表达式

    ^[A-Z0-9]{8}-[A-Z0-9]{4}-[A-Z0-9]{4}-[A-Z0-9]{4}-[A-Z0-9]{12}$

    描述格式8-4-4-4-12匹配的例子2064d355-c0b9-41d8-9ef7-9d8b26524751不匹配的例子

    验证文件路径和扩展名表达式

    ^([a-zA-Z]/:|//)//([^//]+//)*[^//:*?"<>|]+/.txt(l)?$

    描述检查路径和文件扩展名匹配的例子E:/mo.txt不匹配的例子E:/ , mo.doc, E:/mo.doc ,http://blog.csdn.net/21aspnet/

    验证Html颜色值表达式

    ^#?([a-f]|[A-F]|[0-9]){3}(([a-f]|[A-F]|[0-9]){3})?$

    描述检查颜色取值匹配的例子#FF0000不匹配的例子http://blog.csdn.net/21aspnet

     

     

     

     邮件地址最基本的格式可以看作是 <用户名@域名>。对于用户名,各个ISP没有统一的标准,除了数字和字母外,有的允许有<_>,有的允许有<.>,也有的两者皆可,或者允许其他的特殊字符。对此我们只能根据具体的情况加以判断。 文中假设除字母和数字外还允许<.><_>,<.><_>不能出现在首末位,<.><_>不能相连。域名中各段除数字和字母外只允许出现<->,且<->不能出现在首位和末位,各段用<.>连接。我们还可从域名得知最后一段大于一位且只有字母。 下面我们就可以依据以上假设写出如下表达式来判断是否该串是一个邮件地址:

    ^([a-z0-9A-Z]+[-|/.]?)+[a-z0-9A-Z]@([a-z0-9A-Z]+(-[a-z0-9A-Z]+)?/.)+[a-zA-Z]{2,}$

    稍作解释: ^:匹配开始 ([a-z0-9A-Z]+[-|/.]?)+:数字或字母>1位 + <->或<.>,以上组合重复1次以上 [a-z0-9A-Z]:用户名以数字或字母结尾 @:匹配<@> ( [a-z0-9A-Z]+:匹配多位数字或字母 (-[a-z0-9A-Z]+)?:匹配 -加多位数字或字母 0次或1次 /.:匹配<.> )+:匹配括号中内容多次 [a-zA-Z]{2,}:匹配字母2次以上 $:匹配结尾

    转载请注明原文地址: https://ju.6miu.com/read-650094.html

    最新回复(0)