记录一下正则表达式语法规则

2022-08-15 16:55 86 2 条评论 我没有领悟

记录一下正则表达式语法规则

正则表达式

正则表达式是由普通字符(例如字符 a 到 z)以及特殊字符(称为"元字符")构成的文字序列,可以是单个的字符、字符集合、字符范围、字符间的选择或者所有这些组件的任意组合。

正则应该是我们在写 PHP 和 JS 时,应该是经常要用到的一个方法了。然而正则太过强大,语法及规则不易掌握,需要经常查找翻阅资料。在此,下面的表格中列举了构成正则表达式的一些语法规则及其含义,以供查阅参考。

1 字符

语法说明表达式示例匹配结果
一般字符匹配自身abcabc
.匹配任意除换行符"\n"外的字符, 在 DOTALL 模式中也能匹配换行符a.cabc
\转义字符,使后一个字符改变原来的意思;
如果字符串中有字符 * 需要匹配,可以使用 \* 或者字符集[*]。
a\.c
a\\c
a.c
a\c
[...]字符集(字符类),对应的位置可以是字符集中任意字符。
字符集中的字符可以逐个列出,也可以给出范围,如 [abc] 或 [a-c],
第一个字符如果是 ^ 则表示取反,如 [^abc] 表示除了 abc 之外的其他字符。
a[bcd]eabe 或 ace 或 ade
\d数字:[0-9]a\dca1c
\D非数字:[^\d]a\Dcabc
\s空白字符:[<空格>\t\r\n\f\v]a\sca c
\S非空白字符:[^\s]a\Scabc
\w单词字符:[A-Za-z0-9]a\wcabc
\W非单词字符:[^\w]a\Wca c

2 数量词(用在字符或 (...) 之后)

语法说明表达式示例匹配结果
*匹配前一个字符 0 或无限次abc*ab 或 abccc
+匹配前一个字符 1 次或无限次abc+abc 或 abccc
?匹配前一个字符 0 次或 1 次abc?ab 或 abc
{m}匹配前一个字符 m 次ab{2}cabbc
{m,n}匹配前一个字符 m 至 n 次,m 和 n 可以省略,若省略 m,则匹配 0 至 n 次;
若省略 n,则匹配 m 至无限次
ab{1,2}cabc 或 abbc

3 边界匹配

语法说明表达式示例匹配结果
^匹配字符串开头,在多行模式中匹配每一行的开头^abcabc
$匹配字符串末尾,在多行模式中匹配每一行的末尾abc$abc
\A仅匹配字符串开头\Aabcabc
\Z仅匹配字符串末尾abc\Zabc
\b匹配 \w 和 \W 之间a\b!bca!bc
\B[^\b]a\Bbcabc

4 逻辑、分组

语法说明表达式示例匹配结果
|| 代表左右表达式任意匹配一个,优先匹配左边的表达式abc|defabc 或 def
(...)括起来的表达式将作为分组,分组将作为一个整体,可以后接数量词(abc){2}abcabc
(?P<name>...)分组,功能与 (...) 相同,但会指定一个额外的别名(?P<id>abc){2}abcabc
\<number>引用编号为 <number> 的分组匹配到的字符串(\d)abc\11abe1 或 5abc5
(?P=name)引用别名为 <name> 的分组匹配到的字符串(?P<id>\d)abc(?P=id)1abe1 或 5abc5

5 特殊构造(不作为分组)

语法说明表达式示例匹配结果
(?:...)(…) 的不分组版本,用于使用 "|" 或后接数量词(?:abc){2}abcabc
(?iLmsux)iLmsux 中的每个字符代表一种匹配模式,只能用在正则表达式的开头,可选多个(?i)abcAbC
(?#...)# 后的内容将作为注释被忽略。abc(?#comment)123 abc123
(?=...)之后的字符串内容需要匹配表达式才能成功匹配a(?=\d)后面是数字的 a
(?!...)之后的字符串内容需要不匹配表达式才能成功匹配a(?!\d)后面不是数字的 a
(?<=...)之前的字符串内容需要匹配表达式才能成功匹配(?<=\d)a前面是数字的 a
(?<!...)之前的字符串内容需要不匹配表达式才能成功匹配(?<!\d)a前面不是数字的 a

「点点赞赏,手留余香」

还没有人赞赏,快来当第一个赞赏的人吧!

本文转载自我没有领悟,本文观点不代表龙笑天下立场,版权归原作者所有,欢迎分享本文,转载请保留出处!

2021-12-25

2022-01-28

发表评论

评论
正在努力加载中...
扫一扫二维码分享