正则表达式,又称正规表示式、正规表示法、正规表达式、规则表达式、常规表示法(英语:Regular Expression,在代码中常简写为regex、regexp或RE),是计算机科学的一个概念。正则表达式使用单个字符串来描述、匹配一系列匹配某个句法规则的字符串。在很多文本编辑器里,正则表达式通常被用来检索、替换那些匹配某个模式的文本。
以我的理解,正则即是一种查找规则,用与快速查找元素的规则。
基本规则
\b 元字符,代表单词开头或结尾,通常而言单词有空格、标点、tab 、换行等分割。不匹配字符只匹配位置
. 元字符,匹配除换行以外的任意字符。
- 元字符,代表数量,任意多次(可以 0 次)。前边的内容可以连续重复使用任意次以使整个表达式得到匹配。
- 元字符,任意多次(最少 1 次)
\d 元字符,匹配一个数字:\d\d\d\d\d\d\d\d\d\d\d ===> \d{11} 必须连续匹配 11 次
\s 元字符,匹配任意空白符:空格、制表符、换行符、中文全角空格等
\w 元字符,匹配字母、数字、下划线、汉字等
^ 匹配字符串的开始
$ 匹配字符串的结尾,如 /^\d{11}$/g 要求整个字符串匹配都要求规则,而不是在字符串中匹配符合规则的子串
字符转义
查找元字符本身需要字符转义,如查找 .:
重复
- 重复 0 次或者多次
- 重复 1 次或者多次
- ? 重复 0 次或者 1 次
- {n} 重复 n 次
- {n,} 至少重复 n 次
[未完待续]……