正则表达式语法全解析
1. 正则表达式基础
正则表达式是由以下元素组成的序列:
- 字面字符
- 匹配字符、字符集或字符类
- 重复量词
- 交替子句
- 用括号分组的子模式
1.1 匹配字符
大部分字符直接匹配自身,例如模式 ab 匹配一个 a 后面跟着一个 b 。通配符 . 可以匹配任意单个字符,如 a. 匹配一个 a 后面跟着任意字符。
需要注意的是,匹配可以在字符串的任意位置发生,不一定需要匹配整个字符串。可以使用锚点来改变这种行为。
1.2 字符集
可以使用 [xyz] 语法将匹配字符限制在一组字符中,方括号内的任意字符都可以匹配。例如, [Hh]ello 可以匹配 Hello 或 hello 。
还可以使用 [x-y] 语法指定字符集的范围,如 [0-9] 匹配任意数字。使用 [^xyz] 语法可以指定集合的补集,即匹配除了集合中字符之外的任意字符。例如, [^a-zA-Z] 匹配除了大小写字母之外的任意字符。
在字符集中使用特殊字符时,如果要匹配 ] ,可以将其放在方括
超级会员免费看
订阅专栏 解锁全文
3万+

被折叠的 条评论
为什么被折叠?



