正则表达式基本使用(一)

在 poc 过程中,正则表达式的作用在处理搜集到的信息的时候表现的异常明显。以下内容是关于正则的介绍和基本使用方法:

正则表达式基本使用(一)正则表达式基本使用(一)

  1. 基本匹配
    例如: 一个正则表达式 the, 它表示一个规则: 由字母t开始, 接着是h, 再接着是e.

“the” => The fat cat sat on **the **mat.

2. 元字符

| 元字符 | 描述 |
| :-: | --- |
| . | 句号匹配任意单个字符除了换行符. |
| [ ] | 字符种类. 匹配方括号内的任意字符. |
| [^ ] | 否定的字符种类. 匹配除了方括号里的任意字符 |
| * | 匹配>=0个重复的在*号之前的字符. |
| + | 匹配>=1个重复的+号前的字符. |
| ? | 标记?之前的字符为可选. |
| {n,m} | 匹配num个大括号之前的字符 (n <= num <= m). |
| (xyz) | 字符集, 匹配与 xyz 完全相等的字符串. |
| | | 或运算符,匹配符号前或后的字符. |
| \ | 转义字符,用于匹配一些保留的字符 `[ ] ( ) { } . * + ? ^ $ \ |` |
| ^ | 从开始行开始匹配. |
| $ | 从末端开始匹配. |

3. 点运算符

.匹配任意单个字符, 但不匹配换行符. 例如, 表达式.ar匹配一个任意字符后面跟着是ar的字符串.

".ar" => the **car** **par** ked in the **gar**age.

4 字符集
在方括号中使用连字符来指定字符集的范围. 在方括号中的字符集不关心顺序. 例如, 表达式[Tt]he 匹配 the 和 The.

"[Tt]he" =>** The** car parked in **the **garage.

5 否定字符集
一般来说 ^ 表示一个字符串的开头, 但它用在一个方括号的开头的时候, 它表示这个字符集是否定的. 例如, 表达式[^c]ar 匹配一个后面跟着ar的除了c的任意字符.

"[^c]ar" => The car [**par**]ked in the [**gar**])age.