什么是正则表达式?
正则表达式(Regular Expression)是一种用于匹配字符串中字符组合的模式。它就像一种"通配符"语言,可以用来搜索、替换、验证文本。正则表达式广泛应用于表单验证、日志分析、数据提取、文本替换等场景。
基础元字符
.— 匹配任意单个字符(除换行符外)\d— 匹配任意数字,等价于[0-9]\w— 匹配字母、数字、下划线,等价于[a-zA-Z0-9_]\s— 匹配任意空白字符(空格、制表符、换行)\b— 匹配单词边界
量词
*— 匹配0次或多次(贪婪)+— 匹配1次或多次(贪婪)?— 匹配0次或1次{n}— 精确匹配n次{n,}— 至少匹配n次{n,m}— 匹配n到m次
字符类
[abc]— 匹配a、b或c中的任意一个[^abc]— 匹配除a、b、c之外的任意字符[a-z]— 匹配小写字母a到z[A-Z]— 匹配大写字母A到Z[0-9]— 匹配数字0到9
锚点
^— 匹配字符串开头$— 匹配字符串结尾
分组与引用
(abc)— 捕获分组,匹配并记住"abc"(?:abc)— 非捕获分组,匹配但不记住\1— 反向引用第一个捕获组(?=abc)— 正向先行断言(?!abc)— 负向先行断言
常用正则模式
- 邮箱:
^[\w.-]+@[\w.-]+\.[a-zA-Z]{2,}$ - 手机号(中国):
^1[3-9]\d{9}$ - URL:
^https?://[\w.-]+(:\d+)?(/.*)?$ - IP地址:
^\d{1,3}\.\d{1,3}\.\d{1,3}\.\d{1,3}$
修饰符
g— 全局匹配(找到所有匹配项)i— 不区分大小写m— 多行模式(^和$匹配每行开头/结尾)s— 点号匹配包括换行符
总结
正则表达式是一门"一次学习,终身受益"的技能。虽然语法看起来晦涩,但只要掌握了基础规则,就能通过组合创造出强大的匹配模式。建议配合在线正则测试工具多加练习。
推荐
分享这篇文章
相关文章
评论功能开发中
敬请期待