正则表达式速查手册:从入门到精通

作者2024年3月1日3 分钟阅读

什么是正则表达式?

正则表达式(Regular Expression)是一种用于匹配字符串中字符组合的模式。它就像一种"通配符"语言,可以用来搜索、替换、验证文本。正则表达式广泛应用于表单验证、日志分析、数据提取、文本替换等场景。

基础元字符

  • . — 匹配任意单个字符(除换行符外)
  • \d — 匹配任意数字,等价于 [0-9]
  • \w — 匹配字母、数字、下划线,等价于 [a-zA-Z0-9_]
  • \s — 匹配任意空白字符(空格、制表符、换行)
  • \b — 匹配单词边界

量词

  • * — 匹配0次或多次(贪婪)
  • + — 匹配1次或多次(贪婪)
  • ? — 匹配0次或1次
  • {n} — 精确匹配n次
  • {n,} — 至少匹配n次
  • {n,m} — 匹配n到m次

字符类

  • [abc] — 匹配a、b或c中的任意一个
  • [^abc] — 匹配除a、b、c之外的任意字符
  • [a-z] — 匹配小写字母a到z
  • [A-Z] — 匹配大写字母A到Z
  • [0-9] — 匹配数字0到9

锚点

  • ^ — 匹配字符串开头
  • $ — 匹配字符串结尾

分组与引用

  • (abc) — 捕获分组,匹配并记住"abc"
  • (?:abc) — 非捕获分组,匹配但不记住
  • \1 — 反向引用第一个捕获组
  • (?=abc) — 正向先行断言
  • (?!abc) — 负向先行断言

常用正则模式

  • 邮箱:^[\w.-]+@[\w.-]+\.[a-zA-Z]{2,}$
  • 手机号(中国):^1[3-9]\d{9}$
  • URL:^https?://[\w.-]+(:\d+)?(/.*)?$
  • IP地址:^\d{1,3}\.\d{1,3}\.\d{1,3}\.\d{1,3}$

修饰符

  • g — 全局匹配(找到所有匹配项)
  • i — 不区分大小写
  • m — 多行模式(^和$匹配每行开头/结尾)
  • s — 点号匹配包括换行符

总结

正则表达式是一门"一次学习,终身受益"的技能。虽然语法看起来晦涩,但只要掌握了基础规则,就能通过组合创造出强大的匹配模式。建议配合在线正则测试工具多加练习。

推荐

试试我们的在线字数统计工具

立即体验专业的在线工具,完全免费,无需注册。

立即使用
分享这篇文章

作者

资深内容创作者,致力于分享实用的在线工具和使用教程。

查看全部文章

相关文章

评论功能开发中

敬请期待