正则表达式速查

3小时前更新 2 00

跨语言正则模式验证与文本解析工具

收录时间:
2026-02-25
正则表达式速查正则表达式速查
正则表达式速查

技能简介

正则表达式速查技能提供了一套实用的正则表达式模式库,支持JavaScript、Python、Go和命令行工具。涵盖验证、解析、提取和重构等常见场景,帮助快速解决文本处理需求。

能做什么

  • 验证用户输入:邮箱、URL、IP地址、电话号码、日期
  • 解析日志行:Apache/Nginx访问日志、Syslog、JSON日志
  • 从文本提取数据:ID、数字、令牌
  • 代码搜索替换:重命名变量、更新导入语句
  • 过滤文件或命令输出行
  • 调试不匹配的正则表达式

使用说明

安装指令:

clawhub install regex-patterns

元字符速查:

模式匹配内容示例
.任意字符(除换行)a.c匹配abc、a1c
\d数字[0-9]\d{3}匹配123
\w单词字符\w+匹配hello_123
\s空白字符\s+匹配空格/制表符
^行首^Error匹配以Error开头的行
$行尾.js$匹配以.js结尾的行

 

常用验证模式:

  • 邮箱:^[a-zA-Z0-9._%+-]+@[a-zA-Z0-9.-]+\.[a-zA-Z]{2,}$
  • URL:https?://[^\s/]+(/[^\s?]*)?(\?[^\s#]*)?
  • IPv4:\b(?:(?:25[0-5]|2[0-4]\d|[01]?\d\d?)\.){3}(?:25[0-5]|2[0-4]\d|[01]?\d\d?)\b
  • 美国电话:(?:\+1[-.\s]?)?\(?\d{3}\)?[-.\s]?\d{3}[-.\s]?\d{4}
  • UUID:[0-9a-fA-F]{8}-[0-9a-fA-F]{4}-[0-9a-fA-F]{4}-[0-9a-fA-F]{4}-[0-9a-fA-F]{12}
  • 语义版本:\bv?(\d+)\.(\d+)\.(\d+)(?:-([\w.]+))?(?:\+([\w.]+))?\b

日志解析示例:

# Apache访问日志提取IP和状态码
grep -oP '^\S+|\"\s\K\d{3}' access.log

# 提取JSON日志中的level字段
grep -oP '\"level\"\s*:\s*\"\K[^\"]+' app.log

# 查找JavaScript函数定义
grep -nP '(?:function\s+\w+|(?:const|let|var)\s+\w+\s*=\s*(?:async\s*)?\([^)]*\)\s*=>)' src/*.ts

量词说明:

  • *:0次或多次(贪婪)
  • +:1次或多次(贪婪)
  • ?:0次或1次(可选)
  • {3}:恰好3次
  • {2,5}:2到5次
  • *?+?:懒惰模式(匹配尽可能少)

输入与输出

见下方输入与输出表格。

项目内容
输入待验证的文本(邮箱/URL/IP/电话等)、待解析的日志内容、待搜索替换的代码文本、正则模式字符串
输出验证结果(匹配/不匹配)、提取的数据字段、替换后的文本、调试建议
适用人群开发人员、数据分析师、运维工程师、需要文本处理的技术人员
不包含正则表达式可视化工具、性能分析器、自动化测试生成

 

见下方输入输出表格。

风险提示

  • 复杂正则可能难以维护和调试
  • 贪婪量词可能导致性能问题(回溯)
  • 不同语言的正则引擎有细微差异
  • 原始页面信息不足,缺少完整的多语言代码示例

来源信息

原始链接:https://github.com/openclaw/skills/tree/main/skills/gitgoodordietrying/regex-patterns/SKILL.md
来源类型:github

数据统计

相关导航

暂无评论

none
暂无评论...