文本提取
从长文本批量提取网址、邮箱、手机号、数字、IP 与身份证格式,支持去重排序,本地处理。
使用记录 0 展开
使用工具或停止输入约 3 秒后会自动保存输入内容,点击列表可恢复。仅存于本浏览器,不会上传。
从长文本中批量提取网址、邮箱、手机号、数字、IP等,按类型分 Tab 展示,支持去重排序与单独复制。
共找到 31 条(已选 4 种类型)
网址 URL · 1 条
使用说明
- 粘贴待分析文本,勾选要提取的类型
- 可选去重、排序后点击「提取」
- 按类型 Tab 查看结果并单独复制
文本提取说明
适用场景
- 从会议纪要、邮件正文、网页复制内容中批量提取链接、邮箱、电话
- 日志或报表里筛出 IP、数字列,复制到 Excel 或 列表求和
- 整理测试数据中的虚构身份证号(本工具不验证真伪,仅供格式筛选)
- 与 正则测试、 文本行处理 组合做深度清洗
提取在本地浏览器执行,原文不会上传服务器。
各类型匹配规则
| 类型 | 匹配规则 | 说明 |
|---|---|---|
| 网址 URL | http:// 或 https:// 开头链接 | 不含引号、尖括号内的 URL |
| 电子邮箱 | user@domain.com 格式 | 常见邮箱本地部分与域名 |
| 手机号 | 1 开头 11 位大陆手机号 | 前后不能紧邻其他数字 |
| 固话/400 | 区号-号码 或 400 电话 | 如 010-88886666、400-800-1234 |
| 数字 | 整数、小数、千分位数字 | 含负号与 1,234.56 形式 |
| IPv4 地址 | 四段 0~255 点分十进制 | 如 192.168.1.1 |
| 身份证号 | 18 位二代身份证格式 | 仅格式匹配,不校验校验位真伪 |
典型用法
- 客服工单:粘贴用户留言,勾选「手机号」「邮箱」,去重后复制联系方式列表
- 竞品调研:从长文中提取全部 URL,排序去重后导出
- 财务对账:勾选「数字」,配合去重得到金额候选;注意千分位数字可能与其他类型重叠
- 运维日志:提取 IPv4 地址,快速统计涉及的服务器
使用建议
- 一次勾选多种类型时,结果按类型分 Tab 展示,各 Tab 可单独复制
- 「数字」类型较宽,可能匹配日期片段;需要精确规则时请用正则测试工具
- 身份证号仅做格式提取,请勿用于非法采集真实个人信息
文本提取常见问题
- 数字类型会匹配哪些内容?
- 包含整数、小数及带千分位逗号的数字;范围较宽,可能与日期片段重叠,精确需求请用正则测试工具。
- 身份证号会校验真伪吗?
- 不会,仅按 18 位格式匹配,不验证校验位。