我找找就

文本提取

从长文本批量提取网址、邮箱、手机号、数字、IP 与身份证格式,支持去重排序,本地处理。

使用记录 0 展开

使用工具或停止输入约 3 秒后会自动保存输入内容,点击列表可恢复。仅存于本浏览器,不会上传。

    从长文本中批量提取网址、邮箱、手机号、数字、IP等,按类型分 Tab 展示,支持去重排序与单独复制。

    提取类型

    共找到 31 条(已选 4 种类型)

    网址 URL · 1 条

    使用说明

    1. 粘贴待分析文本,勾选要提取的类型
    2. 可选去重、排序后点击「提取」
    3. 按类型 Tab 查看结果并单独复制

    文本提取说明

    适用场景

    • 从会议纪要、邮件正文、网页复制内容中批量提取链接、邮箱、电话
    • 日志或报表里筛出 IP、数字列,复制到 Excel 或 列表求和
    • 整理测试数据中的虚构身份证号(本工具不验证真伪,仅供格式筛选)
    • 正则测试文本行处理 组合做深度清洗

    提取在本地浏览器执行,原文不会上传服务器。

    各类型匹配规则

    类型 匹配规则 说明
    网址 URL http:// 或 https:// 开头链接 不含引号、尖括号内的 URL
    电子邮箱 user@domain.com 格式 常见邮箱本地部分与域名
    手机号 1 开头 11 位大陆手机号 前后不能紧邻其他数字
    固话/400 区号-号码 或 400 电话 如 010-88886666、400-800-1234
    数字 整数、小数、千分位数字 含负号与 1,234.56 形式
    IPv4 地址 四段 0~255 点分十进制 如 192.168.1.1
    身份证号 18 位二代身份证格式 仅格式匹配,不校验校验位真伪

    典型用法

    • 客服工单:粘贴用户留言,勾选「手机号」「邮箱」,去重后复制联系方式列表
    • 竞品调研:从长文中提取全部 URL,排序去重后导出
    • 财务对账:勾选「数字」,配合去重得到金额候选;注意千分位数字可能与其他类型重叠
    • 运维日志:提取 IPv4 地址,快速统计涉及的服务器

    使用建议

    • 一次勾选多种类型时,结果按类型分 Tab 展示,各 Tab 可单独复制
    • 「数字」类型较宽,可能匹配日期片段;需要精确规则时请用正则测试工具
    • 身份证号仅做格式提取,请勿用于非法采集真实个人信息

    文本提取常见问题

    数字类型会匹配哪些内容?
    包含整数、小数及带千分位逗号的数字;范围较宽,可能与日期片段重叠,精确需求请用正则测试工具。
    身份证号会校验真伪吗?
    不会,仅按 18 位格式匹配,不验证校验位。