施工规范提取器

20分钟前更新 2 00

从建筑规范文档提取结

收录时间:
2026-02-26
施工规范提取器施工规范提取器
施工规范提取器

技能简介

该技能用于从建筑施工规范文档中提取结构化数据,支持解析CSI MasterFormat章节编号、识别产品要求、提交物清单及引用的行业标准,输出可供估算和采购使用的格式化数据。

业务背景

施工规范提取器帮助工程团队自动解析建筑规范PDF,将非结构化的技术文档转化为可直接用于估算报价和采购决策的清单数据。解决人工翻阅数百页规范效率低、关键信息遗漏的问题,确保投标阶段快速准确响应技术要求。

落地案例:某承包商收到一份200页的混凝土工程规范,需3天内完成材料清单。使用该技能上传PDF后,系统自动识别出03 30 00混凝土章节,提取出指定品牌的水泥型号、抗压强度参数,同时生成提交物清单(含28天强度检测报告模板、供应商质保函格式),并标注引用的ACI 318标准版本,采购团队据此直接发起询价。

能做什么

  • 自动识别并拆分CSI标准章节(如03 30 00混凝土)
  • 提取产品规格:制造商、型号、性能参数
  • 生成提交物清单:图纸样板、检测报告、质保文件等
  • 识别引用的ASTM、ANSI、ACI等行业标准
  • 输出JSON/结构化数据供下游系统使用

使用说明

安装依赖

pip install pdfplumber

基础调用

from specification_extractor import SpecificationExtractor

extractor = SpecificationExtractor()
result = extractor.extract_from_pdf("project_specs.pdf")

print(f"共{len(result.sections)}个章节")
print(f"发现{len(result.submittals)}项提交物要求")

访问提取结果

# 遍历产品要求
for product in result.products:
    print(f"{product.section}: {product.manufacturer} {product.model}")

# 查看提交物清单
for sub in result.submittals:
    print(f"[{sub.timing}] {sub.submittal_type}: {sub.description}")

输入与输出

见下方输入与输出表格。

项目内容
输入PDF格式施工规范文档;Python 3.6+;pdfplumber依赖库
输出结构化数据对象,包含CSI章节、产品规格、提交物要求、引用标准四类信息
适用人群建筑工程造价师、采购专员、项目管理人员、BIM工程师
不包含图纸解析、模型生成、价格数据、合规判定功能

 

风险提示

  • 扫描版PDF需先OCR处理,纯图片格式无法直接解析
  • 非标准CSI格式的规范文档可能识别不完整
  • 复杂表格嵌套的产品数据可能丢失层级关系
  • 引用标准的版本号需人工核对时效性

来源信息

原始链接:https://github.com/openclaw/skills/tree/main/skills/datadrivenconstruction/specification-extractor/SKILL.md
来源类型:GitHub开源项目

数据统计

相关导航

暂无评论

none
暂无评论...