法律文档智能处理
合同审查与法律研究自
该技能用于从建筑施工规范文档中提取结构化数据,支持解析CSI MasterFormat章节编号、识别产品要求、提交物清单及引用的行业标准,输出可供估算和采购使用的格式化数据。
施工规范提取器帮助工程团队自动解析建筑规范PDF,将非结构化的技术文档转化为可直接用于估算报价和采购决策的清单数据。解决人工翻阅数百页规范效率低、关键信息遗漏的问题,确保投标阶段快速准确响应技术要求。
落地案例:某承包商收到一份200页的混凝土工程规范,需3天内完成材料清单。使用该技能上传PDF后,系统自动识别出03 30 00混凝土章节,提取出指定品牌的水泥型号、抗压强度参数,同时生成提交物清单(含28天强度检测报告模板、供应商质保函格式),并标注引用的ACI 318标准版本,采购团队据此直接发起询价。
安装依赖
pip install pdfplumber
基础调用
from specification_extractor import SpecificationExtractor
extractor = SpecificationExtractor()
result = extractor.extract_from_pdf("project_specs.pdf")
print(f"共{len(result.sections)}个章节")
print(f"发现{len(result.submittals)}项提交物要求")
访问提取结果
# 遍历产品要求
for product in result.products:
print(f"{product.section}: {product.manufacturer} {product.model}")
# 查看提交物清单
for sub in result.submittals:
print(f"[{sub.timing}] {sub.submittal_type}: {sub.description}")
见下方输入与输出表格。
| 项目 | 内容 |
|---|---|
| 输入 | PDF格式施工规范文档;Python 3.6+;pdfplumber依赖库 |
| 输出 | 结构化数据对象,包含CSI章节、产品规格、提交物要求、引用标准四类信息 |
| 适用人群 | 建筑工程造价师、采购专员、项目管理人员、BIM工程师 |
| 不包含 | 图纸解析、模型生成、价格数据、合规判定功能 |
原始链接:https://github.com/openclaw/skills/tree/main/skills/datadrivenconstruction/specification-extractor/SKILL.md
来源类型:GitHub开源项目