Word文档自动化

21分钟前更新 1 00
Word文档自动化Word文档自动化
Word文档自动化

技能简介

该技能通过Python脚本调用Windows COM接口,控制Microsoft Word或WPS Writer完成常见文档操作,包括读取文本、查找替换、插入内容、设置标题样式、调整页眉页脚、分页、合并拆分文档、导出PDF/TXT以及图片处理。

业务背景

合同、报告、标书等Word文档的整理、合并、拆分和格式调整是高频重复工作。该技能帮助业务人员自动化处理文档内容提取、批量替换、样式统一及格式转换,减少手工复制粘贴和低效排版时间,让团队专注核心内容创作,降低人为差错风险。

落地案例:法务部收到30份供应商合同需整合为一份总览文件,并提取关键条款生成摘要。使用该技能可自动合并全部文档、统一页眉页脚编号,再按章节拆分为独立文件分发给不同负责人审核。同时可将合同正文批量替换为脱敏版本导出PDF,全程无需手动打开Word操作。

能做什么

  • 提取Word文档纯文本内容
  • 批量查找并替换指定文本
  • 在文档开头或结尾插入新内容
  • 按前缀自动应用标题1/2/3样式
  • 统一设置页眉页脚文字
  • 在文档末尾插入分页符
  • 将多个文档合并为单一文件
  • 按页码范围拆分文档
  • 导出为PDF或TXT格式
  • 在文档末尾添加或替换图片

使用说明

环境准备

  1. 确保Windows系统已安装Microsoft Word或WPS Writer
  2. 安装Python及pywin32库:python -m pip install pywin32

基础命令示例

读取文档文本:

python {baseDir}/scripts/wps_word_automation.py read --input "C:\path\file.docx"

查找替换并另存:

python {baseDir}/scripts/wps_word_automation.py replace --input "C:\path\file.docx" --find "旧" --replace "新" --save "C:\path\out.docx"

导出为PDF:

python {baseDir}/scripts/wps_word_automation.py export --input "C:\path\file.docx" --format pdf --output "C:\path\out.pdf"

合并多个文档:

python {baseDir}/scripts/wps_word_automation.py merge --inputs "a.docx" "b.docx" --output "merged.docx"

拆分指定页码:

python {baseDir}/scripts/wps_word_automation.py split --input "C:\path\file.docx" --pages "1-3,4-6" --outdir "C:\out"

设置页眉页脚:

python {baseDir}/scripts/wps_word_automation.py header-footer --input "C:\path\file.docx" --header "标题" --footer "页脚" --save "C:\path\out.docx"

插入图片:

python {baseDir}/scripts/wps_word_automation.py image --input "C:\path\file.docx" --image "C:\path\img.png" --save "C:\path\out.docx"

可选参数:使用--app wps强制调用WPS;使用--visible true显示操作界面。

输入与输出

见下方输入与输出表格。

项目内容
输入本地Word文档路径(.docx)、操作指令(read/replace/insert/headings/header-footer/page-break/merge/split/export/image)、查找/替换文本、页码范围、图片文件路径
输出处理后文档(.docx/.pdf/.txt)、提取的纯文本、拆分后的多份文档
适用人群Windows办公用户、需要自动化文档处理的财务人员、合同/报告批量调整场景、格式标准化整理需求
不包含Mac/Linux系统支持、云端文档直接处理、批量文件夹遍历操作、复杂表格公式计算、文档加密解密功能

 

风险提示

  • 仅支持单文档操作,不适合大批量文件处理场景
  • 依赖Windows系统及已安装的Word/WPS软件环境
  • COM调用可能因软件版本差异出现兼容问题
  • 建议操作前备份原始文档,避免覆盖导致数据丢失
  • 复杂格式文档可能出现样式错乱,需人工核对

来源信息

原始链接:https://github.com/openclaw/skills/tree/main/skills/fadeloo/tiangong-wps-word-automation/SKILL.md
来源类型:开源技能仓库

数据统计

相关导航

暂无评论

none
暂无评论...