文档编译记忆化

19分钟前更新 1 00

网页文档转AI原生记

收录时间:
2026-02-26
文档编译记忆化文档编译记忆化
文档编译记忆化

技能简介

Moltext 将互联网上的传统产品文档转换为高密度的 AI 原生上下文/记忆,使智能体能够直接读取技术结构而非人类可读页面。

业务背景

Moltext 将分散的网页技术文档转化为 AI 可直接理解的结构化知识。自动抓取并清洗网站内容,输出保留代码块与 API 签名的纯净技术规格,消除视觉噪音干扰。帮助智能体快速掌握工具库核心能力,提升自动化任务执行效率,减少人工整理文档的人力投入。

落地案例:运维团队需让智能体掌握最新 AWS 服务接口,使用 Moltext 抓取官方文档站点,启用 –raw 模式剥离页面样式与导航元素,生成压缩后的结构化 Markdown。该记忆文件被加载至智能体上下文,使其直接读取 API 参数与调用示例,无需反复检索原始网页即可完成云资源编排任务的自动化处理。

能做什么

  • 抓取任意网站文档并剥离视觉噪音
  • 输出结构化 Markdown 保留代码块与 API 签名
  • 为大型工具库(如 AWS、React)生成压缩记忆文件
  • 支持原始模式直接获取技术规格

使用说明

安装指令:

npm install -g moltext

步骤一:编译文档

moltext <url> --raw --output <filename.md>

示例:学习 foobar 库

moltext https://docs.foobar.com --raw --output foobar_context.md

步骤二:读取生成的上下文

cat foobar_context.md

建议:对大型工具始终使用 --raw 模式;输出文件已针对智能体解析优化。

输入与输出

见下方输入与输出表格。

项目内容
输入目标文档 URL、输出文件名、–raw 模式开关
输出结构化 Markdown 文件,保留代码块与 API 签名
适用人群需要快速掌握大型工具库的智能体、上下文窗口受限场景
不包含自动去重与增量更新、可视化渲染、非网页格式解析

 

风险提示

  • 依赖外部网站可用性,目标站点变更或封锁会导致抓取失败
  • 生成内容质量受原始文档结构影响,混乱源码可能产生噪声
  • 未内置去重机制,多次编译相同 URL 会产生重复记忆
  • Node.js 环境,容器内缺失 npm 时无法运行

来源信息

原始链接:https://github.com/openclaw/skills/tree/main/skills/uditakhourii/moltext/SKILL.md
来源类型:GitHub 仓库

数据统计

相关导航

暂无评论

none
暂无评论...