业务背景
B站作为年轻人的潮流文化社区,拥有海量视频内容与活跃创作者生态。平台每日产生大量用户咨询,涵盖UP主规则、版权政策、稿件审核、活动投稿、会员权益等多类问题。
传统客服模式面临三重挑战:
知识覆盖广:平台规则涉及投稿规范、社区公约、版权管理、商业合作等数十个领域,知识点多且更新频繁。
长尾问题多:用户咨询不仅包括高频FAQ,还涉及大量个性化场景,如”这个视频为什么被限流””联合投稿权限如何开通”等。
内容形态杂:除文本外,用户常上传截图、视频片段辅助说明,需要多模态理解能力。
技术方案
1. 领域知识库构建
将分散的业务知识统一整合为结构化知识库:
知识来源:
– 业务文档:投稿规则、审核标准、运营政策
– 历史会话:人工客服处理记录与优秀回复
– FAQ集合:高频问题标准答案
– 社区公约:弹幕礼仪、评论规范、版权说明
知识处理:
– 文本分块:按段落/规则条目切分,保留上下文
– 向量化:使用领域适配的Embedding模型生成向量
– 元数据标注:标注知识类别、适用场景、生效时间
2. 检索增强生成(RAG)
通过检索外部知识增强大模型回答能力,降低幻觉风险。
检索流程:
“`
用户提问:"联合投稿怎么开通?"
Query处理:
– 意图识别:功能开通咨询
– Query改写:扩展同义词(协作投稿、多人投稿)
– 子Query拆分:开通条件、操作步骤、权限要求
检索执行:
– 向量检索:匹配语义相似的文档片段
– 关键词检索:精确匹配规则条款
– 重排序:Cross-encoder模型精排Top-K结果
结果融合:
– 合并多路检索结果
– 去重与相关性过滤
– 按时间戳筛选有效规则
Prompt构建:
– 系统指令:"你是B站客服助手,基于以下参考资料回答用户问题"
– 参考资料:检索到的相关文档片段
– 用户问题:原始提问
答案生成:
– 大模型基于参考资料生成回答
– 标注信息来源
– 不确定时主动拒答
“`
3. 长文本与多轮对话
针对复杂问题与上下文依赖场景:
长文本处理:
– 扩大上下文窗口至32K/64K tokens
– 引入弱相关知识作为背景信息
– 多轮交互澄清用户真实意图
多轮对话管理:
– 维护对话状态与历史上下文
– 指代消解(”这个””那个”的语义还原)
– 意图切换检测与话题追踪
4. 安全与可控
内容平台对回答安全性要求极高:
拒答机制:
– 检索结果相关性低于阈值时拒答
– 涉及敏感话题时转人工
– 无法验证的信息不随意生成
内容审核:
– 生成回答经安全模型过滤
– 高风险回答人工复核
– 定期抽样质检确保合规
技术架构
“`
┌─────────────────────────────────────────────────────────┐
│ 知识层 │
│ ┌─────────┐ ┌─────────┐ ┌─────────┐ ┌─────────┐ │
│ │业务文档 │ │历史会话 │ │FAQ集合 │ │社区公约 │ │
│ └────┬────┘ └────┬────┘ └────┬────┘ └────┬────┘ │
└───────┼────────────┼────────────┼────────────┼─────────┘
│ │ │ │
└────────────┴────────────┴────────────┘
│
▼
┌─────────────────────────────────────────────────────────┐
│ 处理层 │
│ ┌─────────────┐ ┌─────────────┐ ┌─────────────┐ │
│ │ 文本分块 │ │ 向量化 │ │ 索引构建 │ │
│ └─────────────┘ └─────────────┘ └─────────────┘ │
└─────────────────────────────────────────────────────────┘
│
▼
┌─────────────────────────────────────────────────────────┐
│ 检索层 │
│ ┌─────────────────────────────────────────────────┐ │
│ │ Query理解与改写 │ │
│ │ ┌─────────┐ ┌─────────┐ ┌─────────┐ │ │
│ │ │意图识别 │───▶│Query改写│───▶│子Query │ │ │
│ │ └─────────┘ └─────────┘ │拆分 │ │ │
│ │ └────┬────┘ │ │
│ └─────────────────────────────────────┼──────────┘ │
└────────────────────────────────────────┼────────────────┘
│
┌──────────────┼──────────────┐
│ │ │
▼ ▼ ▼
┌─────────────────────────────────────────────────────────┐
│ 生成层 │
│ ┌─────────────┐ ┌─────────────┐ ┌─────────────┐ │
│ │ 向量检索 │ │ 关键词检索 │ │ 重排序 │ │
│ └─────────────┘ └─────────────┘ └─────────────┘ │
│ │ │
│ ▼ │
│ ┌─────────────────────────────────────────────────┐ │
│ │ 大模型生成(RAG微调) │ │
│ │ – 答案生成 │ │
│ │ – 来源标注 │ │
│ │ – 拒答判断 │ │
│ └─────────────────────────────────────────────────┘ │
└─────────────────────────────────────────────────────────┘
“`
关键技术细节
1. Query改写策略
| 策略 | 说明 | 示例 |
|---|---|---|
| Re-writing | 同义改写 | "联合投稿"→"协作投稿" |
| Step-back | 抽象泛化 | "这个视频为什么被限流"→"视频推荐机制" |
| Sub-query | 拆分细化 | "如何成为UP主"→注册/认证/投稿 |
2. 检索重排序
粗排:向量相似度召回Top-100
精排:Cross-encoder计算Query-Doc相关性,输出Top-5
3. RAG微调
在基础大模型上进行领域适配:
– 监督微调(SFT):使用标注的客服对话数据
– 思维链(CoT):引导模型展示推理过程
– 函数调用(ReAct):支持调用外部工具验证信息
实施效果
系统上线后,客服效能显著提升:
| 指标 | 优化前 | 优化后 | 提升幅度 |
|---|---|---|---|
| 智能客服拦截率 | 基线 | – | +20% |
| 回答准确率 | 基线 | – | +15% |
| 平均响应时间 | 基线 | – | -40% |
| 人工客服工作量 | 基线 | – | -30% |
| 用户满意度 | 基线 | – | +12% |
关键价值:
知识覆盖提升:RAG架构支持海量知识动态更新,新规则上线后小时级同步至知识库。
长尾问题处理:通过检索增强,有效回答传统FAQ无法覆盖的个性化问题。
安全可控:检索结果约束生成范围,显著降低幻觉风险,保障回答合规性。
方案延展
该方案对内容平台具有借鉴意义,可扩展至以下场景:
创作者服务:投稿指导、数据分析、变现咨询
版权管理:侵权检测、申诉处理、授权咨询
社区治理:违规判定、申诉复核、规则解读
多模态客服:结合OCR识别用户上传的截图,结合视频内容理解进行精准回复
总结
视频平台内容客服智能化的核心在于:构建高质量领域知识库,通过RAG技术增强大模型回答能力,在保障安全可控的前提下提升服务效率与用户体验。技术不是替代人工,而是让有限的客服资源覆盖更广泛的用户需求,同时确保回答的准确性与合规性。
*本文技术方案参考了视频平台智能客服实践,该系统已在内容审核、创作者服务、用户咨询等场景中落地应用。*


