知识库

文档解析 / 向量切片 / RAG 检索 / 飞书生态打通,AI 回复与创作的"大脑"

最后更新:2026-05-15

能力概述

知识库是平台的**“大脑”**——为创作智能体、巡检智能体、舆情预警、AI 助手等场景提供知识检索能力。知识库中的文档被自动切片和向量化后,AI 可根据自然语言查询精准找到相关内容。

核心概念层级

知识库 → 文档 → 切片 → 向量
层级说明
知识库一个业务主题的知识集合,如”品牌话术库""产品 FAQ”
文档上传到知识库的一份完整资料,如 PDF、飞书文档、人工录入 FAQ
切片文档被自动切割成的小段,每段是一个独立的语义单元
向量(Embedding)切片内容的数学表示,用于语义相似度搜索
知识库列表页
知识库列表页

操作步骤

创建知识库

  1. 左侧导航进入 「知识库」
  2. 点击 「新建知识库」,填写名称(必填)与描述(选填)
  3. 点击 「确认」

添加知识内容

手动上传文件

  1. 点击目标知识库展开文档列表
  2. 点击 「上传文档」,支持格式:PDF / Word / Excel / Markdown / JSON / XML / TXT
  3. 系统自动解析→切片→向量化
上传文档弹窗
上传文档弹窗

手工录入 FAQ

适用于常见问答场景,一条 FAQ 生成一个文档和一个切片:

录入 FAQ 弹窗
录入 FAQ 弹窗

飞书生态导入

  1. 点击 「飞书导入」,选择类型:

    • 飞书 Wiki:自动列出可见空间,勾选订阅后,空间内所有文档自动导入
    • 飞书文档:粘贴链接 → 解析(订阅同步 或 一次性导入)
    • 飞书多维表格:粘贴链接 → 解析后订阅
待补充截图
飞书导入配置
  1. 已订阅的源可设置 定时自动同步(每 30 分钟)或 手动触发同步

搜索预览

在知识库详情页的搜索框中输入问题(如”如何退款”),系统返回与该查询语义相似度最高的前 5 个切片。

特性说明
语义匹配基于向量相似度而非关键词匹配,可理解近义词和不同表述
预览可提前评估 AI 回复 / 创作的检索效果
置信度每条结果附带相似度分数(0~1,越高越相关)

字段与状态

知识库列表字段

字段说明
名称业务语义命名
描述用途说明(选填)
文档数量该知识库下的文档总数
总大小所有文档的存储空间之和
总切片数所有文档的切片总数,越多内容粒度越细

文档字段

字段说明
文件名文件原名 / 飞书文档标题 / FAQ 问题文本
文件类型PDF / Excel / Word / Markdown / JSON / TXT
切片数量文档被切割成的片段数,点击可查看每个切片详情
处理状态待处理 / 处理中 / 已完成 / 失败
数据来源手动上传 / 飞书 Wiki / 飞书文档 / 飞书多维表格 / 手工录入 FAQ

文档处理状态

状态显示含义
待处理灰色刚创建,等待进入处理队列
处理中蓝色,每 3 秒自动刷新正在执行解析→切片→向量化
已完成绿色全部处理完成,可被语义搜索召回
失败红色,显示错误详情处理出错,可点击重试

切片字段

字段说明
序号切片在文档中的位置(从 0 开始)
Token 数量切片文本的 Token 计数,用于估算信息密度
内容切片完整文本,可编辑(保存后自动重算向量)
相似度语义搜索时与查询的向量相似度

订阅管理

已订阅的外部数据源显示在「在线导入」面板的「已订阅」Tab:

操作说明
手动同步立即拉取最新内容
开关自动同步启用:定时自动拉取;禁用:仅手动
删除订阅仅解除订阅关系,已导入文档不会被自动删除

典型场景

客服 RAG 库:上传”产品手册”、“退款政策”、“常见问题 FAQ”三类资料,绑定到巡检机器人。当用户咨询”怎么退款”,AI 自动检索”退款政策”片段,生成专业回复,避免使用预设死板模板。

品牌话术库:MCN 机构上传”品牌调性""文案风格""禁用词清单”等内部规范文档,绑定到创作智能体。每次 AI 生成作品时引用这些片段,确保产出符合品牌一致性。

飞书 Wiki 即时同步:教育机构把课程介绍维护在飞书 Wiki,订阅后开启自动同步。Wiki 一更新,30 分钟内知识库即同步,AI 助手回答永远基于最新课程信息。

相关链接