知识库
文档解析 / 向量切片 / RAG 检索 / 飞书生态打通,AI 回复与创作的"大脑"
最后更新:2026-05-15
能力概述
知识库是平台的**“大脑”**——为创作智能体、巡检智能体、舆情预警、AI 助手等场景提供知识检索能力。知识库中的文档被自动切片和向量化后,AI 可根据自然语言查询精准找到相关内容。
核心概念层级
知识库 → 文档 → 切片 → 向量
| 层级 | 说明 |
|---|---|
| 知识库 | 一个业务主题的知识集合,如”品牌话术库""产品 FAQ” |
| 文档 | 上传到知识库的一份完整资料,如 PDF、飞书文档、人工录入 FAQ |
| 切片 | 文档被自动切割成的小段,每段是一个独立的语义单元 |
| 向量(Embedding) | 切片内容的数学表示,用于语义相似度搜索 |
操作步骤
创建知识库
- 左侧导航进入 「知识库」
- 点击 「新建知识库」,填写名称(必填)与描述(选填)
- 点击 「确认」
添加知识内容
手动上传文件
- 点击目标知识库展开文档列表
- 点击 「上传文档」,支持格式:PDF / Word / Excel / Markdown / JSON / XML / TXT
- 系统自动解析→切片→向量化
手工录入 FAQ
适用于常见问答场景,一条 FAQ 生成一个文档和一个切片:
飞书生态导入
-
点击 「飞书导入」,选择类型:
- 飞书 Wiki:自动列出可见空间,勾选订阅后,空间内所有文档自动导入
- 飞书文档:粘贴链接 → 解析(订阅同步 或 一次性导入)
- 飞书多维表格:粘贴链接 → 解析后订阅
待补充截图
飞书导入配置
- 已订阅的源可设置 定时自动同步(每 30 分钟)或 手动触发同步
搜索预览
在知识库详情页的搜索框中输入问题(如”如何退款”),系统返回与该查询语义相似度最高的前 5 个切片。
| 特性 | 说明 |
|---|---|
| 语义匹配 | 基于向量相似度而非关键词匹配,可理解近义词和不同表述 |
| 预览 | 可提前评估 AI 回复 / 创作的检索效果 |
| 置信度 | 每条结果附带相似度分数(0~1,越高越相关) |
字段与状态
知识库列表字段
| 字段 | 说明 |
|---|---|
| 名称 | 业务语义命名 |
| 描述 | 用途说明(选填) |
| 文档数量 | 该知识库下的文档总数 |
| 总大小 | 所有文档的存储空间之和 |
| 总切片数 | 所有文档的切片总数,越多内容粒度越细 |
文档字段
| 字段 | 说明 |
|---|---|
| 文件名 | 文件原名 / 飞书文档标题 / FAQ 问题文本 |
| 文件类型 | PDF / Excel / Word / Markdown / JSON / TXT |
| 切片数量 | 文档被切割成的片段数,点击可查看每个切片详情 |
| 处理状态 | 待处理 / 处理中 / 已完成 / 失败 |
| 数据来源 | 手动上传 / 飞书 Wiki / 飞书文档 / 飞书多维表格 / 手工录入 FAQ |
文档处理状态
| 状态 | 显示 | 含义 |
|---|---|---|
| 待处理 | 灰色 | 刚创建,等待进入处理队列 |
| 处理中 | 蓝色,每 3 秒自动刷新 | 正在执行解析→切片→向量化 |
| 已完成 | 绿色 | 全部处理完成,可被语义搜索召回 |
| 失败 | 红色,显示错误详情 | 处理出错,可点击重试 |
切片字段
| 字段 | 说明 |
|---|---|
| 序号 | 切片在文档中的位置(从 0 开始) |
| Token 数量 | 切片文本的 Token 计数,用于估算信息密度 |
| 内容 | 切片完整文本,可编辑(保存后自动重算向量) |
| 相似度 | 语义搜索时与查询的向量相似度 |
订阅管理
已订阅的外部数据源显示在「在线导入」面板的「已订阅」Tab:
| 操作 | 说明 |
|---|---|
| 手动同步 | 立即拉取最新内容 |
| 开关自动同步 | 启用:定时自动拉取;禁用:仅手动 |
| 删除订阅 | 仅解除订阅关系,已导入文档不会被自动删除 |
典型场景
客服 RAG 库:上传”产品手册”、“退款政策”、“常见问题 FAQ”三类资料,绑定到巡检机器人。当用户咨询”怎么退款”,AI 自动检索”退款政策”片段,生成专业回复,避免使用预设死板模板。
品牌话术库:MCN 机构上传”品牌调性""文案风格""禁用词清单”等内部规范文档,绑定到创作智能体。每次 AI 生成作品时引用这些片段,确保产出符合品牌一致性。
飞书 Wiki 即时同步:教育机构把课程介绍维护在飞书 Wiki,订阅后开启自动同步。Wiki 一更新,30 分钟内知识库即同步,AI 助手回答永远基于最新课程信息。