元数据
元数据
一、什么是元数据
1. 定义
元数据是描述其他数据的结构化信息,即“关于数据的数据”。
在知识库中,元数据用于说明文档的来源、内容、分类、时间等信息,帮助你更高效地检索、筛选与管理文档。
举例:一本书的目录、作者、出版日期等信息,就是它的元数据。
2. 基本概念
- 字段(Field):用于描述文档某一属性的标识项,例如
author、language - 字段值(Value):字段对应的实际内容,例如
Jack、English - 字段值计数(Value Count):表示该字段下存在多少个不同字段值(包括重复项)
- 值类型(Value Type):字段值的数据类型
- 字符串(String):文本型内容
- 数字(Number):数值型内容
- 时间(Time):日期或时间信息
二、管理元数据

1. 元数据管理入口
- 在知识库管理页面右上角点击 【元数据】,进入元数据管理面板
- 在此可以进行元数据字段的 创建、修改、删除 与 启用/禁用 操作
相关信息
字段管理为全局级操作。任何变更都会影响该知识库中所有文档的元数据信息。
2. 元数据字段类型
(1)内置元数据(Built-in)
- 位置:管理面板下半部分
- 启用方式:默认禁用,需手动开启
- 生成方式:启用后系统自动提取字段值
- 修改权限:字段与字段值均不可修改
- 应用范围:适用于所有已上传及新上传文档
- 典型字段:
document_name(string):文件名uploader(string):上传者upload_date(time):上传日期last_update_date(time):最后更新时间source(string):文件来源
(2)自定义元数据(Custom)
- 位置:管理面板上半部分
- 启用方式:用户手动创建
- 生成方式:完全自定义,由用户在文档中标注
- 修改权限:可编辑、删除字段与字段值
- 应用范围:新增字段会加入字段列表,需手动在文档中标记后生效
- 支持类型:字符串 / 数字 / 时间
3. 管理操作
(1)新建元数据字段
- 点击【+ 添加元数据】
- 选择字段值类型(字符串 / 数字 / 时间)
- 填写字段名称(仅支持小写字母、数字、下划线
_) - 点击【保存】
(2)修改元数据字段
- 点击字段右侧的【编辑】 按钮
- 修改字段名称(不支持修改字段类型)
- 点击 【保存】
- 修改后将同步更新所有引用该字段的文档
(3)删除元数据字段
- 点击字段右侧的【删除】
- 删除后,该字段及其所有值将从知识库及所有文档中移除
三、编辑文档的元数据

1. 批量编辑(多篇文档)
- 在文档列表中勾选目标文档
- 点击底部操作栏 【元数据】
- 在弹窗中执行以下操作:
- 添加字段:从下拉框选择已有字段,或点击【+ 新建元数据】
- 填写字段值:直接输入或选择时间
- 删除字段值:可单独删除或清空多个值。
- 删除字段(仅选中文档):仅在当前批量范围内删除字段,不影响全局字段列表
- 设置应用范围:
- 默认仅作用于已有该字段的文档
- 若开启“应用于所有文档”,则对所有选中文档生效

2. 编辑单篇文档
- 进入文档详情页
- 执行以下操作:
- 添加元数据:可新建或选择已有字段
- 填写字段值:在字段右侧输入内容
- 修改/删除值:点击“编辑” → “修改或删除” → “保存”
- 删除字段:仅删除当前文档中的字段,不影响全局字段
四、使用元数据筛选文档
在应用中可将元数据作为检索过滤条件,限定搜索范围,从而提高召回精度。
常见做法:
- 按
department、category、language等字段过滤文档 - 按
effective_date、last_update_date等时间字段筛选版本或时效
五、常见问题(FAQ)
元数据的作用是什么?
- 提升搜索效率:通过字段过滤提高命中率。
- 增强安全性:结合访问策略管控敏感信息。
- 优化数据管理:统一字段定义与命名规范。
- 支持自动化:在流程中可基于元数据触发动作。
字段列表与文档内元数据的区别?
- 字段列表(全局):预设可用字段,所有文档共享。
- 文档内元数据值:单篇文档的实际取值。
删除字段的影响范围?
- 在管理页面删除:全局移除字段与所有字段值。
- 在批量编辑中删除:仅影响选中文档。
- 在文档详情页删除:仅影响当前文档。
