文件上传
文件上传
相较于纯聊天文本,文件(文档、图片、音频、视频)能承载更丰富的上下文信息。为降低用户反复复制粘贴的成本,AICenter 允许在应用内以上传变量(File / Array[File])的形式进行上传、解析、引用与下载,从而构建能够理解与处理多模态内容的智能体与工作流。
适用场景
- 文档分析:上传学术报告/行业白皮书,自动提炼要点并按需问答
- 代码审查:上传源代码,自动做结构梳理、质量建议与潜在缺陷提示
- 学习辅导:上传作业或讲义,获得个性化讲解与练习生成
- 合同审阅:上传合同文本,标注关键条款与潜在风险点
与知识库的区别
| 对比项 | 文件上传 | 知识库 |
|---|---|---|
| 信息来源 | 终端用户在会话或表单中临时上传 | 开发者预置并长期维护 |
| 灵活性 | 高,按需上传任意受支持类型 | 中,面向可复用的固定资料 |
| 处理方式 | 通常需经“文档提取器”等节点转为可解析文本,或由具备文件理解的模型直接处理 | 已预处理并向量化,可直接检索 |
| 典型场景 | 个性化文档处理(我的合同、我的报告) | 通用问答(产品手册、客服知识) |
| 持久性 | 多为临时使用 | 长期存储与迭代 |
快速开始
AI Center 在 对话流智能体 与 工作流 中均支持文件上传,并可通过变量引用在下游节点中使用。
开启方式(两类应用)
工作流:在【开始】节点添加 “单文件” 或 “多文件” 输入字段。

20251030092622tKgNluKO 对话流智能体:

20251030092745x9D39WGv - 在【功能】中启用文件上传(会话窗内直接上传);
- 或在【开始】节点添加 “单文件/多文件” 输入字段。
注意
二者互不影响:附加功能的上传限制不会作用于“开始”节点中的文件变量设置。
两种处理路径
路径 A:使用具备“文件理解/视觉”能力的模型(直连文件变量)
部分模型原生支持读取文件(如图片、部分文档或音频)。此时可在【LLM】节点** 中:
- 选择支持文件/视觉的模型;
- 启用视觉/文件输入能力;
- 在提示词或变量插入器中直接引用文件变量(来自“开始”节点或
sys.files)。
注意
使用前请以该模型的官方说明为准,确认其支持的文件类型与大小限制。
路径 B:经“文档提取器”转文本(通用做法)
若模型不支持直接读文件,或你需要稳定、可控的纯文本上下文:
- 在【开始】节点添加文件变量(单文件或文件列表);
- 使用【文档提取器】节点将文件解析为
string/array[string]; - 在【LLM】 节点的提示词中插入提取结果作为上下文;
- 使用【直接回复】或 【结束】节点输出结果。
在对话框中开启上传(对话流智能体)
- 在应用的“附加功能”中启用文件上传后,用户可在会话中随时上传 / 替换文件;
- 可配置最大文件数与大小限制;
- 该方式不等于自动具备“读文件”能力:
- 文档类文件通常需接“文档提取器”转文本;
- 图片可由启用视觉能力的 LLM 直接理解;
- 音频可由支持音频输入的 LLM 直接处理;
- 其他类型(如视频)可通过工具节点或自建服务处理。
注意
使用 sys.files 可获取会话框内上传的文件数组。如需区分多类型文件,请结合【列表操作】节点做筛选。
总结
文件上传让 AICenter 的对话流智能体与工作流拥有面向真实文件的多模态理解能力。
结合 文档提取器 / 视觉模型 / 工具节点 / 列表操作 等组件,你可以快速构建从上传 → 解析 → 理解 → 输出/下载的一站式处理链路。
