技术要求
本章节说明部署与实施 Data Agent 所需的硬件要求、技术背景与能力要求。
硬件要求
根据不同的部署方式,硬件要求有所不同:
服务要求
Data Agent 依赖以下服务组件:
大模型要求
Data Agent 需要接入以下两类大模型 API:
主模型(Chat Completion)
- 需要支持 Tool Call(Function Calling)功能的非推理类大模型
- 最小参数量:32B,但必须支持 Tool Call 能力
- 推荐参数量:235B 以上
- 可前往 https://models.dev/ 查询模型是否支持 Tool Call 功能
- 接入前建议按《大模型可用性测试》完成验收
大模型评测对比
以下是我们针对不同大模型在 Data Agent 各模块中的评测对比,供您选择模型时参考:
说明:以上评测结果仅供参考,实际表现可能因具体场景而异。
向量模型(Embedding)
- 需要提供一个 Embedding 大模型 API
- 用于文本向量化,支持语义检索
- 同样可前往 https://models.dev/ 查询 Embedding 模型
外部 API 要求
TBD
对实施人员的要求
实施人员负责系统的业务建模与配置,需要具备以下能力:
- Docker 基础操作:会使用 Docker 和 Docker Compose 进行容器管理。
- 熟悉大模型 API 技术:了解大模型标准 API 格式、baseURL 的定义,理解聊天 API(Chat Completion)与向量化 API(Embedding)各自的作用。
- 精通 SQL:能够熟练编写和优化 SQL 查询语句。
- 精通数据建模理论:熟悉三范式、雪花模型、维度建模、大宽表等相关概念。本产品使用三范式或雪花模型建模方法论。
- 深入理解业务:能够将业务逻辑理顺,并表达成三范式模型。这是实施成功的关键。
- 初级 JavaScript 脚本编写能力:用于高级功能配置,对语言要求不高,可以现学。
对部署人员的要求
部署人员负责系统的安装与运维,需要具备以下能力:
- 容器编排工具:会使用 Docker 和 Docker Compose,或 Kubernetes (K8s)。
- Linux Shell 操作:熟悉基本的 Linux 命令行操作。

