技术要求

本章节说明部署与实施 Data Agent 所需的硬件要求、技术背景与能力要求。

硬件要求

根据不同的部署方式,硬件要求有所不同:

服务要求

Data Agent 依赖以下服务组件:

服务版本要求说明
Redis8缓存服务
PostgreSQL17元信息数据库,需安装 pgvector 扩展

大模型要求

Data Agent 需要接入以下两类大模型 API:

主模型(Chat Completion)

  • 需要支持 Tool Call(Function Calling)功能的非推理类大模型
  • 最小参数量32B,但必须支持 Tool Call 能力
  • 推荐参数量235B 以上
  • 可前往 https://models.dev/ 查询模型是否支持 Tool Call 功能
  • 接入前建议按《大模型可用性测试》完成验收

大模型评测对比

以下是我们针对不同大模型在 Data Agent 各模块中的评测对比,供您选择模型时参考:

大模型数据问答表现(Nora)深度代理表现(deepagent)AI建模表现(sage)
qwen3.5-plus-2026-02-15良好良好良好
deepseek-chat中等良好较差
qwen3-max中等较差中等
qwen3 32b良好较差较差
kimi-k2.5良好良好中等
glm-5中等良好良好
MiniMax-M2.5较差不支持较差

说明:以上评测结果仅供参考,实际表现可能因具体场景而异。

向量模型(Embedding)

  • 需要提供一个 Embedding 大模型 API
  • 用于文本向量化,支持语义检索
  • 同样可前往 https://models.dev/ 查询 Embedding 模型

外部 API 要求

TBD

对实施人员的要求

实施人员负责系统的业务建模与配置,需要具备以下能力:

  • Docker 基础操作:会使用 Docker 和 Docker Compose 进行容器管理。
  • 熟悉大模型 API 技术:了解大模型标准 API 格式、baseURL 的定义,理解聊天 API(Chat Completion)与向量化 API(Embedding)各自的作用。
  • 精通 SQL:能够熟练编写和优化 SQL 查询语句。
  • 精通数据建模理论:熟悉三范式、雪花模型、维度建模、大宽表等相关概念。本产品使用三范式或雪花模型建模方法论
  • 深入理解业务:能够将业务逻辑理顺,并表达成三范式模型。这是实施成功的关键。
  • 初级 JavaScript 脚本编写能力:用于高级功能配置,对语言要求不高,可以现学。

对部署人员的要求

部署人员负责系统的安装与运维,需要具备以下能力:

  • 容器编排工具:会使用 Docker 和 Docker Compose,或 Kubernetes (K8s)。
  • Linux Shell 操作:熟悉基本的 Linux 命令行操作。