大模型评测对比

本页汇总不同大模型在 Data Agent 中的评测结果。

评测维度

大模型	数据问答表现（Nora）	深度代理表现（deepagent）	AI建模表现（sage）	测试日期
deepseek-chat	中等	良好	较差	2026/03/25
deepseek-v4-pro	良好	中等	良好	2026/04/24
deepseek-v4-flash	中等	中等	良好	2026/04/24
qwen3-max	中等	较差	中等	2026/03/25
qwen3 32b	良好	较差	较差	2026/03/25
qwen3.5-plus-2026-02-15	良好	良好	良好	2026/03/25
qwen3.6-27b	较差	良好	中等	2026/04/29
qwen3.6-plus	良好	中等	较差	2026/05/14
qwen3.7-max	中等	良好	良好	2026/05/25
doubao-seed-2-0-pro-260215	中等	良好	良好	2026/05/19
doubao-seed-2-0-lite-260428	较差	良好	较差	2026/05/19
kimi-k2.5	良好	良好	中等	2026/03/25
glm-5	中等	良好	良好	2026/03/25
glm-5.1	良好	良好	良好	2026/05/25
MiniMax-M2.5	较差	不支持	较差	2026/03/25