搜索
K
指南
API
简体中文
简体中文
English
繁體中文
主题
语言
简体中文
简体中文
English
繁體中文
✦
AI问答
菜单
目录
#
大模型评测对比
复制 Markdown
打开
本页汇总不同大模型在 Data Agent 中的评测结果。
#
评测维度
数据问答表现(Nora)
深度代理表现(deepagent)
AI建模表现(sage)
#
评测结果
大模型
数据问答表现(Nora)
深度代理表现(deepagent)
AI建模表现(sage)
测试日期
deepseek-chat
中等
良好
较差
2026/03/25
deepseek-v4-pro
良好
中等
良好
2026/04/24
deepseek-v4-flash
中等
中等
良好
2026/04/24
qwen3-max
中等
较差
中等
2026/03/25
qwen3 32b
良好
较差
较差
2026/03/25
qwen3.5-plus-2026-02-15
良好
良好
良好
2026/03/25
qwen3.6-27b
较差
良好
中等
2026/04/29
qwen3.6-plus
良好
中等
较差
2026/05/14
qwen3.7-max
中等
良好
良好
2026/05/25
doubao-seed-2-0-pro-260215
中等
良好
良好
2026/05/19
doubao-seed-2-0-lite-260428
较差
良好
较差
2026/05/19
kimi-k2.5
良好
良好
中等
2026/03/25
glm-5
中等
良好
良好
2026/03/25
glm-5.1
良好
良好
良好
2026/05/25
MiniMax-M2.5
较差
不支持
较差
2026/03/25
#
说明
本页仅用于横向对比不同模型的整体表现。
评测结果会随着产品能力、测试用例和模型版本变化而调整。
如需查看详细原因与测试现象,请前往
完整评测页面
。