Data Agent 简介

Data Agent 是一套面向企业数据资产的智能问答与分析平台,能够将业务语言直接转化为可执行的数据查询,并结合 Agent 推理能力完成复杂任务。它在 ChatBI 的基础上升级了知识建模、推理记忆和系统集成能力,帮助企业以更少的配置获得更强大的数据应用。

产品定位

  • 多源数据统一访问:通过连接主流数据库、湖仓与 API,将分散的数据集中到统一的语义空间中。
  • 自然语言交互:让业务人员像与同事对话一样提出问题,系统自动解析意图、生成 SQL 并返回结构化可视化结果。
  • 可扩展的 Agent 框架:支持插拔式工具(SQL、API、脚本等),以多步推理的方式执行更复杂的分析任务。

核心能力

  1. 语义建模与上下文理解:按照业务主题构建指标、维度与业务术语映射,结合会话上下文消歧和补全意图。
  2. 智能执行链:先识别用户意图,再匹配数据源、生成优化后的 SQL/DSL,必要时串联多个步骤完成计算、过滤、汇总等操作。
  3. 数据分析报告:基于问答结果自动生成分析结论、趋势解读与可视化内容,帮助业务用户快速完成汇报与复盘。
  4. 开放集成:提供 API、Web 小部件、IM 机器人等多种集成方式,可嵌入到钉钉、飞书、企业微信或自建门户。

三种数据问答模式

Data Agent 支持三种典型的数据问答模式,适合从快速验证到企业级统一落地的不同阶段:

模式说明优点缺点适用场景
临时数据问答通过上传 csvExcel 等文件进行临时问答,文件内容需控制在大模型上下文限制内。无需接数据库,可快速导入临时数据验证效果。数据量受上下文窗口限制,不适合长期、稳定、持续更新的数据场景。临时分析、会议材料核对、一次性文件问答。
直接 NL2SQL不做业务建模,直接将自然语言转为 SQL 查询数据库。无需建模,支持所有表模型,接入速度快。无法给不同用户配置不同权限,结果稳定性无法保证 100%,更适合试用而非生产基座。初期上手、先看效果再推进建设。
语义建模问答按照 Data Agent 的语义建模方法论建设统一语义层后再进行问答。查询速度快、稳定性高、支持无限表数量,且可做分用户权限控制。需要前期建模投入。全公司全业务链路统一数据问答、分权限访问、要求高稳定性的正式生产场景。

其中,第三种模式是最推荐的落地方式。它更适合作为企业统一的数据问答底座,承接整个公司的数据查询需求,包括接入企业自有前端聊天界面、企业 OA、各类智能体以及 API 对接等场景。

典型使用场景

  • 面向经营管理层的实时经营分析、日报周报生成。
  • 业务运营人员的 ad-hoc 查询、活动效果追踪和复盘。
  • 数据分析师的多维钻取、交叉对比和指标监控。
  • 客服、销售等前线团队对客户、订单、库存等信息的即时查询。

架构模块

模块说明
接入层负责身份认证、权限校验以及多端组件(Web、IM、API)。
语义建模层定义主题域、模型、指标、维度以及共现关系,为自然语言解析提供上下文。
推理与执行层包含 LLM、提示模板、工具编排(SQL、API、脚本等)以及执行监控。
数据连接层提供数据库/数据湖/第三方 API 适配器,并管理连接配置、缓存与限流。
运维管理层提供日志、指标、告警、发布和多环境配置能力。

了解这些组成部分后,可以在“快速开始”章节中按照步骤完成首次部署与验证。随后再继续阅读“使用指南”,学习如何构建高质量语义模型与运维体验。