同义词配置

场景价值

首先明确一点,在问答时,系统会检索意图近似的词向量,同义词配置用显式规则把“用户说的业务语言”映射到“系统识别的模型字段”,是语义检索可控性的第一道防线。它可以显著降低理解失败率,让问答体验保持业务语境的一致性。

  1. 兜底理解:把罕见叫法映射到既有指标,避免“听不懂”。
  2. 统一话语体系:同一指标在不同团队的别称统一管理,跨部门沟通不再靠口口相传。
  3. 沉淀行业语料:把一线说法配置成规则,平台使用越久越懂业务。
  4. 应对口语化提问:即使用户使用高频口头禅,系统也能稳定命中原字段。

例:围绕“销售额”的常见叫法包括“实收”“到账金额”“回款”“GMV”“成交金额”“实付金额”“支付金额”“成交额”“落袋金额”等,把这些别名全部收录后,意图命中率会显著提升。

配置入口速览

类型入口作用对象
模型同义词系统搭建 → 数据管理 → 业务建模模型、字段的概念层
全局同义词系统搭建 → 知识库配置 → 全局同义词数据库中储存的名词

同义词类型

模型同义词

  • 适用场景:用户提到的模型/字段仍属于抽象概念层,只是叫法不同;常发生在建模阶段与业务方沟通。
  • 配置要点
    • 在 schema “基本信息”里维护模型别名,确保概念名称统一。
    • 在“属性列表”为字段补充业务含义及口语化别名,覆盖常见变体。
  • 生效机制:语义匹配阶段能够通过同义词匹配到对应模型/字段,减少“找不到概念”的概率。

全局同义词

  • 适用场景:真实存在的名词在不同团队之间有多个叫法,需要在知识库层统一。
  • 配置要点
    • 需要是数据库中确实存在、可直接查询的字段添加别名,否则不会生效。
    • 例如给“苹果”添加同义词“软软棉花糖”,能实现问“棉花糖销售额”返回“苹果销售额”
  • 生效机制:解析自然语言时先命中别名,再回溯到原字段执行查询,保障结果准确。