同义词配置
场景价值
首先明确一点,在问答时,系统会检索意图近似的词向量,同义词配置用显式规则把“用户说的业务语言”映射到“系统识别的模型字段”,是语义检索可控性的第一道防线。它可以显著降低理解失败率,让问答体验保持业务语境的一致性。
- 兜底理解:把罕见叫法映射到既有指标,避免“听不懂”。
- 统一话语体系:同一指标在不同团队的别称统一管理,跨部门沟通不再靠口口相传。
- 沉淀行业语料:把一线说法配置成规则,平台使用越久越懂业务。
- 应对口语化提问:即使用户使用高频口头禅,系统也能稳定命中原字段。
例:围绕“销售额”的常见叫法包括“实收”“到账金额”“回款”“GMV”“成交金额”“实付金额”“支付金额”“成交额”“落袋金额”等,把这些别名全部收录后,意图命中率会显著提升。
配置入口速览
同义词类型
模型同义词
- 适用场景:用户提到的模型/字段仍属于抽象概念层,只是叫法不同;常发生在建模阶段与业务方沟通。
- 配置要点
- 在 schema “基本信息”里维护模型别名,确保概念名称统一。
- 在“属性列表”为字段补充业务含义及口语化别名,覆盖常见变体。
- 生效机制:语义匹配阶段能够通过同义词匹配到对应模型/字段,减少“找不到概念”的概率。
全局同义词
- 适用场景:真实存在的名词在不同团队之间有多个叫法,需要在知识库层统一。
- 配置要点
- 需要是数据库中确实存在、可直接查询的字段添加别名,否则不会生效。
- 例如给“苹果”添加同义词“软软棉花糖”,能实现问“棉花糖销售额”返回“苹果销售额”
- 生效机制:解析自然语言时先命中别名,再回溯到原字段执行查询,保障结果准确。

