问答优先级配置

问答优先级解决的是“多个候选来源都能回答同一问题时,系统应默认选谁”。核心分为 表优先级词优先级 两层:先依靠语义匹配筛出候选,再通过优先级规则打破“多选一”的摇摆,保障用户拿到稳定、符合口径的答案。

什么时候需要配置

触发信号表现处理建议
多条表结果频繁弹出让用户二选一“请选择想问的表”提示反复出现给结构高度重合、又必须共存的表设置优先级
不同词条互相抢答常见别名越多,冲突越多提升主流词条优先级或忽略低价值别名

表优先级

  • 作用:抬升整张表的回答权重,表内字段的检索顺序随之靠前。
  • 入口系统搭建 → 数据管理 → 业务建模 → 编辑 schema → 基本信息 → 问答优先级
  • 运行机制
    • 系统会先尝试在优先级高的表中取值;若问题涉及只有低优先级表才有的字段,会自动顺位到下一级优先级表,不会漏答。
    • 仅在“业务上必须并存且字段高度重合”的表之间启用,避免人为干预过度导致统计偏差。

场景示例:交易主表 vs 结算表

运营分析依赖交易主表查看渠道、活动、终端等字段;财务对账则需要结算表里的结算状态、打款批次、结算单号等数据。两张表超过 90% 字段一致,让“去年销售额”、“去年某产品销售额”这类问题在两张表之间摇摆,用户难以及时判断差异。

推荐做法:

  1. 将低优先级口径所在的表设置为优先级 -1(推荐),或者把默认口径表设为1,让系统按业务期望的顺序返回结果;
  2. 在备注中写清“销售额默认采用结算口径(t_settle_order)”,并说明另一张表负责渠道、活动等独占维度。

这样既保证通用指标优先走正确口径,又保留另一张表在自身场景下的命中能力,显著减少“二选一”弹窗。

词优先级

  • 作用:在知识库层规定具体词条的优先级,或把干扰性强的词条标记为忽略学习,降低歧义。
  • 入口系统搭建 → 知识库配置 → 问答优先级调整 → 筛选目标词
  • 使用方式
    1. 监控上线后的问答日志及用户反馈,定位经常被提示“请选择想问的词”记录。
    2. 提升常用、语义明确的词条优先级;把偶尔口误但影响匹配的词条设为忽略学习。
    3. 与同义词配置配套:先覆盖所有叫法,再用优先级控制“默认谁来回答”。

通过“语义匹配 + 优先级规则 + 日志复盘”的组合拳,问答系统既可保持自动化体验,又能在关键口径上做到可控、透明。