Text2SQL 指南

用户问题有歧义时,系统如何澄清

这一章讲澄清策略:Web3 投研问题里“最近、融资好、热度高、重点项目、AI Crypto、Apple”都可能有歧义,系统要在直接默认、询问澄清和拒绝执行之间做可评测的权衡。

OPENING30 秒开口版

我不会所有模糊问题都硬查,也不会一上来问很多问题。系统先用 rules + semantic hybrid 判断歧义是否会影响结果:时间窗口、指标口径、实体消歧、权限范围、输出形态。如果是低风险默认,比如最近默认 7 天,可以直接执行并在 answer 说明默认值;如果歧义会显著改变 SQL 或排序,比如“融资好”按金额还是投资人质量,“Apple”是项目还是 Token,就进入 clarification。

理解与记忆 · 术语、解析、关联知识点
专业术语Clarification Gate:决定是否需要澄清、澄清哪些槽位的门控。
Smart Defaults:低风险歧义使用默认口径,并在回答中说明。
Slot Filling:把缺失的时间、实体、指标、排序等信息补齐。
Post-clarify Pass Rate:澄清后语义计划能继续成功执行的比例。
为什么这样回答澄清题要讲产品体验和工程指标。既不能乱猜,也不能过度打扰用户。
小白解析用户说“最近融资好的项目”,系统要判断是可以默认最近 7 天,还是必须先问“按金额还是按投资人质量”。问得太多烦,问得太少容易错。
关联知识点clarification rollout runbook 使用 hybrid clarification,支持 rules-only kill switch,并用 triggerRate、false positive、false negative、postClarifySemanticPassRate、averageClarificationRounds 做门禁。

1 MIN一分钟口语版

工程上澄清是一个可治理节点,不是随便问用户。intake 或 clarify 节点先用规则识别短句、缺时间、缺实体、指标词模糊;semantic evaluator 再补偿复杂歧义。输出不是自由文本,而是 slots:timeRange、entity、metricDefinition、sortBy、filters、scope。澄清后进入 semantic-plan,继续生成 SQL 或 data pack。线上用 triggerRate、falsePositiveRate、falseNegativeRate、postClarifySemanticPassRate、averageClarificationRounds 做 gate;semantic evaluator 超时或异常时可以切 rules-only kill switch,保证主链路稳定。

理解与记忆 · 术语、解析、关联知识点
专业术语Clarification Gate:决定是否需要澄清、澄清哪些槽位的门控。
Smart Defaults:低风险歧义使用默认口径,并在回答中说明。
Slot Filling:把缺失的时间、实体、指标、排序等信息补齐。
Post-clarify Pass Rate:澄清后语义计划能继续成功执行的比例。
为什么这样回答澄清题要讲产品体验和工程指标。既不能乱猜,也不能过度打扰用户。
小白解析用户说“最近融资好的项目”,系统要判断是可以默认最近 7 天,还是必须先问“按金额还是按投资人质量”。问得太多烦,问得太少容易错。
关联知识点clarification rollout runbook 使用 hybrid clarification,支持 rules-only kill switch,并用 triggerRate、false positive、false negative、postClarifySemanticPassRate、averageClarificationRounds 做门禁。

ARCHITECTURE架构设计要点

歧义类型

时间、实体、指标、排序、权限、输出格式。

默认策略

低风险默认值可执行,但必须在 answer 说明。

澄清策略

高影响歧义用 1 个关键问题补 slot,控制轮次。

执行衔接

澄清结果进入 contextEnvelope 和 semantic-plan。

线上门禁

触发率、误触发、漏触发、澄清后通过率、平均轮次。

回滚机制

semantic 澄清超时或异常时切 rules-only。

DIAGRAM架构图

歧义问题如何进入澄清或默认

用户问题有歧义时,系统如何澄清 Mermaid diagram 1

澄清上线门禁和回滚

用户问题有歧义时,系统如何澄清 Mermaid diagram 2

TABLE关键对象和面试讲法

对象职责面试强调
最近时间窗口缺失默认 7d 或澄清 7d/30d/季度。
融资好指标口径模糊金额、轮次、投资人质量。
热门排序指标模糊热度、增长、访问、社媒。
Apple实体歧义项目、机构、Token、人物。
重点项目主观标准模糊融资、热度、生态、风险。
全部权限和范围风险可能需要限制或拒绝。
生成报告输出形态缺失周报、尽调、榜单、图表。

INTERVIEW MAP面试表达地图

  1. 先承认歧义Web3 投研问题大量依赖默认口径。
  2. 再讲分类时间、实体、指标、排序、权限、输出。
  3. 讲策略低风险默认,高影响澄清,不安全拒绝。
  4. 讲指标trigger、FP、FN、post-clarify pass、轮次。
  5. 讲回滚hybrid 失败可切 rules-only。

SUBAGENTS面试官、候选人和红队

本章写作前已实际启动多 subagent:面试官 subagent 负责连续追问生产压力,候选人 subagent 负责把答案压成现场能讲出口的表达,资料审阅 + 红队 subagent 负责指出哪些地方容易写虚,并补充安全、评测、runId、下游报告 Agent 的攻击面。

本章追问重点:所有回答都要落到 RootData 类 Web3 主项目、Agent Bot、Text2SQL、RAG、runId/evidence/artifact/data pack 和下游报告 Agent 复用。

Q&A20 组高强度追问

面试官:“最近融资好的项目”有哪些歧义?

我:至少有时间窗口、融资好口径、赛道范围、项目状态和排序方式。最近是 7 天还是 30 天,融资好按金额还是投资人质量,都会改变结果。

理解与记忆 · 背后工程点

背后工程点:先识别歧义类型。
专业术语:Clarification Gate:决定是否需要澄清、澄清哪些槽位的门控。
Smart Defaults:低风险歧义使用默认口径,并在回答中说明。
Slot Filling:把缺失的时间、实体、指标、排序等信息补齐。
为什么这样回答:澄清题要讲产品体验和工程指标。既不能乱猜,也不能过度打扰用户。
小白解析:用户说“最近融资好的项目”,系统要判断是可以默认最近 7 天,还是必须先问“按金额还是按投资人质量”。问得太多烦,问得太少容易错。
关联知识点:clarification rollout runbook 使用 hybrid clarification,支持 rules-only kill switch,并用 triggerRate、false positive、false negative、postClarifySemanticPassRate、averageClarificationRounds 做门禁。

面试官:“最近”默认 7 天、30 天还是本季度?

我:默认值要按场景写入语义层或产品策略。实时老板问数可默认 7 天,周报默认本周或 30 天。关键是 answer 要说明默认,并允许用户追问修改。

理解与记忆 · 背后工程点

背后工程点:默认口径要可声明。
专业术语:Clarification Gate:决定是否需要澄清、澄清哪些槽位的门控。
Smart Defaults:低风险歧义使用默认口径,并在回答中说明。
Slot Filling:把缺失的时间、实体、指标、排序等信息补齐。
为什么这样回答:澄清题要讲产品体验和工程指标。既不能乱猜,也不能过度打扰用户。
小白解析:用户说“最近融资好的项目”,系统要判断是可以默认最近 7 天,还是必须先问“按金额还是按投资人质量”。问得太多烦,问得太少容易错。
关联知识点:clarification rollout runbook 使用 hybrid clarification,支持 rules-only kill switch,并用 triggerRate、false positive、false negative、postClarifySemanticPassRate、averageClarificationRounds 做门禁。

面试官:什么时候用 smart defaults,什么时候必须澄清?

我:低风险且行业有常用默认时直接执行,比如最近 7 天;如果不同选择会大幅改变 TopN 或 SQL 结果,就澄清。实体歧义和权限范围通常也要澄清或拒绝。

理解与记忆 · 背后工程点

背后工程点:澄清取决于结果敏感度。
专业术语:Clarification Gate:决定是否需要澄清、澄清哪些槽位的门控。
Smart Defaults:低风险歧义使用默认口径,并在回答中说明。
Slot Filling:把缺失的时间、实体、指标、排序等信息补齐。
为什么这样回答:澄清题要讲产品体验和工程指标。既不能乱猜,也不能过度打扰用户。
小白解析:用户说“最近融资好的项目”,系统要判断是可以默认最近 7 天,还是必须先问“按金额还是按投资人质量”。问得太多烦,问得太少容易错。
关联知识点:clarification rollout runbook 使用 hybrid clarification,支持 rules-only kill switch,并用 triggerRate、false positive、false negative、postClarifySemanticPassRate、averageClarificationRounds 做门禁。

面试官:澄清问题问一个还是多个?

我:优先问一个最影响结果的问题。比如先问时间窗口或排序口径,不要一次列五个问题。多轮要有上限,避免用户体验变差。

理解与记忆 · 背后工程点

背后工程点:澄清要控制轮次。
专业术语:Clarification Gate:决定是否需要澄清、澄清哪些槽位的门控。
Smart Defaults:低风险歧义使用默认口径,并在回答中说明。
Slot Filling:把缺失的时间、实体、指标、排序等信息补齐。
为什么这样回答:澄清题要讲产品体验和工程指标。既不能乱猜,也不能过度打扰用户。
小白解析:用户说“最近融资好的项目”,系统要判断是可以默认最近 7 天,还是必须先问“按金额还是按投资人质量”。问得太多烦,问得太少容易错。
关联知识点:clarification rollout runbook 使用 hybrid clarification,支持 rules-only kill switch,并用 triggerRate、false positive、false negative、postClarifySemanticPassRate、averageClarificationRounds 做门禁。

面试官:false positive 和 false negative 哪个更危险?

我:看场景。老板实时问数里 false positive 会打断体验;高风险数据和报告场景里 false negative 更危险,因为会带着错误口径生成报告。

理解与记忆 · 背后工程点

背后工程点:误触发和漏触发要按风险权衡。
专业术语:Clarification Gate:决定是否需要澄清、澄清哪些槽位的门控。
Smart Defaults:低风险歧义使用默认口径,并在回答中说明。
Slot Filling:把缺失的时间、实体、指标、排序等信息补齐。
为什么这样回答:澄清题要讲产品体验和工程指标。既不能乱猜,也不能过度打扰用户。
小白解析:用户说“最近融资好的项目”,系统要判断是可以默认最近 7 天,还是必须先问“按金额还是按投资人质量”。问得太多烦,问得太少容易错。
关联知识点:clarification rollout runbook 使用 hybrid clarification,支持 rules-only kill switch,并用 triggerRate、false positive、false negative、postClarifySemanticPassRate、averageClarificationRounds 做门禁。

面试官:澄清后 semantic-plan 如何继续执行?

我:澄清结果进入 contextEnvelope 或 slot state,比如 timeRange、entityMappings、metricDefinition,再重新跑 semantic-plan,锁定 selectedTables、filters 和 route。

理解与记忆 · 背后工程点

背后工程点:澄清输出要结构化进入计划。
专业术语:Clarification Gate:决定是否需要澄清、澄清哪些槽位的门控。
Smart Defaults:低风险歧义使用默认口径,并在回答中说明。
Slot Filling:把缺失的时间、实体、指标、排序等信息补齐。
为什么这样回答:澄清题要讲产品体验和工程指标。既不能乱猜,也不能过度打扰用户。
小白解析:用户说“最近融资好的项目”,系统要判断是可以默认最近 7 天,还是必须先问“按金额还是按投资人质量”。问得太多烦,问得太少容易错。
关联知识点:clarification rollout runbook 使用 hybrid clarification,支持 rules-only kill switch,并用 triggerRate、false positive、false negative、postClarifySemanticPassRate、averageClarificationRounds 做门禁。

面试官:hybrid clarification 超时为什么降级 rules-only?

我:澄清是增强能力,不应阻断主链路。semantic evaluator 超时或异常时,规则澄清仍能覆盖基础歧义,系统记录 degrade reason 并继续。

理解与记忆 · 背后工程点

背后工程点:增强能力可降级。
专业术语:Clarification Gate:决定是否需要澄清、澄清哪些槽位的门控。
Smart Defaults:低风险歧义使用默认口径,并在回答中说明。
Slot Filling:把缺失的时间、实体、指标、排序等信息补齐。
为什么这样回答:澄清题要讲产品体验和工程指标。既不能乱猜,也不能过度打扰用户。
小白解析:用户说“最近融资好的项目”,系统要判断是可以默认最近 7 天,还是必须先问“按金额还是按投资人质量”。问得太多烦,问得太少容易错。
关联知识点:clarification rollout runbook 使用 hybrid clarification,支持 rules-only kill switch,并用 triggerRate、false positive、false negative、postClarifySemanticPassRate、averageClarificationRounds 做门禁。

面试官:澄清策略如何在 runId trace 体现?

我:trace 记录 clarify 节点是否 triggered、触发原因、slot、用户回复、post-clarify semantic pass,以及是否 rules-only fallback。

理解与记忆 · 背后工程点

背后工程点:澄清也要可回放。
专业术语:Clarification Gate:决定是否需要澄清、澄清哪些槽位的门控。
Smart Defaults:低风险歧义使用默认口径,并在回答中说明。
Slot Filling:把缺失的时间、实体、指标、排序等信息补齐。
为什么这样回答:澄清题要讲产品体验和工程指标。既不能乱猜,也不能过度打扰用户。
小白解析:用户说“最近融资好的项目”,系统要判断是可以默认最近 7 天,还是必须先问“按金额还是按投资人质量”。问得太多烦,问得太少容易错。
关联知识点:clarification rollout runbook 使用 hybrid clarification,支持 rules-only kill switch,并用 triggerRate、false positive、false negative、postClarifySemanticPassRate、averageClarificationRounds 做门禁。

面试官:老板和外部用户澄清策略一样吗?

我:不完全一样。老板场景可更多使用 smart defaults 保持效率,外部公开数据或报告生成更注重明确口径和引用。策略由 actor、risk 和 taskType 决定。

理解与记忆 · 背后工程点

背后工程点:澄清策略要按用户和任务分层。
专业术语:Clarification Gate:决定是否需要澄清、澄清哪些槽位的门控。
Smart Defaults:低风险歧义使用默认口径,并在回答中说明。
Slot Filling:把缺失的时间、实体、指标、排序等信息补齐。
为什么这样回答:澄清题要讲产品体验和工程指标。既不能乱猜,也不能过度打扰用户。
小白解析:用户说“最近融资好的项目”,系统要判断是可以默认最近 7 天,还是必须先问“按金额还是按投资人质量”。问得太多烦,问得太少容易错。
关联知识点:clarification rollout runbook 使用 hybrid clarification,支持 rules-only kill switch,并用 triggerRate、false positive、false negative、postClarifySemanticPassRate、averageClarificationRounds 做门禁。

面试官:报告 Agent 调用时能不能返回 clarification?

我:可以,但要结构化返回 needs_clarification 和 requiredSlots。报告 Agent 可以补参数后重试,不能自己猜关键口径生成 data pack。

理解与记忆 · 背后工程点

背后工程点:Agent-to-agent 也需要澄清合同。
专业术语:Clarification Gate:决定是否需要澄清、澄清哪些槽位的门控。
Smart Defaults:低风险歧义使用默认口径,并在回答中说明。
Slot Filling:把缺失的时间、实体、指标、排序等信息补齐。
为什么这样回答:澄清题要讲产品体验和工程指标。既不能乱猜,也不能过度打扰用户。
小白解析:用户说“最近融资好的项目”,系统要判断是可以默认最近 7 天,还是必须先问“按金额还是按投资人质量”。问得太多烦,问得太少容易错。
关联知识点:clarification rollout runbook 使用 hybrid clarification,支持 rules-only kill switch,并用 triggerRate、false positive、false negative、postClarifySemanticPassRate、averageClarificationRounds 做门禁。

面试官:如何评测澄清是否提升最终质量?

我:看 postClarifySemanticPassRate、最终 SQL 准确率、RAG Context Recall、用户放弃率和平均轮次。只看澄清触发率不够。

理解与记忆 · 背后工程点

背后工程点:澄清评测要看后续成功率。
专业术语:Clarification Gate:决定是否需要澄清、澄清哪些槽位的门控。
Smart Defaults:低风险歧义使用默认口径,并在回答中说明。
Slot Filling:把缺失的时间、实体、指标、排序等信息补齐。
为什么这样回答:澄清题要讲产品体验和工程指标。既不能乱猜,也不能过度打扰用户。
小白解析:用户说“最近融资好的项目”,系统要判断是可以默认最近 7 天,还是必须先问“按金额还是按投资人质量”。问得太多烦,问得太少容易错。
关联知识点:clarification rollout runbook 使用 hybrid clarification,支持 rules-only kill switch,并用 triggerRate、false positive、false negative、postClarifySemanticPassRate、averageClarificationRounds 做门禁。

面试官:如果用户不回答澄清怎么办?

我:可以提供可选默认执行,明确说明默认口径和低置信;高风险场景则停止,不生成正式 data pack。

理解与记忆 · 背后工程点

背后工程点:无回复要区分风险等级。
专业术语:Clarification Gate:决定是否需要澄清、澄清哪些槽位的门控。
Smart Defaults:低风险歧义使用默认口径,并在回答中说明。
Slot Filling:把缺失的时间、实体、指标、排序等信息补齐。
为什么这样回答:澄清题要讲产品体验和工程指标。既不能乱猜,也不能过度打扰用户。
小白解析:用户说“最近融资好的项目”,系统要判断是可以默认最近 7 天,还是必须先问“按金额还是按投资人质量”。问得太多烦,问得太少容易错。
关联知识点:clarification rollout runbook 使用 hybrid clarification,支持 rules-only kill switch,并用 triggerRate、false positive、false negative、postClarifySemanticPassRate、averageClarificationRounds 做门禁。

面试官:实体消歧怎么问更自然?

我:给候选实体和关键信息,比如“你指的是 Apple 这个项目、Apple Inc. 机构,还是 AAPL Token?”让用户选择,不要问抽象概念。

相似题已合并 · 建议跳转

Entity resolution、Token 重名与实体消歧:语义映射章主讲实体解析位置,RAG、优化、澄清和排障章分别补充召回、优化、交互和定位。

理解与记忆 · 背后工程点

背后工程点:澄清问题要可操作。
专业术语:Clarification Gate:决定是否需要澄清、澄清哪些槽位的门控。
Smart Defaults:低风险歧义使用默认口径,并在回答中说明。
Slot Filling:把缺失的时间、实体、指标、排序等信息补齐。
为什么这样回答:澄清题要讲产品体验和工程指标。既不能乱猜,也不能过度打扰用户。
小白解析:用户说“最近融资好的项目”,系统要判断是可以默认最近 7 天,还是必须先问“按金额还是按投资人质量”。问得太多烦,问得太少容易错。
关联知识点:clarification rollout runbook 使用 hybrid clarification,支持 rules-only kill switch,并用 triggerRate、false positive、false negative、postClarifySemanticPassRate、averageClarificationRounds 做门禁。

面试官:如何避免重复澄清同一件事?

我:会话里保存已确认 slot 和 runId context,后续追问复用,但每次执行前仍校验权限和数据版本。

理解与记忆 · 背后工程点

背后工程点:会话记忆可减少打扰,但不能绕过校验。
专业术语:Clarification Gate:决定是否需要澄清、澄清哪些槽位的门控。
Smart Defaults:低风险歧义使用默认口径,并在回答中说明。
Slot Filling:把缺失的时间、实体、指标、排序等信息补齐。
为什么这样回答:澄清题要讲产品体验和工程指标。既不能乱猜,也不能过度打扰用户。
小白解析:用户说“最近融资好的项目”,系统要判断是可以默认最近 7 天,还是必须先问“按金额还是按投资人质量”。问得太多烦,问得太少容易错。
关联知识点:clarification rollout runbook 使用 hybrid clarification,支持 rules-only kill switch,并用 triggerRate、false positive、false negative、postClarifySemanticPassRate、averageClarificationRounds 做门禁。

面试官:低置信 RAG 召回是否触发澄清?

我:可能触发。如果问题词和证据都低置信,尤其实体或指标不确定,澄清比让模型猜更好。也可以补检索后再决定。

相似题已合并 · 建议跳转

RAG 召回为空、低置信与降级:RAG 章主讲搜不到时如何表现,架构和澄清章补充继续、澄清、fail-closed 的边界。

理解与记忆 · 背后工程点

背后工程点:检索信号可以驱动澄清。
专业术语:Clarification Gate:决定是否需要澄清、澄清哪些槽位的门控。
Smart Defaults:低风险歧义使用默认口径,并在回答中说明。
Slot Filling:把缺失的时间、实体、指标、排序等信息补齐。
为什么这样回答:澄清题要讲产品体验和工程指标。既不能乱猜,也不能过度打扰用户。
小白解析:用户说“最近融资好的项目”,系统要判断是可以默认最近 7 天,还是必须先问“按金额还是按投资人质量”。问得太多烦,问得太少容易错。
关联知识点:clarification rollout runbook 使用 hybrid clarification,支持 rules-only kill switch,并用 triggerRate、false positive、false negative、postClarifySemanticPassRate、averageClarificationRounds 做门禁。

面试官:澄清会不会影响性能?

我:会增加轮次,所以要做 gate 和预算。只有高影响歧义才问;semantic evaluator 有 timeout;异常时 rules-only。

理解与记忆 · 背后工程点

背后工程点:澄清是质量和体验的权衡。
专业术语:Clarification Gate:决定是否需要澄清、澄清哪些槽位的门控。
Smart Defaults:低风险歧义使用默认口径,并在回答中说明。
Slot Filling:把缺失的时间、实体、指标、排序等信息补齐。
为什么这样回答:澄清题要讲产品体验和工程指标。既不能乱猜,也不能过度打扰用户。
小白解析:用户说“最近融资好的项目”,系统要判断是可以默认最近 7 天,还是必须先问“按金额还是按投资人质量”。问得太多烦,问得太少容易错。
关联知识点:clarification rollout runbook 使用 hybrid clarification,支持 rules-only kill switch,并用 triggerRate、false positive、false negative、postClarifySemanticPassRate、averageClarificationRounds 做门禁。

面试官:权限不足算澄清吗?

我:不算普通澄清。权限不足应返回授权提示或拒绝,不应该问用户“你是不是管理员”。身份来自系统 actor。

理解与记忆 · 背后工程点

背后工程点:澄清不能替代授权。
专业术语:Clarification Gate:决定是否需要澄清、澄清哪些槽位的门控。
Smart Defaults:低风险歧义使用默认口径,并在回答中说明。
Slot Filling:把缺失的时间、实体、指标、排序等信息补齐。
为什么这样回答:澄清题要讲产品体验和工程指标。既不能乱猜,也不能过度打扰用户。
小白解析:用户说“最近融资好的项目”,系统要判断是可以默认最近 7 天,还是必须先问“按金额还是按投资人质量”。问得太多烦,问得太少容易错。
关联知识点:clarification rollout runbook 使用 hybrid clarification,支持 rules-only kill switch,并用 triggerRate、false positive、false negative、postClarifySemanticPassRate、averageClarificationRounds 做门禁。

面试官:如何处理“重点项目”这种主观词?

我:先映射可能指标:融资强、热度增长、顶级投资人、未 TGE、低解锁压力。如果用户没有指定,可以给默认综合口径并说明,正式报告最好澄清。

理解与记忆 · 背后工程点

背后工程点:主观词需要指标化或澄清。
专业术语:Clarification Gate:决定是否需要澄清、澄清哪些槽位的门控。
Smart Defaults:低风险歧义使用默认口径,并在回答中说明。
Slot Filling:把缺失的时间、实体、指标、排序等信息补齐。
为什么这样回答:澄清题要讲产品体验和工程指标。既不能乱猜,也不能过度打扰用户。
小白解析:用户说“最近融资好的项目”,系统要判断是可以默认最近 7 天,还是必须先问“按金额还是按投资人质量”。问得太多烦,问得太少容易错。
关联知识点:clarification rollout runbook 使用 hybrid clarification,支持 rules-only kill switch,并用 triggerRate、false positive、false negative、postClarifySemanticPassRate、averageClarificationRounds 做门禁。

面试官:澄清策略出问题怎么回滚?

我:通过 kill switch 切 rules-only,复跑 clarification balance gate,观察 triggerRate、FP、FN 和 post-clarify pass。恢复前保持 semantic evaluator 关闭。

理解与记忆 · 背后工程点

背后工程点:澄清上线要有回滚。
专业术语:Clarification Gate:决定是否需要澄清、澄清哪些槽位的门控。
Smart Defaults:低风险歧义使用默认口径,并在回答中说明。
Slot Filling:把缺失的时间、实体、指标、排序等信息补齐。
为什么这样回答:澄清题要讲产品体验和工程指标。既不能乱猜,也不能过度打扰用户。
小白解析:用户说“最近融资好的项目”,系统要判断是可以默认最近 7 天,还是必须先问“按金额还是按投资人质量”。问得太多烦,问得太少容易错。
关联知识点:clarification rollout runbook 使用 hybrid clarification,支持 rules-only kill switch,并用 triggerRate、false positive、false negative、postClarifySemanticPassRate、averageClarificationRounds 做门禁。

面试官:一句话总结澄清设计。

我:我的澄清策略是只在歧义会显著改变执行结果时问关键问题,其余用可声明默认值,并用指标和回滚保证体验稳定。

理解与记忆 · 背后工程点

背后工程点:总结要兼顾准确率和体验。
专业术语:Clarification Gate:决定是否需要澄清、澄清哪些槽位的门控。
Smart Defaults:低风险歧义使用默认口径,并在回答中说明。
Slot Filling:把缺失的时间、实体、指标、排序等信息补齐。
为什么这样回答:澄清题要讲产品体验和工程指标。既不能乱猜,也不能过度打扰用户。
小白解析:用户说“最近融资好的项目”,系统要判断是可以默认最近 7 天,还是必须先问“按金额还是按投资人质量”。问得太多烦,问得太少容易错。
关联知识点:clarification rollout runbook 使用 hybrid clarification,支持 rules-only kill switch,并用 triggerRate、false positive、false negative、postClarifySemanticPassRate、averageClarificationRounds 做门禁。

PRINCIPLE本章背诵原则

  • 澄清不是越多越好,要问影响最大的 slot。
  • 低风险默认可以执行,但必须说明默认值。
  • 高影响歧义要澄清,不要让模型猜。
  • 澄清结果要结构化进入 semantic-plan。
  • 澄清策略要有 gate、指标和 kill switch。