Query OS interview notes

Text2SQL 指南

从 LLM 写 SQL 升级到可验证问数操作系统：语义资产、权限策略、查询计划、SQL 校验、执行证据与回放评测

16 章节 8 系统平面 Query OS 核心范式

从第一章开始

01 请你介绍一下业务架构设计 先把主项目事实源、Query OS、老板问数和下游报告 Agent 的依赖方向讲清楚。
02 Text2SQL 整个流程怎么跑 再讲自然语言请求如何经过 schema-ready、QuerySlots、selected context、plan、SQL 生成、校验、执行、grounded answer 和 replay。
03 用户问题有歧义时，系统如何澄清 放在运行时前段：先说明系统什么时候默认、什么时候澄清、什么时候拒绝。
04 如何设计语义层和指标口径治理 先建立业务词、指标、版本和关系路径，再让后面的 schema linking、RAG 和 SQL 有稳定口径。
05 如何把业务领域、数据库表结构和用户问题联系起来 把 Web3 业务词落到 projects、tokens、funding、score snapshots、unlock events 等表结构。
06 RAG 你做了什么优化，如何确保能搜索到 在 Query OS 里讲 schema、术语、来源、图谱证据如何进入 ACL-filtered selected context。
07 如何支持复杂分析问题，而不是简单查数 把 SQL、RAG、GraphRAG、时间序列和 data pack 组合起来，回答复杂投研问题。
08 如何保证 Text2SQL 结果是可信的 讲 grounded answer、delivery.evidence、artifact、data pack 和 runId 如何让结果可证明、可引用、可回放。
09 如何处理数据时效性和多源一致性 可信结果之后补 Web3 数据的新鲜度、source priority、snapshot、indexVersion 和冲突治理。
10 你们是怎么做权限控制和数据安全的 再讲 workspace、datasource binding、table permissions、字段脱敏、审计和 fail-closed。
11 如何防止幻觉、错误 SQL 和 Prompt Injection 在权限之后讲运行时安全：RAG 指令隔离、selected context 权限裁剪、SQL AST 校验、只读执行和 grounded answer 约束。
12 如何做 Text2SQL 和 RAG 的评测体系 安全和可信边界讲完后，用 gold evidence、gold plans、runId replay 和 badcase 闭环证明系统持续变好。
13 系统如何做可观测性和问题定位 把评测和线上排障接起来：trace、RAG replay、delivery、LangSmith 和报告 Agent source runId。
14 如何做性能、成本和并发优化 讲 lane timeout、缓存、预算、物化视图、队列、模型分层和报告 Agent 批量调用保护。
15 你做了什么优化 作为优化总章，把准确率、召回、语义、执行安全、缓存、成本延迟和可观测性收束起来。
16 期间踩到什么坑，如何从架构设计升级 最后复盘从 prompt + SQL demo 到可验证 Query OS 的升级。

DEDUP MAP

相似题去重导航

Query OS 总范式与八个平面

先用 01/02 建立总范式：Text2SQL 是由事实源、语义资产、权限、计划、编译、校验、执行和回放共同约束的查询操作系统。

主讲题

系统 Agent 与报告 Agent 边界

主讲系统 Agent 为什么统一出 data pack，其他题只补权限、性能或踩坑角度。

主讲题

运行时主链路与节点命名

流程章主讲当前 runtime 链路，架构和踩坑章只解释历史命名差异。

主讲题

Query Planner 路由与避免全工具执行

流程章主讲路由判断，优化章主讲降本，复杂分析章主讲计划拆分。

主讲题

权限校验位置与 fail-closed

权限章主讲治理边界，流程、安全和踩坑章复用同一原则。

主讲题

SQL 校验、执行安全与 correct loop

架构章主讲 validate/correct/execute 是主链路，安全章主讲攻击面和终止条件。

主讲题

SELECT * 的权限与安全处理

安全章主讲 SELECT * 的结构化拦截，权限章从字段可见性补充。

主讲题

Schema linking、schema 变更与 join path

语义映射章主讲 join path，流程和优化章只从生成稳定性角度补充。

主讲题

业务语义、模糊词与默认口径

语义映射章主讲业务词如何落表，语义层和澄清章主讲默认与追问边界。

主讲题

Semantic version 与指标口径回放

语义层主讲口径版本锁，架构和时效章补充 runId 回放与历史报告。

主讲题

RAG 召回质量与 gold evidence 评测

RAG 章主讲召回评测，评测章和优化章用于证明优化不是感觉更准。

主讲题

RAG 召回为空、低置信与降级

RAG 章主讲搜不到时如何表现，架构和澄清章补充继续、澄清、fail-closed 的边界。

主讲题

Entity resolution、Token 重名与实体消歧

语义映射章主讲实体解析位置，RAG、优化、澄清和排障章分别补充召回、优化、交互和定位。

主讲题

证据链、data pack 与报告可追溯

可信结果章主讲 evidence/data pack 合同，其他章只补充报告 Agent 消费与复用场景。

主讲题

runId、trace、replay 与回放

可信结果章主讲 runId 可回放，架构、流程、时效和可观测章只从各自链路补充。

主讲题

空结果解释、评测与排查

可信结果章主讲空结果怎么可信解释，评测和可观测章分别处理验证与排查。

主讲题

数据冲突、来源优先级与时效性

时效一致章主讲多源冲突和 source priority，RAG 与可信结果章只补充证据侧处理。

主讲题

缓存、物化视图与批量性能

性能章主讲缓存/物化/批量保护，优化章和复杂分析章只补充业务场景。

主讲题

GraphRAG、图查询与图数据库

复杂分析章主讲共同投资网络为什么走图，评测、排障和性能章分别补充质量、错误定位和成本。

主讲题

澄清策略、smart defaults 与回滚

澄清章主讲默认和必须追问的边界，评测和可观测章只补验证与监控。

主讲题

评测、badcase 与回归门禁

评测章主讲体系，优化、安全、观测和性能章只补各自维度的验收。

主讲题

Prompt Injection、幻觉与敏感数据外带

安全章主讲指令隔离和幻觉防护，权限和可观测章补充审计、记录和外带场景。

主讲题