Text2SQL 指南封面

Governed data-agent notes

Text2SQL 指南

RootData 类 Agent Bot 的语义层、查询编排、证据链与治理设计

16 章节 6 治理域 evidence 阅读路径
从第一章开始
  1. 01 请你介绍一下业务架构设计 先把主项目、Agent Bot、老板问数和下游报告 Agent 的依赖方向讲清楚。
  2. 02 Text2SQL 整个流程怎么跑 再讲自然语言请求如何经过 intake、retrieve、semantic-plan、SQL 生成、校验、执行和 delivery。
  3. 03 用户问题有歧义时,系统如何澄清 放在运行时前段:先说明系统什么时候默认、什么时候澄清、什么时候拒绝。
  4. 04 如何设计语义层和指标口径治理 先建立业务词、指标、版本和关系路径,再让后面的 schema linking、RAG 和 SQL 有稳定口径。
  5. 05 如何把业务领域、数据库表结构和用户问题联系起来 把 Web3 业务词落到 projects、tokens、funding、score snapshots、unlock events 等表结构。
  6. 06 RAG 你做了什么优化,如何确保能搜索到 在语义和表结构明确后,讲 schema、术语、来源、图谱证据如何稳定召回。
  7. 07 如何支持复杂分析问题,而不是简单查数 把 SQL、RAG、GraphRAG、时间序列和 data pack 组合起来,回答复杂投研问题。
  8. 08 如何保证 Text2SQL 结果是可信的 讲 answer、delivery.evidence、artifact、data pack 和 runId 如何让结果可证明、可引用、可回放。
  9. 09 如何处理数据时效性和多源一致性 可信结果之后补 Web3 数据的新鲜度、source priority、snapshot、indexVersion 和冲突治理。
  10. 10 你们是怎么做权限控制和数据安全的 再讲 workspace、datasource binding、table permissions、字段脱敏、审计和 fail-closed。
  11. 11 如何防止幻觉、错误 SQL 和 Prompt Injection 在权限之后讲运行时安全:RAG 指令隔离、SQL AST 校验、只读执行和 evidence 约束。
  12. 12 如何做 Text2SQL 和 RAG 的评测体系 安全和可信边界讲完后,用 gold evidence、gold SQL、runId replay 和 badcase 闭环证明系统持续变好。
  13. 13 系统如何做可观测性和问题定位 把评测和线上排障接起来:trace、RAG replay、delivery、LangSmith 和报告 Agent source runId。
  14. 14 如何做性能、成本和并发优化 讲 lane timeout、缓存、预算、物化视图、队列、模型分层和报告 Agent 批量调用保护。
  15. 15 你做了什么优化 作为优化总章,把准确率、召回、语义、执行安全、缓存、成本延迟和可观测性收束起来。
  16. 16 期间踩到什么坑,如何从架构设计升级 最后从架构演进角度复盘从 prompt + SQL demo 到可治理系统 Agent 的升级。

相似题去重导航

系统 Agent 与报告 Agent 边界

主讲系统 Agent 为什么统一出 data pack,其他题只补权限、性能或踩坑角度。

主讲题

运行时主链路与节点命名

流程章主讲当前 runtime 链路,架构和踩坑章只解释历史命名差异。

主讲题

Query Planner 路由与避免全工具执行

流程章主讲路由判断,优化章主讲降本,复杂分析章主讲计划拆分。

主讲题

权限校验位置与 fail-closed

权限章主讲治理边界,流程、安全和踩坑章复用同一原则。

主讲题

SQL 校验、执行安全与 correct loop

架构章主讲 validate/correct/execute 是主链路,安全章主讲攻击面和终止条件。

主讲题

SELECT * 的权限与安全处理

安全章主讲 SELECT * 的结构化拦截,权限章从字段可见性补充。

主讲题

Schema linking、schema 变更与 join path

语义映射章主讲 join path,流程和优化章只从生成稳定性角度补充。

主讲题

业务语义、模糊词与默认口径

语义映射章主讲业务词如何落表,语义层和澄清章主讲默认与追问边界。

主讲题

Semantic version 与指标口径回放

语义层主讲口径版本锁,架构和时效章补充 runId 回放与历史报告。

主讲题

RAG 召回质量与 gold evidence 评测

RAG 章主讲召回评测,评测章和优化章用于证明优化不是感觉更准。

主讲题

RAG 召回为空、低置信与降级

RAG 章主讲搜不到时如何表现,架构和澄清章补充继续、澄清、fail-closed 的边界。

主讲题

Entity resolution、Token 重名与实体消歧

语义映射章主讲实体解析位置,RAG、优化、澄清和排障章分别补充召回、优化、交互和定位。

主讲题

证据链、data pack 与报告可追溯

可信结果章主讲 evidence/data pack 合同,其他章只补充报告 Agent 消费与复用场景。

主讲题

runId、trace、replay 与回放

可信结果章主讲 runId 可回放,架构、流程、时效和可观测章只从各自链路补充。

主讲题

空结果解释、评测与排查

可信结果章主讲空结果怎么可信解释,评测和可观测章分别处理验证与排查。

主讲题

数据冲突、来源优先级与时效性

时效一致章主讲多源冲突和 source priority,RAG 与可信结果章只补充证据侧处理。

主讲题

缓存、物化视图与批量性能

性能章主讲缓存/物化/批量保护,优化章和复杂分析章只补充业务场景。

主讲题

GraphRAG、图查询与图数据库

复杂分析章主讲共同投资网络为什么走图,评测、排障和性能章分别补充质量、错误定位和成本。

主讲题

澄清策略、smart defaults 与回滚

澄清章主讲默认和必须追问的边界,评测和可观测章只补验证与监控。

主讲题

评测、badcase 与回归门禁

评测章主讲体系,优化、安全、观测和性能章只补各自维度的验收。

主讲题

Prompt Injection、幻觉与敏感数据外带

安全章主讲指令隔离和幻觉防护,权限和可观测章补充审计、记录和外带场景。

主讲题