独立开发，受控 NL2SQL 架构、benchmark 与提交包校验

LCFC NL2SQL 智能问数系统

面向制造业数据问答的受控 NL2SQL 竞赛项目：自然语言先转结构化 IR，再由 schema linker、SQL guardrails、compiler、结果契约和 benchmark 闭环校验。

竞赛项目 resume-records + LCFC workspace

NL2SQLAgentSQLiteIRSQL CompilerBenchmarkTruthfulness

GitHub

项目背景

这是一个面向制造业场景的 NL2SQL 智能问数竞赛项目。目标不是把公开题写成固定模板，而是把自然语言问题转成可执行 SQL，并输出可信结果、解释和洞察。

我把它作为受控 AI 工程项目来做：模型可以参与候选生成，但不能直接绕过 schema 检索、结构化 IR、SQL guardrails、执行校验和结果契约。

我的工作

独立搭建受控 NL2SQL 工程框架，避免直接依赖裸 LLM 生成 SQL。
设计自然语言解析、schema 检索、join path、结构化 IR、SQL compiler、语义检查和结果检查链路。
建立公开题、近邻扰动和 hidden-like benchmark，用于判断系统是否具备泛化能力。
维护能力地图、实验报告、提交包构建脚本和本地验证命令。

方法与实现

项目的核心链路是：

自然语言问题
  -> deterministic / LLM-assisted IR candidate
  -> schema linker + SQL guardrails
  -> controlled SQL compiler
  -> SQLite execution + result contract
  -> truthfulness gate + benchmark feedback

这个设计把不可控的“模型一次性写 SQL”拆成多个可验证环节。每一步都要留下失败原因：是 schema miss、catalog miss、join path 不支持、compiler 不能表达，还是结果契约不匹配。

公开边界

比赛结果尚未公布，所以这里只写“独立开发/参赛项目/结果待公布”。不公开未发布分数、隐藏数据、提交包、平台账号、key 文件或原始题面细节。

复盘

这个项目最适合展示我对 AI Agent 工程的判断：真正可靠的系统不是让模型自由发挥，而是给模型一个受控的结构化出口，再用执行结果、语义契约和 benchmark 把输出收回来。