项目

核心项目经验

Text2SQL 大模型算法与问数产品化（Copilot 0→1） ↗

2023.09 — 2024.08

算法一作，架构主力

· 从算法研究到生产交付：基于在 Text2SQL 方向的持续算法积累，负责模型路由、执行链路和前端交互的核心设计，推动 Copilot 从可演示状态走向金融、政企场景的商业化落地。
· 100% 语法约束机制：研发并部署 Constrained Decoding（约束解码），在生成阶段直接干预 Logits 输出，以毫秒级开销实现 SQL 语法的完全校准，彻底解决语法幻觉问题，并支持"知识配置化"；该工作被阿里云官方头条专题报道。
· 推理加速探索：针对长链路任务的生产时延问题，牵头尝试 Speculative Decoding（投机采样），用轻量模型草稿+大模型验证的方式压缩端到端推理耗时。
· 知识检索体系演进（OneMeta）：从早期基于 SQL 日志的自动表关联挖掘，到构建表/列/SQL 分层知识库（某金融客户准确率从 60% 提升至 95%），再演进为基于 Graph Nodes + 列级向量聚类的动态图记忆底座（Spider2-Snow Top-10 召回率 95%）；基于 CDC + Kafka 构建异步同步链路，通过 Key 分区保障表级因果有序、LSN 乐观锁防乱序覆盖，配合死信队列与分级重试，将图记忆回流延迟控制在 5 分钟内。

Constrained DecodingSpeculative DecodingGraph StorageVector ClusteringCDC+Kafka

2024.03 — 至今

框架发起人，开源主理

· Agent Harness 编排底座：推动架构从 Copilot 升级为 Data Agent，搭建管理上下文、工具执行和循环控制的 Agent Harness 作为统一编排内核；主导发布企业开源级 dms-mcp Server。
· 云端 Claude Code（CLI 形态）：受 Claude Code 启发，搭建云端 CLI 运行环境，支持任务调度、Notebook 运行和 Agent 自动化执行，结合 Plan Mode 深度思考与 Subagent Handoff 实现长链路全自动编排；在内部 AI 挑战赛获得二等奖（3/58），将复杂 ETL 开发流从 4 小时压缩到 4 分钟。
· Meta Harness 自优化方法论：针对长链路中的幻觉和节点失效，设计嵌套于 Harness 之上的 Meta Harness，让系统在运行态自主探测、调参和补漏；结合列级 Schema Profiling 优化，在 Bird-Critic 评测中获得全球第一，Spider-Snow 有效 Pass@k 稳定超过 70%。

Agent HarnessMeta HarnessMCPCLISubagent Handoff

2026.01 — 至今

评测算法与基建负责人

· Rubrics 多 Agent 评测框架：设计多代理拆解 + 柔性规则引导的评测链路，解决 LLM 评测中的 Lazy Score 误判问题，整体一致性达到 80.1%（Kappa），显著高于同条件下外部标注团队的 52.8%。
· 从评测到数据飞轮：通过线上抽样数据集+竞品对比，实现自动化 Badcase 挖掘和偏好数据集构建，目前已累计构建万级以上高置信样本，形成"评测→标注→微调→再评测"的数据飞轮。

EvaluationMulti-AgentKappaData FlywheelReward Model

2021 — 2024

核心架构师

· 高并发分布式架构：设计调度与执行分离的主从架构解决单点问题；基于 Tid 实现多集群 Sharding 使调度能力可横向扩展，支撑周百万级任务调度（成功率 99.95%+），服务公有云万级客户。
· 开源贡献：深入 Azkaban 源码定位并修复核心内存泄漏问题，修复代码已合并至上游开源社区。

AzkabanDistributed SchedulingShardingOpen Source