项目
核心项目经验
Text2SQL 大模型算法与问数产品化(Copilot 0→1) ↗
2023.09 — 2024.08算法一作,架构主力
- · 从算法研究到生产交付:基于在 Text2SQL 方向的持续算法积累,负责模型路由、执行链路和前端交互的核心设计,推动 Copilot 从可演示状态走向金融、政企场景的商业化落地。
- · 100% 语法约束机制:研发并部署 Constrained Decoding(约束解码),在生成阶段直接干预 Logits 输出,以毫秒级开销实现 SQL 语法的完全校准,彻底解决语法幻觉问题,并支持"知识配置化";该工作被阿里云官方头条专题报道。
- · 推理加速探索:针对长链路任务的生产时延问题,牵头尝试 Speculative Decoding(投机采样),用轻量模型草稿+大模型验证的方式压缩端到端推理耗时。
- · 知识检索体系演进(OneMeta):从早期基于 SQL 日志的自动表关联挖掘,到构建表/列/SQL 分层知识库(某金融客户准确率从 60% 提升至 95%),再演进为基于 Graph Nodes + 列级向量聚类的动态图记忆底座(Spider2-Snow Top-10 召回率 95%);基于 CDC + Kafka 构建异步同步链路,通过 Key 分区保障表级因果有序、LSN 乐观锁防乱序覆盖,配合死信队列与分级重试,将图记忆回流延迟控制在 5 分钟内。
Constrained DecodingSpeculative DecodingGraph StorageVector ClusteringCDC+Kafka
Data Agent 编排与自优化底座(Meta Harness) ↗
2024.03 — 至今框架发起人,开源主理
- · Agent Harness 编排底座:推动架构从 Copilot 升级为 Data Agent,搭建管理上下文、工具执行和循环控制的 Agent Harness 作为统一编排内核;主导发布企业开源级 dms-mcp Server。
- · 云端 Claude Code(CLI 形态):受 Claude Code 启发,搭建云端 CLI 运行环境,支持任务调度、Notebook 运行和 Agent 自动化执行,结合 Plan Mode 深度思考与 Subagent Handoff 实现长链路全自动编排;在内部 AI 挑战赛获得二等奖(3/58),将复杂 ETL 开发流从 4 小时压缩到 4 分钟。
- · Meta Harness 自优化方法论:针对长链路中的幻觉和节点失效,设计嵌套于 Harness 之上的 Meta Harness,让系统在运行态自主探测、调参和补漏;结合列级 Schema Profiling 优化,在 Bird-Critic 评测中获得全球第一,Spider-Snow 有效 Pass@k 稳定超过 70%。
Agent HarnessMeta HarnessMCPCLISubagent Handoff
Multi-Agent 评测体系与数据飞轮
2026.01 — 至今评测算法与基建负责人
- · Rubrics 多 Agent 评测框架:设计多代理拆解 + 柔性规则引导的评测链路,解决 LLM 评测中的 Lazy Score 误判问题,整体一致性达到 80.1%(Kappa),显著高于同条件下外部标注团队的 52.8%。
- · 从评测到数据飞轮:通过线上抽样数据集+竞品对比,实现自动化 Badcase 挖掘和偏好数据集构建,目前已累计构建万级以上高置信样本,形成"评测→标注→微调→再评测"的数据飞轮。
EvaluationMulti-AgentKappaData FlywheelReward Model
企业级数据调度平台 ↗
2021 — 2024核心架构师
- · 高并发分布式架构:设计调度与执行分离的主从架构解决单点问题;基于 Tid 实现多集群 Sharding 使调度能力可横向扩展,支撑周百万级任务调度(成功率 99.95%+),服务公有云万级客户。
- · 开源贡献:深入 Azkaban 源码定位并修复核心内存泄漏问题,修复代码已合并至上游开源社区。
AzkabanDistributed SchedulingShardingOpen Source