专业技能
- Data Agent Harness:Multi-Agent协作编排、自动语义层设计、基于图存储引擎的动态记忆基座(Memory)、DeepResearch、终端原生CLI、MCP、Agent Skills
- NL2SQL大模型应用算法:Schema Linking、Few-shot样本构建与检索(RAG)、以及约束解码(Constrained Decoding)、投机采样(Speculative Decoding)等高阶大模型推理优化算法、大小模型层级协同架构设计
- 评估与测试基建:RAG端到端评估系统、基于LLM的自动化评测打标闭环
- 系统架构设计:分布式系统高可用架构、企业级性能优化落地
- 后端代码开发:Java、Python、微服务架构体系
- 项目落地与管理:大型跨业务技术方案统筹设计、架构方案赋能行业级落地复制
教育背景
南方科技大学
计算机科学与技术专业 · 本科 · 优秀毕业生(前5%)
深圳,中国
09/2016 — 07/2020
工作经历
高级开发工程师
阿里云 · 数据库部门
04/2020 — 至今
- Data Agent 体系负责人:主导DMS智能化升级,从0到1打造智能问数Copilot体系并成功商业化,随后驱动平台演进至Data Agent阶段。牵头主力Agent编排能力(Agent Harness)、底层图检索引擎(记忆)、及端侧终端智能体(Data Agent CLI)建设。
- 核心技术布道与前沿突破:主导架构并在权威真实场景SQL评测基准 Bird-Critic中斩获全球第一;主导的 Constrained Decoding(约束解码) 核心算法创新成功由于显著解决高频语法错误作为头条文章登载于阿里云官方微信公众号。
- 数据管理底座与数据可视化架构师:统筹负责大型企业级DMS数据调度编排系统架构及可视化平台建设,攻克海量调度稳定与图表生成的双重技术瓶颈。
核心项目经验
NL2SQL 大模型算法构筑与问数产品化 (0-1 Copilot期)
09/2023 — 08/2024
算法设计一作,系统主负责人
- 端到端闭环落地:从0开始打造DMS智能问数应用构建(最初为Copilot形态),一站式统筹算法逻辑、用户流与前后端交集,推动该项目在金融政企等大型行业的大规模商业化订阅落地。
- 100%语法约束保障:主导自研落地 Constrained Decoding (约束解码) 技术保障机制,根治大模型在生产SQL环节中的语法错误现象,极好地兼容了人工可信干预与审查。该核心创新算法成功作为(头条文章)发表于阿里云官方微信公众号。
- 大规模加速推理机制:创造性提出融合大小模型层级协同的工作模式,并尝试通过 Speculative Decoding (投机采样) 实现复杂推理链路的提速,有效瓦解SQL高并发生成的时延障碍。
Data Agent 核心编排与底层数据流基建 (全栈演进阶段)
03/2024 — 至今
系统主负责人,架构演进统筹
- 架构演进层:将问数全系进化为Data Agent形态。核心主导并研发 Agent 编排协同框架 (Agent Harness):负责管理上下文、工具执行&MCP、编排逻辑、循环控制、钩子/中间件等。同时主导研发并开源首个企业级 dms-mcp Server,成功构建基于该 MCP 的应用模版《DMS ChatBI数据助手》,热度处于百炼应用市场通用模版Top1。
- 权威打榜登顶:基于强劲的Agent Harness和自优化流水线;单人打榜并在数据库领域权威学术榜单 Bird-Critic中斩获全球第一。
- 基础高阶算子重构:主导找表召回基建迭代(含Schema Linking改良、列Profiling聚类),Spider-Snow评测端到端 Pass@k 有效突破 70%+。
OneMeta:从自动语义层到 Data Agent 动态图记忆底座
09/2023 — 至今
技术负责人
- 自动化知识库阶段建立:指导和主导知识系统的发轫与成长:从早期直接依赖解析系统历史 SQL 日志获取粗粝表关联(自动化挖掘期),演进提升至构建 Automatic Semantic Layer (自动语义层) 提取严谨的库表逻辑属性。
- 海量结构演进痛点的破局 (图技术重构):针对企业复杂业务长期发展下(数百万级表结构/列更迭分层)引发的失效问题及核心历史流转状态溯源需求,全面使用业务图存储结构重新表征与容纳庞大检索体系结构(Spider2-Snow 评测中聚类处理后Top-10向量召回率突破 95%)。
- "记忆中枢化"改造与微服务同步:基于上述图存储,将用户个体属性分布、个体数据流转偏好关联上提为首层图节点,正式升维接管为 Data Agent 的动态记忆中枢。同时构建强大的微服务与异步同步引擎,保障表知识更新延迟严控在 5 分钟内。
Data Agent CLI
2025 — 至今
独立发起人,核心研发
- 终端全栈 Harness 架构与业务效能爆炸:作为整体化Data Agent能力的终端载体,运用命令行形态(CLI)打造对标 Claude Code 的高阶智能体架构,为模型提供完整文件系统交互、Bash执行及状态记忆。凭借该架构原型斩获数据库【数智未来—AI创新挑战赛】二等奖(3/58),将企业复杂数据清洗ETL流耗时从 4小时缩短至4分钟。
- 自动化编排与深度思考:自底向上应用包含隐式深度思考框架的 Plan Mode 自动化循环逻辑;创新融合动态 Subagent System (子代理体系),实现无缝的任务流转接管 (Handoff)。全方位应对长链路、高容错的数据清洗与复杂 ET 开发任务流。
- 沙箱级生态容器与记忆闭环:在安全的隔离沙箱端界内,构建并串联原生系统的动态工具链(原生文件操作、安全网络抓取WebFetch、跨环境的Notebook联调)。融合持久化记忆(AGENTS.md)与上下文防"腐烂"拦截机制,最终配合阿里云 AI 网关平稳落地提供稳定公众服务。
AI模型端到端评测基建体系
01/2026 — 至今
评测基建负责人
- 可定制的Multi-Agent 评测平台:负责构建支持多模型的生成、评测统一基建。针对多客户客制化标注诉求,创新研发基于 Multi-Agent 架构的定制评估链路:灵活支持自定义主 Agent 业务拆解,及子 Agent 的精细化 Rubrics 打分标准。
- 超越人类的评测准度闭环:深度参与建立外包准入准则及包含多组多维度金标准的人工/自动化测试集。核心自动化 Agent 一致性评测模型取得 80.1% (Kappa) 的极高一致性(远超同等测试环境下的人类外包专家 52.8% 水平)。
- 数据飞轮与全链路配套:构建自动化 Badcase 挖掘流水线与大盘监控,沉淀了数万级高质量样本;同时,高准度评测 Agent 已初步具备作为 Reward Model 反哺业务生成迭代的能力底座。
企业级数据调度平台构建
2022 — 2024
核心架构师,企业级功能Owner
- 超大规模调度基建:突破开源限制,重构研发企业级数据调度(Azkaban)主从与多集群Sharding架构,支撑金融政企等大型场景周百万级任务调度需求(成功率99.95%+)。
- 开源社区贡献:彻底排查解决开源Azkaban核心内存泄漏问题,相关修复与改进代码已被官方社区合并。
数据分析可视化平台构建
07/2021 — 2023
技术负责人,项目Owner
- 数据分析平台:从0到1构建涵盖20+种数据引擎的数据分析及专利级一键可视化组装引擎,低门槛沉淀业务看板并稳定支撑公有云万级客户长尾数据消费需求。
个人总结
- AI应用与大模型落地:深刻理解从AI Copilot到Data Agent的演进路径,具备主导从0到1构建企业级大模型乃至重构端到端评测基建体系的实战经验
- 前沿技术创新突破:在智能体架构(Agent Harness)、大模型约束解码算法(Constrained Decoding)、和底层动态图记忆基座(Memory)等方面持续产出创新解法并获权威榜单及官方认可
- 复杂系统架构能力:擅长统筹涵盖大规模数据流引擎基建、跨终端原生CLI到大型调度系统等硬核架构底层设计,保障严苛金融政企商业场景下的极致高可用
- 业务洞察与项目管理:敏锐挖掘企业级数据产品深层痛点并转化为技术架构,充当核心发起人具备丰富的跨大型团队攻坚统筹及标杆行业落地方案复制分发经验
- 语言:中文(母语),英语