AI Coding下复杂业务系统重构:反直觉的事实
当团队90%以上的代码由AI生成,31万行的复杂业务系统还在高速膨胀,会发现一个反直觉的事实:AI Coding不会自动收敛复杂度。没有统一规范的约束,不同人用AI写出的代码风格各异,系统反而会加速腐化。
重构记录:积累的关键经验
本文记录了如何在不停止业务交付的前提下,完成这场重构。在这个过程中,积累了三个关键经验:一是用Agent评测思路管理AI Coding,团队负责Agent评测业务,沉淀出“人人对齐→人机对齐”理念,管理AI Coding底层逻辑与之相同;二是AI正在重新定义“经验”的价值边界,利用AI工具,工程师短时间内发现10个性能隐患,经验价值从“能看全”转移到“能判断什么重要”;三是技术债可以像业务需求一样被迭代消化,把技术债拆解为业务需求的“顺带动作”,借着迭代渐进式消化。
背景:复杂的业务系统
Agent评测系统长期承载多个核心业务场景,业务复杂度和工程复杂度都很高。具体体现在三个维度:业务仍处于探索期,需求高度模糊,全行业都在探索Agent评测,用户不了解如何评测,需求又急又模糊;庞大且高频的迭代体量,系统从2025年6月约不足5万行代码快速扩展至31万行,月均16个需求;“笛卡尔积”级别的业务场景矩阵,系统底层支持6种多模态数据评测,上层构建多种核心任务视图和精细化业务动作,配套十余种质检机制,每天需处理成百上千种复杂业务流组合。
为什么要重构?
当业务进入快速迭代与试错期,庞大的业务体量与原有底层架构之间的矛盾集中爆发,迫使启动大规模重构。核心动因有三个痛点:一是业务模型亟需升级,旧架构无法支撑探索性业务,随着业务交互丰富度和复杂度增加,旧有数据模型扩展能力不足,新增业务形式需新增代码;二是代码严重腐化,技术债拖垮迭代效率,过去按需求建包开发,代码缺乏合理工程分层,形成“面条式代码”,技术债让开发痛苦,交付效率瓶颈严重;三是协作模式风险放大,缺乏规范的AI Coding加速系统腐化,团队成员规模增至3倍,技术背景复杂,90%以上代码由AI辅助编写,不建立底层架构规范,系统会快速腐化。因此,需要工程重构并建设符合AI Coding规范的工程重构。
重构时间线与执行路径
阶段一:定义问题,借助AI梳理技术债(2026年2月启动)
在需求高压背景下,梳理技术债面临困境,代码量太大,人力无法短时间穷举和穿透复杂关联逻辑。采用“专家经验定向 + AI辅助排查”方式,由核心开发圈定高危排查边界,AI进行穷举扫描,快速摸清系统底层P0/P1级技术债。AI适合帮把问题“看全”,但判断问题重要性和优先级还是由人负责。投入有限资源完成3个P0技术债和2个P1技术债的梳理,工程师还利用AI辅助精准定位10个性能隐患,这让重新思考“经验”的定义,经验价值从“能看全”转移到“能判断什么重要”。
阶段二:调研并制定AI友好的研发规范(2026年2月底完成)
通过技术债梳理解决了重构哪里的问题,接下来要解决“代码应该怎么写”。在全员90%代码依赖AI Coding的现状下,核心要解决“如何将一两个用好AI的人的经验,高质量泛化到全组”。在传统研发模式下,开发规范主要用于团队协作等,而AI成为主要编码产能后,规范意义发生本质变化,AI Coding时代的研发规范升级为约束AI产出、阻止系统长新债的基础设施。用评测Agent的方式管理AI Coding,先通过规范拉齐团队工程标准(人人对齐),再通过AI Rule和Skill约束大模型生成结果(人机对齐),顺序是先“人人对齐”,再“人机对齐”,人的共识是AI约束的前提。将规范转化为AI的执行约束,调研业内成熟团队研发规范,结合自身流程,沉淀出AI友好的工程约束,落地为always级别的AI Rule,前置到预CR环节,针对领域职责划分问题,沉淀为编码时渐进式加载的Skill。
阶段三:建立SOP,“见缝插针”完成渐进式重构(2026年3月 - 4月)
Action 1:100%借助AI完成工程分层与解耦重构
将“按需求建包”的面条式代码迁移到标准四层架构及按业务域组织的新结构中,重点是治理历史代码深度耦合问题,尤其是底层数据对象PO泄露与上浮。分三步推进:补齐业务对象与数据转换层,重建接口契约,修复上游全链路参数依赖。重构特点是改造规则明确但涉及范围广、重复劳动密集,先由重构主R完成两个最复杂包的迁移,沉淀可让AI执行的标准化迁移SOP,团队其他成员按SOP指导AI完成剩余包迁移,研发聚焦业务语义验收和Code Review,快速完成十余个核心包的工程结构迁移。
Action 2:零排期重构——借着业务需求“渐进式重构业务模型”
行业重构通常有推倒重来或申请专项排期两条路,这次走了第三条路,把技术债拆解为业务需求的“顺带动作”,借着迭代渐进式消化,未申请专门重构时间。具体做法是将技术债拆解到日常高优需求中,如借着核心功能迭代需求设计并落地全新业务模型,借着功能升级需求设计全新质检业务模型并完成全量迁移。难点在于拆解精度,要在不停止业务交付的前提下完成核心数据模型的平滑升级。
Action 3:重构质量保证
一是建设AI CR与Pre - PR机制。AI编码效率提升后,Code Review成为瓶颈,团队达成共识:人工CR价值转变为判断是否在正确约束下解决正确问题,AI审查规范类问题,人重点在前置技术方案评审环节把关。引入Pre - PR机制,提交代码前用AI审查自查,修复问题后提交标准PR文档;高阶模型审查低阶模型;不同厂商模型对抗互相审核。二是调研取经,建立AI辅助测试用例生成规范。团队100%的需求由研发兼任测试,探索AI辅助自测有两条路线,路线A全自动生成用例问题多,最终确认路线B(人工主导,AI辅助)方向,沉淀为Human - in - the - loop的测试SOP,包括建立范围、风险分级、设计分组、生成步骤、验证覆盖等步骤。
总结
沉淀的关键经验
一是用评测Agent的方式管理AI Coding,先团队形成统一共识,再固化为AI可执行约束;二是AI重新定义了“经验”的价值边界,经验价值从“能看全”转移到“能判断什么重要”;三是技术债可以像业务需求一样被迭代消化,关键在于拆解能力;四是工程师的角色变了,工作重心从“写代码”转向“设计并维护能让AI可靠产出代码的工程环境”。
行动指南:如果你的团队也想落地
第一步盘清技术债,由核心开发圈定高危方向,让AI做穷举扫描;第二步制定规范并落地为AI Rule、Skill,先组织团队对齐核心共识,再固化为AI编码时加载的Rule;第三步由主R打样,沉淀可复用的迁移SOP;第四步建立Pre - PR机制,提交前用AI自查,让人工CR聚焦业务语义。