)
当Boris Cherny说出我已经八个月没手写过代码时他身后运行的不是某一个模型而是一个由数千个AI智能体组成的自治编排系统。Claude Code正在经历一场从底层架构到交互范式的根本性变革。一、事件背景一条推文引爆的架构革命Anthropic工程师Boris Cherny近日官宣Claude Code下一版本将默认让子智能体Sub-agents在后台运行。这不是一个简单的功能更新而是一次架构范式的根本性切换——Claude Code正在从一个一问一答的对话框进化为一个异步、并行、自治的工作流引擎。要理解这次变革的分量需要回溯Claude Code在过去几个月中的三次关键架构迭代。这三次迭代的节奏之快、方向之明确在AI开发工具领域几乎前所未见。对于需要在生产环境中管理多模型API调用、统一接入不同大语言模型的团队而言底层平台的架构选型至关重要。作为微元算力(weytoken)这样的企业级大模型聚合平台我们持续跟踪这类架构演进因为它直接决定了上层应用的编排能力和扩展天花板。二、三步演进路线图从定时任务到万级智能体并行2.1 阶段一Routines — 定时任务的基础设施化4月核心变化引入 cron/hooks 机制任务调度跑在云端基础设施上。Routines 的本质是将开发者从实时在线驱动AI的模式中解放出来。通过类 cron 的声明式配置开发者可以定义定时触发的代码审查任务如每日凌晨扫描PR事件驱动的自动化流水线如 git push 触发自动重构周期性健康检查与报告生成# Routines 配置示例概念性routines:-name:daily-code-reviewtrigger:cron:0 2 * * *agent:claude-codetask:Review all open PRs in src/ directoryoutput:slack-channel(#code-reviews)架构意义这是Claude Code第一次具备了脱离用户会话独立运行的能力。虽然此时的任务模型还是单线程、串行的但它奠定了云端调度层的基础。2.2 阶段二Dynamic Workflows — 多智能体并行编排5月核心变化ultracode模式下可调度数十到上百个子智能体并行执行。如果说Routines解决了何时运行的问题Dynamic Workflows解决的则是如何协同的问题。这一阶段引入了能力维度Routines4月Dynamic Workflows5月执行模型单任务串行多智能体并行调度粒度固定cron/事件触发动态DAG编排智能体数量1个数十到上百个状态管理无状态跨智能体状态共享错误处理重试/跳过动态重分配/降级适用场景定时巡检、单点任务大规模重构、并行分析架构意义Claude Code从一个AI帮你干活变成了一个AI指挥一群AI干活。主智能体Orchestrator负责任务分解与结果收束子智能体Workers负责具体执行。这已经是一个典型的分布式智能体系统的雏形。2.3 阶段三后台子智能体默认运行6月官宣核心变化子智能体不再需要前台等待默认在后台异步执行。这是最新也是最关键的一步。在此之前即使是并行模式用户仍然需要在前台看着智能体运行。默认后台运行意味着主智能体完全解耦用户发出指令后可以关闭终端主智能体在云端持续编排资源利用率最大化不再受限于本地机器的算力和网络真正的异步工作流智能体完成后通过通知机制Webhook/Slack/Email回调用户用户发出高层指令 │ ▼ ┌─────────────────┐ │ 主智能体(云端) │ ← 用户可离线 │ 任务分解 编排 │ └────────┬────────┘ │ 动态分发 ┌─────┼─────┐ ▼ ▼ ▼ [子智能体A] [子智能体B] [子智能体C] ← 全部后台运行 │ │ │ └─────┼─────┘ ▼ 结果收束 合并 │ ▼ 通知用户Webhook/Slack三、架构深度拆解子智能体编排系统的技术原理从三次迭代的脉络来看Claude Code正在构建的是一个分层智能体编排架构。我们可以将其拆解为四个核心层3.1 架构全景图基础设施层智能体执行层编排调度层用户交互层高层意图描述任务分解动态调度执行结果执行结果执行结果状态同步完成通知用户终端/IDE会话网关主智能体 Orchestrator任务队列 Task Queue负载均衡器子智能体 Worker-1子智能体 Worker-2子智能体 Worker-N结果收集器状态存储云端沙箱环境文件系统/Git仓库3.2 各层职责详解用户交互层Interaction Layer用户只需提供高层意图如重构整个auth模块不需要指定具体步骤会话网关负责将自然语言意图转化为结构化的任务描述关键设计用户与编排系统完全解耦提交后可离线编排调度层Orchestration Layer主智能体是整个系统的大脑负责任务分解将高层意图拆解为可并行执行的子任务DAG依赖分析识别子任务间的前后依赖关系资源分配根据子任务复杂度分配不同能力的子智能体异常处理监控子智能体执行状态处理超时、失败等异常任务队列采用优先级调度支持动态插入和取消智能体执行层Execution Layer每个子智能体运行在独立的云端沙箱中沙箱隔离确保并行任务之间不会互相干扰子智能体具备完整的工具链访问能力文件读写、终端执行、网络请求执行结果通过标准化的结果协议回传基础设施层Infrastructure Layer状态存储维护全局任务状态、子任务进度、中间产物引用云端沙箱提供一致的文件系统视图Git操作在沙箱层面进行隔离和合并3.3 关键技术决策分析为什么选择默认后台而非可选后台这个设计决策透露了Anthropic对AI编程工具未来的判断前台模式是反模式让人类等待AI完成任务本质上是在用人类的注意力资源补偿系统的同步阻塞这是低效的后台模式释放真正的并行能力只有当用户不再盯着每个智能体时系统才能真正扩展到数十、数百个并行智能体信任模型的自治能力默认后台意味着Anthropic对主智能体的编排可靠性有足够信心四、“写提示的是另一个Claude” — 智能体自举的深层含义Boris Cherny提到的另一个细节同样值得深挖“写提示的是另一个Claude”。这意味着在Boris的工作流中不仅执行代码的是AI连给AI写指令的也是AI。这构成了一个智能体自举Agent Bootstrapping的闭环生成任务提示执行结果反馈质量评估 调整策略Claude-规划者Claude-执行者集群Claude-评估者这个闭环的关键在于人类的角色从编写代码上移到了定义目标。Boris八个月不手写代码不是因为他不写代码了而是他的工作已经完全转移到了更高层级的系统设计和目标定义上。对于企业级大模型聚合平台而言这种多智能体协同模式对底层API的稳定性、并发能力和模型路由策略提出了极高要求。无论是调度不同规格的模型来承担规划、执行、评估等不同角色还是在高并发场景下保证任务队列的可靠运转都需要平台层面提供坚实的基础设施支撑。五、对开发工具生态的启示Claude Code的这次架构演进折射出AI开发工具正在经历的三个范式转移维度旧范式新范式交互模式同步对话一问一答异步工作流提交即走执行模型单智能体串行多智能体并行编排人类角色逐步指令驱动高层意图定义运行环境本地终端云端沙箱扩展方式插件/扩展智能体数量水平扩展这三个范式转移叠加在一起指向一个清晰的趋势AI编程工具正在从辅助工具进化为自治工程团队。六、总结Claude Code的三次架构迭代——Routines、Dynamic Workflows、后台子智能体默认运行——不是三个独立功能的堆叠而是一条清晰的架构演进路线从对话框到工作流引擎从单智能体到万级智能体编排从同步阻塞到全异步自治。Boris Cherny八个月不手写代码的极端案例或许正是未来软件工程的一个缩影。当AI不仅能写代码还能自己分配任务、自己编排执行、自己评估质量时人类工程师的核心价值将彻底转向架构设计与系统目标定义。想了解企业级大模型聚合平台如何为多智能体架构提供稳定的底层支撑了解更多技术细节可以访问微元算力(weytoken)官网。