小白程序员必看：如何优化 Claude Code 类 coding agent 的 token 消耗，降低开发成本？

发布时间：2026/6/14 7:21:42

本文探讨了 Claude Code 类 coding agent 在开发过程中 token 消耗的问题指出并非所有消耗都用于写代码而是很多花在了理解后端架构上。文章强调后端信息表达的清晰度直接影响 agent 的 token 消耗并提供了优化建议如使用 Skills 提前装静态知识、采用 CLI结构化输出执行操作、合理分工 MCP 负责实时状态等帮助开发者降低开发成本。Claude Code 这类 coding agent 的很多 token 消耗并不是花在“写代码”本身而是花在“搞清楚后端到底长什么样”这件事上。如果后端给 Agent 的信息是碎的、糊的、冗长的模型越强往往不是越省而是越贵。因为它会更认真地去探索、重试和补洞。这件事本质上就是 Karpathy 说的context engineering只不过大多数人把它理解成prompt 怎么写RAG 怎么喂上下文窗口怎么塞而这条帖子真正补上的一层是后端本身也是上下文。这条帖子到底在讲什么做了一个很具体的实验用 Claude Code 分别在Supabase和InsForge上搭同一个应用DocuRAG然后比较整个开发会话的 token 消耗和成本。这个应用不简单基本把一个 AI 全栈应用常见的后端能力都摸了一遍Google OAuth 登录PDF 上传文本切块向量存储RAG 检索Edge FunctionRLS 权限隔离调 OpenAI 模型做 embedding 和问答也就是说这不是一个“做个 Todo App”的轻量测试。它比较接近很多人现在真的会拿 Claude Code 去做的事情。给出的结果很抓眼球Supabase会话10.4Mtokens约$9.21InsForge会话3.7Mtokens约$2.81表面看这是一个“成本差了快 3 倍”的故事。但如果只停在这个结论上你很容易看错重点。真正关键的地方不是哪个后端赢了如果只用一句话总结这条内容真正有价值的部分那就是Agent 的成本经常不是由模型决定而是由“系统怎么把信息暴露给 Agent”决定。这个判断很重要。因为很多人做 Agent 系统时默认会把成本问题归因到模型太贵context 太长prompt 写得不好工具调用太多这些当然都有关。但这条帖子指出了一个经常被忽略的来源后端接口的表达方式本身就在决定 Agent 要不要反复试探。换句话说问题不是 Claude Code 会不会用后端而是后端有没有把“对 Agent 有用的信息”用 Agent 友好的方式交出来。为什么后端会变成 token 黑洞帖子里把原因拆成了 3 个我觉得这个拆法很清楚。1. 文档检索返回太多Agent 每次都被迫吃整包第一个问题是文档 retrieval 粒度太粗。举个帖子里的例子。当 Agent 想配置 Google OAuth它去查的是一个非常具体的问题。它真正想知道的可能只有Google OAuth 相关配置项回调地址怎么填哪几个参数必填但如果工具一把把整个认证文档都吐回来里面还顺带塞了email/passwordmagic linksphone authSAMLSSOJWT 配置那 Agent 虽然“拿到了答案”但也同时吞下了大量并不需要的上下文。这不是信息不足而是信息过载。这意味着什么Agent 每问一个小问题后端都在往上下文窗口里倒一整盆东西。如果一个会话里要配置 auth、database、storage、edge functions这种额外开销会叠得非常快。2. Agent 看不到“全局状态”只能靠猜第二个问题更典型。人类开发者看后端通常会同时看很多东西当前有哪些表Auth provider 开了哪些存储桶有没有配函数是否部署成功RLS 状态对不对你是在用“全局视角”理解系统。但 Agent 如果拿不到这种全局状态它就只能一条命令一条命令去拼图查表查扩展查配置查日志再根据结果补一轮查询问题在于拼图式 discovery 很贵而且很容易漏。一旦关键状态没有被清楚暴露Agent 就会开始进入“猜测模式”。而猜测模式正是 token 开始失控的起点。3. 错误信息不够结构化Agent 会掉进 retry loop第三个问题最花钱也最真实。当系统报错时人类开发者通常会做几件事先看错误信息再看 dashboard再去对日志再结合经验判断“错在代码、配置、权限还是平台”但 Agent 并没有你这种综合判断路径。如果返回给它的只是一个模糊的401、403或500它会做什么它会先猜一个原因写一个修复重试发现不对再猜另一个原因如果真实原因不在代码层而在平台层这个循环就会非常昂贵。而这条帖子里最值钱的观察也在这里很多 token不是花在“实现功能”而是花在“错误定位失败之后的连续重试”。为什么模型更强反而可能更贵这条帖子里有个很反直觉的点。提到在一组 MCPMark V2 的测试里Claude 从Sonnet 4.5升到Sonnet 4.6之后后端 token 使用反而从11.6M涨到了17.9M。乍一看很怪。模型更聪明了为什么还更贵原因其实不复杂更强的模型不会自动消灭上下文缺口。它只会更认真地处理这个缺口。也就是说当信息不完整时强模型往往会做更多推理发起更多探索尝试更多修复进行更完整的自我验证这会提高成功率但同时也会放大成本。所以如果后端暴露方式没有优化模型升级有时会把问题“做得更认真”而不是“做得更便宜”。这其实就是“后端上下文工程”把解决方案总结成一句话不要让 Agent 通过探索来理解后端而要让后端主动把关键上下文整理好。这个说法我非常认同。因为 context engineering 的本质从来不是“把东西塞满”而是在下一步行动之前把最该知道的信息用最低摩擦的方式放进上下文。放到后端层就是三件事1. 静态知识用 Skills 提前装进去如果某些知识是稳定的比如SDK 用法常见框架接入方式哪些认证模式是推荐写法哪些 edge case 最容易踩坑那就不该让 Agent 每次都重新查文档。更务实的做法是把这些稳定知识做成 Skills。这样 Agent 进入任务时先看到的是已经整理过的模式而不是从海量文档里做二次检索。这能省的不只是 token还有很多“走错第一步”的成本。2. 执行动作用 CLI不要让状态修改过度依赖聊天式工具调用帖子里特别强调CLI structured output这一层。这点很关键。因为对 Agent 来说最理想的执行接口不是“像人在点网页”而是命令明确输出结构化成功失败信号清楚可以被程序继续处理比如一条 CLI 命令如果支持# 返回结构化 JSONAgent 可以直接解析 npx backend-cli metadata --json那 Agent 就不需要先看一大段自然语言说明再自己猜哪些字段有用。3. MCP 更适合看“正在变化的状态”不适合当文档仓库这条内容里我最认可的一个设计判断是MCP 不是不能用而是要把它放在合适的位置。更合理的分工是Skills 负责静态知识CLI 负责执行操作MCP 负责实时状态如果把 MCP 主要用来查文档你很容易出现“大量 schema / metadata 一起回传”的问题。但如果用它来回答当前 auth provider 开了什么当前表结构和 RLS 状态是什么当前有哪些 bucket / function / model那它就很有价值。一句话总结MCP 更像“系统透视镜”不该变成“超大号文档搜索器”。那个 3 倍结果到底该怎么理解这里要稍微冷静一点。实验结果很亮眼但帖子自己也补了一句边界条件这次接近2.8x的差距有一部分是因为 Supabase 那边踩进了一个很贵的调试循环。具体发生了什么登录修好之后文档上传仍然报错。Agent 看到的是一连串401于是连续尝试了很多代码层修复改 header补日志改 token 读取方式换认证做法再次部署函数最后才发现真正的问题不是代码而是平台侧的verify_jwtgate 在函数代码运行前就把请求挡掉了。这就导致 Agent 在“错层排障”上烧掉了大量 token。这不是一个虚构问题。恰恰相反这非常真实。但也正因为它很真实所以我们要更准确地解读这个结果这不是在证明某个后端天然就永远便宜 3 倍而是在证明当后端上下文不清楚、错误信号不明确时Agent 的调试成本会成倍放大。这个实验真正想告诉我们的不是选型而是设计原则如果你把这条帖子理解成“InsForge 赢了Supabase 输了”那你其实只看到了表层。它真正更通用的启发是这 4 条1. 不要让 Agent 自己去猜系统全貌如果系统状态可以一次性给就不要拆成 10 次工具调用让它拼。2. 不要把稳定知识放在运行时反复检索能前置成 Skills、模板、标准模式的就尽量前置。3. 不要让错误信息停留在“人类勉强看得懂Agent 只能瞎猜”错误应该尽量结构化最好能告诉 Agent错在哪一层是权限问题还是平台问题是代码没跑到还是代码跑了但失败4. 真正贵的不是执行一次而是连续重试Agent 系统的成本很多时候不是来自成功路径而是来自失败路径。所以最该优化的往往不是 happy path而是state discoveryambiguity reductionfailure diagnosis如果你正在做 Agent Backend这篇内容最值得你检查什么你可以直接拿它当一张自查清单。1. 你的后端能不能一次性返回“当前系统长什么样”如果不能Agent 基本就会进入探索模式。2. 你的文档检索是返回“相关答案”还是返回“整个领域”如果是后者token 很容易被背景噪音吃掉。3. 你的关键操作有没有结构化 CLI 或等价接口如果 Agent 只能靠网页、自然语言日志、非结构化输出做判断成本通常会更高。4. 你的错误信息能不能明确指出失败层级比如平台层拒绝权限层拒绝业务代码报错外部服务失败这几个对 Agent 来说完全不是一回事。5. 你有没有把“错误重试成本”算进系统设计很多团队只盯单次调用 token不盯 retry loop。但真实世界里retry loop 才是最容易爆预算的地方。最后一句Claude Code 这类 agent 的成本优化很多时候不是 prompt engineering也不是 model switching而是 backend context engineering。真正关键的地方在于别让 Agent 用昂贵的探索去补你本来就可以明确给出的后端信息。而是它把一个很少被单独拿出来讨论的问题讲清楚了当我们开始让 Agent 真正接管全栈开发流程后端不只是业务基础设施它本身就是上下文基础设施。最后如果说程序员已经是高薪职业那么干AI的程序员就是高薪中的高薪。现在的市场已经用数据给程序员指明了方向学AI大模型就是冲刺高薪的最优解看着身边越来越多的同行转型大模型、拿到高薪offer很多人心里都动了心但真正的难题来了零基础小白不知道从哪入门有基础的程序员找不到系统学习路径实战项目练手无门面试不知道考什么别慌今天就给大家整理了一份【2026年最新版】AI大模型免费学习资源包覆盖从入门到实战、从理论到面试、从基础到进阶的全流程所有资料均已整理归档无冗余、无套路免费分享给每一位想抓住AI风口的程序员和小白扫码免费领取全部内容1、大模型系统化学习路线2、大模型学习书籍文档3、AI大模型最新行业报告4、大模型项目实战配套源码5、大模型大厂面试真题四阶段精细化学习规划附时间节点可直接照做结合上述资源给大家整理了一份可直接落地的四阶段学习规划总时长约2个月小白可循序渐进程序员可根据自身基础调整节奏高效掌握大模型核心能力快速实现从“入门”到“能落地、能面试”的跨越。第一阶段10天初阶应用该阶段让大家对大模型 AI有一个最前沿的认识对大模型 AI 的理解超过 95% 的人可以在相关讨论时发表高级、不跟风、又接地气的见解别人只会和 AI 聊天而你能调教 AI并能用代码将大模型和业务衔接。大模型 AI 能干什么大模型是怎样获得「智能」的用好 AI 的核心心法大模型应用业务架构大模型应用技术架构代码示例向 GPT-3.5 灌入新知识提示工程的意义和核心思想Prompt 典型构成指令调优方法论思维链和思维树Prompt 攻击和防范…第二阶段30天高阶应用该阶段我们正式进入大模型 AI 进阶实战学习学会构造私有知识库扩展 AI 的能力。快速开发一个完整的基于 agent 对话机器人。掌握功能最强的大模型开发框架抓住最新的技术进展适合 Python 和 JavaScript 程序员。为什么要做 RAG搭建一个简单的 ChatPDF检索的基础概念什么是向量表示Embeddings向量数据库与向量检索基于向量检索的 RAG搭建 RAG 系统的扩展知识混合检索与 RAG-Fusion 简介向量模型本地部署…第三阶段30天模型训练恭喜你如果学到这里你基本可以找到一份大模型 AI相关的工作自己也能训练 GPT 了通过微调训练自己的垂直大模型能独立训练开源多模态大模型掌握更多技术方案。到此为止大概2个月的时间。你已经成为了一名“AI小子”。那么你还想往下探索吗为什么要做 RAG什么是模型什么是模型训练求解器损失函数简介小实验2手写一个简单的神经网络并训练它什么是训练/预训练/微调/轻量化微调Transformer结构简介轻量化微调实验数据集的构建…第四阶段20天商业闭环对全球大模型从性能、吞吐量、成本等方面有一定的认知可以在云端和本地等多种环境下部署大模型找到适合自己的项目/创业方向做一名被 AI 武装的产品经理。硬件选型带你了解全球大模型使用国产大模型服务搭建 OpenAI 代理热身基于阿里云 PAI 部署 Stable Diffusion在本地计算机运行大模型大模型的私有化部署基于 vLLM 部署大模型案例如何优雅地在阿里云私有部署开源大模型部署一套开源 LLM 项目内容安全互联网信息服务算法备案…扫码免费领取全部内容6、这些资料真的有用吗这份资料由我和鲁为民博士(北京清华大学学士和美国加州理工学院博士)共同整理现任上海殷泊信息科技CEO其创立的MoPaaS云平台获Forrester全球’强劲表现者’认证服务航天科工、国家电网等1000企业以第一作者在IEEE Transactions发表论文50篇获NASA JPL火星探测系统强化学习专利等35项中美专利。本套AI大模型课程由清华大学-加州理工双料博士、吴文俊人工智能奖得主鲁为民教授领衔研发。资料内容涵盖了从入门到进阶的各类视频教程和实战项目无论你是小白还是有些技术基础的技术人员这份资料都绝对能帮助你提升薪资待遇转行大模型岗位。这份完整版的大模型 AI 学习资料已经上传CSDN朋友们如果需要可以微信扫描下方CSDN官方认证二维码免费领取【保证100%免费】

文章详情

小白程序员必看：如何优化 Claude Code 类 coding agent 的 token 消耗，降低开发成本？

相关新闻

最新新闻

日新闻

周新闻

月新闻