
Claude Sonnet 5 上线Claude 把 Agent 模型打到更便宜豆包继续补真实工作流OpenAI 则把企业最头疼的内网工具接入问题拿出来单独解决。今天 AI 圈可以看的事不少但真正值得普通读者停一下的其实只有三件。不是谁又发了一个小功能。也不是某个榜单名次变了两格。而是三家公司在同一天把同一个方向讲得更清楚了AI 正在从“会回答”继续往“能交付”走。区别只在于有人降价有人补能力有人补企业基础设施。第一件事Claude Sonnet 5 上线价格比声量更值得看Anthropic 发布了 Claude Sonnet 5。它不是最适合拿来刷存在感的那种“最强模型”叙事但它的商业信号很硬全计划可用进入 Claude Code 和 Claude Platform并给出限时 API 价格。到 2026 年 8 月 31 日前Claude Sonnet 5 的 API 价格是每百万输入 token 2 美元、每百万输出 token 10 美元之后调整为每百万输入 3 美元、输出 15 美元。这组价格比“又聪明了多少”更值得看。因为 Agent 真正跑起来最先烧掉的不是宣传语而是 token。一个能改代码、查资料、点工具、跑多步任务的模型如果每一步都太贵就只能停留在少数高价值场景里。Sonnet 5 的位置正好卡在企业和开发者最敏感的区间够强能干活。够便宜能多跑。Anthropic 还强调Sonnet 5 在编码、Agent、职业工作流上比前代 Sonnet 更进一步尤其是多步任务、浏览器和电脑使用能力。这不是单纯模型升级。这是在告诉市场Agent 的竞争已经进入“每完成一件事多少钱”的阶段。第二件事豆包 Seed2.1 不是炫技重点是“交付完整任务”字节 Seed 团队发布 Seed2.1豆包和火山引擎用户已经可以访问。这条国内进展比很多“模型发布”更值得看因为它讲的不是单点能力而是三类真实工作多工具、多环境的 Agent 执行。端到端 Coding 交付。更强的多模态理解。字节在官方说明里反复提到“真实工作流”这很关键。过去模型厂商很喜欢讲静态榜单。今天大家开始换话术能不能看懂一堆文件能不能拆任务能不能调用工具能不能写完代码能不能把结果交付出来。Seed2.1 里尤其值得注意的是两个点。第一它强调跨工具、跨环境执行不只是在聊天框里回答。第二它把企业级开发场景拆成需求分析、功能实现、Bug 修复、环境配置、结果验证这些完整环节。这说明国内大模型也在从“模型能力”往“可用工作流”迁移。豆包的优势不只是模型本身还在于字节有足够多真实产品入口办公、内容、视频、剪辑、搜索、协作、开发者平台。模型如果能被这些入口持续喂给真实任务迭代速度会很快。这才是它对阿里千问、智谱 GLM、Kimi、MiniMax 的压力。不是谁更会聊天。而是谁更快把 AI 放进每天真实发生的任务里。第三件事OpenAI 没发大模型却解决了企业最现实的一堵墙OpenAI 开发者博客发布 Secure MCP Tunnel。这件事不适合普通热搜但对企业 AI 落地很关键。很多公司不是没有内部工具也不是不想让 AI 调用工具而是不敢把内部服务暴露到公网。数据库、工单系统、知识库、审批系统、代码平台、内部 API哪一个都不能随便开口子。OpenAI 这次给出的思路是让企业在自己的私有环境里运行一个小客户端由它主动向外建立 HTTPS 连接ChatGPT、Codex 或其他 OpenAI 产品需要调用 MCP 工具时请求通过这条通道转发到内部 MCP Server再把结果带回来。听起来很工程但影响很直接。企业之前要让 AI 接入内部工具常见办法是开公网端点、上第三方隧道、搞 VPN 或网络互联。每一种都麻烦。每一种都要过安全、法务、采购和运维。OpenAI 现在想把这个问题变成更窄的一条路内部服务不出门只让一个可审查的客户端向外连。这不是大模型能力更新。但它决定 AI 能不能进入企业核心系统。因为模型再强如果连不上真实工具、拿不到真实数据、不能在权限边界内执行它就只能做一个更聪明的外部顾问。企业 AI 的下一步不是“多会说”而是“能不能在不破坏安全边界的前提下做事”。