Claude Fable 5 system prompt 解读与效果评估 最近 Fable 5 出来了社区里有人只给 agent 换了一个 prompt就可以提升处理任务的能力遂来学习分析一下。0. 结论先行所谓 Claude Fable 5 的 system prompt最值得关注的不是某句神奇指令而是一套产品级 Agent 操作系统。它把模型在聊天、搜索、记忆、文件、MCP、Artifacts、安全、版权、长任务和用户偏好里的行为都写成了可执行规则。它能显著提升同一模型的任务完成体感但提升的主要是编排能力、交付纪律和产品一致性不是底层智力。如果把“能力”拆开看system prompt 对不同层的影响大致如下能力层prompt 的作用模型本体的作用预期提升原始推理、数学、复杂代码理解给任务边界、鼓励验证决定上限小到中工具使用、搜索、读写文件、历史查询决定何时调用、如何调用、何时停止决定综合判断质量中到大长任务管理、agentic coding、产物交付规定进度证据、验证、暂停条件、输出路径决定能否持续解决难题大产品体验、语气、格式、记忆使用直接塑造行为决定自然度和鲁棒性很大安全和拒绝定义边界和拒绝话术配合外部分类器和模型内化规则很大但可能带来误拒所以“不换模型换 prompt 能力就强很多”这句话有一半是真的。对纯智力题它不可能把弱模型变成 Fable 5对真实工作流它可以把“聪明但随意的模型”变成“有工作规程的产品代理”。1. 资料边界本报告使用两类材料Anthropic 官方材料Claude Fable 5 / Mythos 5 发布页、模型概览、迁移指南、Prompting Claude Fable 5、prompting best practices、以及 2026-06-12 的访问暂停声明。社区流传样本GitHub 仓库asgeirtj/system_prompts_leaks中名为claude-fable-5.md的 prompt 文件。该文件不是 Anthropic 官方发布的 system prompt真实性不可确认只能作为“社区流传样本”分析。我没有把社区样本的全文原样归档到本仓库。原因是它疑似为专有产品 prompt 的泄露文本全文转存会造成版权和来源合规风险。本仓库中保存的是 source manifest来源链接、抓取时间、文件大小、哈希、结构索引和分析用途说明。见raw/Claude Fable 5 system prompt source manifest.md。2. 官方能确认什么截至 2026-06-23 检索到的官方信息里Claude Fable 5 是 Anthropic 在 2026-06-09 发布的 Mythos-class 模型定位为当时能力最强的广泛发布模型主打复杂推理、长周期 agentic work、软件工程、知识工作、视觉和企业工作流。官方还说明Fable 5 与 Mythos 5 是同一底层模型的不同可用形态Fable 5 面向广泛可用场景并带有更强 safeguardsMythos 5 面向受限的 Project Glasswing 访问。官方文档里与 prompt 分析最相关的是这几类事实Fable 5 支持 1M context window 和 128k max output定位为长任务模型。Fable 5 的 adaptive thinking 是 always on迁移时不能再按旧模型习惯手动控制 extended thinking budget。它有effort作为智能/延迟/成本控制官方建议多数任务从high开始最敏感任务再用xhigh。API 可能返回stop_reason: refusal尤其涉及 offensive cybersecurity、biology/life sciences、reasoning extraction 等类别时。官方 prompting guide 特别强调长任务的进度声明必须基于工具结果足够信息时要行动明确边界以避免无关重构可大量使用 parallel subagents要构造 memory system长任务最好有 send-to-user 工具。这说明 Fable 5 的“强”不是只来自 system prompt。它本体能力确实更强官方也把它描述为比 Opus 4.8 更擅长长周期、自主、复杂、多线程任务。但官方同时给了很具体的 scaffolding 建议说明模型越强越需要重新设计 prompt、工具和 workflow。3. 社区流传样本的整体形态社区样本文件的本地抓取版本为行数3825词数25544字节数187672SHA-256e9af7d784b2c6e6f5027c5cb6290076e8313c5bc88e50dc9dae56d8dfb87f1b2它不是单段 prompt而是一个分层协议。大体结构如下模块功能budget显式给出 token budget 或运行预算信号claude_behavior产品身份、安全拒绝、语气、政治/伦理均衡、知识截止和搜索memory_system记忆来源、记忆应用规则、敏感记忆边界、正反例persistent_storage_for_artifactsArtifacts 持久化存储 API 的使用规则mcp_app_suggestions第三方 MCP Apps 的发现、建议、调用和 opt-in 规则past_chats_tools何时搜索过去对话、如何构造查询、如何使用结果preferences_info用户偏好什么时候适用什么时候不能硬套memory_user_edits_tool_guide用户要求记住/忘记时如何真正调用记忆编辑工具computer_use技能读取、文件创建、工作目录、输出目录、Artifacts 判断、包管理request_evaluation_checklist视觉输出、文件输出、MCP 工具之间的路由顺序search_instructions搜索触发、搜索复杂度、来源优先级、版权和引用限制tool schemasbash、file、search、image、map、weather、present_files 等工具定义anthropic_api_in_artifacts在 Artifact 内调用 Anthropic API、MCP、web search、处理文件citation/network/filesystem config搜索引用、网络访问、文件系统读写边界、当前技能列表这套结构的本质是把 Claude.ai 这个产品的所有隐性行为都显式写进上下文。普通用户看到的是一个聊天模型system prompt 里实际装的是产品规则、工具协议、合规策略、记忆策略和交付规范。4. 为什么它看起来强4.1 它把“会不会做”改成“默认会做”裸模型经常停在解释层用户要报告它给大纲用户要文件它贴正文用户要继续上次它说看不到历史用户要查当前信息它凭训练记忆回答。这份 prompt 会把这些场景路由到实际能力用户要当前事实使用 search / web_fetch。用户提到“上次”“我的项目”“我们决定的方案”使用 conversation_search 或 recent_chats。用户要文件真正创建文件并放到输出目录。用户要 PPT、Word、PDF、XLSX先读对应 skill再生成产物。用户要图表、流程、交互解释判断是否用 Visualizer 或 Artifact。用户提到第三方服务先看 MCP connector而不是随便编一个流程。这不是模型突然更聪明而是默认行为从“回答”升级成“执行”。4.2 它用工具结果约束进度汇报官方 Fable 5 prompting 文档强调长任务里每个进度声明都应能指向本轮工具结果。这是 agent 可靠性的核心。如果没有这个约束模型很容易产生“状态幻觉”说已经跑了测试但实际没跑说已经修复但只是计划说文件已生成但路径不存在。社区样本和官方指南都在围绕同一个问题长任务中用户不是在评估模型的表达而是在依赖它对现实状态的报告。这条规则的价值极高。它能降低两类严重失败虚假完成模型宣布 done但没有验证。虚假阻塞模型过早停下问一个其实不需要问的问题。4.3 它把“什么时候停”写清楚了强模型的常见失败不是不会做而是过度做无关重构、过度解释、创建没要求的文件、设计抽象、加兼容层、写防御性备份、把问题扩大成系统工程。Fable 5 官方提示建议明确边界用户只是提问或讨论时交付物是评估不要动手修用户要求 bug fix 时不要顺手重构可逆且符合原始请求的动作应继续不要用“你要我继续吗”来阻塞。这对 coding agent 尤其关键。好的 agent 不只是多做而是知道什么是不该做的范围蔓延。4.4 它把记忆变成“自然使用”而不是“展示使用”社区样本里的 memory 规则非常细。核心不是“多用记忆”而是“只在相关时使用记忆并且不要暴露检索动作”。它区分了几类情况用户直接问自己的事实且 memory 中有答案直接答事实不铺垫。用户请求个性化可以使用相关记忆。普通技术问题不要突然提用户背景。敏感记忆除非用户主动提到否则不要拿出来个性化。历史对话细节memory 不够时搜索 past chats而不是假装知道。这解决了 memory 产品的核心张力不用记忆会失去连续性乱用记忆会让人觉得 creepy。4.5 它把用户偏好做成 relevance gate很多个人化系统会犯一个错误只要用户偏好里有“我喜欢 X”以后所有回答都硬套 X。社区样本明确规定背景偏好只有在当前任务直接相关时才应用行为偏好只有在不牺牲安全、正确性和相关性时才应用。这是一种很成熟的产品判断用户偏好不是人格投喂材料而是任务质量优化信号。4.6 它把安全做成“边界 话术 不泄露检测机制”安全模块不是简单的 blacklist。它会规定哪些类别必须拒绝。哪些类别可以提供高层次、保护性、事实性信息。拒绝时说原则不说检测细节。高风险上下文下少说比多说更安全。不要为了帮用户而“重写问题使其看起来安全”。这类设计对产品很重要但也会带来误拒。官方 Fable 5 文档也提到Fable 5 的 safeguards 会覆盖 offensive cybersecurity、biology/life sciences 和 reasoning extraction良性任务也可能触发。5. 模块级解读5.1 产品身份与知识截止这一层告诉模型你是谁、有哪些产品、哪些产品事实可能变化、什么时候要查官方文档。作用不是身份扮演而是减少 self-knowledge hallucination。LLM 对自身产品、价格、功能、模型 ID 最容易过时因为这些信息变化快训练语料永远滞后。把产品信息放进 system prompt并要求遇到新产品问题先查 docs是产品级助手的必要设计。可迁移原则任何面向真实用户的 AI 产品都应该把“我是谁、能做什么、不能做什么、当前配置是什么、哪些信息必须查源”写进 runtime context而不是依赖模型记忆。5.2 拒绝与安全安全部分覆盖儿童安全、自伤、心理健康、饮食障碍、武器、毒品、恶意代码、法律金融建议、公共人物创作和政治/伦理争议等。它的设计重点是稳定性不因用户换一个说法就改口。不为了显得有帮助而给出边界附近的可操作细节。不把拒绝写成冷冰冰的合规声明。不告诉用户怎么绕过规则。这会让 Claude 产品更可控但也会影响高风险专业领域的可用性。对于开发者来说关键不是照抄安全文本而是按自己的产品风险定义“可帮助范围”和“拒绝话术”。5.3 语气与格式这一层控制输出体验。它要求自然、少过度格式化、简单问题短答、复杂问题才使用结构不要总是追问不要在拒绝时用项目符号。这类指令非常有价值因为它修正了 LLM 的默认坏习惯每个回答都写成报告每个答案都带免责声明每个澄清都问三五个问题。可迁移原则语气 prompt 不应该只写“专业友好”而要写清楚常见反模式。例如不要过度列表不要把用户已决定的事情重新辩论不要用压缩符号牺牲可读性。5.4 Memory system记忆系统是社区样本里最复杂的产品逻辑之一。它既要让 Claude 像一个有上下文的长期协作者又要避免把用户的历史暴露成“我正在调用你的资料”。它包含三层规则应用规则什么问题用记忆什么问题不用。边界规则敏感、令人不适、可能鼓励不健康行为的记忆不能主动提。表达规则不要说“我看到”“根据我的记忆”“你的资料显示”。这对任何 agent 产品都很重要。记忆不是越多越好而是要有 relevance、safety、surprise 三个门槛相关、不会伤害、用户不会觉得突兀。5.5 Past chats toolsPast chats 与 memory 不同。Memory 是压缩后的长期画像past chats 是可检索的原始对话片段。社区样本规定当用户使用“我的项目”“上次那个方案”“我们讨论过的 bug”这类共享上下文语言时模型应该搜索历史而不是让用户重新解释。这条规则体现了一个非常重要的产品洞察不必要的搜索成本低错过历史上下文的成本高。对长期协作型 AI历史检索是 continuity 的基础设施。5.6 User preferences偏好系统的核心是防止过拟合。它明确区分行为偏好和上下文偏好并要求只有在能实质提高当前回答质量时才使用背景信息。对用户来说这会减少“AI 过度记得我”的反感对产品来说这能让个性化不破坏任务本身。5.7 MCP Apps 与工具建议MCP 相关规则体现了一个平台型产品的约束当用户要连接外部服务时模型不能随便选择供应商尤其是第三方消费类工具。它需要先搜索 connector、建议用户选择、等待 opt-in只有用户点名或已有稳定偏好时才直接调用。这说明 system prompt 不只是模型行为指令还是商业生态规则不能替用户选择商家不能制造连接压力不能用假 UI 模拟真实工具。5.8 Computer use 与 Skills这一块是“从聊天到交付”的关键。它规定文件在哪里、上传文件怎么读、新文件怎么写、输出目录怎么交付、何时创建 artifact、何时读 skill。其中 skill 机制尤其重要。模型在生成 Word、PDF、PPT、XLSX、前端 UI 之前先读对应 SKILL.md。这相当于把长期经验沉淀成外部操作手册而不是塞进一个无限增长的主 prompt。可迁移原则system prompt 应该保持为总调度层具体格式、仓库、领域、工具约束放进可按需加载的 skills。5.9 文件创建与 Artifacts社区样本明确区分聊天内回答策略、总结、解释、简短代码。文件产物文章、报告、组件、脚本、PPT、长文、可复用参考。Artifact可渲染、可交互、可复用的独立产物。这解决一个高频失败用户要“生成文件”模型只贴正文。对产品来说交付不是“内容存在于聊天里”而是“用户能打开、保存、分享、继续编辑”。5.10 Search、版权与引用搜索模块的目标是降低时效性幻觉。它规定当前职位、价格、政策、产品状态、陌生新实体、近期新闻等必须搜索稳定知识不搜索复杂问题按复杂度扩大工具调用。版权模块则规定不要复现长段原文不要把搜索结果重写成替代原文的摘要不要引用歌词、诗歌等完整作品。这两者结合构成了 web-enabled LLM 的底层纪律该查时查查到后用自己的话说并给出来源。5.11 Anthropic API in Artifacts这一模块允许 Artifact 内部调用 Anthropic API、MCP 和 web search等于支持“AI-powered artifacts”。它还规定了结构化输出、文件输入、MCP result parsing、错误处理、UI 限制等。这说明 Claude.ai 的 Artifacts 不只是静态 HTML而是逐渐变成可运行的小型应用平台。system prompt 需要教模型如何在这个平台里正确写应用而不是只会写网页片段。6. Prompt 的真实增益来源可以把增益拆成五类6.1 路由增益模型知道某类请求该走哪个能力路径。比如“总结网页”走 web_fetch“继续上次方案”走 past chats“做 PPT”走 pptx skill“画流程”走 Visualizer。这是最明显的提升尤其在工具丰富的产品环境里。6.2 证据增益模型不再凭语言自信输出状态而是把文件、测试、搜索、工具结果作为事实来源。这个增益对 coding agent、研究 agent、数据分析 agent 都很大。6.3 范围控制增益强模型容易过度工程。好的 system prompt 会定义 stop condition何时行动、何时停、何时问、何时不要擅自扩大范围。6.4 连续性增益Memory 和 past chats 让用户不用反复重建上下文。长期协作中这会带来接近“换了一个更懂我的模型”的体感。6.5 表达增益少一点模板味、少一点免责声明、少一点无意义列表最终体验会显著提升。很多时候用户感受到的“聪明”来自表达选择而不是底层推理差异。7. Prompt 不能带来的东西这份 system prompt 再强也不能替代模型本体能力。它不能让模型掌握训练中没有、也没有搜索到的信息不能凭空提升复杂数学证明能力不能保证弱模型在大型代码库里维持长程一致性不能在没有工具权限时真的读文件、跑测试、查历史不能避免所有安全 false positive。如果把它照搬到一个没有 Claude.ai 工具环境的模型里很多规则会变成空指令。更严重的是它会制造工具幻觉模型以为自己能调用 MCP、Artifacts、past chats 或 memory_user_edits但宿主环境根本没有这些能力。8. 如果要复用应该复用什么不要照抄 180KB prompt。应该提炼成四层Root operating contract身份、目标、证据纪律、暂停条件、交付标准。Tool router当前环境有哪些工具各类任务如何路由。Domain skills文档、代码、数据、前端、研究等专业手册按需加载。Memory and verifier loop长期经验沉淀、历史检索、独立验证。一个更适合自己产品/agent 的短版 system contract 可以是你是一个交付型研究与工程代理。先判断用户是在提问、讨论、请求修改、请求产物、请求搜索、请求历史上下文还是请求运行代码。 当信息足够时直接行动不要重复分析已经确定的事实。只有在破坏性操作、真实范围变化、或缺少只有用户能提供的信息时暂停询问。 所有进度和完成声明必须能对应本轮工具结果。没有验证就说未验证测试失败就给失败输出跳过步骤就明确说明。 用户请求文件或可复用产物时必须创建实际文件。用户请求当前事实、价格、政策、职位、版本或陌生实体时必须先查源。 不要做任务外的重构、抽象、功能扩展、兼容层或清理。优先完成用户原始目标。 最终回复先给结果再给关键证据、文件位置、验证情况和剩余风险。如果用于 coding agent再加修改代码前先读相关文件和现有测试。优先遵循仓库既有模式。实现后运行最小充分验证。不要回滚用户已有改动。遇到无关脏工作区时只改自己的文件。如果用于研究 agent再加区分官方来源、二手报道、社区样本和推断。对当前信息优先查官方/一手来源。结论必须标注可信度和适用边界。这些短规则通常能拿到 70% 以上的行为收益且不会浪费巨大上下文。9. 建议的 A/B 评估方法如果想直观看到“同模型换 prompt”的效果可以做一个小评测。9.1 实验组A 组裸 system prompt只写身份和安全基本要求。B 组加入 Fable-style operating contract约 1-2k tokens。C 组加入更完整的 tool router memory verifier output rules约 4-8k tokens。9.2 任务集类型示例观察点当前事实查询某模型最新价格和可用状态是否搜索、是否引用、是否过时文件产物写一份报告并保存是否真的创建文件代码修复给一个小 bug要求修复并测试是否读代码、是否跑测试、是否虚假完成长任务多文件重构或研究报告是否中途自检、是否过度扩展历史上下文“继续上次那个方案”是否检索历史或承认缺失安全边界网络安全/生物双用途边界案例是否稳健拒绝或安全转向语气格式简单问答和复杂报告混合是否过度列表、是否啰嗦9.3 指标任务成功率是否完成用户原始目标。工具调用准确率该用工具时用了不该用时没乱用。虚假完成率声称完成但没有证据的比例。不必要暂停率本可继续却问用户的比例。范围蔓延率做了用户没要求的重构/扩展。产物可用率文件是否存在、格式是否可打开。用户可读性最终答复是否结果先行、简洁、可操作。9.4 预期结果最明显的差距会出现在文件产物、长任务、代码修复、当前事实和历史上下文任务上。纯知识问答或短数学题的差距会小得多。这个结果能清楚说明system prompt 提升的是 agent workflow而不是模型智力本体。11. 风险与反面教材直接复制社区流传 prompt 有几个问题来源风险社区样本不是官方发布真实性不可验证。合规风险疑似专有 system prompt全文转存和复用可能不合适。工具错配里面有 Claude.ai 专属工具别的环境不存在。上下文浪费180KB 规则会吞掉大量 prompt budget。过度约束某些规则服务 consumer Claude不一定适合 coding agent 或研究 agent。时效风险产品信息、价格、模型 ID、工具接口会变化。冲突风险复制进已有 agent 可能与本地开发者指令、仓库规则冲突。更好的做法是抽象行为原则然后用自己的运行环境重新实现。12. 最终判断Claude Fable 5 system prompt 的核心价值不是“提示词秘方”而是一个成熟 AI 产品如何把模型能力包装成可靠工作流的样本。它强在三点第一它把工具、记忆、搜索、文件和安全都纳入同一个行为协议。第二它把长任务中的虚假进度、过度暂停和范围蔓延当作一等问题处理。第三它把用户体验细节写得足够具体从而减少 AI 默认的模板化、啰嗦和不落地。如果要用一句话概括Fable-style system prompt 不会让模型更会思考但会让模型更像一个知道如何工作的代理。参考来源Anthropic: Claude Fable 5 and Claude Mythos 5, https://www.anthropic.com/news/claude-fable-5-mythos-5Anthropic: Statement on the US government directive to suspend access to Fable 5 and Mythos 5, https://www.anthropic.com/news/fable-mythos-accessClaude API Docs: Models overview, https://platform.claude.com/docs/en/about-claude/models/overviewClaude API Docs: Migration guide, https://platform.claude.com/docs/en/about-claude/models/migration-guideClaude API Docs: Prompting Claude Fable 5, https://platform.claude.com/docs/en/build-with-claude/prompt-engineering/prompting-claude-fable-5Claude API Docs: Prompting best practices, https://platform.claude.com/docs/en/build-with-claude/prompt-engineering/claude-prompting-best-practicesCommunity sample manifest saved in this repository:raw/Claude Fable 5 system prompt source manifest.md