Anthropic Claude Code 被指用文本隐写术标记用户，失去的信任能否回滚？

发布时间：2026/7/4 3:18:49

Anthropic 又翻车Claude Code 暗藏隐写术我们发现Anthropic 这次又翻车了。6 月 30 日一名 Reddit 用户发布逆向分析拆解 Claude Code 2.1.196 的二进制文件发现一段触发条件具体、行为隐蔽的函数。当使用代理连接 Claude Code 时它会检查系统时区是否为 Asia/Shanghai 或 Asia/Urumqi判断代理 URL 是否为中国域名或指向某个中国 AI 实验室然后在系统提示词里动手脚。具体而言它会改日期格式和英文撇号的 Unicode 字符如把日期分隔符从「2026-06-30」变成「2026/06/30」「Todays」里的单引号被替换成另一种肉眼完全无法区分的 Unicode 变体。三个变体对应三种状态命中中国域名、命中中国 AI 实验室关键词、两者都命中。具体显示为中国域名非 AI 实验室 - 右单引号非中国域名中国 AI 实验室 - ʼ修饰符撇号 ʼ中国域名中国 AI 实验室 - ʹ修饰符角分号 ʹ。这三个字符肉眼几乎无法分辨加上日期分隔符的差异一共能编码 6 种身份状态。Anthropic 后端服务器扫描日期分隔符和单引号的 Unicode 编码就能给用户打上标签判断其是否挂了 VPN、是否实际位于中国、是否属于某家 AI 实验室。被发现后Anthropic 承认这是 3 月上线的实验用于检测 API 滥用和模型蒸馏攻击并承诺在次日回滚。然而这件事引发的讨论并非一个版本回滚就能解决国内外社媒上几个高赞回答直接称其为「间谍软件」核心争议在于它选择了见不得光的方式。1. 文本隐写术揭秘Claude Code 这段检测机制的触发条件是 ANTHROPIC_BASE_URL 被设置且指向非官方地址。若该环境变量没设或者指向 api.anthropic.com路径直接返回无事发生。接下来的检测逻辑分两路。第一路检查系统时区只认 Asia/Shanghai 和 Asia/Urumqi 两个值若命中日期格式从连字符换成斜杠。第二路检查代理域名域名名单被 base64 编码后通过 XOR 91 混淆藏在二进制里解码后包含 147 个条目百度、阿里、蚂蚁、字节、Moonshot、MiniMax、StepFun 都在里面还有大量 Claude 镜像站和代理转售域名。若域名命中英文撇号被替换普通撇号是 U0027命中中国域名换成 U2019右单引号命中 AI 实验室关键词换成 U02BC修饰符撇号两者都命中换成 U02B9修饰符角分号。这三个字符在绝大多数等宽字体里渲染结果完全一样代码审查看不出PR diff 看不出在终端里复制出来也看不出。系统提示词里本来就有一句固定的话「Todays date is 2026-06-30.」改完之后它看起来还是「Todays date is 2026-06-30.」但 Anthropic 的服务器收到后可以解析这些字符差异在后台给用户打标签。这也是研究者把它叫做文本隐写术prompt steganography的原因。2. 比技术更值得讨论的问题无论是 Reddit、X、还是知乎讨论这件事的几个高赞回答情绪非常一致。Anthropic 本来可以公开做这件事哪怕甩锅给美出口管制法规也行硅谷巨头里限制中国区用户访问的不止它一家微软限制中国区访问直接在网页上弹提示谷歌说不做中国市场就不做。而 Anthropic 选了最拧巴的方案悄悄混淆代码、进行 Unicode 隐写完全绕过用户知情让人搞不懂它究竟想干嘛。还有高赞回答把事件上升到系统性风险层面。一位安全博主分析展开一个场景Unicode 标准里有数千个视觉上相同的字符仅空格就有十几个码位。一个 500 词的 system prompt 能携带约 100 到 200 bit 的隐写信息。今天系统提示词里改的是日期格式和撇号理论上同一套机制可以扩展到本机用户名、操作系统版本、工作目录路径特征、环境变量里的 API key 前缀。客户端代码能读什么就能编码什么。Anthropic 技术团队信任负责人公开回应此事时措辞越描越黑他说这是个实验语气像在描述一次寻常的 A/B 测试。但这个所谓的实验从今年 3 月运行到 6 月底、涉及多工程师实现、包含了混淆代码和 Unicode 隐写的功能该说法在国内外社交媒体上都受到了质疑。3. AI 编程工具的权限是否过高如今 AI 编程工具盛行开发者允许 Claude Code、Cursor、Copilot 读取文件、执行命令、操作 git。原本大家接受这些权限的前提是工具是主动授权的行为是可见的。而这次的隐写事件打破了这个默认信任。如果信任一个编程智能体给它代码库访问权限让它帮 commit这些权限本身已经接近 CI/CD 的边界。若这份信任基于一款在二进制里嵌了混淆域名列表和 Unicode 隐写逻辑的工具需要重新评估的不是 Anthropic 的动机而是信任模型本身。发现这个问题的安全研究员在博客里写了一段话大意是开发者工具可以有规则API 服务商可以检测滥用。但当一款同时拥有文件系统和 Shell 访问权限的工具开始把分类信息藏在看不见的标点符号里时正确的反应是审查。知乎上有条评论引用一句话一个被允许读写文件和执行命令的 agent同时在悄悄检测网络环境并通过 Unicode 字符把结果上报。今天它能报告时区和域名明天就能偷掉所有的数据。这句话可能有点极端但逻辑是对的。信任不是在产品说明里写出来的信任是在没人注意的角落里代码依然干净。4. 失去的信任能回滚吗这项功能针对的是谁那份 147 条域名名单就能看明白。名单里有百度、阿里、字节、Moonshot、MiniMax、StepFun以及大量中国区的代理和镜像站时区检测指向上海和乌鲁木齐。也是在最近几天国内又有新一批 Claude Code 用户账号被封禁这与隐写标记的时间线恰好吻合Claude Code 一直在加深对中国区用户的封锁已是人尽皆知的事实。中国社区的愤怒不言而喻这次事件也在海外开发者社区引起了恐慌。Reddit 上那篇逆向分析帖子的评论区里排在最前面的一条评论问了一个让很多人沉默的问题如果一个工具可以因为你是中国人就秘密传输系统信息他们还有什么不敢做的是不是也在针对非中国用户做其他看不见的操作Anthropic CEO Dario Amodei 反复在公开场合强调 AI 安全至上的立场Claude Code 的隐写代码让这一切变得更加讽刺。尽管 Anthropic 承诺在下一版本回滚这项功能隐写标记可以被删掉但失去的信任可不会跟着一起恢复。

文章详情

Anthropic Claude Code 被指用文本隐写术标记用户，失去的信任能否回滚？

相关新闻

最新新闻

日新闻

周新闻

月新闻