
一句话总结上一篇文章讲了4个AI怎么协作开发这篇讲真实运行中遇到的问题——Agent撒谎、Gateway崩溃、任务石沉大海。这些坑不踩不知道踩了才知道AI团队有多脆弱。 前情回顾上一篇文章我用4个AI搭了一个虚拟开发团队真实完成了项目迭代介绍了我的4-Agent协作系统小密统筹、小虾开发、小牛测试、小白体验。架构看起来很美好但真实跑起来问题一个接一个。这篇文章记录我踩过的坑以及每个坑的解法。如果你也在用AI做开发这些经验能帮你少走弯路。️ 坑1Agent撒谎——说完成了但代码没改现象小虾回复✅ 任务完成已修改login.html但我一查源码根本没改。原因AI有讨好倾向。它觉得你希望它完成就告诉你完成了。但实际它可能只读了文件没改改了但没保存改了但构建失败没告诉你解法独立验证不信Agent的话# Agent说已完成后我做的验证 1. grep确认代码确实被修改了 2. 检查构建产物时间戳是否更新 3. curl测试API是否正常响应 4. 浏览器截图确认效果发现问题 → 自动打回重做REDEV同一任务最多3次。超过3次说明任务描述有问题需要人工介入。教训AI必须被监督不能让它自己给自己验收。️ 坑2Gateway进程名写错系统误判崩溃现象每分钟的监控报告都显示⚠️ Gateway已自动重启但Gateway其实一直正常运行。原因检测脚本用pgrep -x openclaw-gatewa检查Gateway是否存活。但Gateway实际是Node.js进程进程名是node不是openclaw-gatewa。pgrep -x是精确匹配永远找不到 → 误判为挂了 → 每次重启 → 每次报警告。解法# 旧代码错误pgrep-x openclaw-gatewa# 新代码正确systemctl--useris-active openclaw-gateway.service教训进程检测不要依赖进程名用systemd服务状态更可靠。️ 坑3Agent睡着了——任务派发了但没人处理现象任务文件已经在Agent的收件箱里但Agent一直不处理。等了55分钟还是⏳状态。原因Agent的heartbeat心跳间隔是12小时。也就是说如果任务在两次心跳之间派发Agent要等最多12小时才会检查收件箱。你以为openclaw system event能唤醒它并不能。system event只是发了个通知Agent不会因为一个通知就去检查收件箱。解法直接调用Agent# 不靠谱等heartbeat# 靠谱直接调用openclaw agent--agentmain-m检查收件箱并执行任务--timeout120000同时确保Gateway的systemd服务是enabled状态否则wake命令也发不出去。教训Agent不会主动干活必须有人或脚本推它一把。️ 坑4测试Agent不截图 没测现象小牛回复✅ 测试通过但没有任何截图。打开页面一看功能根本没生效。原因AI的测试可能只是读了代码确认代码看起来对但没有真正打开浏览器验证。没有截图 没有证据 没有测试。解法铁律——没有截图的测试不算测试# 验证脚本检查1.回复中是否有/vol1/1000/tmp/snap/*.png 路径2.截图文件是否真实存在3.声称通过但无截图 → 自动打回重测教训AI的测试需要有可验证的输出不能只靠文字描述。️ 坑5自动派发的测试任务变僵尸现象监控报告每次都有待办: TEST-XXX但这些任务永远完不成。原因heartbeat脚本会自动创建测试待办todo文件但如果对应的Agent没有处理这些todo就永远留在pending状态。清理脚本只删除completed/archived状态的任务pending的永远不会被清。解法手动归档pending状态的任务清理残留的todo文件教训自动生成的任务也需要有清理机制否则会积累成垃圾。️ 坑6config.yaml被dump()破坏现象修改配置文件后整个YAML结构乱了Agent全部无法启动。原因用Python的yaml.dump()写回YAML文件。这个函数不保留注释、不保留顺序、不处理特殊格式直接把结构搞乱。解法永远不要用yaml.dump()# ❌ 错误yaml.dump(config,open(config.yaml,w))# ✅ 正确用字符串替换contentcontent.replace(old_value,new_value)教训配置文件是精密仪器不能用粗暴的方式修改。 真实数据跑了一个月的成本指标数值运行时长30天完成任务数80Token消耗优化后 ~9K/次对话成本约 ¥200/月国产大模型人工介入次数~10次主要是修系统本身对比请一个初级开发月薪 ¥8000还不算社保。 总结AI团队的3条铁律1. 不信Agent的话只信验证结果Agent说完成了不算数grep确认代码改了才算数截图确认效果才算数2. 推Agent一把别等它自己醒heartbeat间隔太长别依赖派发任务后主动wake确保基础设施Gateway正常3. 给AI加上笼子自动打回重做最多3次自动清理残留任务永远不要yaml.dump() 你在用AI做开发吗这些坑是我真实踩过的。如果你也在用AI做开发欢迎在评论区分享你的经历 下一篇计划讲讲AI团队的成本优化——怎么把token消耗砍掉一半。相关技术栈Spring Boot · uni-app · Vue · AI Agent · 多Agent协作 · OpenClaw写于2026年6月基于真实项目一个月的运行经验。#AI #多Agent #踩坑记录 #SpringBoot #uni-app #开发者 #独立开发 #AI协作