
“素人模型”冲上抱抱脸热榜一位个人开发者杀进抱抱脸 Models Trending 榜前排。第一是智谱 GLM - 5.2下载量 6 万多第二是百度无限 OCR下载量 7 万。个人账号 yuxinlu1 占两个位置下载量达 20.7 万和 53.6 万。前一周其模型霸榜力压 GLM - 5.2智谱负责人公开推荐。热榜前排多为大厂、明星团队和热门赛道如智谱 GLM - 5.2 有 753B 超大参数百度 Unlimited - OCR 踩中 OCR 和文档理解方向。还有 Qwen、英伟达、微软等大厂模型以及国产开源大模型和图像生成模型。luyuxin 的 12B GGUF 模型夹在其中。这两个新模型把 Fable 5 的编程推理能力融入 Gemma4 - 12B 小模型4.5GB 显存就能本地、离线运行零 API 成本。V1 是 Coder 版训练数据是“可验证”的代码推理教师数据来自 Cursor 的 Composer 2.5 和 Fable 5发布后曾连续多日霸榜榜首。V2 是 agentic 版增加多步工具调用能力在 tau2 - bench 的 telecom 子集上得分是基座的 3.5 倍但作者表示不能跟官方榜直接比与 frontier 大模型有差距。Fable 5 下线后作者用 Claude Opus 4.8(xhigh)补全社区缺失数据重建轨迹可能与原版有出入。微调数据约 1 万条作者强调数据质量、筛选和验证更重要。模型热度高是因为能本地运行是 GGUF 量化版用户可用多种工具加载对 coding 场景有吸引力可避免传代码到云端和付 API 调用成本。V1 最小 Q2_K 版本约 4.5GB推荐 Q4_K_M 约 6.87GBQ8_0 约 11.8GBV2 最小可靠版本 Q3_K_M 约 5.7GB推荐 Q4_K_M 约 6.87GB。作者透露 V3 筹备中沿 12B 做 coding agentic 方向改进 V2 问题还在做 Qwen3.6 - 27B 更大版本。一个人40 小时杀进大厂中间作者逯雨鑫是美国高校在读 AI 方向研究生本科是数据与商业分析补过全栈开发。爆火模型是纯自费个人项目做 V1 动机是“自我提升”因学校知识更新慢。为做模型消耗一个 Claude Max 20×套餐V2 花 40 多小时数据处理、训练等基本一人完成。硬件用 RTX 5090显存 32GB VRAM有 96GB 本地 SSD 资源可调动约 128GB 资源与大厂算力池差距大。过程中最耗时的是数据处理agentic 数据长受显存限制训练时一次最多喂 2048 token做了“滑动窗口”处理。V1 和 V2 以 Gemma 4 - 12B 为底座适配麻烦选它一是挑战自己二是 12B 尺寸能让 8GB 统一内存 Mac 用户运行。逯雨鑫认为本地模型价值是隐私和免费很多人不想为 Claude、GPT 付费。V1 发布后开始没关注榜单后突然排名上升评论和 issue 大量涌入他认真回复称社区需求是关键。原来还是个爱看网文的…逯雨鑫在 HF 上发布 9 个公开模型除爆火模型还有“直接蒸 Claude”的模型如 gemma - 4 - 12B - it - Claude - 4.6 - 4.8 - Opus - GGUF把 Claude Opus 能力融入 12B 本地模型。另一个用 JetBrains 的 Mellum2 做底座专做推理蒸馏。还有中文网文 LoRA 微调模型分四个题材基于 Qwen3.6。这是他做 Hugging Face 模型的入口因喜欢看小说想做免费小说生成 pipeline但后来发现用户更关注 coding 和 agentic方向转变。给个人开发者的建议逯雨鑫建议个人开发者要真诚和坚持。真诚是如实说明模型强弱不夸大能力坚持是要接受会遇到不好的声音开源难登顶热榜也不直接带来收入要面对负面声音。他有 ADHD在 AI 领域快速切换兴趣成优势认为“AI 时代是 ADHD 的天下”。凭什么在大厂间挤进前排逯雨鑫认为大厂有优势但发布开源小模型有品牌宣传、API 引流等目标个人开发者没这些包袱可专注解决具体痛点。他觉得个人开源作者机会是把具体问题做到好用。如果你想体验本地模型HF 地址是 https://huggingface.co/yuxinlu1 最适配平台是 llama.cpp。