
大家好这里是硅谷茶馆。今天和大家分享一个让本地大模型真正帮上忙的实用方案——用 Ollama 结合 OpenAI 的 Codex 工具在自己电脑上运行 AI 编程助手。前段时间我们刚分享完Qwen35B的开源无审查模型今天就把我实践结果分享给大家。过去AI 辅助编程大多依赖云端服务长时间使用容易产生费用。本地化方案可以减少对网络和费用的依赖让开发者在断网环境下也能完成一些代码相关任务。下面我们聊聊实际可行的部署方式。一、AI Agent 与普通聊天机器人的区别Agent场景操作二、基础部署步骤以下是简单上手流程适合有一定命令行基础的朋友操作。第一步安装 Codex 客户端前往 OpenAI 开发者官网下载对应系统的 Codex App支持 Mac 和 Windows。 安装后先不要用云端账号登录直接跳过或关闭登录保持本地模式。第二步更新 Ollama确保 Ollama 版本在 0.24 或以上。 在终端输入 ollama -v 检查版本如果过旧请到 Ollama 官网下载最新安装包覆盖安装。因为ollama很大可以使用指定目录安装。下载好本地版本用下面命令安装#指定程序安装目录.\OllamaSetup.exe/DIRF:\Ollama#再添加模型路径环境变量同上OLLAMA_MODELS第三步下载合适模型推荐根据显存选择模型例如 Qwen 系列或 Gemma 系列。常用命令示例Windows/Linuxollama run qwen3:27b或更轻量的版本。Mac 用户可选择 MLX 优化版本以提升速度。第四步启动本地对接执行以下命令以 qwen3.6模型为例ollama launch codex-app --model qwen3.6终端提示重启 Codex 时选择确认。重启后界面会显示已连接本地模型。三、实际案例应用分享测试1修复BUG幽灵会穿墙、卡墙、不会追击小黄修复后幽灵会不会卡墙了也知道追踪小黄修复后真的可以玩了测试2开发一个新游戏游戏展示游戏整体还可以而且我只是给了一句话的prompt它完成的很好火力、等级、飞机样式、攻击、还有敌人的血条完成的还是可以四、踩坑看了很多分享说使用llama直连或者直接代理走codex本地推理完全不可行个人实验多次各种报错如下1、写法错误failed to resolve feature overrideprecedence:legacy profile llamacpp-codex config is no longer supported;use --profile llamacpp-codex with llamacpp-codex.config.toml instead2、接口不被支持Unabletogenerate parserforthis template.Automatic parser generation failed:------------ While executing CallExpression at line 85, column 32 in source: ...first %}↵ {{- raise_exception(System message must be at the beginnin... ^ Error: Jinja Exception: System message must be at the beginning.3、jinjia模版异常invalid configuration: wire_api chat is no longer supported. How to fix: set wire_api responses in your provider config. More info: https://github.com/openai/codex/discussions/7782 in model_providers.llamacpp.wire_api反正我是各种报错如果有大佬成功了可以分享给小妹不胜感激本地 AI 工具的发展让更多开发者能低成本尝试 Agent 模式。希望这个分享能给大家提供一些参考实际操作时请注意数据安全和模型局限性。科技的乐趣就是把前沿工具变成每个人都能上手的东西。如果对茶馆的分享感兴趣欢迎点赞、转发、关注感谢大家