Ollama + LocalCode Windows 本地部署指南:免费打造你的私有 AI 编程助手 前言你是否遇到过这些问题Lingma、Qorder 的免费额度用完了续费太贵公司的代码太敏感不敢上传到云端 AI网速慢、断网时想用 AI 辅助编程本地运行 AI 模型是解决这些问题的终极方案。本文将带你从零开始在 Windows 上部署 Ollama LocalCode打造一个完全免费、数据不出门、无使用限制的本地 AI 编程助手。最重要的是整个过程不需要 GPU普通办公电脑就能跑。一、为什么选择这套方案对比项云端 AIClaude/ChatGPT本地方案Ollama LocalCode费用订阅制或按 token 收费完全免费数据隐私代码上传到云端数据留在本地网络要求必须联网可离线使用使用限制有额度/次数限制无限制模型选择固定模型自由切换1.3B/7B/14B二、准备工作硬件要求项目最低要求推荐配置操作系统Windows 10/11Windows 10/11内存8GB16GB硬盘10GB 可用空间20GB网络用于下载模型宽带即可软件要求Node.js18 或更高版本 → 下载地址PowerShellWindows 自带三、安装步骤第 1 步安装 Ollama模型运行环境Ollama 是让大模型能在本地运行的核心工具。访问 https://ollama.com点击Download选择Windows版本运行OllamaSetup.exe完成安装验证安装powershellollama --version第 2 步启动 Ollama 服务方法一推荐通过开始菜单启动 Ollama系统托盘会出现羊驼图标方法二命令行启动需保持窗口打开powershellollama serve验证服务是否正常powershellcurl http://localhost:11434 # 返回 Ollama is running 即成功第 3 步下载 AI 模型这次测试用的deepseek-coder:latest(1.3B)powershell# 首选推荐已验证8GB 内存流畅运行 # 实际是 1.3B 量化版大小约 776MB ollama pull deepseek-coder:latest # 进阶模型需要 16GB 内存能力强 # q4_0 量化版大小约 3.8GB ollama pull deepseek-coder:6.7b-instruct-q4_0 # 旗舰模型需要 32GB 内存质量最高 # 大小约 9GB ollama pull qwen2.5-coder:14b实测经验deepseek-coder:latest(1.3B) 虽然在标签上叫 “latest”但实际上是一个轻量级模型在 8GB 内存的电脑上能流畅运行日常代码辅助完全够用。如果尝试 6.7B 模型遇到内存不足错误说明你的内存不足以运行该模型建议换回 1.3B 版本。第 4 步安装 LocalCodeAI 编程助手LocalCode 是一个终端 AI 助手可以读取你的项目代码并与模型交互。powershellnpm install -g localcode-agent验证安装powershelllocalcode --version四、常见问题与解决方案 问题 1Ollama is not reachable错误现象text✗ Ollama is not reachable.原因Ollama 服务没有启动解决方案从开始菜单启动 Ollama或运行ollama serve并保持窗口打开运行curl http://localhost:11434确认服务正常 问题 2URL 解析错误错误现象textTypeError: Failed to parse URL from http://localhost:11434:11434/api/chat原因配置文件中的 URL 端口重复了解决方案打开配置文件powershellnotepad $env:USERPROFILE\.localcode\config.json将baseURL改为正确的地址json{ llm: { provider: ollama, model: deepseek-coder:latest, baseURL: http://localhost:11434, temperature: 0.1 } }保存文件重启 LocalCode 问题 3模型下载慢原因模型文件较大776MB - 9GB从海外下载解决方案耐心等待下载一次即可选择网络较好的时段如清晨 问题 4运行卡顿、响应慢原因内存不足或使用 CPU 运行解决方案关闭其他占用内存的程序浏览器、IDE 等换用更小的模型powershellollama pull deepseek-coder:latest # 1.3B776MB使用q4_0量化版本体积更小 问题 5模型下载成功但运行时报内存错误错误现象textError: 500 Internal Server Error: llama-server process has terminated: ggml_backend_cpu_buffer_type_alloc_buffer: failed to allocate buffer of size 3642753024 alloc_tensor_range: failed to allocate CPU_REPACK buffer原因模型需要 6-8GB 连续内存你的系统无法提供解决方案换用轻量级模型推荐powershellollama run deepseek-coder:latest限制上下文长度powershellollama run deepseek-coder:6.7b-instruct-q4_0 --num-ctx 1024增加 Windows 虚拟内存到 16GB 以上右键此电脑 → 属性 → 高级系统设置高级 → 性能设置 → 高级 → 虚拟内存更改取消自动管理设置初始和最大为 16384 MB五、使用指南启动 LocalCodepowershellcd C:\你的项目路径 localcode首次配置连接启动后输入/connect选择Ollama作为 provider输入地址http://localhost:11434选择已下载的模型推荐deepseek-coder:latest常用命令命令功能/doctor检查连接状态/model切换模型/session save 名称保存当前对话/session load 名称加载历史对话/clear清空聊天/exit退出快捷键快捷键功能Tab切换 BUILD/PLAN 模式↑查看输入历史CtrlC中止/退出六、实战用 AI 分析项目写技术博客工作流text1. 进入项目目录启动 LocalCode 2. 分步提问获取素材 3. 人工整合润色 4. 发布博客提问模板text# 第一步了解项目结构 列出这个项目的目录结构每个文件夹的主要职责是什么 # 第二步分析核心模块 找出项目中最核心的3个模块分别解释它们的作用 # 第三步提取技术栈 列出项目使用的所有框架和库说明各自的用途 # 第四步找设计亮点 这个项目中有什么独特的设计或实现技巧 # 第五步生成博客初稿 基于以上分析生成技术博客初稿模型选择指南实测版你的内存推荐模型实际大小实测状态响应速度质量4GB-8GBdeepseek-coder:latest776 MB✅ 已验证可运行很快够用16GBdeepseek-coder:6.7b-instruct-q4_03.8 GB⚠️ 可能需调整虚拟内存中等良好32GBqwen2.5-coder:14b~9 GB未验证较慢优秀七、效果验证运行/doctor后看到以下输出即表示部署成功text✓ Ollama is reachable ✓ Model deepseek-coder:latest is available然后提问测试text 用Python写一个快速排序算法如果能返回正确的代码说明一切正常八、总结优点✅完全免费无任何 API 费用✅数据隐私代码从不离开本地✅无使用限制想问多少问多少✅离线可用没网也能用缺点⚠️硬件要求需要 8-16GB 内存⚠️首次部署需下载数百 MB 到数 GB 模型文件⚠️质量上限1.3B/7B 模型略逊于云端大模型适合人群代码敏感不便上传的项目经常断网或网络不稳定的环境Lingma/Qorder 免费额度用完的用户想学习本地 AI 部署的技术爱好者九、常见问题速查表问题解决方案Ollama 连不上启动 Ollama 服务检查托盘图标URL 解析错误修改 config.json 中的 baseURL模型下载慢耐心等待或换时间段下载响应太慢换deepseek-coder:latest轻量模型内存不足错误换 1.3B 模型或增加虚拟内存中文乱码提示 AI “用中文回答”效果图写在最后这套方案我已经在自己的 Windows 电脑上跑通deepseek-coder:latest(1.3B) 模型在 8GB 内存环境下流畅运行用来分析开源项目、提取技术博客素材体验非常丝滑。如果你也在寻找一个免费、私密、无限制的 AI 编程助手不妨跟着本文试试。