AI 编程助手本地安装入门：用 Ollama 跑通你的第一个模型

从零开始，教你安装 Ollama、下载编程模型，并配置 Codex CLI 等工具在本地运行 AI 助手。

准备环境：安装 Ollama

Ollama 是一个让你在电脑上运行 AI 模型的免费工具，不需要联网，数据全部留在本地。首先从 ollama.com 下载并安装。安装后打开终端（Mac 的“终端”或 Windows 的“命令提示符”），输入以下命令下载一个适合编程的模型：

运行 ollama pull qwen3-coder:30b（约 22GB，下载需要一些时间）
如果硬盘空间有限，可以换小模型如 qwen3-coder:14b 或 codellama:7b

下载完成后，运行 ollama run qwen3-coder:30b 测试能否正常对话。输入“Hello”并回车，看到回复就说明成功了。

安装步骤：让 AI 助手接入本地模型

我们用 Codex CLI（OpenAI 推出的终端编程助手）来演示。首先安装 Codex CLI（从 GitHub 下载或通过 npm 安装）。然后设置环境变量，告诉它使用本地模型：

在终端执行 export OPENAI_API_KEY=ollama（Ollama 不需要真实密钥，但 Codex 要求有这个变量）
执行 export OPENAI_BASE_URL=http://127.0.0.1:11434/v1（让 Codex 连接到你本地的 Ollama）
运行 codex 启动 CLI。第一次会要求配置模型目录，按提示创建一个空 JSON 文件即可跳过。

常见坑：如果遇到“does not support thinking”错误，需要手动编辑模型配置，把 supports_reasoning 设为 false。具体方法可参考 Ollama 文档。

验证是否成功

在 Codex CLI 中输入一个简单的任务，比如“写一个 Python 程序计算斐波那契数列”。如果模型返回了正确的代码，说明一切正常！你也可以试试其他工具，比如 Cursor（一款 AI 代码编辑器），在设置里把 API 地址改成 http://127.0.0.1:11434/v1，密钥随便填，就能用上本地模型了。

下一步可以做什么

尝试其他模型：Ollama 支持数百种模型，比如 llama3、mistral 等
让局域网内其他设备访问：设置环境变量 OLLAMA_HOST=0.0.0.0，然后通过你的电脑 IP 地址连接
探索更多工具：Claude Code 等也支持本地模型，配置方法类似

现在你已经拥有了一个完全本地、私密的 AI 编程助手，尽情享受吧！

内容来源

DEV Ollama

发布时间

2026-06-08 01:31