Mac 新手入门：本地跑通 AI 模型，一步步来

手把手教你用 Ollama 在 Mac 上安装、运行本地 AI 模型，零基础也能第一次跑通。

准备环境：先装 Ollama

Ollama 是一个帮你下载、管理和运行本地 AI 模型的工具，相当于一个“模型管家”。你不需要懂底层原理，装好就能用。

安装后，Ollama 会在右上角菜单栏出现一个小图标，同时后台自动启动。现在我们来下载一个轻量模型。

小提示：模型名字里的“7b”表示 70 亿参数，参数越多越聪明，但也越吃内存。你的 Mac 如果是 16GB 内存，建议选 7B 或 8B 的模型；32GB 以上可以试试 13B 的。

模型跑起来后，Ollama 会在本地开一个 API 服务地址 http://localhost:11434。你可以用浏览器打开这个地址，如果看到“Ollama is running”之类的提示，就说明一切正常。

另外，打开“活动监视器”（在“实用工具”里），看看内存占用：如果模型占用的内存接近你总内存的 1/3 左右，说明配置合理；如果系统开始大量使用“交换内存”（即硬盘当内存用），模型会变慢，建议换更小的模型。

换模型：去 ollama.com/library 浏览更多模型，用 ollama pull 模型名 下载，用 ollama run 模型名 运行。
在 VS Code 里用：如果你写代码，可以安装“Continue”插件，把 Ollama 设为后端，这样就能在编辑器里直接对话，相当于本地版 Copilot。
调优内存：在终端里设置环境变量 export OLLAMA_FLASH_ATTENTION=1 和 export OLLAMA_KV_CACHE_TYPE=q8_0，能省出 1-2GB 内存，让模型跑得更流畅。

现在，你已经成功在 Mac 上跑起了本地 AI 模型！不用担心按量收费，也不用担心数据外泄，尽情探索吧。

内容来源

DEV Ollama

发布时间

2026-06-05 01:35