Mac 新手入门:本地跑通 AI 模型,一步步来
手把手教你用 Ollama 在 Mac 上安装、运行本地 AI 模型,零基础也能第一次跑通。
准备环境:先装 Ollama
Ollama 是一个帮你下载、管理和运行本地 AI 模型的工具,相当于一个“模型管家”。你不需要懂底层原理,装好就能用。
- 如果你装过 Homebrew(Mac 上的软件包管理器),打开终端(Terminal)输入:
brew install ollama。 - 没装 Homebrew 也没关系,直接去 ollama.com 下载安装包,双击安装就行。
安装步骤:下载并运行你的第一个模型
安装后,Ollama 会在右上角菜单栏出现一个小图标,同时后台自动启动。现在我们来下载一个轻量模型。
- 打开终端,输入:
ollama pull qwen2.5:7b,按回车。这会下载一个约 4GB 的模型文件,需要几分钟到十几分钟,取决于网速。 - 下载完成后,输入:
ollama run qwen2.5:7b,就能进入对话界面。试试问它“你好,你是谁?”——它应该会回答你。
小提示:模型名字里的“7b”表示 70 亿参数,参数越多越聪明,但也越吃内存。你的 Mac 如果是 16GB 内存,建议选 7B 或 8B 的模型;32GB 以上可以试试 13B 的。
验证是否成功:检查服务是否在运行
模型跑起来后,Ollama 会在本地开一个 API 服务地址 http://localhost:11434。你可以用浏览器打开这个地址,如果看到“Ollama is running”之类的提示,就说明一切正常。
另外,打开“活动监视器”(在“实用工具”里),看看内存占用:如果模型占用的内存接近你总内存的 1/3 左右,说明配置合理;如果系统开始大量使用“交换内存”(即硬盘当内存用),模型会变慢,建议换更小的模型。
下一步可以做什么
- 换模型:去 ollama.com/library 浏览更多模型,用
ollama pull 模型名下载,用ollama run 模型名运行。 - 在 VS Code 里用:如果你写代码,可以安装“Continue”插件,把 Ollama 设为后端,这样就能在编辑器里直接对话,相当于本地版 Copilot。
- 调优内存:在终端里设置环境变量
export OLLAMA_FLASH_ATTENTION=1和export OLLAMA_KV_CACHE_TYPE=q8_0,能省出 1-2GB 内存,让模型跑得更流畅。
现在,你已经成功在 Mac 上跑起了本地 AI 模型!不用担心按量收费,也不用担心数据外泄,尽情探索吧。
内容来源
DEV Ollama
发布时间
2026-06-05 01:35