极客前沿

Mac 新手入门:本地跑通 AI 模型,一步步来

2026-06-05 01:35
DEV Ollama
查看原文

手把手教你用 Ollama 在 Mac 上安装、运行本地 AI 模型,零基础也能第一次跑通。

准备环境:先装 Ollama

Ollama 是一个帮你下载、管理和运行本地 AI 模型的工具,相当于一个“模型管家”。你不需要懂底层原理,装好就能用。

  • 如果你装过 Homebrew(Mac 上的软件包管理器),打开终端(Terminal)输入:brew install ollama
  • 没装 Homebrew 也没关系,直接去 ollama.com 下载安装包,双击安装就行。

安装步骤:下载并运行你的第一个模型

安装后,Ollama 会在右上角菜单栏出现一个小图标,同时后台自动启动。现在我们来下载一个轻量模型。

  1. 打开终端,输入:ollama pull qwen2.5:7b,按回车。这会下载一个约 4GB 的模型文件,需要几分钟到十几分钟,取决于网速。
  2. 下载完成后,输入:ollama run qwen2.5:7b,就能进入对话界面。试试问它“你好,你是谁?”——它应该会回答你。

小提示:模型名字里的“7b”表示 70 亿参数,参数越多越聪明,但也越吃内存。你的 Mac 如果是 16GB 内存,建议选 7B 或 8B 的模型;32GB 以上可以试试 13B 的。

Tutorial Image

验证是否成功:检查服务是否在运行

模型跑起来后,Ollama 会在本地开一个 API 服务地址 http://localhost:11434。你可以用浏览器打开这个地址,如果看到“Ollama is running”之类的提示,就说明一切正常。

另外,打开“活动监视器”(在“实用工具”里),看看内存占用:如果模型占用的内存接近你总内存的 1/3 左右,说明配置合理;如果系统开始大量使用“交换内存”(即硬盘当内存用),模型会变慢,建议换更小的模型。

下一步可以做什么

  • 换模型:去 ollama.com/library 浏览更多模型,用 ollama pull 模型名 下载,用 ollama run 模型名 运行。
  • 在 VS Code 里用:如果你写代码,可以安装“Continue”插件,把 Ollama 设为后端,这样就能在编辑器里直接对话,相当于本地版 Copilot。
  • 调优内存:在终端里设置环境变量 export OLLAMA_FLASH_ATTENTION=1export OLLAMA_KV_CACHE_TYPE=q8_0,能省出 1-2GB 内存,让模型跑得更流畅。

现在,你已经成功在 Mac 上跑起了本地 AI 模型!不用担心按量收费,也不用担心数据外泄,尽情探索吧。

内容来源

DEV Ollama

发布时间

2026-06-05 01:35

返回 AI技术