AI 入门:本地跑通大模型,一步步装好 Ollama
零基础学会安装 Ollama、下载模型、运行第一个 AI 对话,避开新手常见坑。
准备环境:你只需要一台电脑
本地运行 AI 模型不需要高端硬件,大多数 8GB 内存的电脑都能跑小模型。你只需要:
- 一台 Windows、macOS 或 Linux 电脑
- 至少 4GB 空闲硬盘空间(用于下载模型)
- 网络连接(下载工具和模型用)
Ollama 是一个免费工具,让你像装 App 一样在本地运行 AI 模型。它自动处理底层配置,你只需几条命令就能开始对话。
安装步骤:三步搞定
- 下载 Ollama:打开浏览器,访问 ollama.com,点击“Download”按钮,选择你的操作系统版本。安装包约 500MB,下载后双击安装即可。
- 打开终端:安装完成后,在 Windows 上搜索“命令提示符”或“PowerShell”,在 Mac/Linux 上打开“终端”。
- 运行第一个模型:在终端中输入
ollama run qwen2.5-coder:1.5b,然后按回车。Ollama 会自动下载一个约 1GB 的模型,下载完成后你就可以直接输入问题并得到回答。
注意:下载过程可能持续几分钟,取决于你的网速。如果遇到“command not found”错误,请重启终端或重新安装 Ollama。
验证是否成功:问它一句话
当终端出现 >>> 提示符时,说明模型已就绪。输入“你好,你是谁?”并按回车,模型会回复你。如果看到回复,恭喜你——你已经成功在本地运行了 AI!要退出对话,输入 /bye 并按回车。
模型 就像 AI 的“大脑”,不同模型擅长不同任务。qwen2.5-coder:1.5b 是一个轻量级模型,适合入门体验。如果你想要更聪明的回答,可以换成 qwen2.5-coder:7b(约 4.7GB),但需要至少 8GB 内存。
下一步可以做什么
- 尝试更多模型:在 Ollama 官网的“Models”页面查看所有可用模型,用
ollama run 模型名切换。 - 调整对话参数:在终端中设置
/set temperature 0.7让回答更随机或更精确。 - 集成到代码:Ollama 提供 API,你可以用 Python 等语言调用本地模型。
常见坑提醒:如果运行 7B 模型时电脑变慢或报错,说明内存不足,换回 1.5B 模型即可。另外,不要同时打开太多浏览器标签页,为模型留出内存。
内容来源
DEV Ollama
发布时间
2026-06-14 01:31