用ollama在ubuntu下部署一个大模型

ruchong001

160人浏览 · 2026-06-21 21:11:12

ruchong001 · 2026-06-21 21:11:12 发布

简单介绍ollama就相当于大模型的docker

sudo apt update && sudo apt upgrade -y

安装ollama

curl -fsSL https://ollama.com/install.sh | sh

ollama --version

systemd服务：安装脚本会自动将 Ollama 设置为系统服务（systemd），并默认开机自启。你可以用 systemctl status ollama 来查看它的运行状态

关于“No NVIDIA GPU detected”警告：如果你的机器没有 NVIDIA 显卡，安装过程可能会显示这条警告。这很正常，Ollama 会自动切换到 CPU 模式运行，模型依然可以正常工作

Ollama 的模型库非常丰富，支持 Llama、Mistral、DeepSeek 等众多主流开源模型

拉取（下载）模型：
用 ollama pull 命令下载你想要的模型。这里以 Meta 的 Llama 3.2（一个轻量高效的模型）为例
ollama pull llama3.2

运行并对话：
下载完成后，用 ollama run 命令启动模型，你会直接进入一个交互式的命令行对话界面

ollama run llama3.2

现在，你就可以像和 ChatGPT 聊天一样，直接在终端里输入问题，和这个本地大模型对话了

硬件要求：运行大模型比较吃内存。通常建议至少 8GB 内存来运行 7B 参数级别的模型，16GB 或以上体验会更好

模型选择：除了上面提到的模型，你也可以去 Ollama 官网的模型库寻找其他你感兴趣的模型，比如阿里巴巴的 Qwen（通义千问）系列等

API 服务：Ollama 默认会在后台开启一个 API 服务（地址是 http://localhost:11434），方便你通过编程方式来调用模型能力

from langchain_ollama import ChatOllama

# 1. 初始化模型
llm = ChatOllama(
model="llama3.2",
base_url="http://localhost:11434", # 默认值，可省略
temperature=0.7,
num_predict=512,
)

# 2. 直接调用
response = llm.invoke("请用一句话介绍什么是人工智能")
print(response.content)

如果你在安装或下载过程中遇到了问题，比如网络连接失败，可以随时把具体的报错信息告诉我，我来帮你分析。

AI Agent技术社区

Agent 垂直技术社区，欢迎活跃、内容共建。

更多推荐

ChatGPT 5.5 辅助测试用例生成实践：从支付回调接口到可验证的研发流程

AI Agent技术社区

2026年如何用Gemini镜像站辅助学术写作？

把Gemini融入学术写作流程，能从文献处理、初稿打磨到格式校对等环节释放大量时间。对于国内研究者，选择像RskAi这样无需复杂网络配置、集成多款先进模型的镜像服务，让技术直接服务研究思维。想一站式体验不同模型在学术辅助上的侧重，可以访问，从一个小任务开始，逐步建立自己的AI辅助写作方法。【本文完】

AI Agent技术社区

AI 中转站：企业大模型应用中容易被忽视的安全关键点

2026年3月，墨西哥三人初创团队遭遇AI密钥盗用危机，团队月度常规Google Cloud费用仅180美元，攻击者盗取Gemini关联API密钥后，48小时疯狂调用模型接口，产生82314.44美元（约56.8万元）账单，费用暴涨近455倍，远超企业账户流动资金，团队濒临破产。此次事件叠加多重隐患：API密钥权限自动扩张、平台无异常调用风控告警、密钥缺少分级隔离，且企业全量AI模型调用流量，缺少