Ollama——大语言模型本地部署的极速利器

Ollama 是一款开源跨平台大模型工具，主要用于在本地便捷部署和运行大型语言模型（LLM），核心目标是降低用户使用大模型的门槛，同时保障数据隐私。

程序学到昏

1260人浏览 · 2025-09-06 09:45:00

程序学到昏 · 2025-09-06 09:45:00 发布

1、概述

　　Ollama 是一款开源跨平台大模型工具，主要用于在本地便捷部署和运行大型语言模型（LLM），核心目标是降低用户使用大模型的门槛，同时保障数据隐私。核心功能与特点如下：

（1）本地部署，隐私保护

支持在 Windows、MacOS、Linux 等系统本地运行模型，无需依赖云端，数据交互全程在本地完成，避免隐私泄露。
适合对数据敏感的场景（如企业内部、科研）。

（2）丰富模型库，开箱即用

预集成主流开源模型，如 Llama 3、DeepSeek-R1、Qwen、Mistral 等（可以在 http://ollama.com/library 上找到），覆盖文本生成、代码开发、多语言翻译等场景。
支持模型量化（如 7B/13B 参数模型），降低显存需求，普通电脑（8GB + 内存）即可运行轻量模型。

（3）极简交互，命令行与 API 双支持

命令行：通过 ollama run [模型名] 一键下载并启动模型，支持流式对话（如 ollama run yi:6b-chat）。
API 接口：默认开放 11434 端口，兼容 OpenAI API 格式，可无缝对接 LangChain 等工具，方便开发集成。

（4）自定义模型

通过 Modelfile 配置参数（温度、上下文长度、系统提示等），创建个性化模型（如 FROM llama2 PARAMETER temperature 0.7）。

2、安装与基础命令

（1）安装（Github：https://github.com/ollama/ollam）

官网下载：ollama.com（Windows、Mac支持一键安装包）。
命令行安装（Linux）：curl -fsSL https://ollama.com/install.sh | sh。
Docker安装：直接docker run ollama。

（2）常用命令

拉取模型：ollama pull llama3:13b
运行对话：ollama run llama3:13b（首次自动下载）
列出模型：ollama list
停止服务：ollama stop
查看帮助：ollama --help

注意：详细命令使用参见《大模型-ollama（运行框架）》这篇博文。

3、本地部署大语言模型和云端部署大语言模型对比

4、典型使用场景

开发者测试：快速验证模型性能，无需申请云端 API 权限。
本地化应用：离线聊天机器人、内部文档问答系统（如医疗、法律领域）。
科研与教学：自定义模型训练，分析模型行为（如参数窃取实验）。
隐私优先场景：避免敏感数据上传云端（如企业代码、用户对话）。

5、安全风险与加固建议

（1）安全风险

　　2025 年 3 月，国家网络安全通报中心指出 Ollama 默认配置存在三大风险：

未授权访问：11434 端口默认开放且无认证，攻击者可直接调用模型、删除文件。
数据泄露：通过 /api/show 接口获取模型敏感信息（如 License）。
历史漏洞：可利用 CVE-2024 系列漏洞执行恶意操作（如数据投毒）。

（2）加固建议

限制端口监听：修改配置仅允许本地访问（ollama serve --listen localhost:11434）。
配置防火墙：禁止公网访问 11434 端口。
启用 API 密钥：通过环境变量 OLLAMA_API_KEY 认证（需版本 ≥0.5.12）。
及时更新：修复漏洞，避免使用默认配置暴露公网。

6、优缺点总结

优点：轻量易用、模型丰富、隐私性强，适合快速原型开发。
缺点：默认配置不安全（需手动加固），多模型并行依赖 GPU 显存，复杂场景需结合 vLLM 等框架优化。

7、总结

　　Ollama 是本地大模型的 “瑞士军刀”，用一行命令即可开启私有化 AI 体验，但需注意安全配置，适合追求便捷与隐私的开发者和企业。

我们该怎样系统的去转行学习大模型？

很多想入行大模型的人苦于现在网上的大模型老课程老教材，学也不是不学也不是，基于此，我用做产品的心态来打磨这份大模型教程，深挖痛点并持续修改了近100余次后，终于把整个AI大模型的学习门槛，降到了最低！

您只需要听我讲，跟着我做即可，为了让学习的道路变得更简单，这份大模型教程已经给大家整理并打包，现在将这份 LLM大模型资料 分享出来： 😝有需要的小伙伴，可以 扫描下方二维码领取🆓↓↓↓

一、大模型经典书籍（免费分享）

AI大模型已经成为了当今科技领域的一大热点，那以下这些大模型书籍就是非常不错的学习资源。

二、640套大模型报告（免费分享）

这套包含640份报告的合集，涵盖了大模型的理论研究、技术实现、行业应用等多个方面。无论您是科研人员、工程师，还是对AI大模型感兴趣的爱好者，这套报告合集都将为您提供宝贵的信息和启示。(几乎涵盖所有行业)
在这里插入图片描述

三、大模型系列视频教程（免费分享）

在这里插入图片描述

四、2025最新大模型学习路线（免费分享）

我们把学习路线分成L1到L4四个阶段，一步步带你从入门到进阶，从理论到实战。

L1阶段:启航篇丨极速破界AI新时代

L1阶段：我们会去了解大模型的基础知识，以及大模型在各个行业的应用和分析；学习理解大模型的核心原理、关键技术以及大模型应用场景。

L2阶段：攻坚篇丨RAG开发实战工坊

L2阶段是我们的AI大模型RAG应用开发工程，我们会去学习RAG检索增强生成：包括Naive RAG、Advanced-RAG以及RAG性能评估，还有GraphRAG在内的多个RAG热门项目的分析。

L3阶段：跃迁篇丨Agent智能体架构设计

L3阶段：大模型Agent应用架构进阶实现，我们会去学习LangChain、 LIamaIndex框架，也会学习到AutoGPT、 MetaGPT等多Agent系统，打造我们自己的Agent智能体。

L4阶段：精进篇丨模型微调与私有化部署

L4阶段：大模型的微调和私有化部署，我们会更加深入的探讨Transformer架构，学习大模型的微调技术，利用DeepSpeed、Lamam Factory等工具快速进行模型微调。

L5阶段：专题集丨特训篇【录播课】

全套的AI大模型学习资源已经整理打包，有需要的小伙伴可以微信扫描下方二维码，免费领取

AI Agent技术社区

Agent 垂直技术社区，欢迎活跃、内容共建。

更多推荐

试了6款AI编程工具，我只留这2个

AI Agent技术社区

为什么AI功能越发达，电商客服的差评反而越多？

但一个矛盾的现象正在越来越多的客服管理者之间蔓延：技术预算花了，机器人上线了，可客服团队的疲惫感没有减轻，大促期间的排队时长没有显著缩短，而用户投诉中关于“机器人答非所问”“转人工后要重复说三遍”的声音反而增加了。一线客服不再盯着几十个聊天窗口同时回复，而是监控AI Agent的运行状态，处理那些AI无法独立完成的边缘案例——情绪激动的投诉、涉及多方协调的纠纷、超出知识库范围的新品问题。人员流失率