1、概述

  Ollama 是一款开源跨平台大模型工具,主要用于在本地便捷部署和运行大型语言模型(LLM),核心目标是降低用户使用大模型的门槛,同时保障数据隐私。核心功能与特点如下:

(1)本地部署,隐私保护

  1. 支持在 Windows、MacOS、Linux 等系统本地运行模型,无需依赖云端,数据交互全程在本地完成,避免隐私泄露。
  2. 适合对数据敏感的场景(如企业内部、科研)。

(2)丰富模型库,开箱即用

  1. 预集成主流开源模型,如 Llama 3、DeepSeek-R1、Qwen、Mistral 等(可以在 http://ollama.com/library 上找到),覆盖文本生成、代码开发、多语言翻译等场景。
  2. 支持模型量化(如 7B/13B 参数模型),降低显存需求,普通电脑(8GB + 内存)即可运行轻量模型。

(3)极简交互,命令行与 API 双支持

  1. 命令行: 通过 ollama run [模型名] 一键下载并启动模型,支持流式对话(如 ollama run yi:6b-chat)。
  2. API 接口:默认开放 11434 端口,兼容 OpenAI API 格式,可无缝对接 LangChain 等工具,方便开发集成。

(4)自定义模型 

  1. 通过 Modelfile 配置参数(温度、上下文长度、系统提示等),创建个性化模型(如 FROM llama2 PARAMETER temperature 0.7)。

2、安装与基础命令

(1)安装(Github:https://github.com/ollama/ollam

  • 官网下载:ollama.com(Windows、Mac支持一键安装包)。
  • 命令行安装(Linux):curl -fsSL https://ollama.com/install.sh | sh。
  • Docker安装:直接docker run ollama。

(2)常用命令

拉取模型:ollama pull llama3:13b
运行对话:ollama run llama3:13b(首次自动下载)
列出模型:ollama list
停止服务:ollama stop
查看帮助:ollama --help

注意: 详细命令使用参见《大模型-ollama(运行框架)》这篇博文。

3、本地部署大语言模型和云端部署大语言模型对比

4、典型使用场景

  • 开发者测试:快速验证模型性能,无需申请云端 API 权限。
  • 本地化应用:离线聊天机器人、内部文档问答系统(如医疗、法律领域)。
  • 科研与教学:自定义模型训练,分析模型行为(如参数窃取实验)。
  • 隐私优先场景:避免敏感数据上传云端(如企业代码、用户对话)。

5、安全风险与加固建议

(1)安全风险

  2025 年 3 月,国家网络安全通报中心指出 Ollama 默认配置存在三大风险:

  1. 未授权访问:11434 端口默认开放且无认证,攻击者可直接调用模型、删除文件。
  2. 数据泄露:通过 /api/show 接口获取模型敏感信息(如 License)。
  3. 历史漏洞:可利用 CVE-2024 系列漏洞执行恶意操作(如数据投毒)。

(2)加固建议

  • 限制端口监听:修改配置仅允许本地访问(ollama serve --listen localhost:11434)。
  • 配置防火墙:禁止公网访问 11434 端口。
  • 启用 API 密钥:通过环境变量 OLLAMA_API_KEY 认证(需版本 ≥0.5.12)。
  • 及时更新:修复漏洞,避免使用默认配置暴露公网。

6、优缺点总结

  • 优点:轻量易用、模型丰富、隐私性强,适合快速原型开发。
  • 缺点:默认配置不安全(需手动加固),多模型并行依赖 GPU 显存,复杂场景需结合 vLLM 等框架优化。

7、总结

  Ollama 是本地大模型的 “瑞士军刀”,用一行命令即可开启私有化 AI 体验,但需注意安全配置,适合追求便捷与隐私的开发者和企业。

我们该怎样系统的去转行学习大模型 ?

很多想入行大模型的人苦于现在网上的大模型老课程老教材,学也不是不学也不是,基于此,我用做产品的心态来打磨这份大模型教程,深挖痛点并持续修改了近100余次后,终于把整个AI大模型的学习门槛,降到了最低!

您只需要听我讲,跟着我做即可,为了让学习的道路变得更简单,这份大模型教程已经给大家整理并打包,现在将这份 LLM大模型资料 分享出来: 😝有需要的小伙伴,可以 扫描下方二维码领取🆓↓↓↓

一、大模型经典书籍(免费分享)

AI大模型已经成为了当今科技领域的一大热点,那以下这些大模型书籍就是非常不错的学习资源。

二、640套大模型报告(免费分享)

这套包含640份报告的合集,涵盖了大模型的理论研究、技术实现、行业应用等多个方面。无论您是科研人员、工程师,还是对AI大模型感兴趣的爱好者,这套报告合集都将为您提供宝贵的信息和启示。(几乎涵盖所有行业)
在这里插入图片描述

三、大模型系列视频教程(免费分享)

在这里插入图片描述

四、2025最新大模型学习路线(免费分享)

我们把学习路线分成L1到L4四个阶段,一步步带你从入门到进阶,从理论到实战。

L1阶段:启航篇丨极速破界AI新时代

L1阶段:我们会去了解大模型的基础知识,以及大模型在各个行业的应用和分析;学习理解大模型的核心原理、关键技术以及大模型应用场景。

L2阶段:攻坚篇丨RAG开发实战工坊

L2阶段是我们的AI大模型RAG应用开发工程,我们会去学习RAG检索增强生成:包括Naive RAG、Advanced-RAG以及RAG性能评估,还有GraphRAG在内的多个RAG热门项目的分析。

L3阶段:跃迁篇丨Agent智能体架构设计

L3阶段:大模型Agent应用架构进阶实现,我们会去学习LangChain、 LIamaIndex框架,也会学习到AutoGPT、 MetaGPT等多Agent系统,打造我们自己的Agent智能体。

L4阶段:精进篇丨模型微调与私有化部署

L4阶段:大模型的微调和私有化部署,我们会更加深入的探讨Transformer架构,学习大模型的微调技术,利用DeepSpeed、Lamam Factory等工具快速进行模型微调。

L5阶段:专题集丨特训篇 【录播课】

全套的AI大模型学习资源已经整理打包,有需要的小伙伴可以微信扫描下方二维码,免费领取

Logo

Agent 垂直技术社区,欢迎活跃、内容共建。

更多推荐