设置ollama大模型增加上下文！释放模型的全部潜力。

①蓑烟雨

2179人浏览 · 2025-03-12 14:12:39

①蓑烟雨 · 2025-03-12 14:12:39 发布

默认情况下，模型的上下文窗口大小可能是 2048，这意味着模型在处理任务时只能“记住”最近的 2048 个 token（约 1500-2000 个单词）。虽然这个设置对于大多数简单任务已经足够，但在处理复杂任务时，它可能会成为性能瓶颈。

快速开始！

①

这里假设你拉取的模型是 qwen2.5:32b【不清楚的可以使用指令ollama list查看】，随便找个自己记得的目录，运行以下命令导出 Modelfile文件：

ollama show --modelfile qwen2.5:32b > Modelfile

②

进入增加此行【这里 32768 是你想要的上下文窗口大小。你可以根据需要调整这个值。】

PARAMETER num_ctx 32768

③

使用修改后的 Modelfile 创建一个新模型。例如：

ollama create qwen2.5:32b -f Modelfile

④

运行大模型

ollama run qwen2.5:32b

以上配置完成就可以有超强上下文能力啦！快去试试吧

AI Agent技术社区

Agent 垂直技术社区，欢迎活跃、内容共建。

更多推荐

使用 Reasonix 接入 DeepSeek：从零搭建你的 AI 编程助手

AI Agent技术社区

从理论到落地：基于TOGAF+FastGPT的企业级Agent需求调研与构建实战

企业级AI Agent项目失败通常源于需求调研不足，而非技术问题。本文结合TOGAF框架和FastGPT工具，提出了一套系统化的需求调研方法论：需求调研六大维度：业务目标、干系人、功能需求、数据需求、技术约束和治理合规，全面覆盖Agent构建要素。实施流程：通过准备、收集、分析、验证、文档化五个阶段，结合4W1H框架，确保需求管理的系统性和可追溯性。 FastGPT实践：利用其知识库管理、流程