关于如何切换ollama思考模式以及存在的误区解释

Aainm

1388人浏览 · 2025-10-15 16:22:42

Aainm · 2025-10-15 16:22:42 发布

如何切换模型的思考模式

关闭深度思考

/set nothink

开启深度思考

/set think

操作演示，需要启动模型的时候再操作

通过这两个指令就能实现思考模式的切换

注：在新版的ollama指令已经抛弃掉了/set no_think指令，若使用/set nothink失败的话则为旧版ollama，可以手动升级ollama版本。

不同模式下的运行演示

nothink模式下

think模式下

存在的误区解释

误区

可不可以理解深度思考其实就是把大模型的思考过程展示出来，其实结果已经有了，但是把思考展示出来，打印完成后再输出结果。

即「深度思考」是“结果已经有了，只是额外把草稿打印给你看”

原因

造成误区的原因，就是不同模式下的测试的时候都会有个think，而且话术语法都差不多，就导致出现「深度思考」是“结果已经有了，只是额外把草稿打印给你看”这种现象。

结论

「深度思考」并不是“结果已经有了，只是额外把草稿打印给你看”

而是

模型在生成结果之前，先自回归地把一段内部推理文字（chain-of-thought, CoT）当成普通 token 全部生成出来；
这段 CoT 文字会占用同样的计算量、显存、时间；
等 CoT 生成完毕后，模型继续以它为条件去生成最终答案；
所以总延迟 ≈ CoT 长度 × 每 token 耗时 + 答案长度 × 每 token 耗时，显存也随序列长度线性增长。

它确实多算了一遍，而不是“算完藏着再给你”。

造成误区的原因，就是测试的时候都会有个think这里就要做解释了

在onthink模式下看到的这个“think>...”并不是模型在实时思考，而是 Ollama 控制台在调试模式下打印出来的“内部推理痕迹” —— 它其实是日志残留，不是模型真的在“思考”。

看到的 think>... 是 Ollama 控制台为了调试方便，把模型内部的第一层推理（系统提示词触发）打印出来了，不是模型返回给用户的正式内容。

AI Agent技术社区

Agent 垂直技术社区，欢迎活跃、内容共建。

更多推荐

使用 Reasonix 接入 DeepSeek：从零搭建你的 AI 编程助手

AI Agent技术社区

从理论到落地：基于TOGAF+FastGPT的企业级Agent需求调研与构建实战

企业级AI Agent项目失败通常源于需求调研不足，而非技术问题。本文结合TOGAF框架和FastGPT工具，提出了一套系统化的需求调研方法论：需求调研六大维度：业务目标、干系人、功能需求、数据需求、技术约束和治理合规，全面覆盖Agent构建要素。实施流程：通过准备、收集、分析、验证、文档化五个阶段，结合4W1H框架，确保需求管理的系统性和可追溯性。 FastGPT实践：利用其知识库管理、流程