本文介绍了Claude Code的6大核心模式,包括持久化指令文件、作用域上下文组装、分层记忆等,帮助程序员更好地理解和应用大模型。同时,文章还详细解析了Claude Managed Agents的解耦设计,以及Hermes智能体的五段式循环和五层记忆架构,为读者提供了全面的大模型学习指南。

01

Claude Code

1.1 持久化指令文件

没有这个文件时,每次对话都像从头开始,相同的规则和错误可能反复出现。

代价:文件需要随项目更新维护,否则可能误导智能体。

图片

1.2 作用域上下文组装

将指令按不同范围(如组织、项目)拆分,让智能体能动态加载最相关的规则。

代价:规则分散在多个文件,可读性变差,且不同范围规则可能冲突。

图片

1.3 分层记忆

将记忆分为三层:常驻的精华摘要、按需加载的细节、仅支持搜索的完整历史,以节省Token。

代价:实现更复杂。需设计信息如何分层、流动,并确保索引与实际数据同步。

图片

1.4 做梦整理

定期在后台对记忆进行去重、清理和重组,类似“垃圾回收”,以保持记忆整洁有效。

代价:整理本身消耗资源,且可能误删有用信息。

图片

1.5 渐进式上下文压缩

新的对话保留细节,稍旧的做轻量总结,更早的则压缩成简短摘要,适合长对话任务。

代价:压缩必有信息损失。后续需要细节时,智能体可能会“编造”。

图片

1.6 工作流与编排

这类模式核心是“分离”,通过拆解任务流程来提升复杂任务的处理质量和可控性。

探索-规划-行动循环

严格分为三步:只读探索、与用户对齐的规划、拥有写权限的执行,避免盲目操作。适用于不熟悉的代码库或复杂修改。

代价:流程更慢,小任务会显得“笨重”。

图片

上下文隔离子智能体

为不同阶段(如调研、执行)创建拥有独立上下文和权限的子智能体,防止信息相互污染。适合长会话、多阶段任务。

代价:需要额外协调信息传递,传多或传少都有问题。

图片

分支-合并并行

将可并行的子任务分发给多个在独立环境中工作的子智能体,最后合并结果,以提升效率。

代价:合并更复杂,处理代码冲突的难度增加。

图片

1.7 工具与权限

这类模式关注如何安全、高效地管理智能体的能力。

渐进式工具扩展

开始时只提供最必要的工具,复杂工具按需动态加载,降低智能体的选择成本和出错概率。

图片

命令风险分类

根据命令类型、参数和影响,自动评估其风险等级(安全、有风险、危险),并采取自动执行、请求确认或直接拦截等不同策略。

图片

单用途工具设计

将常用操作(如读文件、搜索)封装为专用工具,而非依赖通用Shell命令,以提高可理解性、可审查性和权限控制粒度。

图片

1.8 自动化

确定性生命周期钩子

在智能体生命周期的关键节点(如会话开始、工具调用后)自动触发预设动作(如代码格式化),由系统确保关键流程被执行,不依赖可能被模型遗忘的指令。

图片

02

Claude Managed Agents

2.1 宠物与牲畜基础设施哲学

  • Session(会话)是宠物:精心培育、持久保存、不可丢失。
  • Harness(控制器)和 Sandbox(沙盒)是牲畜:可以随时创建、销毁、替换。

图片

2.2 智能体三件套解耦

一个智能体由三个核心组件构成:

  1. Claude(大脑):负责推理和决策。

  2. Harness(双手):驱动运行循环,调用Claude API并将工具调用路由到执行环境。

  3. Sandbox(工作台):Claude在其中编写代码、编辑文件、运行命令的隔离环境。

图片

Session:不可变的事件流

Session核心接口只有两个:记录事件(emitEvent())和读取事件(getEvents())。它是只追加的日志,天然支持重放和状态恢复,赋予智能体容错能力。

Harness:驱动循环

Harness是控制中心,它执行一个循环:从Session取上下文 → 调用Claude → 记录响应 → 如有工具调用则路由到Sandbox执行 → 记录结果 → 循环。Harness本身无状态,所有状态都在Session中,因此可随时替换或重启。

Sandbox:隔离的执行环境

每个Sandbox完全隔离,有自己的文件系统、进程和网络。关键特性是可隔离、可重建、可扩展。

核心安全设计:凭证永不进沙盒

采用保险库(vault) + 代理(proxy)架构:

所有第三方凭证存储在独立的保险库中,Harness和Sandbox都无法直接访问。

当需要调用外部工具时,通过代理从保险库按需获取凭证并执行请求。凭证始终不会暴露给Sand盒中的代码。

优势:遵循最小权限原则,所有外部调用可审计,凭证可统一轮换。

2.3 多智能体协作模式

图片

得益于三组件解耦,自然支持多种协作模式:

  • 多脑一手:多个Claude实例共享一个Sandbox。适用于多角度分析同一份代码(如安全审查+性能优化)。

  • 一脑多手:一个Claude实例控制多个Sandbox。适用于需在不同环境(如Python和Node.js)中同时执行任务。

  • 多脑多手:多个Claude实例各有自己的Sandbox,通过共享Session协调。适用于最复杂的多步骤任务。

    2.4 上下文工程:保持大脑专注

图片

为管理长任务中的上下文窗口,引入多种技术:

  • 上下文压缩:当上下文窗口将满时,将早期对话压缩成总结,腾出空间。原始数据仍完整保留在Session中。
  • 记忆工具:让Claude能主动将重要信息写入持久存储,后续可主动检索,类似人类记笔记。
  • 上下文裁剪:在发送给Claude前,智能地裁剪不相关的上下文,只保留当前任务需要的部分。

三者协同,确保Claude始终获得最相关的上下文。

2.5 性能优化:显著降低响应延迟

图片

关键在于将大脑(推理)从容器(Sandbox)中解耦。解耦前,每次推理都需等待Sandbox容器完全启动。解耦后,编排层从Session日志拉取事件后,推理可立即开始,使得首Token延迟降低60-90%。

03

Hermes:会进化的智能体

图片

3.1 五段式循环

规划 → 执行 → 观察 → 学习 → 适应

图片

3.2 五层记忆架构

图片

L1 短期记忆(便利贴):

当前对话的临时信息。

L2 技能手册(肌肉记忆):

完成复杂任务(如涉及5次以上工具调用)后,自动生成SKILL.md文件,记录完整的解决步骤,形成可复用的流程。

L3 知识库(语义记忆)

如何理解语义记忆?

简单讲就是利用向量存储这个技术,来实现模糊检索,原理是:即使字面不同,但语义相近的文本,其向量在数学空间中的位置也很接近。

举例查询进度报告技能:

“进度报告” vs “项目周报” → 相似度 0.92(很高!)

“进度报告” vs “预订机票” → 相似度 0.15(很低)

返回结果:返回最相关的技能:生成项目周报.md

L4 对你的了解(用户建模)

首先什么是黑格尔“辩证式”:

黑格尔“辩证式”就是AI内部在讨论:“我对用户的理解对吗?新证据说明了什么?怎么更新我的理解?”

图片

越来越懂你的朋友:

不是一次判断就定终身,允许你改变、允许情况复杂,通过不断观察、思考、调整,越来越懂真实的你。

这就像最好的朋友:知道你“通常”怎样,但也理解你“有时”会例外

比喻:

  • 旧版本:“林总喜欢喝美式”
  • 新发现:今天林总点了拿铁
  • 冲突:旧版本 和 新证据矛盾
  • 解决方案:不直接覆盖成“喜欢拿铁”,而是升级:
  • “林总平时喝美式,但周三下午会换拿铁”

L5 工作日志(长期档案)

FTS5全文检索+LLM摘要:跨会话搜索历史对话,永久存储

  • LLM 摘要(写读书笔记):每次长谈后,AI 会自动用一两句话总结核心结论,写在笔记本的“摘要区”。
  • FTS5 全文检索(给笔记本加智能目录):AI 会给笔记本的每一页(包括详细对话和摘要)的所有关键词,自动生成一个超快的电子索

-End-

小白/程序员如何系统学习大模型LLM?

由于新岗位的生产效率,要优于被取代岗位的生产效率,所以实际上整个社会的生产效率是提升的。

但是具体到个人,只能说是:

“最先掌握AI的人,将会比较晚掌握AI的人有竞争优势”。

这句话,放在计算机、互联网、移动互联网的开局时期,都是一样的道理。

我在一线互联网企业工作十余年里,指导过不少同行后辈。帮助很多人得到了学习和成长。

我意识到有很多经验和知识值得分享给大家,也可以通过我们的能力和经验解答大家在人工智能学习中的很多困惑,所以在工作繁忙的情况下还是坚持各种整理和分享。但苦于知识传播途径有限,很多互联网行业朋友无法获得正确的资料得到学习提升,故此将并将重要的AI大模型资料包括AI大模型入门学习思维导图、精品AI大模型学习书籍手册、视频教程、实战学习等录播视频免费分享出来。

第一阶段(10天):初阶应用

该阶段让大家对大模型 AI有一个最前沿的认识,对大模型 AI 的理解超过 95% 的人,可以在相关讨论时发表高级、不跟风、又接地气的见解,别人只会和 AI 聊天,而你能调教 AI,并能用代码将大模型和业务衔接。

  • 大模型 AI 能干什么?
  • 大模型是怎样获得「智能」的?
  • 用好 AI 的核心心法
  • 大模型应用业务架构
  • 大模型应用技术架构
  • 代码示例:向 GPT-3.5 灌入新知识
  • 提示工程的意义和核心思想
  • Prompt 典型构成
  • 指令调优方法论
  • 思维链和思维树
  • Prompt 攻击和防范

第二阶段(30天):高阶应用

该阶段我们正式进入大模型 AI 进阶实战学习,学会构造私有知识库,扩展 AI 的能力。快速开发一个完整的基于 agent 对话机器人。掌握功能最强的大模型开发框架,抓住最新的技术进展,适合 Python 和 JavaScript 程序员。

  • 为什么要做 RAG
  • 搭建一个简单的 ChatPDF
  • 检索的基础概念
  • 什么是向量表示(Embeddings)
  • 向量数据库与向量检索
  • 基于向量检索的 RAG
  • 搭建 RAG 系统的扩展知识
  • 混合检索与 RAG-Fusion 简介
  • 向量模型本地部署

第三阶段(30天):模型训练

恭喜你,如果学到这里,你基本可以找到一份大模型 AI相关的工作,自己也能训练 GPT 了!通过微调,训练自己的垂直大模型,能独立训练开源多模态大模型,掌握更多技术方案。

到此为止,大概2个月的时间。你已经成为了一名“AI小子”。那么你还想往下探索吗?

  • 为什么要做 RAG
  • 什么是模型
  • 什么是模型训练
  • 求解器 & 损失函数简介
  • 小实验2:手写一个简单的神经网络并训练它
  • 什么是训练/预训练/微调/轻量化微调
  • Transformer结构简介
  • 轻量化微调
  • 实验数据集的构建

第四阶段(20天):商业闭环

对全球大模型从性能、吞吐量、成本等方面有一定的认知,可以在云端和本地等多种环境下部署大模型,找到适合自己的项目/创业方向,做一名被 AI 武装的产品经理。

  • 硬件选型
  • 带你了解全球大模型
  • 使用国产大模型服务
  • 搭建 OpenAI 代理
  • 热身:基于阿里云 PAI 部署 Stable Diffusion
  • 在本地计算机运行大模型
  • 大模型的私有化部署
  • 基于 vLLM 部署大模型
  • 案例:如何优雅地在阿里云私有部署开源大模型
  • 部署一套开源 LLM 项目
  • 内容安全
  • 互联网信息服务算法备案

学习是一个过程,只要学习就会有挑战。天道酬勤,你越努力,就会成为越优秀的自己。

如果你能在15天内完成所有的任务,那你堪称天才。然而,如果你能完成 60-70% 的内容,你就已经开始具备成为一名大模型 AI 的正确特征了。

这份完整版的大模型 AI 学习资料已经上传CSDN,朋友们如果需要可以微信扫描下方CSDN官方认证二维码免费领取【保证100%免费

在这里插入图片描述

Logo

Agent 垂直技术社区,欢迎活跃、内容共建。

更多推荐