上下文工程，AI智能体落地的‘关键武器’！如何唤醒大模型‘心智’？

【摘要】大语言模型发展催生"上下文工程"新领域，成为构建AI智能体的核心技术。前特斯拉AI总监Andrej Karpathy指出，上下文窗口是控制LLM行为的核心，如同CPU与RAM的关系。文章系统阐述了四种上下文工程策略：1）写上下文（便签/记忆系统）实现信息持久化；2）选上下文（动态检索）精准注入相关信息；3）压缩上下文（摘要/修剪）优化token使用；4）隔离上下文（多A

AI-椰子不椰

1092人浏览 · 2025-07-10 14:46:15

AI-椰子不椰 · 2025-07-10 14:46:15 发布

随着大语言模型（LLM）能力的不断跃升，AI 智能体正在从纯对话系统迈向更复杂的多轮推理、多工具协同与长期任务执行。

而支撑这一演化的“幕后主角”，正是一个技术门槛日益提升的新领域：上下文工程（Context Engineering）。继 Vibe Coding（氛围编程）火了之后，AI圈又迎来一股新的技术热潮。

这一次，是由前特斯拉 AI 总监、深度学习布道者 Andrej Karpathy 亲自点燃的火。他在一次演讲中强调：“如果你想真正掌控一个大语言模型的行为，不是去微调权重，而是掌控它的‘心智世界’——你提供给它的上下文。”

在构建 AI 智能体的过程中，“上下文”不仅仅是几个提示词的组合，更是构成其“认知宇宙”的核心素材。它包含模型当前能“看到”的信息（如任务指令、外部知识、历史轨迹），也决定了模型“如何看到”（结构化与否）、“何时看到”（静态注入或动态更新）。

正如 Andrej Karpathy 所说：“LLM 是新的计算平台，模型本体就像 CPU，而上下文窗口就像 RAM。你无法重新训练模型每次适配具体任务，但你可以用上下文工程去控制它‘思考的材料’。”

于是，一个全新的工程范式被推上风口浪尖：Context Engineering（上下文工程）。

上下文工程是一门集艺术与科学于一体的学问，目标是高效填充 LLM 的上下文窗口，使其在每一步任务执行中都拥有“刚刚好”的信息量。它不仅涉及信息的选择、组织与注入方式，还关注上下文的动态性、可扩展性与准确性。

具体而言，构建 AI 智能体过程中所涉及的上下文类型包括：

指令：提示词、少样本示例、工具描述、系统角色设定等；
知识：结构化事实、外部知识库（通过RAG注入）或语义记忆；
工具反馈：函数调用、API 返回值、插件响应等多模态中间结果；
历史轨迹：对话上下文、用户输入记录、策略路径等。

由于 LLM 的上下文窗口资源有限（即使扩展至百万 tokens 也依旧存在边界），不加选择地注入上下文将导致成本上升、响应延迟、性能退化甚至幻觉增强。因此，对上下文的管理与设计，必须借助系统化策略。

四大上下文工程策略详解：写、选、压缩、隔离。

1. 写上下文（Write Context）

写上下文是指将关键任务信息保存在上下文窗口之外，但又可被模型间接利用的手段，类似人类“写便签”、“做笔记”的行为。

便签（Scratchpads）：Anthropic 提出的研究显示，AI 智能体通过工具调用或状态字段记录计划信息，可帮助其在任务过程中持久化策略、参数或状态。例如，研究人员将超过 20 万 tokens 的长任务拆解为阶段性步骤，并通过便签记录每一阶段决策，从而避免窗口溢出。
记忆（Memory）：指 AI 智能体自动从多轮历史对话中提取高价值事实（语义记忆）、行为流程（程序记忆）、案例轨迹（情景记忆）并长期保留。这一机制已被 ChatGPT、Cursor、Windsurf 等集成，用于实现“个性化响应”。如 ChatGPT 能记住用户的写作风格和工作场景，并在未来会话中主动融合。

2. 选上下文（Select Context）

选上下文是将最相关的信息拉入当前上下文窗口。它是上下文工程中最典型的动态部分，涵盖便签、记忆、工具与知识四种维度：

记忆选择：如 Claude Code 使用 CLAUDE.md 文件、Cursor 使用 config rules，用于提供始终注入的规则性知识。对于海量语义记忆，ChatGPT 结合知识图谱与向量索引过滤调用内容，但仍存在“意外注入”问题（如 Simon Willison 遭遇 AI 自动泄露位置信息）。
工具选择：大模型面对多种工具时，可能会因描述相似产生混淆。RAG-MCP 架构通过将工具说明索引入库，仅检索任务相关的工具描述，实验证明工具选择准确率提高 3 倍。
知识选择（RAG）：以 Windsurf 为例，其代码 RAG 架构并非简单做文本嵌入，而是结合 AST 分块、语义重排、多源索引等手段，在千万行代码中快速定位任务相关逻辑模块，从而大幅提升智能体响应的专业度。

3. 压缩上下文（Compress Context）

压缩上下文用于精简冗余 tokens，通过“摘要”和“修剪”两类方式实现：

上下文摘要（Summarization）：Claude Code 在上下文窗口使用率达到 95% 后会自动对对话轨迹进行总结，再替代注入。这种方式可以采用递归摘要、层次摘要等策略，也可以训练微调模型用于关键事件提取。
上下文修剪（Trimming）：使用规则剔除老旧、无效或冲突上下文。例如清除最早回合信息、剔除中间无关路径等。这种策略操作简便，在工具调用频繁或成本敏感场景中尤为常用。

4. 隔离上下文（Isolate Context）

隔离上下文是将任务上下文拆分为多个“独立空间”，实现多 Agent 协作、环境分区或状态模块化：

多智能体架构（Multi-Agent）：如 OpenAI Swarm 和 Anthropic 多智能体团队研究，每个子 Agent 管理自己的上下文、工具与指令，适用于分布式复杂任务。实验显示，相较单体 Agent，这种模式响应准确率显著提高，尽管 token 使用量高达单 Agent 的 15 倍。
环境隔离（Environment Isolation）：Hugging Face CodeAgent 架构将代码工具执行放入沙箱环境，工具调用参数与返回值在沙箱中完成状态隔离，仅返回结果注入 LLM，从而防止上下文污染。
运行时状态对象（State Object）：以 LangGraph 为例，系统状态由结构化字段组成。开发者可精确控制哪些字段在每步注入模型，哪些信息保持隔离，仅在特定回合暴露，从而实现“动态上下文管理”。

上下文工程已逐步成为 AI 智能体设计的核心工程分支。无论是 Anthropic 的研究，OpenAI 的产品落地，还是 LangChain/LangGraph 等开发框架的演进，都在强调一个趋势：

上下文，不只是提示词，它是智能体的“工作内存”、“知识总线”与“行为约束”。

未来，随着工具生态扩张、多模态输入爆发与任务持续增长，AI 智能体的上下文管理将走向更自动化、更智能、更语义化。

Context Engineering 将从人工手工选择，进化为“智能上下文调度器”，成为每一个 AI 开发者的核心能力之一。

参考原文：https://blog.langchain.com/context-engineering-for-agents/

大模型&AI产品经理如何学习

求大家的点赞和收藏，我花2万买的大模型学习资料免费共享给你们，来看看有哪些东西。

这份完整版的大模型 AI 学习资料已经上传CSDN，朋友们如果需要可以微信扫描下方CSDN官方认证二维码免费领取【保证100%免费】

1.学习路线图

第一阶段：从大模型系统设计入手，讲解大模型的主要方法；

第二阶段：在通过大模型提示词工程从Prompts角度入手更好发挥模型的作用；

第三阶段：大模型平台应用开发借助阿里云PAI平台构建电商领域虚拟试衣系统；

第四阶段：大模型知识库应用开发以LangChain框架为例，构建物流行业咨询智能问答系统；

第五阶段：大模型微调开发借助以大健康、新零售、新媒体领域构建适合当前领域大模型；

第六阶段：以SD多模态大模型为主，搭建了文生图小程序案例；

第七阶段：以大模型平台应用与开发为主，通过星火大模型，文心大模型等成熟大模型构建大模型行业应用。

2.视频教程

网上虽然也有很多的学习资源，但基本上都残缺不全的，这是我自己整理的大模型视频教程，上面路线图的每一个知识点，我都有配套的视频讲解。

（都打包成一块的了，不能一一展开，总共300多集）

因篇幅有限，仅展示部分资料，需要点击下方图片前往获取

3.技术文档和电子书

这里主要整理了大模型相关PDF书籍、行业报告、文档，有几百本，都是目前行业最新的。

4.LLM面试题和面经合集

这里主要整理了行业目前最新的大模型面试题和各种大厂offer面经合集。

👉学会后的收获：👈
• 基于大模型全栈工程实现（前端、后端、产品经理、设计、数据分析等），通过这门课可获得不同能力；

• 能够利用大模型解决相关实际项目需求：大数据时代，越来越多的企业和机构需要处理海量数据，利用大模型技术可以更好地处理这些数据，提高数据分析和决策的准确性。因此，掌握大模型应用开发技能，可以让程序员更好地应对实际项目需求；

• 基于大模型和企业数据AI应用开发，实现大模型理论、掌握GPU算力、硬件、LangChain开发框架和项目实战技能，学会Fine-tuning垂直训练大模型（数据准备、数据蒸馏、大模型部署）一站式掌握；

• 能够完成时下热门大模型垂直领域模型训练能力，提高程序员的编码能力：大模型应用开发需要掌握机器学习算法、深度学习框架等技术，这些技术的掌握可以提高程序员的编码能力和分析能力，让程序员更加熟练地编写高质量的代码。

1.AI大模型学习路线图
2.100套AI大模型商业化落地方案
3.100集大模型视频教程
4.200本大模型PDF书籍
5.LLM面试题合集
6.AI产品经理资源合集***

👉获取方式：
😝有需要的小伙伴，可以保存图片到wx扫描二v码免费领取【保证100%免费】🆓

AI Agent技术社区

Agent 垂直技术社区，欢迎活跃、内容共建。

更多推荐

如何卸载openclaw

OpenClaw（俗称"龙虾"）是一个本地 AI 智能体平台，用于在电脑上部署自主运行的 AI 代理。

AI Agent技术社区

（已解决）安装openclaw龙虾[特殊字符]npm权限问题EACCES

先安装升级完成node和homebrew后。安装就很快了。但是遇到EACCESS问题！！！发现报错了。问题错误：核心问题是sharp解决（90%人遇到的）安装 macOS 编译工具很多人缺少，导致sharp无法编译。运行：xcode-select --install安装完成后重新执行：sharp编译需要 C++ 编译器和 node-gyp，这些都来自 Xcode CLI。