AI核心概念扫盲:从大模型到Agent的一站式入门指南
AI核心概念扫盲:从大模型到Agent的一站式入门指南
掌握这条链路,让你彻底搞懂AI热词不再发懵。
学AI工具时,最让人头疼的往往不是“不会用”,而是扑面而来的各种名词:大语言模型、Token、上下文、Prompt、工具调用、MCP、Agent、Agent Skill……
其实,这些概念并非孤立存在,它们可以串联成一条完整的逻辑链路,理解了它,就能从底层看懂当前绝大多数AI应用(如Claude Code、Cursor、MCP工具等)。
一、核心概念速览
我们可以用一张图来理解这条核心链路:
LM → Token → Context → Prompt → Tool → MCP → Agent → Agent Skill
下面,我们来逐一拆解每个环节。
1. LM / 大语言模型 (Large Language Model)
定义:AI的底层引擎,负责理解和生成文本。
通俗理解:可以把它想象成AI的“大脑”。所有基于文本的推理、创作、对话,都依赖这个大模型作为核心动力源。它通过海量数据训练而成,能根据输入的文字预测并生成最合理的输出。
2. Token
定义:模型处理文本的最小单位。
通俗理解:AI看不懂我们日常的“字”或“词”,它看到的是一个个“Token”。一个词、一个子词、一个标点符号,甚至一个表情符号,都可能被拆解成一个或多个Token。比如,“ChatGPT”可能被拆成“Chat”和“GPT”两个Token。
3. Context / 上下文
定义:模型当前能“看到”和“记住”的所有信息的总和。
通俗理解:就像和人聊天时,你需要知道前面说了什么才能接话。对于AI来说,上下文包含了用户本次提出的问题、之前聊过的历史对话、系统给它设定的规则,以及它刚刚调用工具得到的结果。上下文的大小(通常以Token数量衡量)决定了模型能“记住”多少信息。
4. Prompt / 提示词
定义:你给模型下达的任务指令。
通俗理解:你向AI提出的“问题”或“要求”就是Prompt。Prompt的质量直接决定了输出的质量。一个清晰、具体、包含示例的Prompt,能引导模型生成更稳定、更符合预期的结果。
5. Tool / 工具调用
定义:让模型不仅仅会“说话”,还能“动手做事”的能力。
通俗理解:大模型本身只能生成文本。但通过Tool,它能够调用外部的功能,比如搜索网页、读取本地文件、执行代码、查询数据库、调用第三方API等。这让AI从一个“纸上谈兵”的理论家,变成了一个“能动手执行”的实干家。
6. MCP (Model Context Protocol)
定义:模型接入外部工具的一套统一协议,全称是Model Context Protocol。
通俗理解:可以将MCP理解为AI界的“USB-C接口”。以前,每个工具都要给AI写一套独特的“驱动程序”(接入代码)。有了MCP,所有符合该协议的工具,AI都可以即插即用,极大地简化了工具接入的过程,实现了标准化。它解决了工具调用的碎片化问题。
7. Agent
定义:能围绕目标自主规划、调用工具、观察结果并持续推进任务的系统。
通俗理解:Agent是一个“高阶智能体”。你不是简单地问它“今天天气怎么样”,而是交给它一个总目标,比如“帮我规划一次下周去北京的3日游行程,预算5000元,然后输出一份旅游攻略文档”。Agent会自主地将这个大目标分解为多个子任务(查机票、查酒店、规划景点路线、计算预算、生成文档),然后按顺序调用对应的工具来执行,并观察每一步的结果,直到完成最终目标。
8. Agent Skill
定义:写给Agent“阅读”和“执行”的技能说明书。
通俗理解:为了让Agent能高效完成特定任务(比如“企业财务分析”),你需要教它怎么做。Agent Skill就是一本详细的操作手册,里面写清楚了执行该任务的具体规则、详细步骤、注意事项、以及最终输出的格式。当Agent遇到特定任务时,就会读取并遵循对应的Skill,这使得Agent的能力可以被标准化、模块化,并且可以被复用。
二、总结
记住这条核心链路,你就抓住了理解AI Agent的钥匙:
LM 是大脑,拥有基础能力。
Token 是基本认知单元。
Context 是工作记忆区。
Prompt 是任务指令。
Tool 是外部执行器。
MCP 是标准化接口协议。
Agent 是能自主完成复杂任务的智能体。
Agent Skill 是让Agent做特定工作的专业操作手册。
更多推荐

所有评论(0)