AI Agent的“心智理论”挑战：当前局限性与突破方向展望

心智理论（Theory of Mind, ToM）这一术语最早由认知心理学家Premack和Woodruff在1978年发表的经典论文《Does the chimpanzee have a theory of mind?》中提出。

数据结构与算法学习

342人浏览 · 2026-05-17 02:59:56

数据结构与算法学习 · 2026-05-17 02:59:56 发布

AI Agent的“心智理论”挑战：当前局限性与突破方向展望

引言

背景介绍

从1950年图灵在《计算机器与智能》中提出“机器能否思考”这一振聋发聩的疑问，到2022年ChatGPT引爆通用人工智能（Artificial General Intelligence, AGI）讨论，再到2024年OpenAI发布具备一定任务协作能力的GPT-4o mini Agentic Preview，AI系统的形态正在从被动的信息响应工具向主动的目标驱动实体——AI Agent（人工智能体） 快速演进。

根据Lilian Weng（OpenAI前AGI安全研究科学家）在2023年提出的经典定义，AI Agent是“由感知（Perception）、推理（Reasoning）、行动（Action）三大核心模块构成，能在动态环境中自主设定或接受子目标、规划路径、执行操作并根据反馈调整策略的实体”。目前，AI Agent已经在软件测试（如Debuild的Agent自动构建MVP）、游戏协作（如DeepMind的AlphaStar组队模式、Roblox中的NPC智能助手）、科研辅助（如Meta的Cicero在《文明帝国VI》中实现人类级别的外交策略、IBM的Watson Discovery+Agent自动分析医疗文献并设计实验）等领域取得了突破性进展。

然而，当AI Agent走出“封闭的实验室环境”或“单智能体任务场景”，进入需要与人类或其他智能体（Agent-Human/Agent-Agent）进行复杂、非结构化、意图模糊的社会交互的真实世界时，它的表现往往会出现严重的“失能”：例如，它可能无法理解人类用户的“反话”（“你可真厉害，把我的代码删得干干净净”——实际是在批评而非赞美），无法识别同伴Agent的“隐瞒意图”（例如两个协作编程的Agent，其中一个故意输出错误的语法建议来拖延进度），也无法根据交互对象的“情感状态”调整自己的行动节奏（例如面对正在焦虑的用户依然用生硬、冗长的技术术语解释问题）。

这些失能本质上源于当前AI Agent缺乏一项人类及部分高等动物（如黑猩猩、渡鸦）在长期进化中获得的核心社会认知能力——心智理论（Theory of Mind, ToM）。心智理论被认知科学家称为“社会认知的基石”，它指的是“个体能够将不可观察的心理状态（如信念、愿望、意图、情感、知识、不确定性）归因于自己和他人，并理解这些心理状态之间的因果关系，进而预测或解释他人行为的能力”。

核心问题

本文将围绕以下三个核心问题展开深度剖析与探讨：

心智理论（ToM）究竟是什么？它有哪些核心的概念结构与认知发展阶段？人类的ToM是如何工作的？
当前主流AI Agent的ToM实现方案有哪些？它们在认知科学的经典ToM测试（如错误信念任务、莎莉-安妮任务、二阶信念任务、意图识别任务、情感推理任务）和真实的社会交互场景中存在哪些局限性？这些局限性的技术根源与认知根源是什么？
未来AI Agent的ToM突破方向有哪些？认知科学、神经科学、强化学习、大语言模型（Large Language Models, LLMs）、因果推理、多模态感知等领域的最新进展将如何为AI Agent的ToM赋能？我们离“具备人类级ToM的AGI Agent”还有多远？

文章脉络

本文将遵循“从人类认知的本质出发，到AI实现的现状与痛点，再到未来的技术突破路径”的逻辑脉络进行组织：

第一部分（基础概念篇）：详细介绍心智理论的核心定义、认知科学分类（一阶ToM vs 二阶ToM、感知ToM vs 推理ToM、冷ToM vs 热ToM）、经典的发展心理学测试、人类ToM的神经机制（包括镜像神经元系统、心智化网络的核心脑区）、人类ToM的数学模型与算法逻辑（如贝叶斯心智理论）。
第二部分（现状与局限性篇）：首先梳理当前AI Agent实现ToM的主流技术路径——基于规则的ToM、基于统计的ToM（早期的机器学习方法）、基于大语言模型（LLMs）的ToM、基于多模态大语言模型（MLLMs）的ToM、基于强化学习（RL）的ToM；然后，通过认知科学的经典测试和真实的社会交互实验数据，系统分析这些技术路径的局限性；最后，从技术架构的缺陷、训练数据的偏差、认知模型的简化、因果推理能力的缺失四个维度深入挖掘这些局限性的根源。
第三部分（突破方向展望篇）：结合认知科学、神经科学、LLMs/MLLMs、因果推理、世界模型（World Models）、元强化学习（Meta-RL）等领域的最新研究成果，提出AI Agent ToM的六大突破方向——神经启发的心智化架构设计、基于因果世界模型的贝叶斯ToM增强、从LLMs的“统计模拟ToM”到“符号-统计融合的概念性ToM”、多模态感知与情感共情的深度结合、元学习驱动的ToM快速适应与泛化、多智能体社会环境下的协同ToM进化；并详细阐述每个方向的核心技术原理、代表性研究工作、面临的挑战与未来的发展潜力。
第四部分（总结与展望篇）：回顾本文的核心观点，总结当前AI Agent ToM的研究进展与主要瓶颈，展望AI Agent ToM在未来5-10年的行业应用前景（如智能客服、智能教育、智慧医疗、自动驾驶、社交机器人、元宇宙NPC），并探讨“具备人类级ToM的AGI Agent”可能带来的伦理与安全挑战（如意图欺骗、情感操纵、隐私侵犯、责任归属问题）。

第一部分基础概念：什么是“心智理论（ToM）”？

1.1 心智理论的核心定义与历史溯源

心智理论（Theory of Mind, ToM）这一术语最早由认知心理学家Premack和Woodruff在1978年发表的经典论文《Does the chimpanzee have a theory of mind?》中提出。在这篇论文中，Premack和Woodruff通过黑猩猩Sarah的实验（Sarah能够根据实验者的意图选择合适的工具来解决问题，例如当实验者假装无法够到高处的香蕉时，Sarah会选择一根长棍子而非短棍子递给实验者），首次提出了“非人类灵长类动物可能具有某种形式的ToM”的假设，并将ToM定义为：

“个体能够推断出自己和其他个体具有不可观察的心理状态（如目的、意图、信念、知识、愿望），并能够利用这些心理状态来预测和解释其他个体行为的一套认知系统或理论框架。”

需要特别强调的是，Premack和Woodruff在这里使用了“理论”（Theory）一词，并非指ToM是一套经过科学验证的、明确的命题系统，而是指个体在社会交互中会自发地构建一套关于“心理状态如何产生、如何影响行为”的内隐的、朴素的（Naive）认知模型——这套模型类似于物理学中的“朴素物理学理论”（例如“物体下落是因为重力”），虽然不一定完全符合科学事实，但足以指导个体在日常社会交互中的决策与行动。

自Premack和Woodruff的开创性工作以来，心智理论的研究已经成为认知科学、发展心理学、神经科学、人类学、哲学、人工智能等多个学科领域的交叉热点。经过近50年的发展，心智理论的定义得到了进一步的细化与拓展：

发展心理学家强调ToM的发展性：个体的ToM不是与生俱来的，而是在后天的社会交互中逐渐发展成熟的（例如儿童通常在3-4岁时获得一阶错误信念理解能力，在6-7岁时获得二阶错误信念理解能力）。
神经科学家强调ToM的神经基础：人类大脑中存在一套专门负责心智化（Mentalizing）的脑网络——包括内侧前额叶皮层（mPFC）、颞顶联合区（TPJ）、颞上沟（STS）、杏仁核（Amygdala）、前扣带回皮层（ACC）等。
认知科学家强调ToM的功能性：ToM的核心功能包括“心理状态归因”（Attribution of Mental States）、“心理状态因果关系理解”（Understanding of Causal Links Between Mental States）、“行为预测与解释”（Prediction and Explanation of Behavior）、“社会交互决策”（Social Interaction Decision-Making）、“情感共情与视角采择”（Empathy and Perspective-Taking）。
人类学家强调ToM的文化差异性：虽然ToM的核心认知机制具有跨文化的普遍性，但不同文化背景下的个体在心理状态的归因方式、情感表达的理解方式等方面存在一定的差异（例如东方文化背景下的个体更倾向于从“社会情境”而非“个体心理状态”的角度来解释他人的行为）。

1.2 心智理论的认知科学分类

为了更深入地理解ToM的结构与功能，认知科学家从不同的维度对ToM进行了分类：

1.2.1 按照心理状态的“归因对象”分类：自我ToM vs 他人ToM

自我ToM（Self-ToM）指的是“个体能够将心理状态归因于自己，并对自己的心理状态进行内省、监控与调节的能力”——例如“我现在感到焦虑，因为我担心明天的考试通不过；我需要听一首轻音乐来缓解焦虑”。自我ToM是元认知（Metacognition）的核心组成部分，它帮助个体了解自己的认知局限、调整自己的学习策略、控制自己的情绪与行为。

他人ToM（Other-ToM）指的是“个体能够将心理状态归因于他人，并利用这些心理状态来预测和解释他人行为的能力”——例如“莎莉认为她的玩具还在篮子里，因为她没有看到安妮把玩具转移到了盒子里；所以莎莉会去篮子里找她的玩具”。他人ToM是社会交互的核心认知能力，它帮助个体理解他人的意图、避免冲突、建立合作关系、进行有效的沟通。

虽然自我ToM和他人ToM在功能上有所区别，但它们共享一套核心的神经机制（例如内侧前额叶皮层mPFC同时参与自我内省和他人心理状态归因）——不过，当个体进行“自我内省”时，mPFC的腹内侧区域（vmPFC）激活更强烈；当个体进行“他人心理状态归因”时，mPFC的背内侧区域（dmPFC）激活更强烈。

1.2.2 按照心理状态的“抽象程度”与“因果推理层次”分类：一阶ToM vs 二阶ToM vs 高阶ToM

一阶ToM（First-Order ToM）指的是“个体能够理解‘他人对客观世界有一个信念’的能力”——核心是“对他人的一阶心理状态（如‘莎莉相信P’，其中P是一个关于客观世界的命题）的归因与理解”。一阶ToM的经典测试是“莎莉-安妮错误信念任务”（Sally-Anne False Belief Task），我们将在1.3节详细介绍。

二阶ToM（Second-Order ToM）指的是“个体能够理解‘他人对另一个人的心理状态有一个信念’的能力”——核心是“对他人的二阶心理状态（如‘安妮相信莎莉相信P’）的归因与理解”。二阶ToM的经典测试是“冰淇淋车错误信念任务”（Ice Cream Truck False Belief Task）或“小偷-侦探二阶信念任务”（Thief-Detective Second-Order Belief Task）。

高阶ToM（Higher-Order ToM）指的是“个体能够理解‘三阶及以上的心理状态嵌套’的能力”——例如“我相信你希望他认为我们不知道这件事”（四阶ToM）。高阶ToM的抽象程度非常高，通常只有成年人类（尤其是受过良好教育的成年人类）才能熟练掌握，它在复杂的社会博弈、文学创作、政治谈判等场景中发挥着重要作用。

发展心理学的研究表明，个体的ToM是按照“一阶→二阶→高阶”的顺序逐渐发展成熟的：儿童通常在3-4岁时获得一阶错误信念理解能力（在此之前，他们会认为“别人的信念和自己的信念完全一致”，即存在“自我中心偏差”），在6-7岁时获得二阶错误信念理解能力，在青春期前后开始逐渐掌握高阶ToM。

1.2.3 按照心理状态的“类型”与“处理方式”分类：冷ToM vs 热ToM

“冷ToM”（Cold ToM）与“热ToM”（Hot ToM）的分类最早由认知心理学家Leslie等人在2004年提出，其核心依据是“心理状态的类型是否涉及情感或动机，以及处理这些心理状态时是否需要调用情感系统”：

冷ToM（Cold ToM）：指的是“对不涉及情感或动机的‘认知性心理状态’（如信念、知识、不确定性、假设、意图的认知层面）的归因与理解能力”——核心是“理性的因果推理”。冷ToM的经典测试是“莎莉-安妮错误信念任务”（不涉及情感）、“意外内容任务”（Unexpected Contents Task，例如“你看到一个糖果盒里装的是铅笔，你认为第一次看到这个糖果盒的小朋友会认为里面装的是什么？”）。冷ToM的核心神经基础是内侧前额叶皮层背内侧区域（dmPFC）、颞顶联合区（TPJ）、颞上沟后部（pSTS）。
热ToM（Hot ToM）：指的是“对涉及情感或动机的‘情感性/动机性心理状态’（如愿望、意图的动机层面、情感、情绪、欲望、偏好、价值观）的归因与理解能力”——核心是“情感共情与视角采择的结合”。热ToM的经典测试是“错误情绪任务”（False Emotion Task，例如“小明的妈妈给小明买了一个他不喜欢的玩具，但小明不想让妈妈难过，所以他假装很开心；你认为小明的真实情绪是什么？他妈妈认为小明的情绪是什么？”）、“道德判断任务”（Moral Judgment Task，例如“甲为了救乙而不小心弄坏了丙的贵重物品，甲的行为是否道德？”——需要理解甲的“善意意图”与乙的“积极后果”、丙的“消极后果”之间的关系）。热ToM的核心神经基础是内侧前额叶皮层腹内侧区域（vmPFC）、杏仁核（Amygdala）、前扣带回皮层（ACC）、岛叶（Insula）。

需要特别注意的是，冷ToM和热ToM并不是完全独立的，它们在大多数社会交互场景中是协同工作的——例如，当你理解“小明假装开心”时，你需要先用冷ToM理解“小明的妈妈相信小明喜欢这个玩具”（二阶信念），再用热ToM理解“小明的真实愿望是不让妈妈难过”“小明的真实情绪是失望”。此外，自闭症谱系障碍（Autism Spectrum Disorder, ASD）患者的ToM缺陷通常表现为“冷ToM和热ToM的双重缺陷”，但也有部分ASD患者的冷ToM相对较好（例如高功能自闭症患者阿斯伯格综合征），而热ToM缺陷较为严重。

1.2.4 按照心理状态的“感知方式”分类：感知ToM vs 推理ToM

感知ToM（Perceptual ToM）指的是“个体通过观察他人的非言语行为线索（如面部表情、眼神注视、肢体动作、手势、语调）直接、快速地感知到他人的心理状态的能力”——例如，你看到一个人皱着眉头、攥紧拳头，你会直接感知到“他现在很愤怒”；你看到一个人不停地看手表、东张西望，你会直接感知到“他现在很着急，可能在等什么人”。感知ToM具有自动化、快速、内隐的特点，它不需要个体进行复杂的因果推理，通常在人类出生后的第一年就开始发展（例如婴儿能够识别成人的面部表情）。感知ToM的核心神经基础是颞上沟（STS）（负责处理面部表情、眼神注视、肢体动作等非言语行为线索）、杏仁核（Amygdala）（负责处理情感性非言语行为线索）。

推理ToM（Inferential ToM）指的是“个体通过观察他人的言语行为线索（如对话内容、语气）、社会情境线索（如他人所处的环境、之前的行为历史）、客观世界线索（如他人的行为对客观世界的影响），进行复杂的因果推理，从而推断出他人的心理状态的能力”——例如，你听到一个人说“这个餐厅的菜真好吃”，但你之前看到他吃了一口就皱了眉头，而且你知道他最讨厌吃辣的，而这个餐厅的菜全是辣的，你会通过推理得出“他是在说反话，他其实觉得这个餐厅的菜很难吃”。推理ToM具有受控、缓慢、外显的特点，它需要个体调用工作记忆和执行功能，通常在人类出生后的第三年才开始发展（与一阶ToM的发展时间一致）。推理ToM的核心神经基础是内侧前额叶皮层（mPFC）、颞顶联合区（TPJ）。

同样，感知ToM和推理ToM也是协同工作的——感知ToM为推理ToM提供了“初始的线索输入”，而推理ToM则对感知ToM的结果进行“验证、修正与补充”。例如，当你看到一个人笑的时候，感知ToM会先告诉你“他可能很开心”；但如果你知道他刚刚失去了亲人，推理ToM会修正这个结果，告诉你“他可能是在强颜欢笑”。

1.3 心智理论的经典发展心理学测试

为了量化评估个体的ToM发展水平，发展心理学家设计了一系列经典的ToM测试——这些测试不仅是研究人类ToM发展的重要工具，也是评估AI Agent ToM能力的“金标准”之一。下面我们将详细介绍6种最常用的经典ToM测试：

1.3.1 一阶错误信念任务：莎莉-安妮任务（Sally-Anne False Belief Task）

莎莉-安妮任务是由Baron-Cohen、Leslie和Frith在1985年设计的，它是目前世界上使用最广泛的一阶ToM测试，主要用于评估个体的一阶冷ToM能力。

测试场景：
测试者向被试（通常是儿童或AI Agent）展示两个玩偶——莎莉（Sally）和安妮（Anne），以及两个容器——一个篮子（Basket）和一个盒子（Box），还有一个玩具（例如弹珠）。具体的测试步骤如下：

步骤1（场景构建）：测试者演示莎莉把弹珠放进篮子里，然后用一块布把篮子盖上，接着莎莉离开了房间。
步骤2（信念改变）：测试者演示安妮把弹珠从篮子里拿出来，放进盒子里，然后用一块布把盒子盖上，接着安妮也离开了房间。
步骤3（测试问题）：测试者向被试提出以下3个问题：
a. 记忆问题（Memory Check）：弹珠一开始放在哪里？（正确答案：篮子里）——这个问题用于排除被试的记忆缺陷对测试结果的影响。
b. 现实问题（Reality Check）：弹珠现在放在哪里？（正确答案：盒子里）——这个问题用于排除被试的现实认知缺陷对测试结果的影响。
c. 错误信念问题（False Belief Question）：莎莉回来后，会去哪里找她的弹珠？（正确答案：篮子里）——这个问题是核心测试问题，用于评估被试是否能够理解“莎莉对弹珠的位置有一个错误的信念”。

测试结果解释：

如果被试能够正确回答所有3个问题，说明被试具备一阶冷ToM能力。
如果被试能够正确回答记忆问题和现实问题，但错误地回答了错误信念问题（例如说“莎莉会去盒子里找弹珠”），说明被试存在一阶ToM缺陷——即存在“自我中心偏差”，认为“别人的信念和自己的信念完全一致”。

发展心理学研究数据：
Baron-Cohen等人的原始研究表明，4岁以上的正常儿童通常能够正确回答莎莉-安妮任务的所有问题；3岁以下的正常儿童通常会错误地回答错误信念问题；而绝大多数自闭症谱系障碍（ASD）儿童（即使是智力正常的高功能ASD儿童）也会错误地回答错误信念问题——这一研究结果为“ASD患者存在ToM缺陷”的假说提供了强有力的证据。

1.3.2 一阶错误信念任务：意外内容任务（Unexpected Contents Task）

意外内容任务是由Perner、Leekam和Wimmer在1987年设计的，它也是一种常用的一阶ToM测试，主要用于评估个体的一阶冷ToM能力，以及“自我信念的修正能力”（属于自我ToM的范畴）。

测试场景：
测试者向被试展示一个常见的容器——例如一个糖果盒（Smarties Box），然后向被试提出以下问题：

步骤1（初始信念问题1）：你认为这个糖果盒里装的是什么？（正确答案：糖果）——这个问题用于评估被试的初始信念。
步骤2（现实揭示）：测试者打开糖果盒，让被试看到里面装的不是糖果，而是铅笔。
步骤3（记忆问题/自我信念修正问题）：在我打开糖果盒之前，你认为里面装的是什么？（正确答案：糖果）——这个问题用于评估被试是否能够记住并修正自己的初始错误信念（属于自我ToM的范畴）。
步骤4（初始信念问题2/记忆检查）：这个糖果盒里现在装的是什么？（正确答案：铅笔）——这个问题用于排除被试的记忆缺陷对测试结果的影响。
步骤5（错误信念问题）：如果你的好朋友小明从来没有看过这个糖果盒里面的东西，你认为小明会认为里面装的是什么？（正确答案：糖果）——这个问题是核心测试问题，用于评估被试是否能够理解“小明对糖果盒里的内容有一个错误的信念”。

测试结果解释：

如果被试能够正确回答所有5个问题，说明被试具备一阶冷ToM能力和自我信念修正能力。
如果被试能够正确回答步骤2-4的问题，但错误地回答了步骤3或步骤5的问题（例如说“在你打开盒子之前，我认为里面装的是铅笔”或“小明会认为里面装的是铅笔”），说明被试存在一阶ToM缺陷或自我ToM缺陷。

1.3.3 二阶错误信念任务：冰淇淋车任务（Ice Cream Truck False Belief Task）

冰淇淋车任务是由Perner和Wimmer在1985年设计的，它是目前世界上使用最广泛的二阶ToM测试，主要用于评估个体的二阶冷ToM能力。

测试场景：
测试者向被试讲述一个故事（可以配合图片或玩偶演示），故事的具体内容如下：

有一个小男孩叫约翰（John），他住在一个小镇上。有一天，约翰在公园里玩，他看到一辆冰淇淋车停在公园的门口。约翰很想吃冰淇淋，但他没有带钱，所以他决定回家拿钱。约翰回家拿钱的时候，冰淇淋车的司机把车从公园的门口开到了教堂的门口。约翰的好朋友玛丽（Mary）看到了冰淇淋车司机把车从公园的门口开到了教堂的门口，但约翰没有看到。
过了一会儿，约翰拿着钱从家里出来了，他在路上遇到了玛丽。玛丽对约翰说：“我刚刚看到冰淇淋车了！”但玛丽没有告诉约翰冰淇淋车现在停在哪里。

讲完故事后，测试者向被试提出以下4个问题：

记忆问题1（Memory Check 1）：冰淇淋车一开始停在哪里？（正确答案：公园的门口）
记忆问题2（Memory Check 2）：冰淇淋车现在停在哪里？（正确答案：教堂的门口）
现实问题/一阶信念问题（Reality Check/First-Order Belief Question）：约翰认为冰淇淋车现在停在哪里？（正确答案：公园的门口）——这个问题用于评估被试的一阶ToM能力。
二阶信念问题（Second-Order Belief Question）：玛丽认为约翰认为冰淇淋车现在停在哪里？（正确答案：公园的门口）——这个问题是核心测试问题，用于评估被试是否能够理解“玛丽对约翰的信念有一个信念”。

测试结果解释：

如果被试能够正确回答所有4个问题，说明被试具备二阶冷ToM能力。
如果被试能够正确回答记忆问题1、记忆问题2和一阶信念问题，但错误地回答了二阶信念问题（例如说“玛丽认为约翰认为冰淇淋车现在停在教堂的门口”），说明被试存在二阶ToM缺陷。

发展心理学研究数据：
Perner和Wimmer的原始研究表明，6-7岁以上的正常儿童通常能够正确回答冰淇淋车任务的所有问题；5岁以下的正常儿童通常会错误地回答二阶信念问题；而大多数高功能自闭症谱系障碍（ASD）儿童（即使是智力正常的阿斯伯格综合征儿童）也会错误地回答二阶信念问题——不过，部分年龄较大的高功能ASD儿童（例如10岁以上）可以通过“反复训练”学会正确回答二阶信念问题，但他们的回答通常是“机械的”，缺乏“内隐的理解”。

1.3.4 意图识别任务：隐藏意图任务（Hidden Intention Task）

隐藏意图任务是由Meltzoff在1995年设计的，它主要用于评估个体的感知ToM和推理ToM的结合能力，以及“对他人‘未完成的意图’的理解能力”。

测试场景：
测试者向被试（通常是18个月以上的儿童或AI Agent）展示一个成人的演示视频（或直接进行现场演示），具体的演示内容如下：

实验组演示（未完成的意图）：成人尝试用一个工具（例如一根棍子）去够一个放在高处的玩具，但他没有成功——成人尝试了好几次，每次都差一点够到玩具，但最后都放弃了。
控制组演示（随机的动作）：成人用同一根棍子做了一系列与够玩具无关的随机动作（例如挥舞棍子、敲桌子）。

演示结束后，测试者把工具交给被试，观察被试的行为：

实验组预期行为：如果被试具备“对他人未完成的意图的理解能力”，他会直接用工具去够高处的玩具，而不是模仿成人的未完成动作。
控制组预期行为：被试可能会模仿成人的随机动作，或者直接忽略工具。

测试结果解释：

如果实验组的被试直接用工具去够高处的玩具，而控制组的被试没有这样做，说明被试具备对他人未完成的意图的理解能力。
如果实验组的被试只是模仿成人的未完成动作，说明被试存在意图识别缺陷。

发展心理学研究数据：
Meltzoff的原始研究表明，18个月以上的正常儿童通常能够在实验组中直接用工具去够高处的玩具；而14个月以下的正常儿童通常会模仿成人的未完成动作——这一研究结果表明，人类的意图识别能力在14-18个月之间开始发展。

1.3.5 情感推理任务：错误情绪任务（False Emotion Task）

错误情绪任务是由Harris等人在1989年设计的，它主要用于评估个体的二阶热ToM能力——即“对他人的‘表面情绪’和‘真实情绪’的区分能力”，以及“对他人的‘情绪伪装意图’的理解能力”。

测试场景：
测试者向被试讲述一个故事（可以配合图片演示），故事的具体内容如下：

有一个小女孩叫露西（Lucy），她的生日到了。露西的妈妈给她买了一个生日礼物——一个洋娃娃。但露西最想要的生日礼物是一辆玩具汽车，她一点也不喜欢这个洋娃娃。不过，露西不想让妈妈难过，所以她决定假装很喜欢这个洋娃娃。露西接过洋娃娃，脸上露出了一个大大的笑容，对妈妈说：“谢谢你，妈妈！我太喜欢这个洋娃娃了！”

讲完故事后，测试者向被试提出以下3个问题：

记忆问题（Memory Check）：露西的妈妈给她买了什么生日礼物？（正确答案：一个洋娃娃）
真实情绪问题（True Emotion Question）：露西的真实情绪是什么？（正确答案：失望/不开心）——这个问题用于评估被试是否能够理解露西的真实情绪。
表面情绪问题/二阶信念问题（Surface Emotion Question/Second-Order Belief Question）：露西的妈妈认为露西的情绪是什么？（正确答案：开心/兴奋）——这个问题是核心测试问题，用于评估被试是否能够理解“露西的妈妈对露西的情绪有一个错误的信念”，以及“露西的情绪伪装意图”。

测试结果解释：

如果被试能够正确回答所有3个问题，说明被试具备二阶热ToM能力。
如果被试能够正确回答记忆问题和真实情绪问题，但错误地回答了表面情绪问题（例如说“露西的妈妈认为露西的情绪是失望”），说明被试存在二阶热ToM缺陷。

发展心理学研究数据：
Harris等人的原始研究表明，6-7岁以上的正常儿童通常能够正确回答错误情绪任务的所有问题；5岁以下的正常儿童通常会错误地回答表面情绪问题——这一研究结果表明，人类的情绪伪装理解能力与二阶冷ToM能力的发展时间基本一致。

1.3.6 道德判断任务：电车难题变体（Trolley Problem Variant）

电车难题（Trolley Problem）是由哲学家Foot在1967年提出的，后来由Thomson在1976年进行了拓展——它虽然最初是一个哲学思想实验，但也被认知科学家广泛用于评估个体的热ToM与道德判断的结合能力。

经典电车难题场景（开关版本）：

你是一辆电车的司机。电车正在轨道上高速行驶，前方有5个工人正在轨道上工作。如果电车继续前进，这5个工人都会被撞死。你可以拉动一个开关，让电车切换到另一条轨道上。但另一条轨道上有1个工人正在工作。如果电车切换到另一条轨道上，这1个工人会被撞死。

拓展电车难题场景（天桥版本）：

你站在一座天桥上，天桥下方是电车轨道。电车正在轨道上高速行驶，前方有5个工人正在轨道上工作。如果电车继续前进，这5个工人都会被撞死。你身边有一个陌生人，这个陌生人非常胖。如果你把这个陌生人推下天桥，他会掉在轨道上，挡住电车的前进，从而拯救那5个工人。但这个陌生人会被撞死。

测试问题：
测试者向被试提出以下问题：

开关版本问题：你会拉动开关吗？为什么？
天桥版本问题：你会把陌生人推下天桥吗？为什么？

测试结果解释：
认知科学的研究表明，大多数正常的成年人类会对这两个版本的电车难题做出不同的判断：

开关版本：大多数人会选择“拉动开关”——这是一种“功利主义（Utilitarianism）”的判断，即“选择拯救最多的人”。
天桥版本：大多数人会选择“不把陌生人推下天桥”——这是一种“义务论（Deontology）”的判断，即“认为直接伤害一个无辜的人是错误的，无论后果如何”。

这种“判断差异”本质上源于热ToM的激活程度不同：

在开关版本中，被试的“冷ToM系统”（dmPFC、TPJ）激活更强烈，主要进行“理性的功利主义因果推理”。
在天桥版本中，被试的“热ToM系统”（vmPFC、杏仁核、岛叶）激活更强烈，主要进行“情感共情与道德直觉判断”——被试会直接感知到“把陌生人推下天桥”是一种“直接的、故意的暴力行为”，从而产生强烈的负面情感反应，进而做出义务论的判断。

如果被试对这两个版本的电车难题做出相同的判断（例如都选择“功利主义”的判断），说明被试可能存在热ToM缺陷——例如，vmPFC受损的患者通常会对这两个版本的电车难题都做出功利主义的判断，因为他们的情感共情能力受损，无法感知到“直接伤害无辜的人”的负面情感反应。

1.4 人类心智理论的神经机制

近20年来，随着功能性磁共振成像（fMRI）、正电子发射断层扫描（PET）、经颅磁刺激（TMS）、脑电图（EEG）等神经成像技术的快速发展，认知神经科学家已经对人类ToM的神经机制有了较为深入的了解——研究表明，人类大脑中存在一套专门负责心智化（Mentalizing）的分布式脑网络，称为“心智化网络（Mentalizing Network）”或“默认模式网络子系统（Default Mode Network Subsystem）”。

下面我们将详细介绍心智化网络的核心脑区、各脑区的功能、各脑区之间的交互关系，以及镜像神经元系统（Mirror Neuron System）与心智化网络的关系：

1.4.1 心智化网络的核心脑区与功能

心智化网络的核心脑区包括：内侧前额叶皮层（Medial Prefrontal Cortex, mPFC）、颞顶联合区（Temporoparietal Junction, TPJ）、颞上沟（Superior Temporal Sulcus, STS）、杏仁核（Amygdala）、前扣带回皮层（Anterior Cingulate Cortex, ACC）、岛叶（Insula）、后扣带回皮层（Posterior Cingulate Cortex, PCC）、楔前叶（Precuneus）。

各脑区的具体功能如下：

1.4.1.1 内侧前额叶皮层（mPFC）

内侧前额叶皮层（mPFC）是心智化网络的“核心控制中枢”，它主要负责以下功能：

自我内省与自我心理状态归因：腹内侧前额叶皮层（vmPFC）主要参与“对自己的情感、愿望、价值观等热心理状态的内省与归因”；背内侧前额叶皮层（dmPFC）主要参与“对自己的信念、知识、意图等冷心理状态的内省与归因”。
他人心理状态归因：dmPFC主要参与“对他人的冷心理状态的归因”；vmPFC主要参与“对他人的热心理状态的归因”，以及“对他人心理状态的因果关系理解”。
社会交互决策：mPFC（尤其是vmPFC）主要参与“基于他人心理状态的社会交互决策”——例如，“我应该说什么话才能让对方开心？”“我应该选择合作还是背叛？”。
道德判断：vmPFC主要参与“基于情感共情的义务论道德判断”；dmPFC主要参与“基于理性推理的功利主义道德判断”。

1.4.1.2 颞顶联合区（TPJ）

颞顶联合区（TPJ）是心智化网络的“核心输入与推理中枢”，它主要负责以下功能：

他人信念归因：右侧颞顶联合区（rTPJ）是“专门负责他人信念归因的脑区”——这一结论得到了大量fMRI和TMS研究的支持：例如，当个体进行错误信念任务时，rTPJ会显著激活；当通过TMS抑制rTPJ的活动时，个体的错误信念任务表现会显著下降。
视角采择（Perspective-Taking）：TPJ主要参与“视觉视角采择”（Visual Perspective-Taking）——即“理解他人的视觉视角与自己的视觉视角不同的能力”（例如，“我站在桌子的左边，看到的是苹果的正面；你站在桌子的右边，看到的是苹果的背面”）。
注意力分配：TPJ主要参与“将注意力分配到与他人心理状态相关的线索上”。

1.4.1.3 颞上沟（STS）

颞上沟（STS）是心智化网络的“核心感知输入中枢”，它主要负责以下功能：

非言语行为线索处理：STS（尤其是颞上沟后部pSTS）主要参与“处理与他人心理状态相关的非言语行为线索”——包括面部表情（尤其是眼睛的注视方向）、肢体动作、手势、生物运动（Biological Motion，例如人类走路的姿势）等。
感知意图识别：STS主要参与“通过非言语行为线索直接感知他人的意图”——例如，“看到一个人伸手去拿一个杯子，直接感知到他想要喝水”。

1.4.1.4 杏仁核（Amygdala）

杏仁核（Amygdala）是心智化网络的“核心情感处理中枢”，它主要负责以下功能：

情感性非言语行为线索处理：杏仁核主要参与“处理与他人情感相关的非言语行为线索”——尤其是恐惧、愤怒、厌恶等负面情绪的面部表情。
情感共情的初步产生：杏仁核主要参与“情感共情的初步产生”——即“当看到他人经历负面情绪时，自己的杏仁核也会激活，从而产生类似的负面情绪反应”。
社会评价：杏仁核主要参与“对他人的社会评价”——例如，“判断一个人是否值得信任”。

1.4.1.5 前扣带回皮层（ACC）

前扣带回皮层（ACC）是心智化网络的“核心冲突监控与调节中枢”，它主要负责以下功能：

冲突监控：ACC主要参与“监控社会交互中的冲突”——例如，“监控自己的信念与他人的信念之间的冲突”“监控自己的情感与社会规范之间的冲突”。
情感调节：ACC主要参与“调节自己的情感反应”——例如，“当看到他人经历负面情绪时，调节自己的杏仁核活动，避免产生过度的负面情绪反应”。
执行功能与社会交互决策的结合：ACC主要参与“将执行功能（如工作记忆、抑制控制）与社会交互决策结合起来”。

1.4.1.6 岛叶（Insula）

岛叶（Insula）是心智化网络的“核心内感受与情感共情中枢”，它主要负责以下功能：

内感受（Interoception）：岛叶主要参与“处理自己的内部生理信号”——例如，心跳、呼吸、饥饿、疼痛等。
情感共情的深化：岛叶主要参与“情感共情的深化”——即“将自己的内感受与他人的情感状态结合起来，从而产生更深刻的情感共情”（例如，“当看到他人经历疼痛时，自己的岛叶会激活，从而产生‘感同身受’的疼痛体验”）。
厌恶情绪的处理：岛叶主要参与“处理自己和他人的厌恶情绪”——包括对“不道德行为”的厌恶。

1.4.1.7 后扣带回皮层（PCC）与楔前叶（Precuneus）

后扣带回皮层（PCC）与楔前叶（Precuneus）是心智化网络的“核心记忆与自我参照中枢”，它们主要负责以下功能：

自我参照加工（Self-Referential Processing）：PCC与楔前叶主要参与“将信息与自我联系起来进行加工”——例如，“回忆自己过去的经历”“思考自己的性格特点”。
情景记忆（Episodic Memory）提取：PCC与楔前叶主要参与“提取与社会交互相关的情景记忆”——例如，“回忆上次和某个人见面时的情景”。
默认模式网络的激活：PCC与楔前叶是默认模式网络的核心脑区，当个体不进行外部任务时（例如“发呆”“做白日梦”），默认模式网络会激活，此时个体会进行“自我内省”“思考他人的心理状态”“回忆过去的社会交互”等活动。

1.4.2 心智化网络各脑区之间的交互关系

心智化网络各脑区之间并不是独立工作的，而是通过白质纤维束（例如弓状束、钩束、扣带束）紧密连接在一起，形成一个分布式的、协同工作的脑网络。

根据心智化网络各脑区的功能，我们可以将其分为三个子系统：

感知输入子系统：包括颞上沟（STS）、杏仁核（Amygdala）、岛叶（Insula）——主要负责“收集与他人心理状态相关的感知线索（非言语行为线索、内感受线索等）”。
推理与控制子系统：包括内侧前额叶皮层（mPFC）、颞顶联合区（TPJ）、前扣带回皮层（ACC）——主要负责“对感知输入子系统收集到的线索进行加工、推理，归因他人的心理状态，理解心理状态之间的因果关系，做出社会交互决策，并监控与调节决策过程中的冲突”。
记忆与自我参照子系统：包括后扣带回皮层（PCC）、楔前叶（Precuneus）——主要负责“提取与社会交互相关的情景记忆，将信息与自我联系起来进行加工，为推理与控制子系统提供背景信息”。

心智化网络的工作流程通常如下：

第一步（感知输入）：感知输入子系统收集与他人心理状态相关的感知线索（例如，看到他人皱着眉头、攥紧拳头——STS激活；感知到他人的负面情绪——杏仁核激活）。
第二步（记忆与背景信息提取）：记忆与自我参照子系统提取与当前社会交互相关的情景记忆和自我参照信息（例如，回忆上次看到他人皱着眉头、攥紧拳头时的情景——PCC与楔前叶激活）。
第三步（推理与控制）：推理与控制子系统对感知输入子系统收集到的线索和记忆与自我参照子系统提取到的背景信息进行加工、推理：
a. 首先，TPJ归因他人的信念（例如，“他认为我做错了什么事”——rTPJ激活）。
b. 然后，mPFC归因他人的情感、愿望、意图，并理解这些心理状态之间的因果关系（例如，“他的愿望是让我承认错误；他的意图是批评我；他的愤怒是因为他认为我做错了什么事——dmPFC与vmPFC激活）。
c. 接着，ACC监控社会交互中的冲突（例如，“监控自己的信念与他人的信念之间的冲突——‘我认为我没有做错事，但他认为我做错了’——ACC激活）。
d. 最后，mPFC做出社会交互决策（例如，“我应该先道歉，然后再解释——vmPFC激活）。
第四步（行动与反馈）：个体执行社会交互决策，并根据他人的反馈调整自己的心理状态归因和社会交互决策——在这个过程中，心智化网络的三个子系统会再次协同工作。

1.4.3 镜像神经元系统（Mirror Neuron System）与心智化网络的关系

镜像神经元系统（Mirror Neuron System, MNS）是由Rizzolatti等人在1992年发现的——他们在研究恒河猴的运动皮层时发现，有一类神经元（称为“镜像神经元”）不仅在恒河猴自己执行某个

AI Agent技术社区

Agent 垂直技术社区，欢迎活跃、内容共建。

更多推荐

Agent 工程中的模型缓存优化经验分享

AI Agent技术社区

CC-Switch不只是切换API：从GitHub更新日志看懂它的功能和底层原理

CC Switch：从配置切换器到AI编程统一管理平台摘要： CC Switch已从最初的Claude Code/Codex供应商切换工具，发展为功能全面的AI编程管理平台。它通过统一界面管理多个AI编程工具（Claude Code、Codex、Gemini CLI等）的配置，支持供应商切换、本地代理路由、跨工具能力同步等功能。核心演进包括：采用SSOT架构集中管理供应商数据、扩展支持6+工具、

AI Agent技术社区

转载--Hermes Agent 05 | 记忆系统（上）：内置记忆的冻结快照模式与 agent-curated 策展

找到匹配的会话后，不是直接把原始对话扔回给主模型——那太长了。它用一个辅助模型（Gemini Flash）对每个匹配的会话做摘要（）：加载匹配会话的完整对话记录以匹配位置为中心，截断到 ~100,000 字符（发给 Gemini Flash，用一个聚焦的 summarization prompt 生成摘要返回带元数据的摘要结果用便宜的辅助模型（Gemini Flash）来压缩长对话，再把短摘要喂给