《LangGraph 踩坑实录：节点里的 state 为什么少了一个字段？》

记阿楠同学黑历史的小册子

370人浏览 · 2026-05-28 15:29:31

记阿楠同学黑历史的小册子 · 2026-05-28 15:29:31 发布

《深入解析 TypedDict 注解的运行时状态过滤机制》

在 LangGraph 中定义图状态时，我们习惯用 TypedDict 来标注类型。但你是否遇到过这样的诡异情况：前一个节点明明已经写入了某个字段，当前节点却怎么也取不到？本文从一个真实调试场景出发，带你深入 LangGraph 的状态过滤机制。

一、问题引入：一个令人困惑的调试现场

先看一段看似再正常不过的代码：

from typing import TypedDict
from langgraph.constants import START, END
from langgraph.graph import StateGraph

# 1. 定义全局状态
class MyState(TypedDict):
    query: str
    final_result: str

# 2. 定义局部状态（用于 final 节点）
class SearchState(TypedDict):
    rag_search_result: str
    web_search_result: str

# 3. 定义输入/输出状态
class InputState(TypedDict):
    query: str

class OutputState(TypedDict):
    final_result: str

# 4. 建图
graph = StateGraph(
    state_schema=MyState,
    input_schema=InputState,
    output_schema=OutputState,
)

# 5. 定义节点
def rag_search_node(state: MyState):
    query = state["query"]
    return {"rag_search_result": f"关于{query}的 RAG 搜索结果"}

def web_search_node(state: MyState):
    query = state["query"]
    return {"web_search_result": f"关于{query}的 Web 搜索结果"}

def final_node(state: SearchState):  # ← 问题在这里
    rag = state["rag_search_result"]
    web = state["web_search_result"]
    # ❌ 这里会报错：KeyError: 'query'
    # query = state["query"]  
    return {"final_result": f"合并{rag}和{web}，由 LLM 总结输出"}

# 6. 组装图
graph.add_node(rag_search_node)
graph.add_node(web_search_node)
graph.add_node(final_node)
graph.add_edge(START, "rag_search_node")
graph.add_edge(START, "web_search_node")
graph.add_edge("rag_search_node", "final_node")
graph.add_edge("web_search_node", "final_node")
graph.add_edge("final_node", END)

# 7. 运行
compiled_graph = graph.compile()
result = compiled_graph.invoke({"query": "什么是 LangGraph"})

诡异之处：final_node 明明是在 rag_search_node 和 web_search_node 之后执行，此时全局状态里已经累积了 query、rag_search_result、web_search_result 三个字段。但当我试图在 final_node 中读取 state["query"] 时，却直接抛出了 KeyError。

更奇怪的是，调试器里显示的 state 变量只有：

{'rag_search_result': '关于什么是 LangGraph的 RAG 搜索结果',
 'web_search_result': '关于什么是 LangGraph的 Web 搜索结果'}

query 去哪儿了？

二、原因剖析：TypedDict 注解是运行时的"字段白名单"

2.1 状态过滤机制

很多人（包括我最初）以为节点参数里的 state: SearchState 只是一个静态类型注解，方便 IDE 做代码提示。但实际上，LangGraph 在运行时会读取这个注解，并把它当作严格的"字段白名单"。

具体流程如下：

编译阶段：当你调用 graph.compile() 时，LangGraph 会遍历所有节点的函数签名。
解析注解：如果发现参数类型是 TypedDict 的子类，LangGraph 会使用 typing.get_type_hints() 提取该 TypedDict 中声明的所有键名。
运行时过滤：每次调用该节点前，LangGraph 会从图运行时的全局状态池中，只挑选出该节点白名单里声明的键，组装成一个新的字典传入。

验证一下：

from typing import TypedDict, get_type_hints

class SearchState(TypedDict):
    rag_search_result: str
    web_search_result: str

print(get_type_hints(SearchState).keys())
# dict_keys(['rag_search_result', 'web_search_result'])

LangGraph 内部正是拿到了这个键名列表，然后执行了类似这样的过滤：

# 伪代码，对应 LangGraph 核心逻辑
input_keys = get_type_hints(SearchState).keys()
filtered_state = {k: v for k, v in global_state.items() if k in input_keys}
node_result = final_node(filtered_state)

这就是为什么 query 消失了——它虽然存在于全局状态池，但不在 SearchState 的键名白名单里，被框架主动过滤掉了。

2.2 全局状态池 vs 局部状态视图

理解这一点，需要建立 LangGraph 的状态模型：

图运行时的全局状态池：这是一个在运行过程中不断累积的大字典。节点返回的新字段会被 update 进来，因此它包含的键往往比 state_schema 初始定义的还要多。
节点参数注解（局部状态视图）：定义了该节点被允许看到的字段子集，相当于一把独立的钥匙，只能打开白名单中的抽屉。

特别要注意：这把钥匙是独立的，和 state_schema 是什么无关。即使你把 state_schema 设为包含所有字段的大状态，只要节点自己的参数注解是 SearchState，它就只能看到 SearchState 里那几把钥匙。

┌─────────────────────────────────────┐
│ 运行时全局状态池 │
│ ┌─────────┐ ┌───────────────────┐ │
│ │ query │ │ rag_search_result│ │
│ └─────────┘ └───────────────────┘ │
│ ┌───────────────────┐ ┌─────────┐ │
│ │ web_search_result │ │final_result│ │
│ └───────────────────┘ └─────────┘ │
└─────────────────────────────────────┘
│
▼ SearchState 白名单过滤
┌─────────────────────────────────────┐
│ final_node 看到的状态 │
│ ┌───────────────────┐ │
│ │ rag_search_result│ │
│ └───────────────────┘ │
│ ┌───────────────────┐ │
│ │ web_search_result │ │
│ └───────────────────┘ │
│ (query 不在白名单，被过滤) │
└─────────────────────────────────────┘

三、延伸问题：同名变量在不同 TypedDict 状态中共享吗？

假设你有两个局部状态：

class SearchState(TypedDict):
    shared_key: str
    rag_search_result: str

class OtherState(TypedDict):
    shared_key: str
    other_data: str

答案是：共享，而且是物理上的同一个位置。

因为全局状态池本质上就是一个大字典，局部 TypedDict 只是决定了你能看到哪些键。多个局部状态声明了相同的键名时，它们指向的是全局字典里的同一个条目。

当节点返回更新时，LangGraph 会执行类似字典 update 的操作。

这意味着：

读取时：两个节点读 shared_key 会得到同一个值
写入时：后执行的节点返回的 shared_key 会覆盖先执行的节点的值

四、三种解决方案

核心原则：节点参数类型注解是一个严格的字段白名单，只有白名单里显式声明的键才会传入节点。不同 TypedDict 的白名单彼此独立，不存在"继承"或"自动透传"关系。

方案一：定义包含所有所需字段的新 TypedDict（推荐）

final_node 需要同时看到 query、rag_search_result、web_search_result，那就定义一个涵盖这三个字段的局部状态：

class FinalState(TypedDict):
    query: str
    rag_search_result: str
    web_search_result: str

def final_node(state: FinalState):
    query = state["query"]
    rag = state["rag_search_result"]
    web = state["web_search_result"]
    return {"final_result": f"基于查询[{query}]，合并{rag}和{web}"}

注意，不能直接用原来的 MyState。因为 MyState 只声明了 query 和 final_result，它的白名单里根本没有 rag_search_result 和 web_search_result。每个 TypedDict 都是一把独立的钥匙，只能打开自己名单里的抽屉。

方案二：在已有局部状态中补全字段

如果你希望沿用 SearchState，把缺失的 query 加进去即可：

class SearchState(TypedDict):
    query: str              # ← 增加这一行
    rag_search_result: str
    web_search_result: str

def final_node(state: SearchState):
    query = state["query"]  # 现在可以访问了
    ...

方案三：重构 state_schema 为全字段状态

如果你的聚合节点需要频繁访问多种字段，更治本的做法是将 state_schema 扩展为覆盖全图所有字段的 OverallState，然后让聚合节点直接使用它：

class OverallState(TypedDict):
    query: str
    rag_search_result: str
    web_search_result: str
    final_result: str

graph = StateGraph(
    state_schema=OverallState,
    input_schema=InputState,
    output_schema=OutputState,
)

# 聚合节点直接拿 OverallState，看到所有字段
def final_node(state: OverallState):
    query = state["query"]
    rag = state["rag_search_result"]
    web = state["web_search_result"]
    return {"final_result": f"基于查询[{query}]，合并{rag}和{web}"}

# 中间节点仍然可以用局部 TypedDict 表达最小依赖
def search_node(state: SearchState):
    ...

这样做的好处：

聚合节点无需重复造轮子：直接拿 OverallState 就能看到所有字段
局部状态仍然可用：中间节点如果只需要一两个字段，继续用小型 TypedDict 表达最小依赖
schema 即文档：OverallState 本身就是一张全图字段清单，一目了然

⚠️ 注意：在原始代码的 MyState 定义下，试图通过"去掉类型注解"或改用 dict 来绕过白名单是行不通的。因为无注解时 LangGraph 会 fallback 到 state_schema 的字段范围，而 MyState 并未声明 rag_search_result 和 web_search_result。

五、源码验证

源码里可以确认这个机制，可以在本地定位到 LangGraph 的安装位置：

<site-packages>/langgraph/graph/state.py # StateGraph.add_node / compile 相关
<site-packages>/langgraph/utils.py # 状态合并与过滤工具函数

在 state.py 中搜索以下关键词，可以找到对应实现：

get_type_hints —— TypedDict 键名提取
input_schema 或节点输入构建相关函数 —— 运行时状态过滤
update 或状态合并函数 —— 节点输出写回全局状态池

六、总结

经过这次踩坑，总结几条使用 LangGraph 状态的经验：

聚合节点要显式声明所有需要的字段：不要假设"前面的字段会自动透传"，白名单机制是严格隔离的。
局部状态遵循最小权限原则：中间节点如果只需要 1-2 个字段，用小型 TypedDict 可以降低耦合。
考虑定义一个 OverallState 作为全图字段总览：方便末端聚合节点直接使用。
注意同名键的覆盖风险：并行节点如果都写同一个键，最终结果取决于执行顺序和 LangGraph 的合并策略。
善用 input_schema 和 output_schema：它们不仅控制对外的输入输出格式，也提升图的可测试性。

LangGraph 的 TypedDict 过滤机制是一个典型的"类型注解影响运行时行为"的设计。它让类型系统不只是静态检查的辅助工具，而是成为了框架编排逻辑的一部分。每个节点看到的不是"全局状态"，而是"经自己白名单过滤后的局部视图"——理解这一点，能帮助你更准确地设计状态结构，避免在调试器前困惑"我的字段去哪儿了"。