面试官皱眉：“你懂 Claude Code 主循环 Query 流程吗？” 我说：“就是一个 while 循环，调模型、跑工具、再调模型”，他：就这？？

菜菜的tunning

94人浏览 · 2026-06-10 17:32:39

菜菜的tunning · 2026-06-10 17:32:39 发布

面试被问：通义Code主循环Query架构？只答while循环直接挂科！

2026-06-04 15:10
大家好，我是JIA YOU。

前段时间不少粉丝反馈面试踩坑，面试官深挖通义Code主循环Query完整流程，求职者随口回答：无非while循环，调模型、执行工具往复循环。面试官当即摇头：就这？基础demo水平，不符合工程落地要求。

这道面试题核心不是考察通义Code使用，而是甄别候选人有没有落地过工业化AI Agent架构。只懂表层循环逻辑，不懂异常兜底、流式调度、状态管控、容错修复，很难通过中高级AI开发面试。

今天拆解通义Code源码核心queryLoop主循环架构，从调用链路、五步运行逻辑、工具调度、异常容错四大维度拆解，看完面试可以完整流畅作答，文章干货偏多，建议收藏留存。

一、终端输入指令回车后，通义Code内部全链路发生了什么？

日常在终端输入：帮我修复项目报错代码，等待片刻代码自动修改完毕。外行以为只是请求大模型返回答案，实际内部是多轮Agent循环调度。

模型首轮回复大概率是：需要读取目标报错源码文件；框架调取文件工具，读取内容回传模型；模型再次下发运行单元测试指令，框架执行测试、回传报错日志；反复多轮交互后，模型确认bug根源，输出最终修改代码，本轮对话终止。

这套反复调用模型→执行工具→回填结果的闭环，就是Query Loop主循环，是整个代码Agent的核心心脏。

很多人手写简易Agent：

while(true){
    调用大模型();
    if(存在工具调用){执行工具();}else break;
}

代码看似没问题，仅能跑通玩具Demo。工业化场景里要处理用户终止、工具崩溃、上下文超限、输出截断、循环死跑等数十类异常，通义Code主循环源码超1600行，正常业务逻辑仅占两成，剩余八成全是异常边界处理逻辑。

二、四层调用链路：从用户输入ask到底层queryLoop

通义Code采用分层解耦设计，四层链式调用依次：ask → QueryEngine → query → queryLoop，依靠异步生成器yield实现事件逐层透传，类比自来水供给：水龙头(ask)→小区储水(QueryEngine)→输水管道(query)→水厂处理(queryLoop)。

精简伪代码：

//第一层：ask，对外简易调用入口
async function* ask(params){
  const engine = new QueryEngine(config)
  yield* engine.submitMessage(params.prompt)
}
//第二层：QueryEngine，全权维护会话状态
class QueryEngine{
  async *submitMessage(prompt){
    //预处理指令、拼装系统提示词、挂载项目上下文
    yield* query({messages,systemPrompt,tools})
  }
}
//第三层：query流式转发包装层
async function* query(params){
  yield* queryLoop(params)
}
//第四层：主循环核心本体
async function* queryLoop(params){
  while(true){
    //消息预处理、模型调用、工具解析、任务执行、结果回填
  }
}

分层作用详解

ask：SDK对外最简调用入口，使用者一行代码即可发起对话，屏蔽内部复杂逻辑。
QueryEngine：会话管家，统一保管全量历史消息、文件缓存、权限记录，所有会话数据统一归集。
query：异步生成器载体，区别于普通函数整段返回结果，边执行边向外推送实时数据，实现终端打字流式输出效果。
queryLoop：循环执行主体，负责全轮次逻辑流转。

异步生成器是流式打字的关键：普通函数=装满一桶水再交付；生成器=水龙头实时流水，模型每输出一个字符，立刻推送前端展示。

三、主循环queryLoop五大固定执行步骤

整个循环骨架依托while死循环，单次迭代固定5步：消息预处理→流式请求模型→判断终止条件→批量运行工具→结果并入上下文开启新一轮。

async function* queryLoop(params) {
  let state = { messages: [], turnCount:1 }
  while(true){
    //1.按需压缩上下文
    const reqMsg = maybeCompact(state.messages)
    let toolBlocks = [], needNext = false
    //2.流式接收模型返回内容
    for await(const chunk of callModel(reqMsg)){
      yield chunk
      if(chunk为tool_call){
        toolBlocks.push(chunk)
        needNext = true
      }
    }
    //3.判定是否结束对话
    if(!needNext) return {reason:"completed"}
    //4.批量执行全部工具指令
    const toolRes = await runTools(toolBlocks)
    //5.更新上下文状态，开启下一轮循环
    state = {...state,messages:[...reqMsg,...assistantMsg,...toolRes],turnCount:state.turnCount+1}
  }
}

分步拆解

消息预处理：被动式上下文压缩
不会每轮主动压缩历史消息节省token，优先直接请求模型；只有接口返回上下文超限报错后，才触发消息摘要压缩，同一轮循环仅允许压缩1次，通过hasAttemptedReactiveCompact状态位防重复压缩浪费token。压缩后仍超限则直接终止会话。
流式调用大模型，区分文本/工具调用
模型返回内容分为两类：普通自然文本、结构化tool_call工具指令。

文本内容实时向上抛出，终端实时打字展示；
工具调用内容统一缓存，等待后续调度执行。

终止判定：依靠tool_call有无做决策
核心规则：本轮存在工具调用→继续循环执行工具；无工具调用→任务完结，正常退出。
但实际退出场景不止正常完成，通义Code内置十余种终止枚举：

completed：任务正常完成
max_turns：轮次达到上限强制止损，避免无限循环高额计费
aborted_streaming：用户Ctrl+C打断模型输出
aborted_tools：工具运行中途被手动终止
prompt_too_long：上下文压缩后依旧超出模型窗口
max_output_truncated：模型输出超长多次续写失败

流式并行工具执行（核心优化亮点）
摒弃传统「等模型全量输出完毕再启动工具」串行方案，采用StreamingToolExecutor流式执行器：识别到单条完整tool_call立刻后台异步启动工具，不用等待模型输出结束。
类比点菜：刚报完红烧肉，后厨立刻开工，继续报剩下菜品，全部点菜结束时部分菜品已经烹饪完毕，大幅压缩整体耗时。

工具并行约束规则

只读工具（读取文件、检索目录、关键词搜索）：全并行执行，无资源冲突；
变更类工具（修改代码、写入文件、运行shell）：强制串行执行，避免并发修改导致文件覆盖错乱；
未标注读写属性的工具，默认串行兜底，优先保证稳定性。

工具结果回填上下文
工具执行结果统一封装成tool_result结构并入消息列表，迭代轮次计数+1，进入下一轮循环。历史消息持续累积，也是上下文压缩机制存在的底层原因。

四、三大隐形工业级容错设计（面试高频考点）

1.全量状态集中托管，统一State对象

所有跨轮次变量（消息列表、循环轮数、续写失败次数、本轮压缩标记）统一收纳在State结构体，摒弃零散全局/闭包变量。
优势：每一轮状态数据可追溯，调试排查问题直观，从根源规避变量忘记重置引发死循环、逻辑错乱。

type State={
  messages:Message[];
  turnCount:number;
  resumeFailCount:number;
  compacted:boolean;
}

2.工具异常空结果兜底补全，防止接口校验报错

接口强制约束：每一条tool_call必须绑定对应tool_result结果，缺失配对会直接拦截请求。
遇到工具崩溃、手动中断、进程异常导致无返回数据时，框架自动生成错误标记的伪tool_result消息，标注异常原因与对应工具ID补齐配对，模型收到报错信息后自主调整后续方案，不会单次故障直接卡死整轮对话。

3.模型输出超限自动续写修复

模型受单次输出token上限限制，内容过长会被截断，通义Code两段式静默修复：
1.首次截断自动上调输出token上限重试，用户无感知；
2.上调上限仍截断，在下轮prompt附加续写指令，引导模型从断点接续输出；
最多允许3次续写尝试，超限后终止会话并返回截断异常。

五、总结：面试高分作答思路

再次被问到通义Code主循环架构，避开简易while浅层回答，按照这套逻辑表述：
整体采用四层分层调用+异步生成器流式输出，主循环五大执行步骤，依托有无tool_call判定循环启停；工具采用边解析边执行的流式并行方案区分读写权限调度；通过集中式State管理全量跨轮状态，配套缺失结果补全、输出截断续写、上下文被动压缩三类容错机制，同时预置十几种异常退出逻辑完成工业级兜底。

弄懂这套逻辑，不止吃透通义Code，市面上绝大多数代码Agent架构设计思路一通百通。

AI Agent技术社区

Agent 垂直技术社区，欢迎活跃、内容共建。

更多推荐

我发现 Claude Code 不是失忆，而是我没给它办入职

摘要：作者在使用Claude Code时发现，频繁重复介绍项目背景和规范导致效率低下，问题并非AI记忆缺陷，而是缺乏系统性的项目知识沉淀。通过创建CLAUDE.md文件（类似"员工手册"）记录项目定位、目录结构、开发规范等核心信息，显著降低了沟通成本。这种将散落聊天记录的项目知识集中归档的方式，使AI能更快理解上下文，实现知识积累而非重复学习。作者指出，AI工具的价值不仅在于代码能力，更在于如何