AI Agent Harness Engineering 时代:产品经理的能力跃迁手册


1. 开场:被Harness Engineering冲懵的产品经理们

2024年春招某大厂AI产品岗的面试现场,做了6年电商APP产品的李磊遇到了一道完全答不上来的题:「我们要上线一套多Agent智能客服系统,包含咨询Agent、售后Agent、物流Agent、投诉Agent4个独立角色,请问你会怎么设计这套系统的Harness调度规则、安全护栏边界和多Agent协同的退出机制?」
李磊过往的经验里,客服系统的需求无非是画原型、写PRD、定义关键词触发逻辑、配话术库,但这道题里的「Harness」「Agent边界」「退出机制」完全超出了他的认知体系。走出面试间他刷朋友圈才发现,2024年以来,几乎所有做ToB、ToC AI应用的公司都在招「Agent产品经理」「Harness产品经理」,JD里的要求清一色提到了「熟悉Agent架构、能设计Harness规则、能定义多Agent协同逻辑」。
这不是个例:随着2023年AutoGPT、GPTs、多Agent框架的爆发,AI应用已经从「基座模型+Prompt」的1.0时代,快速进入到「Harness为核心的多Agent系统」的2.0商用时代。原来的产品经理能力体系——调研、画原型、写PRD、跟进项目迭代,已经完全无法适配新的AI产品形态。
本文将从核心概念、架构认知、能力矩阵、实战落地、最佳实践多个维度,完整拆解AI Agent Harness Engineering时代产品经理需要具备的核心能力,帮你完成从传统互联网产品经理到AI时代产品架构师的跃迁。

2. 核心概念扫盲:什么是AI Agent Harness Engineering?

2.1 核心概念定义

要理解Harness Engineering,我们先做个生活化的类比:
你可以把AI Agent比作一辆自动驾驶汽车,大模型是汽车的发动机,各种工具(API、知识库、数据库)是汽车的轮胎、座椅、雷达等配件,Harness就是汽车的整套线束+电控系统:它连接发动机、所有配件、传感器,负责传输控制信号、供电、故障检测、安全防护,没有Harness的汽车就是一堆不能动的废铁,没有Harness的Agent就是一个只会胡说八道的聊天机器人。
官方定义:AI Agent Harness Engineering是为AI Agent提供控制调度、记忆管理、工具编排、安全防护、多Agent协同、可观测性的整套工程体系,是把Agent从「玩具级Demo」变成「可商用、可管控、可扩展系统」的核心基础设施。

2.2 相关概念边界对比

很多人会把Harness Engineering和Prompt工程、LLM应用开发混为一谈,我们用表格明确边界:

概念 核心目标 工作内容 边界
Prompt工程 提升单轮大模型输出的准确率 编写优化Prompt、Few-Shot示例 只关注大模型的输入输出,不涉及调度、安全、协同
LLM应用开发 实现基于大模型的功能 对接大模型API、开发前后端功能 没有系统化的Agent管控逻辑,大多是单轮交互
Harness Engineering 实现Agent系统的可控、可观测、可商用 设计调度规则、记忆体系、安全护栏、多Agent协同协议、可观测体系 是所有Agent应用的核心控制层,向下对接大模型和工具,向上承接业务需求

2.3 Harness系统的核心价值

Harness解决了过往Agent应用的3个核心痛点:

  1. 可控性差:原来的Agent经常出现幻觉、调用错误工具、泄露敏感信息,Harness通过多层护栏、结果校验实现100%的行为可控
  2. 协同混乱:多Agent场景下经常出现「踢皮球」「重复执行任务」的问题,Harness通过统一的调度协议、边界定义实现高效协同
  3. 无法商用:原来的Agent没有容错、降级、灰度机制,出问题就全崩,Harness提供完整的可观测、容错、灰度能力,满足企业级商用要求

3. 时代背景:为什么Harness Engineering成为了AI产品的核心?

我们用行业发展时间线来理解Harness的演进逻辑:

时间 AI产品阶段 核心特征 核心痛点 产品经理能力要求
2022.11-2023.3 基座模型时代 ChatGPT爆发,大家都在玩大模型 输出不可控、没有行业能力 会写Prompt、懂大模型基础能力
2023.4-2023.9 单Agent时代 AutoGPT、GPTs爆发,大家都在做单Agent应用 幻觉严重、工具调用出错率高、复杂任务完成率不足30% 会设计Agent角色、懂基础工具调用逻辑
2023.10-2024.3 多Agent时代 微软AutoGen、字节AgentStudio、阿里通义Agent平台发布,多Agent协同成为主流 多Agent协同混乱、安全无保障、没有可观测能力、无法商用 会设计多Agent协同逻辑、懂安全规则
2024.4至今 Harness Engineering时代 LangChain、LlamaIndex、开源Harness框架成熟,企业级Agent应用开始规模化落地 如何实现Agent系统的可控、可观测、可扩展、高性价比 懂Harness架构、能设计整套Harness规则、能搭建评估体系
你可以看到,每一次AI产品的迭代,对产品经理的能力要求都上了一个台阶:原来只需要懂Prompt,现在需要懂整套Agent系统的控制逻辑。这不是要求产品经理变成工程师,而是要求产品经理从「功能设计者」变成「Agent生态的架构师」。

4. AI Agent Harness系统的核心架构

要做Harness时代的产品经理,首先要懂Harness系统的核心架构,知道每个模块的功能、边界,以及你在每个模块里的职责。我们先看整体架构图:

大模型层

通用大模型

领域微调大模型

小模型/规则引擎

工具与知识库层

API工具集

向量知识库

第三方服务

Harness核心控制层

安全校验模块

意图识别与路由模块

记忆管理模块

工具编排与调用模块

多Agent协同调度模块

结果校验模块

可观测性与评估模块

用户层

Harness核心控制层

大模型层

工具与知识库层

4.1 各模块核心功能与产品经理职责

Harness模块 核心功能 产品经理核心职责
安全校验模块 对用户输入、Agent输出进行合规校验,拦截敏感内容、违规请求 定义安全规则:哪些内容不能输入、哪些内容不能输出、违规后的处理逻辑
意图识别与路由模块 识别用户请求的意图,路由到对应的Agent或功能模块 定义意图分类体系、路由规则、边界条件:什么请求归哪个Agent处理、什么请求转人工
记忆管理模块 存储、管理用户的对话历史、Agent的执行日志、知识库的召回结果 定义记忆规则:短期记忆保留多少轮、长期记忆存储什么内容、记忆召回的优先级
工具编排与调用模块 管理Agent可以调用的工具、参数校验、错误重试、降级逻辑 定义工具边界:哪些工具可以给Agent用、工具的参数要求、调用失败的Fallback逻辑
多Agent协同调度模块 管理多Agent之间的任务分配、信息同步、状态同步、退出机制 定义Agent角色边界、协同规则、退出条件:什么时候Agent之间需要同步信息、什么时候任务结束
结果校验模块 对Agent生成的结果进行准确性、合规性、相关性校验 定义校验规则:什么结果是合格的、不合格的结果怎么处理
可观测性与评估模块 收集Agent的运行数据、计算核心指标、输出分析报告 定义评估体系:核心指标是什么、指标的阈值是多少、异常报警规则

5. Harness时代产品经理的核心能力矩阵

我们把Harness时代产品经理的能力分为5层,从认知层到实践层,逐层递进:

5.1 能力矩阵总览

我们先通过ER图看能力和Harness模块的对应关系:

设计、定义、管控

PRODUCT_MANAGER

认知层能力

第一性原理思维

设计层能力

规则设计

评估层能力

指标定义

协作层能力

跨角色对齐

实践层能力

落地迭代

HARNESS_SYSTEM

路由模块

核心模块

记忆管理模块

核心模块

工具编排模块

核心模块

安全护栏模块

核心模块

多Agent协同模块

核心模块

可观测性模块

核心模块

5.2 第一层:认知层能力(基础前提)

认知层能力是所有能力的基础,没有正确的认知,你设计出来的Agent系统一定会出问题:

(1)Agent第一性原理思维

你要从本质上理解Agent的核心逻辑:Agent是「具备感知、决策、执行能力的自主实体」,不是原来的固定流程功能。你不能用原来的「0/1功能逻辑」去设计Agent,要接受Agent的输出是概率性的,存在出错的可能,你的核心工作不是消除所有错误,而是把错误控制在可接受的范围内。

(2)Harness系统思维

你要把Harness当成一个完整的系统,而不是零散的功能组合:所有模块之间是相互影响的,比如你改了安全规则,可能会影响路由的准确率,改了记忆规则,可能会影响工具调用的准确率。你需要从整体上权衡各个模块的设计,而不是只关注单个模块的功能。

(3)风险前置思维

Harness系统的核心是「可控」,你需要在设计阶段就把所有可能的风险考虑到:比如Agent会不会泄露用户隐私?会不会调用错误的工具给用户造成损失?多Agent协同会不会出现死循环?你需要提前设计好防护机制,而不是等出了问题再补救。

5.3 第二层:设计层能力(核心能力)

设计层能力是Harness时代产品经理的核心竞争力,也是和传统产品经理最大的区别:

(1)Agent角色与边界设计能力

你要能清晰定义每个Agent的角色、能力边界、禁止行为:

  • 角色定义:比如物流Agent的角色是「只处理用户的物流查询请求,不处理退款、投诉请求」
  • 边界定义:比如物流Agent只能查询最近1年的订单物流信息,超过1年的请求要转人工
  • 禁止行为:比如物流Agent不能泄露其他用户的物流信息,不能给用户承诺超出物流规则的配送时间
    示例:某电商客服的物流Agent角色定义:

【角色】电商平台物流查询专员
【能力范围】仅可处理用户关于订单物流状态、配送时间、快递信息的查询请求,可调用物流查询工具
【边界条件】仅可查询订单创建时间1年内的物流信息,非物流相关请求直接转给调度Agent
【禁止行为】不得处理退款、换货、投诉请求,不得编造物流信息,不得承诺超出官方规则的配送时间

(2)Harness流程编排能力

你要能设计Harness的完整执行流程,包括正常流程和异常流程:比如用户请求进来先做什么、再做什么、出错了怎么处理、什么时候转人工。我们在后面的算法流程部分会详细讲解。

(3)Prompt规则定义能力

你不需要成为Prompt工程师,但你要能定义每个Agent的核心Prompt规则:包括系统Prompt的核心要求、Few-Shot示例的标准、输出格式的要求。你不需要写最优化的Prompt,但你要能给Prompt工程师明确的需求:比如要求Agent的回复必须简洁、不能超过50字、必须包含指定的信息。

(4)安全护栏设计能力

安全是Harness系统的生命线,你要能设计多层安全护栏:

  • 输入层护栏:拦截敏感词、违规请求、恶意攻击
  • 执行层护栏:限制Agent可以调用的工具、可以访问的资源、可以执行的操作
  • 输出层护栏:拦截违规输出、错误信息、敏感信息
  • 兜底层护栏:所有无法处理的请求统一转人工,避免出现不可控的情况

5.4 第三层:评估层能力(效果保障)

Harness系统的效果不能只靠主观判断,你需要能设计多维度的评估体系,量化Agent的效果:

(1)多维度评估体系设计能力

你要能根据业务场景定义核心评估指标,我们可以用核心公式来量化:
Stotal=ω1×Stask+ω2×Scontrol+ω3×Ssafe+ω4×Scost S_{total} = \omega_1 \times S_{task} + \omega_2 \times S_{control} + \omega_3 \times S_{safe} + \omega_4 \times S_{cost} Stotal=ω1×Stask+ω2×Scontrol+ω3×Ssafe+ω4×Scost
其中:

  • StotalS_{total}Stotal:系统总得分,范围0-1
  • StaskS_{task}Stask:任务完成率,范围0-1,指Agent成功完成用户请求的比例
  • ScontrolS_{control}Scontrol:可控率,范围0-1,指Agent的行为符合预设规则的比例
  • SsafeS_{safe}Ssafe:安全合规率,范围0-1,指Agent的输入输出都符合安全规则的比例
  • ScostS_{cost}Scost:成本得分,范围0-1,指系统运行成本符合预期的比例
  • ω1,ω2,ω3,ω4\omega_1,\omega_2,\omega_3,\omega_4ω1,ω2,ω3,ω4 是各指标的权重,和为1,由产品经理根据业务场景定义
    示例:金融客服场景的权重设置:ω3=0.4\omega_3=0.4ω3=0.4(安全合规最重要),ω2=0.3\omega_2=0.3ω2=0.3(可控性次之),ω1=0.2\omega_1=0.2ω1=0.2(任务完成率),ω4=0.1\omega_4=0.1ω4=0.1(成本)
(2)可观测性指标设计能力

你要能定义Harness系统的可观测性指标,包括:

  • 业务指标:任务完成率、用户满意度、转人工率、平均处理时长
  • 系统指标:大模型调用成功率、工具调用成功率、错误率、平均响应时间
  • 安全指标:安全拦截率、违规输出率、风险事件次数
(3)错误归因分析能力

你要能根据可观测数据,定位Agent出错的原因:是Prompt的问题?还是路由规则的问题?还是工具的问题?还是大模型的问题?然后给出对应的优化方案。

5.5 第四层:协作层能力(落地保障)

Harness系统的落地需要跨多个角色协作,你需要能和不同角色对齐需求:

  • 和大模型工程师对齐:大模型的能力边界、微调的效果、成本的优化
  • 和Harness工程师对齐:调度规则的实现、工具的接入、安全护栏的实现
  • 和安全工程师对齐:安全规则的定义、风险的防控、合规的要求
  • 和业务方对齐:业务的核心目标、指标的阈值、迭代的节奏

5.6 第五层:实践层能力(迭代优化)

Harness系统的迭代和传统互联网产品完全不同,你需要掌握新的迭代方法:

(1)最小Agent原型验证能力

你要能快速搭建最小可行的Agent原型,验证核心逻辑:不需要做完整的系统,用GPTs、LangChain Flow等工具就能快速搭个原型,测试任务完成率、可控率,验证需求是否可行,避免浪费大量开发资源。

(2)灰度迭代与优化能力

Harness系统不能一上来就全量上线,你需要设计灰度迭代的规则:先放1%的流量测试,然后逐步放量,根据数据不断优化规则,直到指标达到阈值再全量上线。

(3)边界风险管控能力

你要能清晰定义系统的边界:什么场景下系统可以处理,什么场景下必须转人工,什么场景下需要紧急下线。你需要建立完善的应急处理机制,出现问题可以快速止损。

5.7 与传统产品经理的能力对比

我们用表格直观对比两者的差异:

能力维度 传统互联网产品经理 Harness时代产品经理
核心产出 PRD、原型图、需求池 Agent角色定义、Harness流程规则、Prompt规则、安全护栏规则、评估体系
核心思维 功能思维、流程思维 系统思维、风险思维、概率思维
核心能力 需求调研、用户体验设计、项目管理 Agent架构设计、Harness规则设计、多维度评估、风险管控
协作对象 UI、前端、后端、测试 大模型工程师、Harness工程师、数据科学家、安全工程师
迭代方式 版本迭代,固定周期发布 小样本灰度迭代,实时优化规则
评估指标 DAU、留存、转化率、GMV 任务完成率、可控率、安全合规率、用户满意度、成本下降率
边界认知 明确的功能边界,0/1逻辑 概率性的能力边界,容错设计,灰度管控

6. 算法流程:Harness任务调度的核心逻辑

你需要掌握Harness任务调度的核心流程,知道每个步骤的设计要点,我们用流程图展示:

校验不通过

校验通过

参数错误

参数正确

校验不通过

校验通过

用户发起请求

Harness输入安全校验

返回合规提示,记录风险

意图识别与分类

路由到对应Agent

Agent查询记忆库获取上下文

是否需要调用工具/知识库

工具参数校验

Agent向用户询问缺失参数

调用工具/知识库

调用是否成功

Fallback逻辑:重试/转人工/提示用户

Agent生成结果

Harness输出安全校验

返回结果给用户

记录所有数据到可观测系统,更新记忆库

每个步骤产品经理需要设计的规则:

  1. 输入安全校验:定义敏感词列表、违规请求的类型、违规后的提示话术
  2. 意图识别:定义意图分类体系、每个意图的触发条件、边界条件
  3. 路由规则:定义每个意图对应的Agent、无法识别的意图的处理逻辑
  4. 记忆规则:定义记忆库存储的内容、召回的优先级、过期时间
  5. 工具调用规则:定义每个Agent可以调用的工具、参数要求、重试次数、调用失败的Fallback逻辑
  6. 输出安全校验:定义输出的合规规则、不合格结果的处理逻辑
  7. 可观测规则:定义需要记录的字段、指标的计算方式、异常报警的阈值

7. 实战落地:从零搭建企业多Agent客服系统

我们用一个真实的项目案例,讲解产品经理在Harness项目中的完整工作流程:

7.1 项目介绍

某电商平台要搭建一套多Agent智能客服系统,替代原来的人工客服,目标是降低30%的人工客服成本,同时用户满意度不低于90%,安全合规率100%。

7.2 环境准备(产品经理需要了解的核心组件)

不需要你会写代码,但你要知道核心的技术组件:

  • Harness框架:LangChain + LangServe(开源的Harness开发框架)
  • 大模型:通义千问4(通用大模型) + 电商领域微调小模型(意图识别用)
  • 工具集:物流查询API、订单查询API、退款申请API、知识库
  • 可观测系统:LangSmith(Agent运行数据监控)

7.3 系统功能设计(产品经理核心工作)

  1. Agent角色设计
    • 调度Agent:负责意图识别、路由、多Agent协同
    • 咨询Agent:负责商品咨询、活动咨询
    • 物流Agent:负责物流查询、配送问题处理
    • 售后Agent:负责退款、换货、售后问题处理
    • 投诉Agent:负责用户投诉处理
  2. Harness流程设计:按照上面的调度流程图设计,转人工规则设置为:用户明确要求转人工、Agent连续3次无法处理请求、涉及大额赔偿的投诉
  3. 安全护栏设计
    • 输入层:拦截涉黄涉暴、政治敏感、恶意攻击的内容
    • 执行层:Agent不能给用户承诺超过平台规则的赔偿、不能泄露用户隐私
    • 输出层:所有涉及退款、赔偿的回复必须经过规则引擎校验才能返回
  4. 评估体系设计
    • 权重:安全合规率0.4、任务完成率0.3、用户满意度0.2、成本0.1
    • 阈值:安全合规率100%、任务完成率≥85%、用户满意度≥90%、成本下降≥30%

7.4 核心代码示例(产品经理需要理解的部分)

我们用Python写一个简化的Harness核心逻辑,注释里标出来了产品经理设计的部分:

from langchain.agents import AgentExecutor, create_openai_tools_agent
from langchain_openai import ChatOpenAI
from langchain_core.prompts import ChatPromptTemplate, MessagesPlaceholder
from langchain_core.tools import tool
from langchain_community.chat_message_histories import ChatMessageHistory
from langchain_core.runnables.history import RunnableWithMessageHistory

# ---------------------- 产品经理定义的工具边界 开始 ----------------------
@tool
def query_logistics(order_id: str) -> str:
    """查询订单的物流信息,参数是订单号,必须是10位数字,仅可查询1年内的订单"""
    # 模拟物流接口调用
    return f"订单{order_id}的物流状态:已发货,预计明天送达"

@tool
def apply_refund(order_id: str, reason: str) -> str:
    """申请订单退款,参数是订单号和退款原因,订单号必须是10位数字,退款金额不得超过订单金额"""
    # 模拟退款接口调用
    return f"订单{order_id}的退款申请已提交,原因:{reason},预计1-3个工作日到账"
# ---------------------- 产品经理定义的工具边界 结束 ----------------------

# ---------------------- 产品经理定义的系统Prompt 开始 ----------------------
prompt = ChatPromptTemplate.from_messages([
    ("system", "你是电商客服调度Agent,只处理和订单相关的问题,不知道就说不知道,不要编造。非订单问题直接提示用户转人工。涉及退款必须先确认订单号和退款原因。"),
    MessagesPlaceholder("chat_history"),
    ("user", "{input}"),
    MessagesPlaceholder("agent_scratchpad"),
])
# ---------------------- 产品经理定义的系统Prompt 结束 ----------------------

# 初始化大模型和Agent
llm = ChatOpenAI(model="gpt-3.5-turbo", temperature=0)
tools = [query_logistics, apply_refund]
agent = create_openai_tools_agent(llm, tools, prompt)
agent_executor = AgentExecutor(agent=agent, tools=tools, verbose=True)

# ---------------------- 产品经理定义的记忆规则 开始 ----------------------
# 每个用户的对话历史保留10轮,超过的自动删除最早的记录
message_history = ChatMessageHistory(max_messages=10)
agent_with_history = RunnableWithMessageHistory(
    agent_executor,
    lambda session_id: message_history,
    input_messages_key="input",
    history_messages_key="chat_history",
)
# ---------------------- 产品经理定义的记忆规则 结束 ----------------------

# 测试调用
response = agent_with_history.invoke(
    {"input": "我要退订单1234567890,原因是质量不好"},
    config={"configurable": {"session_id": "test_user_001"}}
)
print(response["output"])

7.5 项目效果

上线3个月后,系统的核心指标:安全合规率100%、任务完成率88%、用户满意度92%、人工客服成本下降35%,达到了预期目标。

8. 最佳实践与避坑指南

我们总结了10个Harness产品经理的最佳实践,帮你避开90%的坑:

  1. 可控性永远优先于自主性:不要追求Agent100%的自主能力,宁愿牺牲一点自主性,也要保证系统100%可控
  2. 明确的边界比强大的能力更重要:每个Agent的边界越清晰,出错的概率越低,不要试图让一个Agent处理所有问题
  3. 为每个Agent设计明确的退出条件:多Agent协同最容易出现死循环,你要为每个Agent设计明确的退出条件:什么情况下任务结束、什么情况下转人工
  4. 容错设计放在第一位:假设所有环节都可能出错,为每个错误场景设计Fallback逻辑,不要让系统直接崩溃
  5. 小样本迭代比一次性完美设计更高效:不要花几个月写完美的PRD,先搭个原型用1%的流量测试,快速迭代优化
  6. 多维度评估不要只看准确率:准确率高不代表系统好用,你要关注可控率、安全合规率、用户满意度、成本等多个维度的指标
  7. 安全规则要做多层校验:不要只做一层安全校验,输入、执行、输出都要做校验,避免出现漏网之鱼
  8. 记忆不是越多越好:记忆太多会增加大模型的干扰,降低准确率,你要根据业务场景设计合理的记忆规则,不是保留越多历史越好
  9. 工具调用的参数校验要做两次:一次在Agent调用前,一次在工具调用前,避免参数错误导致的问题
  10. 一定要建立应急止损机制:提前设计好紧急下线、全量转人工的机制,出现问题可以快速止损,避免造成更大的损失

9. 行业趋势与能力演进路径

9.1 未来3年Harness Engineering的发展趋势

  1. 无代码Harness平台普及:未来会出现大量无代码/低代码的Harness平台,产品经理可以直接拖拽设计Agent流程、配置规则,不需要依赖工程师
  2. Agent生态标准化:Agent的角色定义、协同协议、安全规则会逐步标准化,不同厂商的Agent可以无缝协同
  3. Harness成为AI应用的基础设施:未来所有的AI应用都会基于Harness搭建,Harness会像现在的云服务一样成为基础设施

9.2 产品经理的学习路径

入门阶段(1-3个月)
  • 玩至少20个以上的Agent产品:GPTs、AutoGPT、各类Agent应用,理解Agent的能力和边界
  • 学习Harness的基础概念:看LangChain、LlamaIndex的官方文档,理解各个模块的功能
  • 用GPTs、LangChain Flow搭一个简单的Agent原型,验证自己的想法
进阶阶段(3-6个月)
  • 参与一个完整的Harness项目,掌握Agent设计、流程编排、评估体系设计的能力
  • 学习基础的Prompt工程知识,能写出合格的系统Prompt
  • 理解大模型的能力边界、成本结构,能和工程师对齐需求
专家阶段(6个月以上)
  • 能独立设计复杂的多Agent系统的Harness架构
  • 能根据业务场景定义最合适的评估体系和迭代路径
  • 能预判行业发展趋势,提前布局产品规划

10. 本章小结

AI Agent Harness Engineering时代的到来,不是产品经理的终点,而是产品经理价值放大的起点:原来的产品经理只能设计固定流程的功能,现在的产品经理可以设计能自主决策、自主执行的Agent系统,创造10倍甚至100倍的价值。
你不需要变成工程师,也不需要精通大模型训练,你只需要掌握Harness的核心架构、规则设计能力、评估体系能力,就能成为AI时代最稀缺的产品人才。

思考作业

如果你是办公协同产品的产品经理,现在要设计一个基于多Agent的智能会议助手系统,包含会议记录Agent、待办整理Agent、决策跟踪Agent3个角色,请你设计:

  1. 每个Agent的角色定义和边界
  2. Harness的核心调度流程
  3. 安全护栏规则
  4. 核心评估指标和权重

推荐学习资源

  • 官方文档:LangChain官方文档、LlamaIndex官方文档、LangSmith官方文档
  • 开源项目:AutoGen、AgentStudio、Dify
  • 书籍:《AI Agent设计实战》《大模型应用开发实战》
    (全文完,共11237字)
Logo

Agent 垂直技术社区,欢迎活跃、内容共建。

更多推荐