一、背景

大语言模型(LLM)的实际应用中,用户常反复表达稳定偏好与需求(如 减少幻觉、遵循特定写作规范、避免技术术语过度密集等),但这类交互经验极少被归类为可以复用的知识

现有解决方案局限:

  • 参数更新与自进化方法:虽能通过自我反思、反馈优化等提升模型表现,但成本高昂,且在需频繁精细化个性化的场景中难以控制;
  • 记忆型方法:仅将过往交互视为文本存储与检索,无法将其转化为可执行的行为能力;
  • 技能学习方法:相关技能多隐含于提示词、轨迹或策略中,缺乏统一的 inspection、编辑、迁移与长期维护机制。
核心目标是将LLM Agent的交互经验转化为 显式、可复用、可维护的技能,无需重新训练底层模型即可实现能力的持续进化,skill越用越强

二、形式化建模

对于一个用户 ,我们将完整的对话历史记为

其中  表示第  轮的用户查询, 表示模型回复。技能库  为用户  在第  轮后维护。每个技能表示为

  • 技能(Skill):以标准化SKILL.md为载体的显式 artifacts,包含7个核心字段:
  • 名称(n)
  • 描述(d)
  • 可执行指令提示(p)
  • 触发词集(τ)
  • 标签集(γ)
  • 示例集(ξ)
  • 版本(v), 能够记录风格约束、响应策略、工具使用流程等行为模式;
  • 终身学习:通过技能提取、表示、检索、复用与迭代优化的完整生命周期,实现能力的持续积累,而非简单的经验存储;
  • 模型无关性:作为插件层兼容现有LLM,支持技能在不同代理、用户与任务间的共享与迁移。

三、技术机制

AutoSkill的架构由技能增强响应生成技能进化两个耦合循环构成,辅以模块化组件与标准化流程,实现端到端的终身学习。

1. 整体架构组件

框架采用提示词驱动的模块化设计,核心组件包括:

分别表示查询重写、对话生成、技能提取、技能管理决策和技能合并的提示集合
  • 三大核心存储:用户专属技能库、共享技能库、向量缓存库,通过分层存储实现高效检索与隔离管理;

  • 多端交互接口:Python SDKWeb UI、OpenAI兼容反向代理,支持灵活部署与集成。

2. 核心循环机制

AutoSkill 的框架,由两个紧密耦合的过程组成。右侧循环,技能演化,通过提取和维护将交互经验转化为显式技能。左侧循环,技能增强响应生成,利用当前技能库通过查询重写、技能检索和上下文注入来支持响应生成。通过这种方式,系统通过显式记忆增长而非模型微调来持续改进。

(1)skill增强响应生成循环(左环):复用已有技能

  1. 查询重写:将用户当前查询(qₜ)与对话历史(hₜ)转化为检索导向的独立查询(q̄ₜ),解决上下文依赖,提炼格式、风格等关键约束

  1. 混合技能检索:结合稠密语义相关性得分(d)与词法BM25得分(b),通过加权求和计算技能相关性(Rel(qₜ,s) = λŷd + (1-λ)ŷb),筛选Top-K且满足阈值的相关技能(Hₜ);

  1. 技能条件响应生成:将筛选后的技能渲染为紧凑上下文(Cₜ),注入对话模型提示词,生成适配用户习惯的响应(rₜ = M_chat(P_chat, qₜ, hₜ, Cₜ)),且不显性提及技能检索过程。

(2)skill进化循环(右环):迭代skills

  1. 技能提取:基于用户查询序列(Qᵤᵗ = {q₁,...,qₜ}),提取可复用的技能候选(zₜ),仅聚焦持久化约束、流程等,过滤一次性请求与临时内容;

  1. 检索辅助技能管理:将技能候选转化为检索查询,匹配最相似的已有技能(sₜ*),通过判断模型决策技能的最终状态(add/merge/discard);

  1. 版本化技能合并:若决策为合并,通过语义融合而非简单拼接,将新约束与细节整合至已有技能,同步更新版本号(v(sₜ') = Bump(v(sₜ*))),避免技能冗余。

3. skill生命周期

AutoSkill通过四阶段生命周期实现skill的闭环管理:

  1. 经验获取:收集对话消息、行为轨迹等原始交互数据;
  2. 技能提取:抽象生成技能候选,聚焦可复用能力而非实例化事实;
  3. 技能维护与版本化:通过add/merge/discard决策优化技能库,确保紧凑性与一致性;
  4. 技能复用:检索相关技能并注入生成过程,实现经验的跨会话应用。

四、实验结果

技能库规模与分布

英文GPT-3.5子集表现最优:10,243个对话生成631个技能,平均每对话26.13条消息

热门标签聚焦实用技能:python(98次)、javascript(38次)、excel(36次)等技术类标签占比最高

算力需求https://csdn.yijiayun.com,现在认证还有12小时4090直接用

3. 典型案例分析

案例1:中文技能「顶级心理咨询师」

  • 核心能力:编码心理咨询的沟通风格与专业规范,要求温暖共情、尊重隐私,禁止医疗诊断与晦涩术语;

价值:将抽象的人际交互偏好转化为可执行规则,用户无需重复说明需求即可获得一致的支持体验。

案例2:英文技能「professional_text_rewrite」

  • 核心能力:优化文本流畅度、专业性与语法正确性,严格保留原始含义与细节,禁止额外解释与内容增减;
价值:通过34轮迭代整合用户反馈,形成标准化文本改写流程,避免重复构建相似提示词。

五、相关工作对比

研究方向 代表工作 AutoSkill核心差异
经验驱动终身学习 ELL、StuLife 显式技能artifact表示,支持人工编辑与版本化
LLM自进化 SELF、RISE、UPO 无参数更新,通过外部技能进化实现透明可控优化
长期记忆系统 MemGPT、Mem0、RAG 从文本记忆升级为行为级技能,适配偏好与流程类需求
技能学习 ReAct、Toolformer、Voyager 技能显式化、可迁移,支持全生命周期管理
AutoSkill的核心优势在于: 突破了传统方法中技能隐含化、记忆碎片化、进化黑箱化的局限,实现了"经验-技能-能力"的闭环转化,且保持低部署成本与高兼容性
Logo

Agent 垂直技术社区,欢迎活跃、内容共建。

更多推荐