AutoSkill:让你的skills越用越聪明
·
一、背景
在 大语言模型(LLM)的实际应用中,用户常反复表达稳定偏好与需求(如 减少幻觉、遵循特定写作规范、避免技术术语过度密集等),但这类交互经验极少被归类为可以复用的知识。
现有解决方案局限:
- 参数更新与自进化方法:虽能通过自我反思、反馈优化等提升模型表现,但成本高昂,且在需频繁精细化个性化的场景中难以控制;
- 记忆型方法:仅将过往交互视为文本存储与检索,无法将其转化为可执行的行为能力;
- 技能学习方法:相关技能多隐含于提示词、轨迹或策略中,缺乏统一的 inspection、编辑、迁移与长期维护机制。
核心目标是将LLM Agent的交互经验转化为 显式、可复用、可维护的技能,无需重新训练底层模型即可实现能力的持续进化,skill越用越强。
二、形式化建模
对于一个用户 ,我们将完整的对话历史记为
其中 表示第 轮的用户查询, 表示模型回复。技能库 为用户 在第 轮后维护。每个技能表示为
- 技能(Skill):以标准化
SKILL.md为载体的显式 artifacts,包含7个核心字段: - 名称(n)
- 描述(d)
- 可执行指令提示(p)
- 触发词集(τ)
- 标签集(γ)
- 示例集(ξ)
- 版本(v), 能够记录风格约束、响应策略、工具使用流程等行为模式;
- 终身学习:通过技能提取、表示、检索、复用与迭代优化的完整生命周期,实现能力的持续积累,而非简单的经验存储;
- 模型无关性:作为插件层兼容现有LLM,支持技能在不同代理、用户与任务间的共享与迁移。
三、技术机制
AutoSkill的架构由技能增强响应生成与技能进化两个耦合循环构成,辅以模块化组件与标准化流程,实现端到端的终身学习。
1. 整体架构组件
框架采用提示词驱动的模块化设计,核心组件包括:
分别表示查询重写、对话生成、技能提取、技能管理决策和技能合并的提示集合
- 三大核心存储:用户专属技能库、共享技能库、向量缓存库,通过分层存储实现高效检索与隔离管理;
- 多端交互接口:Python SDK、Web UI、OpenAI兼容反向代理,支持灵活部署与集成。
2. 核心循环机制

AutoSkill 的框架,由两个紧密耦合的过程组成。右侧循环,技能演化,通过提取和维护将交互经验转化为显式技能。左侧循环,技能增强响应生成,利用当前技能库通过查询重写、技能检索和上下文注入来支持响应生成。通过这种方式,系统通过显式记忆增长而非模型微调来持续改进。
(1)skill增强响应生成循环(左环):复用已有技能
- 查询重写:将用户当前查询(qₜ)与对话历史(hₜ)转化为检索导向的独立查询(q̄ₜ),解决上下文依赖,提炼格式、风格等关键约束;

- 混合技能检索:结合稠密语义相关性得分(d)与词法BM25得分(b),通过加权求和计算技能相关性(Rel(qₜ,s) = λŷd + (1-λ)ŷb),筛选Top-K且满足阈值的相关技能(Hₜ);

- 技能条件响应生成:将筛选后的技能渲染为紧凑上下文(Cₜ),注入对话模型提示词,生成适配用户习惯的响应(rₜ = M_chat(P_chat, qₜ, hₜ, Cₜ)),且不显性提及技能检索过程。

(2)skill进化循环(右环):迭代skills
- 技能提取:基于用户查询序列(Qᵤᵗ = {q₁,...,qₜ}),提取可复用的技能候选(zₜ),仅聚焦持久化约束、流程等,过滤一次性请求与临时内容;

- 检索辅助技能管理:将技能候选转化为检索查询,匹配最相似的已有技能(sₜ*),通过判断模型决策技能的最终状态(add/merge/discard);

- 版本化技能合并:若决策为合并,通过语义融合而非简单拼接,将新约束与细节整合至已有技能,同步更新版本号(v(sₜ') = Bump(v(sₜ*))),避免技能冗余。

3. skill生命周期
AutoSkill通过四阶段生命周期实现skill的闭环管理:
- 经验获取:收集对话消息、行为轨迹等原始交互数据;
- 技能提取:抽象生成技能候选,聚焦可复用能力而非实例化事实;
- 技能维护与版本化:通过add/merge/discard决策优化技能库,确保紧凑性与一致性;
- 技能复用:检索相关技能并注入生成过程,实现经验的跨会话应用。
四、实验结果
技能库规模与分布

英文GPT-3.5子集表现最优:10,243个对话生成631个技能,平均每对话26.13条消息

热门标签聚焦实用技能:python(98次)、javascript(38次)、excel(36次)等技术类标签占比最高
算力需求https://csdn.yijiayun.com,现在认证还有12小时4090直接用
3. 典型案例分析
案例1:中文技能「顶级心理咨询师」
- 核心能力:编码心理咨询的沟通风格与专业规范,要求温暖共情、尊重隐私,禁止医疗诊断与晦涩术语;


价值:将抽象的人际交互偏好转化为可执行规则,用户无需重复说明需求即可获得一致的支持体验。
案例2:英文技能「professional_text_rewrite」


- 核心能力:优化文本流畅度、专业性与语法正确性,严格保留原始含义与细节,禁止额外解释与内容增减;
价值:通过34轮迭代整合用户反馈,形成标准化文本改写流程,避免重复构建相似提示词。
五、相关工作对比
| 研究方向 | 代表工作 | AutoSkill核心差异 |
|---|---|---|
| 经验驱动终身学习 | ELL、StuLife | 显式技能artifact表示,支持人工编辑与版本化 |
| LLM自进化 | SELF、RISE、UPO | 无参数更新,通过外部技能进化实现透明可控优化 |
| 长期记忆系统 | MemGPT、Mem0、RAG | 从文本记忆升级为行为级技能,适配偏好与流程类需求 |
| 技能学习 | ReAct、Toolformer、Voyager | 技能显式化、可迁移,支持全生命周期管理 |
AutoSkill的核心优势在于: 突破了传统方法中技能隐含化、记忆碎片化、进化黑箱化的局限,实现了"经验-技能-能力"的闭环转化,且保持低部署成本与高兼容性。
更多推荐



所有评论(0)