AutoSkill:让你的skills越用越聪明

易嘉云

208人浏览 · 2026-03-27 10:55:20

易嘉云 · 2026-03-27 10:55:20 发布

一、背景

在大语言模型（LLM）的实际应用中，用户常反复表达稳定偏好与需求（如 减少幻觉、遵循特定写作规范、避免技术术语过度密集等），但这类交互经验极少被归类为可以复用的知识。

现有解决方案局限：

参数更新与自进化方法：虽能通过自我反思、反馈优化等提升模型表现，但成本高昂，且在需频繁精细化个性化的场景中难以控制；
记忆型方法：仅将过往交互视为文本存储与检索，无法将其转化为可执行的行为能力；
技能学习方法：相关技能多隐含于提示词、轨迹或策略中，缺乏统一的 inspection、编辑、迁移与长期维护机制。

核心目标是将LLM Agent的交互经验转化为 显式、可复用、可维护的技能，无需重新训练底层模型即可实现能力的持续进化，skill越用越强。

二、形式化建模

对于一个用户，我们将完整的对话历史记为

其中表示第轮的用户查询，表示模型回复。技能库为用户在第轮后维护。每个技能表示为

技能（Skill）：以标准化SKILL.md为载体的显式 artifacts，包含7个核心字段：
名称（n）
描述（d）
可执行指令提示（p）
触发词集（τ）
标签集（γ）
示例集（ξ）
版本（v），能够记录风格约束、响应策略、工具使用流程等行为模式；
终身学习：通过技能提取、表示、检索、复用与迭代优化的完整生命周期，实现能力的持续积累，而非简单的经验存储；
模型无关性：作为插件层兼容现有LLM，支持技能在不同代理、用户与任务间的共享与迁移。

三、技术机制

AutoSkill的架构由技能增强响应生成与技能进化两个耦合循环构成，辅以模块化组件与标准化流程，实现端到端的终身学习。

1. 整体架构组件

框架采用提示词驱动的模块化设计，核心组件包括：

六大功能模块：查询重写模型（Mᵣw）、对话响应模型（M_chat）、技能提取模型（M_ext）、技能管理判断模型（M_judge）、技能合并模型（M_merge）、嵌入模型（M_emb）；

分别表示查询重写、对话生成、技能提取、技能管理决策和技能合并的提示集合

三大核心存储：用户专属技能库、共享技能库、向量缓存库，通过分层存储实现高效检索与隔离管理；

多端交互接口：Python SDK、Web UI、OpenAI兼容反向代理，支持灵活部署与集成。

2. 核心循环机制

AutoSkill 的框架，由两个紧密耦合的过程组成。右侧循环，技能演化，通过提取和维护将交互经验转化为显式技能。左侧循环，技能增强响应生成，利用当前技能库通过查询重写、技能检索和上下文注入来支持响应生成。通过这种方式，系统通过显式记忆增长而非模型微调来持续改进。

（1）skill增强响应生成循环（左环）：复用已有技能

查询重写：将用户当前查询（qₜ）与对话历史（hₜ）转化为检索导向的独立查询（q̄ₜ），解决上下文依赖，提炼格式、风格等关键约束；

混合技能检索：结合稠密语义相关性得分（d）与词法BM25得分（b），通过加权求和计算技能相关性（Rel(qₜ,s) = λŷd + (1-λ)ŷb），筛选Top-K且满足阈值的相关技能（Hₜ）；

技能条件响应生成：将筛选后的技能渲染为紧凑上下文（Cₜ），注入对话模型提示词，生成适配用户习惯的响应（rₜ = M_chat(P_chat, qₜ, hₜ, Cₜ)），且不显性提及技能检索过程。

（2）skill进化循环（右环）：迭代skills

技能提取：基于用户查询序列（Qᵤᵗ = {q₁,...,qₜ}），提取可复用的技能候选（zₜ），仅聚焦持久化约束、流程等，过滤一次性请求与临时内容；

检索辅助技能管理：将技能候选转化为检索查询，匹配最相似的已有技能（sₜ*），通过判断模型决策技能的最终状态（add/merge/discard）；

版本化技能合并：若决策为合并，通过语义融合而非简单拼接，将新约束与细节整合至已有技能，同步更新版本号（v(sₜ') = Bump(v(sₜ*))），避免技能冗余。

3. skill生命周期

AutoSkill通过四阶段生命周期实现skill的闭环管理：

经验获取：收集对话消息、行为轨迹等原始交互数据；
技能提取：抽象生成技能候选，聚焦可复用能力而非实例化事实；
技能维护与版本化：通过add/merge/discard决策优化技能库，确保紧凑性与一致性；
技能复用：检索相关技能并注入生成过程，实现经验的跨会话应用。

四、实验结果

技能库规模与分布

英文GPT-3.5子集表现最优：10,243个对话生成631个技能，平均每对话26.13条消息

热门标签聚焦实用技能：python（98次）、javascript（38次）、excel（36次）等技术类标签占比最高

算力需求https://csdn.yijiayun.com，现在认证还有12小时4090直接用

3. 典型案例分析

案例1：中文技能「顶级心理咨询师」

核心能力：编码心理咨询的沟通风格与专业规范，要求温暖共情、尊重隐私，禁止医疗诊断与晦涩术语；

价值：将抽象的人际交互偏好转化为可执行规则，用户无需重复说明需求即可获得一致的支持体验。

案例2：英文技能「professional_text_rewrite」

核心能力：优化文本流畅度、专业性与语法正确性，严格保留原始含义与细节，禁止额外解释与内容增减；

价值：通过34轮迭代整合用户反馈，形成标准化文本改写流程，避免重复构建相似提示词。

五、相关工作对比

研究方向	代表工作	AutoSkill核心差异
经验驱动终身学习	ELL、StuLife	显式技能artifact表示，支持人工编辑与版本化
LLM自进化	SELF、RISE、UPO	无参数更新，通过外部技能进化实现透明可控优化
长期记忆系统	MemGPT、Mem0、RAG	从文本记忆升级为行为级技能，适配偏好与流程类需求
技能学习	ReAct、Toolformer、Voyager	技能显式化、可迁移，支持全生命周期管理

AutoSkill的核心优势在于： 突破了传统方法中技能隐含化、记忆碎片化、进化黑箱化的局限，实现了"经验-技能-能力"的闭环转化，且保持低部署成本与高兼容性。

AI Agent技术社区

Agent 垂直技术社区，欢迎活跃、内容共建。

更多推荐

cover

【花雕动手做】行空板 K10 系列实验之人工智能调用语音合成（TTS）模块

AI Agent技术社区

cover

苏州企业AI Agent智能体从概念到落地：2026年开发者必须关注的技术范式与工程实践

AI Agent技术社区

cover

GitHub 狂揽 4万+ Star！这个项目直接让你省下 60–95% 的 Token

AI Agent技术社区

所有评论(0)

查看更多评论

易嘉云

已为社区贡献3条内容