转载--Hermes Agent 05 | 记忆系统(上):内置记忆的冻结快照模式与 agent-curated 策展
找到匹配的会话后,不是直接把原始对话扔回给主模型——那太长了。它用一个辅助模型(Gemini Flash)对每个匹配的会话做摘要():加载匹配会话的完整对话记录以匹配位置为中心,截断到 ~100,000 字符(发给 Gemini Flash,用一个聚焦的 summarization prompt 生成摘要返回带元数据的摘要结果用便宜的辅助模型(Gemini Flash)来压缩长对话,再把短摘要喂给
所有评论(0)