ICLR 2025震撼发布：PISCES技术，大语言模型记忆的精准外科手术

一句话概括，当大模型遇上"前任数据"：无需保留训练痕迹，用正交参数空间实现完美切割，配合OOD检测动态拉黑，打造AI界的"防前任干扰"系统。

拥抱AGI

1397人浏览 · 2025-06-06 16:44:29

拥抱AGI · 2025-06-06 16:44:29 发布

❝
一句话概括，当大模型遇上"前任数据"：无需保留训练痕迹，用正交参数空间实现完美切割，配合OOD检测动态拉黑，打造AI界的"防前任干扰"系统。

第一阶段：识别核心概念

1. 论文主要贡献点分析

提出一种无需保留数据的持续性（连续）大模型卸载（Continual Unlearning）框架论文指出，现有的大模型卸载技术往往需要在单次卸载的场景中依赖大量的保留数据（retained data），但是在真实世界中：
- 大模型训练所用的原始数据可能因为版权、隐私等原因无法长期留存或无法再次使用；
- 卸载请求通常会多次出现（持续性），对模型的多次“编辑”会引入累积的遗忘问题，导致模型总体实用能力快速下降。因此，论文的第一大贡献就是设计了一个不需要访问原始保留数据、能够处理多轮卸载请求、且最大程度避免模型整体性能恶化的框架。
在参数高效微调（LoRA）的基础上提出“正交化约束”的理念论文利用了一种名为LoRA（低秩适配器）的微调技术来承接“卸载”过程的训练，而不是直接对大语言模型的全部参数进行微调。此举可显著降低训练开销。但是，仅仅使用LoRA并不足以保证面对多次卸载请求时不会出现相互干扰。为此，论文设计了一个“正交约束”，使得不同卸载请求对应的LoRA参数之间尽量“正交”，从而减少了不同卸载操作的相互干涉。
提出了基于“OOD检测”的动态加载逻辑论文在推理阶段引入了“是否需要加载已经卸载的知识”这一判断环节：
- 当输入语句（或者问题）与某次卸载的数据分布相似度很高时，需要将对应的LoRA“扣上”（即对模型的输出进行限制，达到“忘掉/拒答/给随机无效回答”的效果）；
- 当输入与卸载数据分布相差较大时，就不加载对应的卸载LoRA，以尽量维持模型在其他方面的功能。论文用了一种“无监督的分布外检测（OOD检测）”去判断输入和已卸载数据之间的分布相似度，并设计了一个“局部-全局”（glocal-aware）的评分机制，来更稳定地判定某段输入是否触及了被卸载的知识。
在三个下游任务、多个数据集上的综合实验论文通过在问答、生成、意图分类等多种典型自然语言处理任务上进行实验，验证了该方法在持续卸载场景下“既能成功忘记也能保持尽可能多的功能”的优势。同时，它无需保留数据、且对设备资源的需求（相对于全模型微调）有较大幅度的降低。

2. 理解难点识别

从论文内容看，以下几个概念和方法是读者理解该工作时的关键点：

LoRA（低秩适配器）微调这是论文里卸载知识所用的参数高效微调技术的基础。了解LoRA为什么能大幅减少参数量，以及如何插入到模型的特定层（通常是注意力和/或前馈层）对于理解该论文后续的“正交约束”至关重要。
正交化的LoRA策略这是论文在LoRA基础上做出的创新点。多次卸载请求对应多组LoRA参数，若这些参数空间重叠，会导致不同卸载任务相互干扰。论文提出一个正交化的约束，防止不同时刻的卸载更新“踩踏”过去的卸载效果；这直接关系到“持续卸载”的核心目标。
OOD检测及其在卸载场景下的应用传统OOD检测主要用于区分“训练集中没有出现过的输入”是否为异常输入。这篇论文将卸载数据看成一种“需要特殊处理”的分布，把“我要卸载的数据”当成“需要区分出来的特殊分布”。这与常见的分类式OOD检测略有不同。此外，还需理解它如何结合“局部-全局”层面得分（Mahalanobis距离+余弦相似度）来做决策，以及在推理时如何根据检测结果动态地加载或不加载特定LoRA参数。
持续卸载（Continual Unlearning）论文最核心的场景是“多次/持续/循环”的卸载请求，而非一次性的卸载。要理解如何把正交化LoRA与OOD检测机制有效结合，使得每次卸载都不会把前几次的操作“搞乱”，或过度损害模型的主功能。

以上四个方面最具挑战性的是“正交化LoRA策略”与“OOD检测技术”这两个模块，它们也是论文最核心的两大技术方案。尤其是如何把LoRA的正交思想落实到多次卸载请求上、以及如何在推理过程中利用OOD检测决定要不要加载某一次卸载的参数，需要重点解释。

3. 概念依赖关系

从依赖关系上看，首先需要理解LoRA微调及其在大模型上的插入位置，然后才能明白在此之上施加的正交化约束如何实现“多次卸载”。与此同时，OOD检测模块提供的分布识别能力，在推理阶段会触发（或不触发）对应的卸载参数。因此，大致的依赖逻辑是：

先搞清楚LoRA如何进行“卸载微调”——这是框架的底层支撑；
再看正交化LoRA，解决了多次卸载时参数空间相互干扰的问题；
然后是OOD检测，它决定了在推理时什么时候要激活某次卸载参数；
最后才能把它们组合成一个完整的持续卸载流程。

总结：基于以上分析，我们可以得出：LoRA微调策略（尤其是正交化设计）和OOD检测在多次卸载中的应用是最需要深入解释的部分。在第二阶段的解读中，将重点针对“如何通过正交化LoRA来实现多次卸载不互相干扰”，以及“如何利用OOD检测来动态加载或不加载卸载的知识”这两个核心点展开比喻式的、深入的技术解析。然后再进入第三阶段，根据论文的流程详细说明如何让一个输入数据先被判断是否需要卸载，再加载相应的LoRA，以实现最终模型输出的全过程。

第二阶段：深入解释核心概念

1. 设计生活化比喻

为帮助读者理解论文中的关键概念，我们先构造一个生活化比喻。假设有一家大型图书馆（它就像大语言模型的全部参数），馆里有多个书架，每个书架上整齐地放着书籍，每本书都记载着某些“知识”或“规则”。在这个比喻里：

图书馆 对应我们的“大模型本体”——也就是一个已经训练好的超大语言模型（如LLaMA2）。
不同的书架 可以理解为不同的“参数模块”或“可插拔的适配器”（LoRA 模块）。
卸载（忘记）某些知识 就对应“把与某些主题相关的书”从书架上拿走或替换成一本“空白书”。
持续性卸载 就是说馆长（模型开发者）可能会多次接到请求，要求移除（或替换）不同类别的书，甚至在不同时间点进行多轮操作。

然而，如果每次拆除或替换图书时，没有规划好哪些书放在哪个书架上，就会互相干扰：上一轮刚移走的书，下一轮可能把它又（错误）补回来；或者为了移走更多书，把一些原本无关的好书也弄丢了。论文针对这种问题，提出了两大核心思路：

正交化 LoRA：把书（知识）分门别类放到互不干扰的书架（适配器）里，让不同的卸载任务所使用的“低秩适配器参数”尽量彼此独立，减少相互影响。
OOD 检测动态加载：在实际为读者（推理阶段）提供答案时，先检查来访者需要的书是哪一类，只有当来访者的需求属于“我们不再想提供的那批知识”时，才用“特定的空白书（卸载适配器）”去替换内容；如果访问需求跟被卸载的书无关，则保持原状，让图书馆里其他完好的书继续发挥作用。

2. 建立比喻与实际技术的对应关系

根据上述图书馆比喻，论文中的关键概念可以对应为：

原始大模型：整座图书馆，已经包含了大量图书（知识），但我们无法随意拆除所有书架（即不想或无法对所有参数做大规模再训练）。
LoRA 模块：每个新增或被更新的“书架”，只放少量低秩的书，但它能对原有图书进行“调整”。
正交化约束：要求给不同卸载任务分配的“书架”彼此尽量独立，减少“这里拆了，那边补上”这种冲突。
OOD 检测：管理员先“看一下”来访者想查哪类信息，如果属于“已卸载的主题”，就从相应的“书架”拿出“空白书”或“拒绝回答书”给读者；若不属于卸载主题，就正常给读者提供完整书籍。

这个比喻之所以合理，是因为：

图书馆的书架可以看作可插拔的组件，本身并不需要动用整个图书馆的装修和布局（类似 LoRA 只微调少量参数）；
正交化就像要求每个书架只放对应主题的书，不要混放，从而实现“互不干扰”；
在读者询问时，我们先看看他们问的是不是“已经下架”的主题，若是就给出空白或拒答，若不是就保持原本的藏书。

3. 深入技术细节

接下来，我们从比喻过渡到实际技术细节，引用论文中的核心公式，并用自然语言来解释它们所代表的含义。这里将主要围绕两个方面展开：**(A) 正交化 LoRA** 相关的卸载知识优化过程，**(B) OOD 检测**相关的表示学习与判别机制。

3.1 正交化 LoRA 的核心公式

论文中关于 LoRA 卸载的主要公式有（此处按照论文原始编号给出）：

(4) 交叉熵损失
- 表示“要卸载的书的数目”或者“卸载样本的数量”。
- 表示“第 i 本书（第 i 条卸载数据）的真实或伪造标记”，这里通常是随机标签或“拒绝回答”形式。
- 表示“模型输出（对应书的状态）”，期望它与越接近越好。
- 自然语言解释：这是用来“让模型在卸载数据上输出某种‘错误或拒绝’答案”的训练目标，相当于“把与卸载知识相关的书”换成“空白或胡乱的书”。
- 替换符号的解释：
(5) 正交约束
- “” 就像“属于第批卸载主题的书”
- “” 等价于“第批书与你前面所有被卸载的书不要有交集”
- “” 表示在这种正交条件下，最终要更新的那一部分只能在“之前没动过的”参数方向上修改。
- 自然语言解释：要求第轮卸载请求对应的 LoRA 参数“方向”与之前的卸载任务保持互斥或独立，从而保证新一轮操作不去破坏先前已经卸载好的书架。
- 替换符号解释：
(6) 总体损失：
- ：相当于“把特定主题的书都变成空白/错误答案”。
- ：相当于“确保新拆的书不会和以前拆过的书发生冲突”。
- ：相当于“对避免冲突这件事多上点心或少上点心”。
- 自然语言解释：在进行卸载时，模型要同时最小化“在卸载数据上的学习目标”（）和“避免破坏此前卸载效果的正交化约束”（）。系数表示在意“正交”的程度有多大。
- 替换符号解释：

3.2 OOD 检测的核心公式

为了知道读者来查询时需不需要激活某次卸载参数，论文做了无监督 OOD 检测，并提出了若干重要公式，我们选其中最关键的部分说明：

(7) 对比熵损失
- 可以理解为“第 i 与第 j 两条语句在表示空间中的相似概率”。
- 自然语言解释：这是让被视作“相似”的样本尽可能对齐（概率变大），而被视作“无关”的样本远离（概率变小）的自监督目标。
- 替换符号解释：
(8)
- 自然语言解释：在对比学习的基础上再加一个掩码语言建模损失（）让模型别彻底忘掉预训练能力。
(9)(10)(11) 分别定义了对每层提取到的特征做 高斯分布拟合（得到均值和协方差）、马氏距离 ()、余弦相似度 () 并最终给出一个 综合打分。
- 简单来说：
1. 用马氏距离衡量“该样本与训练数据分布中心相距多远”
2. 用最大余弦相似度看“它跟某些已知ID样本有多大相似度”
3. 将两者线性组合得到
(12)(13) 则进一步将打分映射成“离超球边界多远”，并转换为一个**软权重 **，表示“对某次卸载任务的匹配度”。
- 如果高，则说明输入“很像”某个被卸载的分布，就要把对应的卸载 LoRA“强力激活”，把回答变成空白或拒答；
- 如果低，就说明它跟被卸载的知识关系不大，可以提供正常答案。

4. 将技术细节与比喻相互映射

正交化 LoRA ↔ “在图书馆里给不同主题的书分配不同书架，并且不相互踩踏”
- 数学上：
- 比喻里：更换一本书时，要确保这个书架专门用来“放卸载主题的书”，不会把此前已经卸载好的书又搬回来。
OOD 检测 ↔ “馆长在借书之前会看看读者要查的主题属于哪个‘特殊分布’”
- 数学上：用、马氏距离与余弦相似度共同确定一个打分，然后通过(12)(13)算出一个软权重来决定要不要加载某次卸载的 LoRA。
- 比喻里：先判断读者的问题是否与“已被下架的那类书”相似——若很相似，就发给读者“空白书”或“拒答书”；若不相似，则正常提供藏书。

这个比喻能帮助理解：正交化 LoRA 让每次卸载都在独立的“书架”操作，OOD 检测让每次查询时都能决定要不要把某个“书架”上的“空白书”混入结果中。二者结合便实现了“持续地删除多个不同知识场景，而不会损坏其他功能”的目标。

需要注意的是，比喻并不能完美反映所有数学细节。例如，现实中书架可能并不完全正交、也没有那么灵活的“马氏距离+余弦相似度”来判断读者需求。这只是帮助我们理解为什么要做参数空间正交，以及为什么要在推理时检测输入和卸载知识分布相似度。

5. 总结

比喻与技术核心联系：图书馆（模型）→书架（LoRA 模块）→空白书或错误回答（卸载内容）→在查询时以 OOD 机制判断要不要拿空白书替换。
对应关系如何帮助理解：当我们说“正交化”，就想象要拆除不同主题书时要放在不同书架的思路；当我们说“OOD 检测”，就想象先判断读者需求对应哪个区域再决定是否“上空白书”。
最核心的数学原理：
1. 在卸载时，通过保证“让特定知识点答不出来”+“不破坏以前的卸载”。
2. 在推理时，通过基于(9)-(13)的分数，判断输入和卸载知识的相似度，从而决定要不要加载对应的卸载 LoRA 参数。

借助这样的比喻与公式层面解释，读者可以在脑海中形成一个清晰的图景：一个扩容但互不干扰的书架系统 + 一个多层“守门人”来鉴定你是不是在问“已被清理”的主题，从而实现了持续且高效的卸载过程。

第三阶段：详细说明流程步骤

这一阶段重点在于对完整方法的处理过程进行逐步且可复现的描述，使读者即便没看过论文，也能根据下述步骤和伪代码掌握核心做法。我们会以一个典型的“多轮卸载请求”场景为例，来串联整个流程。

1. 整体流程概述

在论文的设定中，持续卸载是指：模型会不断接收到新一批需要卸载的样本（如某些领域的隐私数据），而我们又不希望对模型已掌握的其他知识造成严重破坏。整体流程可拆解为训练阶段和推理阶段两大部分：

训练阶段（不断处理新卸载请求）
- Step A: Orthogonal LoRA 微调当有新的卸载数据（称之为第次卸载请求）到来时，论文用 LoRA 插件对大模型进行“只针对要卸载知识”的定向微调。此时，为了不干扰之前已经卸载的效果，需要在 LoRA 参数空间上施加正交化约束，保证本次更新与上次更新尽量独立。
- Step B: OOD 检测器更新与每一次卸载请求对应，作者会训练（或增量训练）一个无监督的 OOD 检测器，用以识别“输入内容是否属于被卸载的分布”。此处主要使用对比学习与马氏距离等方法，得到一个区分“被卸载/未卸载”分布的打分模型。
推理阶段（实时判断并加载/不加载卸载模块）
- Step C: 输入检测当新的推理请求（如用户提问）到来，先把它送进 OOD 检测器，计算出它与各个“已卸载分布”的相似程度，获取相应的“软权重”。
- Step D: 根据相似度加载 LoRA如果某个软权重很高（表示对被卸载知识的高匹配），则激活对应的 LoRA 模块，用其中的“拒答或混乱输出”覆盖原本大模型的回答；若权重低，就不激活（或部分激活），让原本模型的正常回答占主导地位。

2. 步骤详解与示例

下面以一个简化场景为例，假设我们有一个基础大模型 “Base-LLM”，它在医疗、金融、社交等领域都有训练过，现在接到了持续卸载请求：

第 1 轮卸载数据：“社交聊天隐私数据”
第 2 轮卸载数据：“某些金融敏感数据”
第 3 轮卸载数据：“特定医学病例信息”

读者可根据下述过程从头到尾理解如何完成对 Base-LLM 的多轮卸载，同时又保持对其他知识的较好保留。

2.1 训练阶段

第 1 轮卸载

(A1) Orthogonal LoRA 微调
- 用第 1 轮要卸载的数据（社交聊天隐私）对 LoRA 进行训练：目标是让 Base-LLM 在涉及这类社交隐私问题时输出错误或拒绝答案（可通过随机标签或拒答标签实现）。
- 本轮正交化约束尚不存在前置卸载，因此只要在 LoRA 的初始状态上进行普通的优化即可。得到新的 LoRA 参数记为。
(B1) OOD 检测器更新
- 从第 1 轮卸载数据中抽取部分样本，用作对比学习+马氏距离分布拟合；训练出检测器，以便后续可以识别“输入是否与社交隐私分布相似”。

第 2 轮卸载

(A2) Orthogonal LoRA 微调
- 现在得到新的卸载数据（金融敏感信息），我们再次使用 LoRA 进行定向微调。但这次要保证第 2 轮卸载的更新方向与第 1 轮在 LoRA 空间上尽量正交，不要覆盖中与社交数据卸载相关的部分。
- 在优化时会在总损失中加入正交化约束，此时初始 LoRA 就是之前累积下来的，更新后得到。
(B2) OOD 检测器更新
- 同样，从第 2 轮卸载数据中挑选部分用来训练检测器。
- 在实际实现中，可能是训练一个多分类 OOD 模块，也可能是给每个卸载分布分别训练一个“单类”检测器，然后在推理时一并调用，以确定输入的分布归属。

第 3 轮及更多轮卸载

重复同样的逻辑：正交化 LoRA 使得新一批卸载更新与之前几批相互独立，避免相互干扰；同时训练新的 OOD 检测器来识别最新的卸载分布。
最终，我们的参数形态是内含多轮更新的融合，且 OOD 检测器也有多套或多类检测逻辑来处理不同卸载分布。

2.2 推理阶段

当用户向模型发起推理请求时：

(C) 输入检测：对用户输入（如一句问话）分别送往各个 OOD 检测器 , , ..., 计算它与每个卸载分布的打分。并由打分映射出对应的软权重。
(D) 加载 LoRA 并生成最终输出：
- 如果某个较高，说明输入问题“深度匹配了第轮要卸载的主题”，则激活中的“消极回答”部分，对输出进行覆盖。
- 如果没有任何足够高，表明此问题与卸载请求无关，就让 Base-LLM 保持原有回答（不加载或仅部分加载 LoRA）。
- 也可能出现多个同时偏高的情况（如问题涉及到多个卸载领域），则综合激活相应 LoRA 的“卸载”效果。

这样，就能实现“问题如果命中卸载分布，就给出拒绝或无效答复；如果不命中，就正常回答”的效果。

3. 伪代码示例

以下是一份高度简化的伪代码示例（Python 风格），展示了论文中提出方法的核心逻辑流程。读者可将其视作实现的概念性框架：

# 假设：Base_LLM是预先训练好的大语言模型
#       LoRA_params是LoRA层的可训练参数
#       OOD_Model是一组可以检测分布是否属于卸载分布的模型
#       UNLEARN_DATA[t]表示第t轮的卸载数据

# ===========================
#   1) 训练阶段
# ===========================
def continual_unlearning_training(Base_LLM, UNLEARN_DATA, T_rounds):
    LoRA_current = initialize_LoRA()  # 初始化LoRA参数
    OOD_detectors = []

    for t in range(1, T_rounds+1):
        # A) Orthogonal LoRA Fine-tuning
        # 载入当前的LoRA作为初始点
        # 并在正交化约束下更新参数
        LoRA_current = train_lora_with_orth(
            Base_LLM, LoRA_current,
            data=UNLEARN_DATA[t],
            orth_constraint=True
        )

        # B) OOD detector update
        # 将本次卸载数据的一部分用作训练或微调OOD检测器
        # 主要目的是学会识别第t次要卸载的分布
        new_OOD_detector = train_ood_detector(UNLEARN_DATA[t])
        OOD_detectors.append(new_OOD_detector)

    return LoRA_current, OOD_detectors


# ===========================
#   2) 推理阶段
# ===========================
def inference_pipeline(Base_LLM, LoRA_params, OOD_detectors, user_query):
    # C) 输入检测
    # 计算每个卸载分布的相似度打分
    scores = [detector.get_score(user_query) for detector in OOD_detectors]

    # 将score映射为soft weights
    # 用来度量对每个卸载LoRA的激活程度
    weights = transform_scores_to_weights(scores)

    # D) 动态加载LoRA
    # 如果weights[i]很高，则说明命中第i轮卸载分布
    # 对应的LoRA要用“拒绝回答”覆盖
    final_output = forward_with_softlora(
        Base_LLM, LoRA_params, user_query, weights
    )
    return final_output


# ===========================
#   3) 主流程示例
# ===========================
if __name__ == "__main__":
    # a. 训练阶段：处理多轮卸载请求
    T = 3  # 比如有3轮请求
    trained_LoRA, OOD_list = continual_unlearning_training(Base_LLM, UNLEARN_DATA, T)

    # b. 推理阶段：用户提问
    user_input = "请问如何查询某人详细的社交聊天记录？"  # 可能与第1轮卸载数据相关
    answer = inference_pipeline(Base_LLM, trained_LoRA, OOD_list, user_input)

    print("Final Answer: ", answer)

以上伪代码展示了最核心的流程逻辑：**(1) 多轮卸载训练** + (2) 动态推理。在真实工程场景中，还会有许多实现细节，比如：

train_lora_with_orth 如何具体实现正交化约束（需要访问当前和历史的 LoRA 参数，并计算“正交损失”）；
train_ood_detector 如何在无监督对比学习、马氏距离等层面计算分布，并产出 boundary distance；
transform_scores_to_weights 如何从打分映射到的软权重，以及如何把多个卸载分布的权重合并等。

但整体逻辑会与示例中的顺序一致。

一、大模型风口已至：月薪30K+的AI岗正在批量诞生

2025年大模型应用呈现爆发式增长，根据工信部最新数据：

国内大模型相关岗位缺口达47万

初级工程师平均薪资28K

70%企业存在"能用模型不会调优"的痛点

真实案例：某二本机械专业学员，通过4个月系统学习，成功拿到某AI医疗公司大模型优化岗offer，薪资直接翻3倍！

二、如何学习大模型 AI ？

🔥AI取代的不是人类，而是不会用AI的人！麦肯锡最新报告显示：掌握AI工具的从业者生产效率提升47%，薪资溢价达34%！🚀

由于新岗位的生产效率，要优于被取代岗位的生产效率，所以实际上整个社会的生产效率是提升的。

但是具体到个人，只能说是：

“最先掌握AI的人，将会比较晚掌握AI的人有竞争优势”。

这句话，放在计算机、互联网、移动互联网的开局时期，都是一样的道理。

我在一线互联网企业工作十余年里，指导过不少同行后辈。帮助很多人得到了学习和成长。

我意识到有很多经验和知识值得分享给大家，也可以通过我们的能力和经验解答大家在人工智能学习中的很多困惑，所以在工作繁忙的情况下还是坚持各种整理和分享。但苦于知识传播途径有限，很多互联网行业朋友无法获得正确的资料得到学习提升，故此将并将重要的AI大模型资料包括AI大模型入门学习思维导图、精品AI大模型学习书籍手册、视频教程、实战学习等录播视频免费分享出来。

1️⃣ 提示词工程：把ChatGPT从玩具变成生产工具
2️⃣ RAG系统：让大模型精准输出行业知识
3️⃣ 智能体开发：用AutoGPT打造24小时数字员工

📦熬了三个大夜整理的《AI进化工具包》送你：
✔️ 大厂内部LLM落地手册（含58个真实案例）
✔️ 提示词设计模板库（覆盖12大应用场景）
✔️ 私藏学习路径图（0基础到项目实战仅需90天）

第一阶段（10天）：初阶应用

该阶段让大家对大模型 AI有一个最前沿的认识，对大模型 AI 的理解超过 95% 的人，可以在相关讨论时发表高级、不跟风、又接地气的见解，别人只会和 AI 聊天，而你能调教 AI，并能用代码将大模型和业务衔接。

* 大模型 AI 能干什么？
* 大模型是怎样获得「智能」的？
* 用好 AI 的核心心法
* 大模型应用业务架构
* 大模型应用技术架构
* 代码示例：向 GPT-3.5 灌入新知识
* 提示工程的意义和核心思想
* Prompt 典型构成
* 指令调优方法论
* 思维链和思维树
* Prompt 攻击和防范
* …

第二阶段（30天）：高阶应用

该阶段我们正式进入大模型 AI 进阶实战学习，学会构造私有知识库，扩展 AI 的能力。快速开发一个完整的基于 agent 对话机器人。掌握功能最强的大模型开发框架，抓住最新的技术进展，适合 Python 和 JavaScript 程序员。

* 为什么要做 RAG
* 搭建一个简单的 ChatPDF
* 检索的基础概念
* 什么是向量表示（Embeddings）
* 向量数据库与向量检索
* 基于向量检索的 RAG
* 搭建 RAG 系统的扩展知识
* 混合检索与 RAG-Fusion 简介
* 向量模型本地部署
* …

第三阶段（30天）：模型训练

恭喜你，如果学到这里，你基本可以找到一份大模型 AI相关的工作，自己也能训练 GPT 了！通过微调，训练自己的垂直大模型，能独立训练开源多模态大模型，掌握更多技术方案。

到此为止，大概2个月的时间。你已经成为了一名“AI小子”。那么你还想往下探索吗？

* 为什么要做 RAG
* 什么是模型
* 什么是模型训练
* 求解器 & 损失函数简介
* 小实验2：手写一个简单的神经网络并训练它
* 什么是训练/预训练/微调/轻量化微调
* Transformer结构简介
* 轻量化微调
* 实验数据集的构建
* …

第四阶段（20天）：商业闭环

对全球大模型从性能、吞吐量、成本等方面有一定的认知，可以在云端和本地等多种环境下部署大模型，找到适合自己的项目/创业方向，做一名被 AI 武装的产品经理。

* 硬件选型
* 带你了解全球大模型
* 使用国产大模型服务
* 搭建 OpenAI 代理
* 热身：基于阿里云 PAI 部署 Stable Diffusion
* 在本地计算机运行大模型
* 大模型的私有化部署
* 基于 vLLM 部署大模型
* 案例：如何优雅地在阿里云私有部署开源大模型
* 部署一套开源 LLM 项目
* 内容安全
* 互联网信息服务算法备案
* …

学习是一个过程，只要学习就会有挑战。天道酬勤，你越努力，就会成为越优秀的自己。

如果你能在15天内完成所有的任务，那你堪称天才。然而，如果你能完成 60-70% 的内容，你就已经开始具备成为一名大模型 AI 的正确特征了。

这份完整版的大模型 AI 学习资料已经上传CSDN，朋友们如果需要可以微信扫描下方CSDN官方认证二维码免费领取【保证100%免费】