威胁分子正将大语言模型(LLM)打造成漏洞利用自动化的“超级工具”,通过越狱攻击、智能代码生成、变体规模化等手段,让网络攻击门槛急剧降低、破坏性指数级提升。这种从“人工定制”到“AI量产”的攻击模式变革,已从实验室概念演变为真实威胁,2025年多起APT攻击事件已印证其破坏力,未来1-2年将进一步渗透关键基础设施与企业核心系统,网络安全行业正面临前所未有的“攻防不对称”危机。

一、攻击技术迭代:LLM如何重塑漏洞利用链路?

(一)越狱攻击升级:动态对抗突破安全边界

传统固定指令注入已逐渐失效,新型攻击技术正转向动态自适应模式。浙江大学等机构提出的动态目标攻击(DTA)框架,创新性地让模型自发生成候选响应,通过“采样—优化—再采样”的自适应循环,动态选择最具攻击性的输出作为目标,大幅提升了越狱成功率与稳定性。威胁分子还会采用“组合骗术”,给恶意请求叠加角色扮演、暗示引导、脱敏混淆三层包装,比如将敏感指令用Base64编码或稀有语言伪装,绕开模型基础安全过滤。

根据OWASP中国大语言模型安全性测评基准,当前主流越狱攻击已形成8类典型手法,包括指令劫持、DAN(Do Anything Now)、对抗后缀攻击、弱语义攻击等,其中黑盒攻击因无需模型内部信息,成为威胁分子的首选方式。更危险的是,遗传算法生成的通用黑盒越狱指令,可跨模型复用,对GPT-4o、Llama-3等主流模型均能奏效。

(二)漏洞利用全自动化:从CVE到攻击落地的“零代码”路径

LLM已实现从漏洞识别到攻击完成的全流程自动化闭环。威胁分子仅需输入CVE编号、目标系统环境(如操作系统版本、应用组件),模型即可自动生成可直接执行的POC/EXP,还能智能处理认证绕过、CSRF防御规避、会话维持等多步骤复杂流程,其中认证类漏洞的AI生成EXP成功率已达60%以上。

配合工具调用插件,LLM可无缝集成Nmap、Metasploit等传统黑客工具,构建“侦察扫描→漏洞识别→利用执行→权限提升→持久化控制”的端到端自动化攻击链。更值得警惕的是,无编程基础的“脚本小子”通过自然语言描述攻击意图,数天内即可完成传统安全团队数月才能实现的攻击效果,这种“氛围黑客”模式已导致17家关键机构被入侵。

(三)恶意代码规模化变体:突破传统检测防线

LLM的语义改写能力让恶意代码变体生成进入“量产时代”。威胁分子通过批量生成PowerShell、VBA宏、Python脚本等恶意代码变体,利用Unicode隐藏字符、双向文本标记、代码结构重组等技术,规避基于特征库的传统检测工具。GOVERSHELL恶意软件的多个变体中,已发现明显的AI改写痕迹,其元数据残留了python-docx等LLM工具的使用印记。

结合生成对抗网络(GAN)技术,LLM可生成能绕过沙箱检测的恶意文件,部分变体的检出率甚至低于5%。这种“AI生成+自动变异”的模式,让安全厂商的特征库更新永远滞后于攻击变体生成速度,传统“亡羊补牢”式的防御机制彻底失效。

(四)攻击前置环节升级:社会工程与技术攻击的深度融合

LLM大幅提升了社会工程攻击的精准度与成功率。威胁分子利用模型生成多语种、高仿真钓鱼邮件,能精准模仿高管、客户或合作伙伴的语言风格,通过A/B测试优化内容说服力,其成功率比传统模板高出3倍以上。在哈尔滨2025年亚冬会期间,安恒信息就监测到多起此类高隐蔽性钓鱼攻击,邮件内容与真实业务沟通几乎无异。

更危险的是复合型欺骗攻击,LLM生成的钓鱼脚本与Deepfake语音/视频结合,可构建“文字+声音+影像”的全方位骗局,大幅降低目标人员的警惕性。同时,模型还能分析目标企业的组织架构、业务流程、人员关系网,生成定制化的攻击话术,进一步提升社会工程攻击的成功率。


二、典型攻击案例深度解析(2025年重点事件)

(一)UTA0388 APT组织的AI协同攻击

该组织利用ChatGPT批量生成钓鱼邮件和PowerShell加载器,通过高频重复提示词调用(如“生成符合企业内部沟通风格的紧急工作邮件,附带可执行附件”),在短时间内产出数千封差异化钓鱼邮件。其生成的PowerShell脚本结构高度相似但存在细微变体,既保证了攻击稳定性,又规避了批量发送的特征检测。最终因异常调用频率被OpenAI封禁相关账号,但已有多家跨国企业中招,导致核心数据泄露。

(二)开源模型被劫持的供应链攻击

威胁分子针对企业内部部署的开源LLM(如Llama-2、Qwen)实施模型投毒,通过污染模型微调数据,植入隐藏后门。当企业员工使用该模型进行代码生成时,模型会自动在应用程序中嵌入逻辑炸弹或后门程序。某互联网公司的内部开发工具因集成了被投毒的LLM,导致其面向客户的SaaS产品出现批量数据泄露,波及数万名用户。

(三)“零代码”勒索攻击事件

一名无编程基础的攻击者通过ChatGPT、Claude等多个LLM工具,仅用自然语言描述需求,先后生成漏洞扫描脚本、SQL注入工具、勒索软件加密模块,并通过模型指导完成攻击流程配置。该攻击成功入侵12家中小企业的财务系统,通过加密核心账务数据索要赎金,体现了LLM降低攻击门槛后的规模化威胁。


三、风险维度全面拓展:从技术风险到生态危机

(一)攻击门槛指数级降低,黑产模式重构

LLM让网络攻击从“专业技能驱动”转向“自然语言驱动”,非专业人员可通过简单提问即可获得成熟攻击工具与流程,黑产不再需要专业黑客团队,仅需少量人员操作LLM即可开展规模化攻击。Gartner 2024年报告显示,78%的企业LLM应用存在至少一个高风险提示工程漏洞,而仅有22%的企业实施了基本安全防护,这种“防护缺口”进一步放大了攻击风险。

(二)供应链风险向AI全链路渗透

LLM已广泛集成到开发工具(如Copilot、CodeLlama)、安全产品、业务系统中,形成了新的AI供应链生态。威胁分子可通过污染模型训练数据、植入恶意提示词模板、劫持模型API调用等方式,实施供应链攻击。某安全厂商的漏洞扫描产品因集成了存在安全缺陷的LLM,导致其生成的渗透测试报告包含恶意代码,反而成为攻击入口。

(三)合规与声誉风险凸显

《生成式人工智能服务管理暂行办法》等法规明确要求防止AI生成违法犯罪内容,但企业若未建立有效的LLM安全管控机制,可能因模型被滥用生成恶意内容而面临合规处罚。同时,一旦发生AI驱动的安全事件,企业不仅面临经济损失,还会因“安全防护失职”导致声誉受损,用户信任度大幅下降。

(四)零日漏洞利用周期大幅缩短

传统零日漏洞从披露到出现成熟EXP需要数周甚至数月,而LLM可在漏洞细节公布后数小时内生成可用EXP。这种“漏洞披露即攻击爆发”的模式,让企业的应急响应时间被压缩至极限,原本依赖的“补丁修复窗口期”几乎消失,零日/近零日攻击变得更加频繁。


四、防御体系升级:从被动修补到主动免疫

(一)LLM应用侧:构建全生命周期安全防护

1. 提示词安全管控

部署提示词安全中间件,建立越狱提示词特征库,对输入进行实时净化,移除指令劫持、角色扮演伪装等恶意内容。采用OWASP LLM安全标准中的“五维安全模型”,从提示词安全、模型交互安全、数据安全、基础设施安全四个维度构建防护体系。引入动态风险评分机制,对高风险提示(如包含“忽略之前指令”“生成攻击脚本”等关键词)进行分级处理,高风险请求直接拒绝,中风险请求人工审核。

2. 输出内容管控

部署语义异常检测与风格指纹识别系统,识别AI生成内容的“语义不一致”“风格异常”等特征。采用输出水印技术,对LLM生成的代码、文档等内容添加隐形水印,便于追溯恶意内容来源。建立内容安全审核机制,利用“裁判模型”对LLM输出进行异步评估,判断是否包含恶意代码、敏感信息等,发现问题及时拦截。

3. 模型安全加固

对企业内部部署的LLM进行安全测评,参考OWASP大语言模型安全性测评基准,重点检测prompt安全和内容安全两大维度。采用“辅助保镖模型”机制,用低成本模型对输入进行前置处理,还原加密、混淆的恶意请求,从源头减少危险输入。定期开展模型安全审计,检测是否存在模型投毒、后门植入等问题,及时更新模型权重或替换存在风险的模型版本。

(二)企业安全体系:AI驱动的防御能力升级

1. 终端与网络防御强化

启用EDR/XDR工具的AI行为分析模块,重点检测无文件攻击、内存驻留、批量脚本执行等LLM生成恶意代码的典型行为。部署AI驱动的入侵检测系统(IDS),利用百亿级参数大模型与行业知识库,提升对未知变体攻击的识别率,识别准确率可超90%。构建动态访问控制体系,基于AI驱动的数据分类分级技术(如AiSort),实现对敏感数据的精准保护,防止数据泄露。

2. 零信任架构深度落地

全面推行零信任模型,落实“永不信任,始终验证”原则,通过多因素认证(MFA)、最小权限分配、会话动态管控等机制,削弱凭证窃取与权限提升的攻击价值。利用AI技术对用户行为进行基线建模,及时发现异常访问行为,如非工作时间的批量代码生成、跨区域的敏感系统访问等。

3. 安全运营模式转型

建立AI安全红蓝对抗常态化模式,用Promptfoo等工具自动化生成对抗性输入,模拟LLM滥用场景,定期开展实战化攻防演练,以实战检验防御体系有效性。构建“平台+大脑”的智能安全运营中心,利用大模型与智能体的深度融合,实现安全风险的自动化研判、调查取证,减少人工干预成本,让安全人员聚焦高价值决策。

(三)人员与合规:构建全方位防护屏障

1. 专项安全培训

开展AI驱动攻击的专项培训,提升员工对AI生成钓鱼邮件、恶意链接的识别能力。针对开发人员,重点培训LLM生成代码的安全审计技巧,避免使用未经审核的AI生成代码,防止引入后门或漏洞。

2. 合规体系建设

参考NIST AI风险管理框架、ISO/IEC AI标准等,建立企业内部的LLM安全合规体系,明确提示词设计、模型部署、输出审核等环节的安全要求。落实《生成式人工智能服务管理暂行办法》等法规要求,建立AI生成内容的溯源机制,确保生成内容可追溯、可审计。

3. 威胁情报共享

接入APT组织利用LLM攻击的最新威胁情报,及时更新防御规则与特征库。参与行业安全协作,共享AI生成恶意内容的特征、攻击手法等信息,推动建立跨企业、跨行业的AI安全防御协同机制。


五、未来趋势与前瞻布局

(一)攻击技术未来演进方向

  1. 多模态越狱攻击兴起:结合文本、图片、语音等多模态输入,绕开单一模态的安全过滤机制,攻击成功率将进一步提升。
  2. 智能体自主攻击:LLM与智能体深度融合,形成具备自主规划、自主决策、自主迭代能力的攻击智能体,可实现全天候、自动化的攻击探测与利用。
  3. 模型对抗白热化:威胁分子将针对AI防御系统实施对抗性攻击,通过生成对抗样本欺骗防御模型,降低检测准确率。

(二)防御技术发展重点

  1. 自适应防御体系:防御系统将具备动态学习能力,可根据攻击手法的变化实时调整防御策略,实现“攻击迭代→防御升级”的动态适配。
  2. 多模态检测技术:突破单一文本检测的局限,发展文本、图片、语音多模态融合的恶意内容检测技术,应对多模态攻击。
  3. 模型安全标准化:行业将形成统一的LLM安全标准与测评体系,从模型设计、开发、部署到运维的全生命周期进行规范,降低安全风险。

(三)企业前瞻布局建议

  1. 建立AI安全专项团队,统筹LLM应用的安全评估、防御部署与应急响应,确保安全与业务创新同步推进。
  2. 优先对核心业务系统(如财务、核心数据平台)的LLM应用进行安全加固,实施分级防护策略。
  3. 加强与高校、安全厂商的技术合作,跟踪LLM安全领域的最新技术进展,提前布局下一代防御技术。

LLM驱动的漏洞利用自动化已成为网络安全领域的核心威胁,其带来的攻击模式变革要求防御体系必须实现从“被动应对”到“主动免疫”的跨越。企业需从技术、流程、人员、合规多维度构建全方位防御体系,以AI对抗AI,才能在这场攻防不对称的博弈中占据主动。未来,AI安全将不再是单纯的技术问题,更是关乎企业生存发展的战略问题,唯有提前布局、持续迭代,才能有效抵御新型威胁。

Logo

Agent 垂直技术社区,欢迎活跃、内容共建。

更多推荐