GLM-Image开源大模型教程：diffusers pipeline定制——添加LoRA微调接口

Rubix-Kai

283人浏览 · 2026-02-13 00:12:08

Rubix-Kai · 2026-02-13 00:12:08 发布

GLM-Image开源大模型教程：diffusers pipeline定制——添加LoRA微调接口

1. 引言：为什么需要定制pipeline？

如果你用过GLM-Image的Web界面，可能会发现一个问题：虽然界面很漂亮，功能也齐全，但每次想用自己微调过的模型，都得改代码、重新部署，特别麻烦。

想象一下这个场景：你花了好几天时间，用自己收集的动漫角色图片训练了一个LoRA模型，想让GLM-Image生成特定风格的动漫人物。按照传统方法，你需要：

找到原始的pipeline代码
手动加载LoRA权重
修改推理逻辑
重新测试验证

这个过程不仅耗时，还容易出错。更麻烦的是，每次换一个LoRA模型，都要重复这些步骤。

今天我要分享的，就是如何给GLM-Image的diffusers pipeline添加LoRA接口，让你能像切换滤镜一样轻松切换不同的微调模型。学完这篇教程，你就能：

一键加载LoRA模型：不用改代码，直接在Web界面选择
动态切换风格：同一个基础模型，可以加载多个LoRA
保持原有功能：所有WebUI的功能都保留，只是多了LoRA选项

听起来是不是很实用？我们这就开始。

2. 理解diffusers pipeline的工作原理

2.1 什么是diffusers pipeline？

简单来说，diffusers pipeline就是一个“图像生成流水线”。它把复杂的图像生成过程封装成几个简单的步骤：

# 这是diffusers pipeline的基本工作流程
输入文本 → 文本编码器 → 噪声预测器 → 图像解码器 → 输出图像

GLM-Image的Web界面背后，其实就是调用了这样一个pipeline。当你点击“生成图像”按钮时，界面会：

收集你输入的提示词和参数
把这些参数传给pipeline
pipeline生成图像
界面显示结果

2.2 LoRA在pipeline中的位置

LoRA（Low-Rank Adaptation）是一种轻量级的微调方法。它不修改原始模型的所有参数，而是添加一些小的“适配层”：

原始模型权重 + LoRA适配层 = 微调后的模型

在diffusers中，LoRA权重通常以.safetensors文件的形式存在。加载LoRA的过程，就是把这些适配层“嫁接”到原始模型上。

2.3 我们需要修改什么？

GLM-Image的Web界面基于Gradio构建，它的核心代码在webui.py中。我们需要：

修改pipeline加载逻辑：让pipeline能识别和加载LoRA
添加界面控件：让用户可以选择LoRA模型
更新生成逻辑：在生成时应用选中的LoRA

下面我们一步步来实现。

3. 环境准备与代码结构

3.1 检查现有环境

首先，确保你的GLM-Image环境已经正常运行：

# 进入项目目录
cd /root/build

# 启动WebUI（如果还没启动的话）
bash start.sh

打开浏览器访问http://localhost:7860，确认界面能正常显示和生成图像。

3.2 了解代码结构

让我们看看关键的几个文件：

/root/build/
├── webui.py              # Web界面主程序
├── start.sh              # 启动脚本
├── test_glm_image.py     # 测试脚本（我们主要修改这个）
└── outputs/              # 生成的图像保存目录

我们主要需要修改webui.py，但为了安全起见，我们先在test_glm_image.py上做实验。

3.3 准备LoRA模型

在开始修改代码前，你需要准备好LoRA模型文件。通常LoRA模型是.safetensors格式的，大小在几十MB到几百MB之间。

假设你有一个动漫风格的LoRA模型，把它放在：

/root/build/lora_models/anime_style.safetensors

如果你还没有LoRA模型，可以从网上下载一些公开的模型来测试。很多模型分享网站都有各种风格的LoRA模型。

4. 修改pipeline支持LoRA加载

4.1 理解原始的pipeline代码

先看看GLM-Image原始的pipeline是怎么创建的：

# 这是简化后的原始代码
from diffusers import StableDiffusionPipeline
import torch

def create_pipeline():
    # 加载基础模型
    model_id = "zai-org/GLM-Image"
    pipeline = StableDiffusionPipeline.from_pretrained(
        model_id,
        torch_dtype=torch.float16,
        safety_checker=None,
        requires_safety_checker=False
    )
    
    # 移动到GPU
    pipeline.to("cuda")
    
    return pipeline

这个代码很简单：加载模型、放到GPU、返回pipeline。但它不支持动态加载LoRA。

4.2 添加LoRA加载功能

我们需要修改这个函数，让它能接受LoRA路径参数：

def create_pipeline_with_lora(lora_path=None, lora_scale=1.0):
    """
    创建支持LoRA的pipeline
    
    参数:
        lora_path: LoRA模型文件路径，如果为None则不加载LoRA
        lora_scale: LoRA权重缩放系数，控制LoRA的影响程度
    """
    # 加载基础模型（和原来一样）
    model_id = "zai-org/GLM-Image"
    pipeline = StableDiffusionPipeline.from_pretrained(
        model_id,
        torch_dtype=torch.float16,
        safety_checker=None,
        requires_safety_checker=False
    )
    
    # 如果提供了LoRA路径，就加载LoRA
    if lora_path and os.path.exists(lora_path):
        print(f"正在加载LoRA模型: {lora_path}")
        
        # 加载LoRA权重
        pipeline.load_lora_weights(
            lora_path,
            adapter_name="custom_lora"
        )
        
        # 设置LoRA的权重系数
        pipeline.set_adapters(["custom_lora"], adapter_weights=[lora_scale])
        
        print(f"LoRA加载完成，权重系数: {lora_scale}")
    
    # 移动到GPU
    pipeline.to("cuda")
    
    return pipeline

这里有几个关键点：

load_lora_weights()：这是diffusers提供的加载LoRA的方法
set_adapters()：设置使用哪个LoRA以及它的权重
lora_scale参数：控制LoRA的影响程度，1.0表示完全应用，0.5表示一半效果

4.3 支持多个LoRA切换

有时候你可能想同时使用多个LoRA，或者快速切换不同的风格。我们可以进一步扩展：

class GLMImagePipelineManager:
    """管理GLM-Image pipeline和LoRA模型"""
    
    def __init__(self):
        self.base_pipeline = None
        self.current_lora = None
        self.lora_scale = 1.0
        
    def initialize(self):
        """初始化基础pipeline"""
        print("正在初始化基础pipeline...")
        model_id = "zai-org/GLM-Image"
        
        self.base_pipeline = StableDiffusionPipeline.from_pretrained(
            model_id,
            torch_dtype=torch.float16,
            safety_checker=None,
            requires_safety_checker=False
        )
        
        self.base_pipeline.to("cuda")
        print("基础pipeline初始化完成")
        
    def load_lora(self, lora_path, lora_scale=1.0):
        """加载LoRA模型"""
        if not self.base_pipeline:
            print("错误：请先初始化基础pipeline")
            return False
            
        if not os.path.exists(lora_path):
            print(f"错误：LoRA文件不存在: {lora_path}")
            return False
        
        try:
            # 先卸载之前的LoRA（如果有的话）
            if self.current_lora:
                self.base_pipeline.unload_lora_weights()
            
            # 加载新的LoRA
            self.base_pipeline.load_lora_weights(lora_path)
            self.current_lora = lora_path
            self.lora_scale = lora_scale
            
            print(f"LoRA加载成功: {os.path.basename(lora_path)}")
            print(f"LoRA权重系数: {lora_scale}")
            return True
            
        except Exception as e:
            print(f"加载LoRA失败: {e}")
            return False
    
    def unload_lora(self):
        """卸载当前LoRA"""
        if self.current_lora:
            self.base_pipeline.unload_lora_weights()
            self.current_lora = None
            print("LoRA已卸载")
    
    def get_pipeline(self):
        """获取当前pipeline"""
        return self.base_pipeline

这个管理器类的好处是：

统一管理：所有pipeline操作都在一个地方
状态保持：记住当前加载的LoRA
错误处理：更好的错误提示和恢复

5. 修改Web界面添加LoRA控件

5.1 分析现有的Gradio界面

GLM-Image的Web界面是用Gradio构建的。在webui.py中，界面大致是这样的结构：

import gradio as gr

def create_ui():
    with gr.Blocks() as demo:
        gr.Markdown("# GLM-Image 文本生成图像")
        
        with gr.Row():
            with gr.Column():
                # 输入区域
                prompt = gr.Textbox(label="正向提示词")
                negative_prompt = gr.Textbox(label="负向提示词")
                
                # 参数设置
                width = gr.Slider(...)
                height = gr.Slider(...)
                steps = gr.Slider(...)
                
                # 生成按钮
                generate_btn = gr.Button("生成图像")
            
            with gr.Column():
                # 输出区域
                output_image = gr.Image(label="生成的图像")
    
    return demo

我们需要在这个界面上添加LoRA相关的控件。

5.2 添加LoRA选择控件

在参数设置区域添加LoRA相关的控件：

def create_ui():
    with gr.Blocks() as demo:
        gr.Markdown("# GLM-Image 文本生成图像")
        
        with gr.Row():
            with gr.Column():
                # ... 原有的输入控件 ...
                
                # 新增：LoRA设置区域
                with gr.Accordion("LoRA设置", open=False):
                    # LoRA模型选择
                    lora_model = gr.Dropdown(
                        label="选择LoRA模型",
                        choices=["无", "anime_style", "realistic_portrait", "watercolor_art"],
                        value="无",
                        info="选择要应用的LoRA风格模型"
                    )
                    
                    # LoRA权重系数
                    lora_scale = gr.Slider(
                        label="LoRA权重系数",
                        minimum=0.0,
                        maximum=2.0,
                        value=1.0,
                        step=0.1,
                        info="控制LoRA的影响程度，0=不使用，1=完全应用"
                    )
                    
                    # LoRA模型管理
                    with gr.Row():
                        refresh_lora_btn = gr.Button("刷新LoRA列表")
                        unload_lora_btn = gr.Button("卸载LoRA")
                
                # ... 原有的生成按钮 ...
            
            with gr.Column():
                # ... 原有的输出区域 ...
    
    return demo

5.3 扫描本地LoRA模型

为了让用户能选择本地的LoRA模型，我们需要添加一个函数来扫描LoRA目录：

import os
import glob

def scan_lora_models(lora_dir="/root/build/lora_models"):
    """扫描指定目录下的LoRA模型文件"""
    
    # 确保目录存在
    os.makedirs(lora_dir, exist_ok=True)
    
    # 查找所有.safetensors文件
    lora_files = glob.glob(os.path.join(lora_dir, "*.safetensors"))
    
    # 提取文件名（不含路径和扩展名）
    lora_names = ["无"]  # 第一个选项是"无"
    
    for file_path in lora_files:
        filename = os.path.basename(file_path)
        name = os.path.splitext(filename)[0]  # 去掉扩展名
        lora_names.append(name)
    
    return lora_names

# 在界面创建时使用
lora_choices = scan_lora_models()
lora_model = gr.Dropdown(
    label="选择LoRA模型",
    choices=lora_choices,
    value="无"
)

5.4 更新生成函数

原来的生成函数需要修改，以支持LoRA参数：

# 创建pipeline管理器实例
pipeline_manager = GLMImagePipelineManager()
pipeline_manager.initialize()

def generate_image(prompt, negative_prompt, width, height, steps, 
                   guidance_scale, seed, lora_model_name, lora_scale):
    """生成图像的主函数"""
    
    # 如果选择了LoRA模型
    if lora_model_name != "无":
        lora_path = f"/root/build/lora_models/{lora_model_name}.safetensors"
        
        # 检查是否需要加载新的LoRA
        current_lora = pipeline_manager.current_lora
        expected_lora = os.path.basename(lora_path)
        
        if not current_lora or current_lora != expected_lora:
            # 加载新的LoRA
            success = pipeline_manager.load_lora(lora_path, lora_scale)
            if not success:
                return None, "加载LoRA失败，请检查模型文件"
    else:
        # 如果选择"无"，但当前有LoRA加载，则卸载
        if pipeline_manager.current_lora:
            pipeline_manager.unload_lora()
    
    # 获取pipeline
    pipeline = pipeline_manager.get_pipeline()
    
    # 设置随机种子
    if seed == -1:
        seed = torch.randint(0, 2**32, (1,)).item()
    
    generator = torch.Generator(device="cuda").manual_seed(seed)
    
    # 生成图像
    try:
        image = pipeline(
            prompt=prompt,
            negative_prompt=negative_prompt,
            width=width,
            height=height,
            num_inference_steps=steps,
            guidance_scale=guidance_scale,
            generator=generator
        ).images[0]
        
        return image, f"生成完成！种子: {seed}"
        
    except Exception as e:
        return None, f"生成失败: {str(e)}"

6. 完整代码整合

6.1 修改后的webui.py核心部分

下面是整合了所有修改的核心代码：

#!/usr/bin/env python3
"""
GLM-Image WebUI with LoRA support
支持LoRA模型加载和切换的GLM-Image Web界面
"""

import os
import glob
import torch
import gradio as gr
from diffusers import StableDiffusionPipeline

class GLMImagePipelineManager:
    """管理GLM-Image pipeline和LoRA模型"""
    
    def __init__(self):
        self.base_pipeline = None
        self.current_lora = None
        self.lora_scale = 1.0
        
    def initialize(self):
        """初始化基础pipeline"""
        print("正在初始化GLM-Image pipeline...")
        
        try:
            model_id = "zai-org/GLM-Image"
            
            self.base_pipeline = StableDiffusionPipeline.from_pretrained(
                model_id,
                torch_dtype=torch.float16,
                safety_checker=None,
                requires_safety_checker=False,
                cache_dir="/root/build/cache/huggingface/hub"
            )
            
            # 启用内存优化
            self.base_pipeline.enable_model_cpu_offload()
            self.base_pipeline.enable_xformers_memory_efficient_attention()
            
            print("✓ 基础pipeline初始化完成")
            return True
            
        except Exception as e:
            print(f"✗ pipeline初始化失败: {e}")
            return False
    
    def load_lora(self, lora_path, lora_scale=1.0):
        """加载LoRA模型"""
        if not self.base_pipeline:
            return False, "请先初始化基础pipeline"
            
        if not os.path.exists(lora_path):
            return False, f"LoRA文件不存在: {lora_path}"
        
        try:
            # 先卸载之前的LoRA
            if self.current_lora:
                self.base_pipeline.unload_lora_weights()
            
            # 加载新的LoRA
            self.base_pipeline.load_lora_weights(lora_path)
            self.current_lora = os.path.basename(lora_path)
            self.lora_scale = lora_scale
            
            return True, f"LoRA加载成功: {self.current_lora}"
            
        except Exception as e:
            return False, f"加载LoRA失败: {e}"
    
    def unload_lora(self):
        """卸载当前LoRA"""
        if self.current_lora:
            self.base_pipeline.unload_lora_weights()
            lora_name = self.current_lora
            self.current_lora = None
            return True, f"已卸载LoRA: {lora_name}"
        return False, "当前没有加载LoRA"
    
    def get_pipeline(self):
        """获取当前pipeline"""
        return self.base_pipeline
    
    def get_status(self):
        """获取当前状态"""
        status = {
            "base_model_loaded": self.base_pipeline is not None,
            "current_lora": self.current_lora,
            "lora_scale": self.lora_scale
        }
        return status

def scan_lora_models(lora_dir="/root/build/lora_models"):
    """扫描LoRA模型目录"""
    os.makedirs(lora_dir, exist_ok=True)
    
    # 查找所有支持的LoRA文件
    patterns = ["*.safetensors", "*.ckpt", "*.pt"]
    lora_files = []
    
    for pattern in patterns:
        lora_files.extend(glob.glob(os.path.join(lora_dir, pattern)))
    
    # 提取文件名
    lora_names = ["无"]
    for file_path in lora_files:
        filename = os.path.basename(file_path)
        name = os.path.splitext(filename)[0]
        lora_names.append(name)
    
    return lora_names

# 创建全局pipeline管理器
pipeline_mgr = GLMImagePipelineManager()

def generate_image(prompt, negative_prompt, width, height, steps, 
                   guidance_scale, seed, lora_model_name, lora_scale):
    """生成图像"""
    
    # 检查pipeline是否初始化
    if not pipeline_mgr.base_pipeline:
        return None, "错误：pipeline未初始化，请先加载模型"
    
    # 处理LoRA
    if lora_model_name != "无":
        lora_path = f"/root/build/lora_models/{lora_model_name}.safetensors"
        
        # 检查文件是否存在（尝试不同扩展名）
        if not os.path.exists(lora_path):
            # 尝试其他扩展名
            for ext in [".ckpt", ".pt"]:
                alt_path = f"/root/build/lora_models/{lora_model_name}{ext}"
                if os.path.exists(alt_path):
                    lora_path = alt_path
                    break
        
        if os.path.exists(lora_path):
            # 加载或切换LoRA
            current_lora = pipeline_mgr.current_lora
            expected_lora = os.path.basename(lora_path).split('.')[0]
            
            if not current_lora or current_lora != expected_lora:
                success, message = pipeline_mgr.load_lora(lora_path, lora_scale)
                if not success:
                    return None, f"LoRA加载失败: {message}"
        else:
            return None, f"找不到LoRA文件: {lora_model_name}"
    else:
        # 卸载LoRA
        if pipeline_mgr.current_lora:
            pipeline_mgr.unload_lora()
    
    # 设置随机种子
    if seed == -1:
        seed = torch.randint(0, 2**32, (1,)).item()
    
    generator = torch.Generator(device="cuda").manual_seed(seed)
    
    # 生成图像
    try:
        pipeline = pipeline_mgr.get_pipeline()
        
        with torch.autocast("cuda"):
            image = pipeline(
                prompt=prompt,
                negative_prompt=negative_prompt,
                width=width,
                height=height,
                num_inference_steps=steps,
                guidance_scale=guidance_scale,
                generator=generator
            ).images[0]
        
        # 保存图像
        from datetime import datetime
        timestamp = datetime.now().strftime("%Y%m%d_%H%M%S")
        output_dir = "/root/build/outputs"
        os.makedirs(output_dir, exist_ok=True)
        
        filename = f"{output_dir}/image_{timestamp}_seed{seed}"
        if pipeline_mgr.current_lora:
            filename += f"_lora_{pipeline_mgr.current_lora}"
        
        image.save(f"{filename}.png")
        
        return image, f"生成完成！种子: {seed}"
        
    except torch.cuda.OutOfMemoryError:
        return None, "显存不足，请尝试降低分辨率或步数"
    except Exception as e:
        return None, f"生成失败: {str(e)}"

def refresh_lora_list():
    """刷新LoRA列表"""
    lora_names = scan_lora_models()
    return gr.Dropdown.update(choices=lora_names)

def unload_current_lora():
    """卸载当前LoRA"""
    success, message = pipeline_mgr.unload_lora()
    return message

def get_system_status():
    """获取系统状态"""
    status = pipeline_mgr.get_status()
    
    status_text = f"""
    ### 系统状态
    - 基础模型: {'已加载' if status['base_model_loaded'] else '未加载'}
    - 当前LoRA: {status['current_lora'] or '无'}
    - LoRA权重: {status['lora_scale']}
    - 显存使用: {torch.cuda.memory_allocated() / 1024**3:.2f} GB
    """
    
    return status_text

def create_ui():
    """创建Web界面"""
    
    # 初始化pipeline
    print("正在启动GLM-Image WebUI...")
    if not pipeline_mgr.initialize():
        print("警告：pipeline初始化失败，部分功能可能不可用")
    
    with gr.Blocks(title="GLM-Image with LoRA", theme=gr.themes.Soft()) as demo:
        gr.Markdown("""
        #  GLM-Image 文本生成图像（支持LoRA）
        基于智谱AI GLM-Image模型，支持LoRA微调模型加载
        """)
        
        with gr.Row():
            # 左侧：输入和控制面板
            with gr.Column(scale=1):
                # 提示词输入
                with gr.Group():
                    gr.Markdown("### 提示词设置")
                    prompt = gr.Textbox(
                        label="正向提示词",
                        placeholder="描述你想要生成的图像...",
                        lines=3
                    )
                    negative_prompt = gr.Textbox(
                        label="负向提示词（可选）",
                        placeholder="描述你不想要的内容...",
                        lines=2
                    )
                
                # 基础参数
                with gr.Group():
                    gr.Markdown("### 生成参数")
                    
                    with gr.Row():
                        width = gr.Slider(
                            label="宽度",
                            minimum=512,
                            maximum=2048,
                            value=1024,
                            step=64
                        )
                        height = gr.Slider(
                            label="高度",
                            minimum=512,
                            maximum=2048,
                            value=1024,
                            step=64
                        )
                    
                    steps = gr.Slider(
                        label="推理步数",
                        minimum=20,
                        maximum=100,
                        value=50,
                        step=1
                    )
                    
                    guidance_scale = gr.Slider(
                        label="引导系数",
                        minimum=1.0,
                        maximum=20.0,
                        value=7.5,
                        step=0.5
                    )
                    
                    seed = gr.Number(
                        label="随机种子",
                        value=-1,
                        info="-1 表示随机种子"
                    )
                
                # LoRA设置
                with gr.Accordion("🎭 LoRA设置", open=False):
                    lora_model = gr.Dropdown(
                        label="选择LoRA模型",
                        choices=scan_lora_models(),
                        value="无",
                        info="选择要应用的LoRA风格模型"
                    )
                    
                    lora_scale = gr.Slider(
                        label="LoRA权重系数",
                        minimum=0.0,
                        maximum=2.0,
                        value=1.0,
                        step=0.1,
                        info="控制LoRA的影响程度"
                    )
                    
                    with gr.Row():
                        refresh_btn = gr.Button(" 刷新列表", size="sm")
                        unload_btn = gr.Button("🗑 卸载LoRA", size="sm")
                        status_btn = gr.Button(" 系统状态", size="sm")
                
                # 生成按钮
                generate_btn = gr.Button(" 生成图像", variant="primary", size="lg")
            
            # 右侧：输出和状态
            with gr.Column(scale=1):
                # 图像输出
                output_image = gr.Image(
                    label="生成的图像",
                    type="pil",
                    height=600
                )
                
                # 状态信息
                status_output = gr.Textbox(
                    label="状态信息",
                    lines=3,
                    interactive=False
                )
                
                # 系统状态显示
                status_display = gr.Markdown()
        
        # 事件处理
        generate_btn.click(
            fn=generate_image,
            inputs=[prompt, negative_prompt, width, height, steps, 
                   guidance_scale, seed, lora_model, lora_scale],
            outputs=[output_image, status_output]
        )
        
        refresh_btn.click(
            fn=refresh_lora_list,
            outputs=[lora_model]
        )
        
        unload_btn.click(
            fn=unload_current_lora,
            outputs=[status_output]
        )
        
        status_btn.click(
            fn=get_system_status,
            outputs=[status_display]
        )
        
        # 示例提示词
        gr.Examples(
            examples=[
                ["A beautiful sunset over mountains, digital art, 8k, highly detailed", "", 1024, 1024, 50, 7.5, -1, "无", 1.0],
                ["Portrait of a cyberpunk girl with neon lights, anime style", "blurry, low quality", 768, 1024, 60, 8.0, -1, "anime_style", 1.0],
                ["Ancient Chinese architecture, watercolor painting style", "modern, people", 1024, 768, 40, 6.0, 12345, "watercolor_art", 0.8]
            ],
            inputs=[prompt, negative_prompt, width, height, steps, guidance_scale, seed, lora_model, lora_scale],
            outputs=[output_image, status_output],
            fn=generate_image,
            cache_examples=False
        )
    
    return demo

if __name__ == "__main__":
    # 创建LoRA模型目录
    os.makedirs("/root/build/lora_models", exist_ok=True)
    
    # 启动界面
    demo = create_ui()
    demo.launch(
        server_name="0.0.0.0",
        server_port=7860,
        share=False
    )

6.2 创建LoRA模型目录

在启动前，需要创建LoRA模型目录：

# 创建LoRA模型存放目录
mkdir -p /root/build/lora_models

# 你可以在这里放置你的LoRA模型文件
# 例如：cp /path/to/your/lora.safetensors /root/build/lora_models/

6.3 更新启动脚本

修改start.sh，确保环境变量正确设置：

#!/bin/bash

# GLM-Image with LoRA WebUI 启动脚本

# 设置环境变量
export HF_HOME="/root/build/cache/huggingface"
export HUGGINGFACE_HUB_CACHE="/root/build/cache/huggingface/hub"
export TORCH_HOME="/root/build/cache/torch"
export HF_ENDPOINT="https://hf-mirror.com"

# 创建必要的目录
mkdir -p /root/build/outputs
mkdir -p /root/build/lora_models
mkdir -p /root/build/cache

# 启动WebUI
echo "启动 GLM-Image WebUI (支持LoRA)..."
echo "访问地址: http://localhost:7860"
echo "LoRA模型目录: /root/build/lora_models"

cd /root/build
python webui.py

7. 使用教程与效果展示

7.1 如何使用LoRA功能

现在你的GLM-Image Web界面已经支持LoRA了，使用方法很简单：

准备LoRA模型：
- 将你的.safetensors格式的LoRA模型文件放到/root/build/lora_models/目录
- 文件名就是你在界面上看到的名字（不含扩展名）
启动Web界面：
```
bash /root/build/start.sh
```
使用LoRA生成图像：
- 在界面上选择LoRA模型
- 调整LoRA权重系数（0.0-2.0）
- 输入提示词，点击生成

7.2 效果对比示例

让我们看看使用LoRA前后的效果对比：

不使用LoRA：

提示词："a beautiful girl, detailed face, portrait"
生成结果：写实风格的人像

使用动漫风格LoRA：

提示词："a beautiful girl, detailed face, portrait"
LoRA模型：anime_style
LoRA权重：1.0
生成结果：动漫风格的人像

使用水彩风格LoRA：

提示词："a beautiful girl, detailed face, portrait"
LoRA模型：watercolor_art
LoRA权重：0.8
生成结果：水彩画风格的人像

7.3 LoRA权重系数的影响

LoRA权重系数控制着LoRA模型的影响程度：

0.0：完全不用LoRA，相当于原始GLM-Image
0.5：LoRA效果减半，风格混合
1.0：完全应用LoRA效果
1.5：增强LoRA效果，风格更强烈
2.0：过度应用，可能产生扭曲

建议从1.0开始尝试，根据效果调整。

8. 常见问题与解决方案

8.1 LoRA加载失败

问题：界面显示"加载LoRA失败"

可能原因和解决方案：

文件格式不支持：

# 检查文件格式
file /root/build/lora_models/your_model.safetensors

# 只支持 .safetensors, .ckpt, .pt 格式

文件损坏：

# 重新下载LoRA模型
# 确保下载完整

路径错误：

# 检查文件是否存在
ls -la /root/build/lora_models/

# 检查文件权限
chmod 644 /root/build/lora_models/*.safetensors

8.2 显存不足

问题：生成时提示"显存不足"

解决方案：

降低分辨率：
- 从1024x1024降到768x768或512x512
减少推理步数：
- 从50步降到30步
卸载不用的LoRA：
- 点击"卸载LoRA"按钮释放显存

使用CPU Offload：

# 在代码中启用（默认已启用）
pipeline.enable_model_cpu_offload()

8.3 生成质量下降

问题：使用LoRA后图像质量变差

可能原因：

LoRA权重过高：尝试降低到0.7-0.9
LoRA与提示词冲突：调整提示词匹配LoRA风格
LoRA模型质量差：尝试其他LoRA模型

8.4 如何获取更多LoRA模型

你可以从这些地方找到公开的LoRA模型：

Civitai：最大的AI模型分享社区
Hugging Face：搜索"LoRA"相关模型
GitHub：一些开源项目提供预训练LoRA

下载后放到/root/build/lora_models/目录即可。

9. 总结

通过这篇教程，我们成功地为GLM-Image的Web界面添加了LoRA支持。现在你可以：

轻松加载LoRA：在界面上直接选择LoRA模型
动态切换风格：不同LoRA实现不同艺术风格
控制影响程度：通过权重系数微调LoRA效果
管理多个模型：支持多个LoRA模型切换使用

关键改进点回顾：

pipeline管理器：统一管理模型加载和LoRA切换
Gradio界面扩展：添加LoRA选择和控制控件
错误处理：完善的错误提示和恢复机制
性能优化：保持原有性能的同时增加功能

下一步可以尝试的：

混合多个LoRA：同时应用多个LoRA模型
LoRA训练界面：集成LoRA训练功能
模型管理：添加模型下载和删除功能
预设管理：保存常用的提示词+LoRA组合

这个定制化的pipeline不仅适用于GLM-Image，同样的思路也可以应用到其他diffusers模型上。希望这个教程能帮助你更好地使用和定制AI图像生成工具。

获取更多AI镜像

想探索更多AI镜像和应用场景？访问 CSDN星图镜像广场，提供丰富的预置镜像，覆盖大模型推理、图像生成、视频生成、模型微调等多个领域，支持一键部署。

AI Agent技术社区

Agent 垂直技术社区，欢迎活跃、内容共建。

更多推荐

从零开始：用Python搭建你的第一个财务数据分析智能体

AI Agent（人工智能智能体）可以理解为一个能自己“思考”并“动手做事”的AI程序。传统的AI就像一个问答机器人——你问一句，它答一句，像个只会接话的客服。而AI Agent更像一个有主见的助理——你给它一个目标（比如“帮我分析一下上季度的财务数据”），它会自己规划怎么做、调用什么工具、按什么顺序执行，最后把完整的结果交给你。传统AI是“你问什么它答什么”，AI Agent是“你给我目标，我自

AI Agent技术社区

smolagents：用代码思考的AI Agent框架

Hugging Face推出的smolagents框架是一个创新的AI Agent开发工具，通过让AI直接生成Python代码而非传统JSON指令来完成任务。该框架核心代码不足千行，设计极简且支持多种主流LLM模型和工具生态，包括多模态处理能力。相比传统方法，代码执行方式可减少30%的步骤，效率更高。框架提供沙箱安全方案，并有命令行工具支持非编程使用。其核心优势在于高效代码执行、简洁可修改的设计以

AI Agent技术社区

从 Prompt 到 Loop：理清 AI Agent 工程的概念演进

也就是说，模型之外的所有东西都是 Harness。你说"Harness"，可能指的是 Claude Code 这个产品我说"Harness"，可能指的是 Initializer + Coding Agent 这种设计模式他说"Harness"，可能指的是他项目里的 AGENT.md 配置文件三个人用同一个词，说的完全不是同一个东西。这就像说"软件工程"——你可能在说设计模式，也可能在说编程语言，也