AI头像生成器保姆级教程：Qwen3-32B模型微调适配与Gradio交互优化

郑丢丢

693人浏览 · 2026-03-23 01:25:56

郑丢丢 · 2026-03-23 01:25:56 发布

AI头像生成器保姆级教程：Qwen3-32B模型微调适配与Gradio交互优化

1. 引言：为什么你需要一个专属的AI头像生成器？

你有没有过这样的经历？想给自己换个酷炫的头像，但打开设计软件，面对空白的画布，脑子里却一片空白。或者，你尝试用Midjourney、Stable Diffusion这类AI绘图工具，但写出来的提示词总是差强人意，生成的头像要么不像自己，要么风格不对味。

这正是我开发这个AI头像生成器的初衷。它不是一个直接画图的工具，而是一个帮你“想点子”和“写脚本”的创意伙伴。你只需要用大白话描述一下想法，比如“我想要一个赛博朋克风格的、戴着护目镜的女生头像”，它就能帮你生成一段极其详细、专业、可以直接喂给AI绘图工具的“导演脚本”。

这个脚本会精确描述人物的五官、发型、表情、服装、背景、光影，甚至构图和艺术风格。本质上，它把Qwen3-32B这个大语言模型的强大理解力和创造力，通过微调和优化，变成了一个专为头像设计服务的“超级提示词工程师”。本教程将手把手带你完成从模型适配到交互界面优化的全过程，让你也能拥有一个专属的头像创意生成器。

2. 环境准备与项目初始化

在开始动手之前，我们需要把“厨房”准备好。整个过程不复杂，跟着步骤走就行。

2.1 基础环境检查

首先，确保你的电脑或服务器满足以下基本要求。这就像做饭前看看煤气和锅具是否齐全：

操作系统：推荐 Ubuntu 20.04/22.04 LTS 或 Windows 10/11（WSL2环境下）。本教程以Ubuntu为例。
Python版本：Python 3.8 到 3.10。建议使用3.9，兼容性最好。在终端输入 python3 --version 检查。
内存与显存：这是关键。Qwen3-32B模型本身比较大，但我们可以用量化版本来大幅降低需求。
- 方案A（推荐，省资源）：使用4-bit或8-bit量化模型，需要约 20-25GB 内存。不需要独立显卡（GPU）也能运行，速度稍慢但完全可用。
- 方案B（追求速度）：如果有GPU（如NVIDIA RTX 3090/4090或以上），使用16-bit精度模型，需要约 30GB以上显存。
磁盘空间：准备至少 40GB 可用空间，用于存放模型文件和依赖包。

2.2 一键部署脚本与依赖安装

我们创建一个项目文件夹，并准备好所有需要的“食材”。

# 1. 创建项目文件夹并进入
mkdir ai-avatar-generator && cd ai-avatar-generator

# 2. 创建Python虚拟环境（避免包版本冲突）
python3 -m venv venv
source venv/bin/activate  # Linux/Mac
# 如果是Windows，使用: venv\Scripts\activate

# 3. 创建requirements.txt文件，写入以下依赖
cat > requirements.txt << 'EOF'
torch>=2.0.0
transformers>=4.35.0
accelerate>=0.24.0
gradio>=4.0.0
sentencepiece  # Qwen模型的分词器需要
tiktoken       # 可选，用于更精确的token计数
peft>=0.7.0     # 用于模型微调（LoRA）
EOF

# 4. 安装依赖（这步可能需要一些时间）
pip install -r requirements.txt -i https://pypi.tuna.tsinghua.edu.cn/simple

如果安装torch时遇到问题，可以去PyTorch官网根据你的系统选择正确的安装命令。对于没有GPU的环境，安装CPU版本即可：pip install torch torchvision torchaudio --index-url https://download.pytorch.org/whl/cpu。

3. 核心步骤：Qwen3-32B模型的下载与本地加载

模型是我们的“核心大脑”。我们选择Qwen3-32B，因为它在中英文理解和创意写作上表现非常均衡。直接加载完整模型对硬件要求高，所以我们用量化技术来“瘦身”。

3.1 下载量化模型

我们使用Hugging Face Hub上的官方量化模型，这样下载快，占用资源少。

# download_model.py
from transformers import AutoModelForCausalLM, AutoTokenizer
import torch

model_name = "Qwen/Qwen3-32B-Instruct-Int4"  # 4-bit量化版本，内存需求小
# 如果你的硬件足够好，可以用 "Qwen/Qwen3-32B-Instruct" 获得更好效果

print(f"开始下载模型: {model_name}...")
print("这可能需要较长时间和大量磁盘空间，请保持网络连接。")

# 下载分词器（很快）
tokenizer = AutoTokenizer.from_pretrained(
    model_name,
    trust_remote_code=True  # Qwen模型需要这个参数
)

# 下载模型。设置low_cpu_mem_usage可以优化内存使用
model = AutoModelForCausalLM.from_pretrained(
    model_name,
    device_map="auto",           # 自动分配资源到GPU或CPU
    torch_dtype=torch.float16,   # 半精度，节省内存
    trust_remote_code=True,
    low_cpu_mem_usage=True
)

print("模型下载与加载完成！")
# 保存到本地，方便以后使用
model.save_pretrained("./local_qwen3_32b")
tokenizer.save_pretrained("./local_qwen3_32b")
print("模型已保存至本地目录: ./local_qwen3_32b")

运行这个脚本：python download_model.py。第一次运行会下载模型文件（约20GB），请耐心等待。下载完成后，以后就可以直接从./local_qwen3_32b加载，速度飞快。

3.2 编写基础对话函数

模型加载好后，我们先写个简单的函数测试一下，看它能不能正常聊天。

# test_model.py
from transformers import AutoModelForCausalLM, AutoTokenizer
import torch

def load_model_and_tokenizer(model_path="./local_qwen3_32b"):
    """加载本地模型和分词器"""
    tokenizer = AutoTokenizer.from_pretrained(model_path, trust_remote_code=True)
    model = AutoModelForCausalLM.from_pretrained(
        model_path,
        device_map="auto",
        torch_dtype=torch.float16,
        trust_remote_code=True
    )
    return model, tokenizer

def generate_response(model, tokenizer, prompt, max_length=500):
    """让模型生成回复"""
    # 构建Qwen的对话格式
    messages = [{"role": "user", "content": prompt}]
    text = tokenizer.apply_chat_template(
        messages,
        tokenize=False,
        add_generation_prompt=True
    )
    
    # 将文本转换为模型可理解的token
    inputs = tokenizer(text, return_tensors="pt").to(model.device)
    
    # 生成回复
    with torch.no_grad():  # 不计算梯度，节省内存
        outputs = model.generate(
            **inputs,
            max_new_tokens=max_length,
            do_sample=True,          # 启用随机采样，让输出更有创意
            temperature=0.8,         # 控制随机性：值越高越天马行空，值越低越保守
            top_p=0.9,               # 核采样，控制输出多样性
        )
    
    # 解码生成的结果，并跳过输入部分
    generated_ids = outputs[0][inputs['input_ids'].shape[1]:]
    response = tokenizer.decode(generated_ids, skip_special_tokens=True)
    return response

# 测试一下
if __name__ == "__main__":
    print("正在加载模型...")
    model, tokenizer = load_model_and_tokenizer()
    print("模型加载成功！")
    
    test_prompt = "用一句话描述一个科幻感十足的男生头像。"
    print(f"\n你的问题: {test_prompt}")
    
    answer = generate_response(model, tokenizer, test_prompt)
    print(f"AI的回答: {answer}")

运行测试：python test_model.py。如果看到模型输出了一个关于头像的描述句子，恭喜你，最核心的一步已经成功了！你的本地AI大脑已经开始运转了。

4. 模型微调实战：让AI成为头像设计专家

现在模型虽然能聊天，但它还不是“头像设计专家”。我们需要通过微调，教会它专门生成高质量的头像描述文案。微调就像给一个聪明的学生进行专项培训。

4.1 准备训练数据

我们不需要海量数据，几百条高质量、成对的“用户需求-AI描述”样本就够了。数据格式很简单：

# avatar_dataset.json
[
  {
    "instruction": "生成一个赛博朋克风格的女性游戏角色头像，要酷一点。",
    "input": "",
    "output": "**人物主题：** 赛博朋克网络女武士\\n\\n**详细描述：**\\n- **面部与五官：** 亚洲女性面孔，锐利明亮的紫色瞳孔，眼角有微小的电路板纹身荧光纹路，表情冷峻自信。黑色短发，一侧剃短，另一侧挑染霓虹粉。\\n- **服装与配饰：** 穿着哑光黑色高科技紧身战斗服，肩部有发光的蓝色全息护甲，颈部有金属颈环，连接着闪烁的数据线。耳朵上挂有多重几何形状的金属耳骨夹。\\n- **背景与光影：** 身处潮湿的霓虹都市小巷，背景是模糊的繁体字全息广告牌和滴水的管道。整体采用蓝紫粉色调的霓虹灯光，面部有强烈的侧光，形成鲜明的明暗对比。\\n- **构图与风格：** 肖像特写，强调眼神。赛博朋克插画风格，细节精密，带有轻微的胶片颗粒感和光晕效果。\\n\\n**优化提示词（英文，用于AI绘图）：**\\ncyberpunk female warrior portrait, Asian woman with sharp purple eyes, circuit board tattoo near eye, black short hair with neon pink streak, wearing matte black high-tech combat suit with glowing blue holographic shoulder armor, in a rainy neon-lit alley with holographic advertisements, blue purple pink neon lighting, dramatic side lighting, portrait close-up, cyberpunk illustration style, intricate details, cinematic, octane render, 8k"
  },
  {
    "instruction": "想要一个温暖阳光的卡通风格小猫头像，看起来要可爱治愈。",
    "input": "",
    "output": "**人物主题：** 午后阳光下的慵懒小猫\\n\\n**详细描述：**\\n- **形象特征：** 一只橘色条纹的小奶猫，圆滚滚的脑袋，睁着大大的、琥珀色的眼睛，眼神好奇又温柔。粉色的鼻子和小嘴巴，耳朵微微向前倾。\\n- **姿态与表情：** 小猫正蜷缩在一个毛线编织的篮子里，爪子抱着一颗毛线球，表情放松惬意，仿佛在打盹。\\n- **背景与氛围：** 背景是洒满阳光的木质窗台，窗台上有一盆绿植（如多肉）。温暖的金黄色阳光从窗户斜射进来，形成柔和的光斑和长长的影子，空气中可见细微的浮尘。整体氛围温馨、宁静、治愈。\\n- **构图与风格：** 对称构图，焦点集中在小猫脸上。扁平卡通插画风格，线条简洁流畅，色彩明亮温暖，色块干净，无复杂阴影。\\n\\n**优化提示词（英文，用于AI绘图）：**\\nA cute cartoon style little orange tabby kitten, with big amber eyes, curled up in a knitting basket holding a yarn ball, on a sunny wooden windowsill with a potted succulent, warm golden sunlight streaming through the window, creating soft light spots, flat illustration style, clean lines, bright and warm colors, cozy and healing atmosphere, vector art, 4k"
  }
]

你需要收集或编写几十到上百条这样的数据。instruction是用户指令，output是你希望模型学习的标准输出格式。注意，输出格式被清晰地分成了详细描述和优化提示词两部分，这是我们希望模型学会的结构。

4.2 使用LoRA进行高效微调

全参数微调32B的模型需要巨大的算力。我们采用LoRA（Low-Rank Adaptation）技术，它只训练模型的一小部分参数，效果却接近全参数微调，速度快，资源消耗小。

# fine_tune_lora.py
from datasets import Dataset
import json
from transformers import AutoModelForCausalLM, AutoTokenizer, TrainingArguments
from peft import LoraConfig, get_peft_model, TaskType
from trl import SFTTrainer
import torch

# 1. 加载数据
with open('avatar_dataset.json', 'r', encoding='utf-8') as f:
    raw_data = json.load(f)

# 转换为训练格式：将instruction和output拼接
def format_example(example):
    # 构建Qwen的对话格式
    messages = [
        {"role": "user", "content": example['instruction']},
        {"role": "assistant", "content": example['output']}
    ]
    # 使用分词器的模板功能，将对话格式化为一个长文本
    formatted_text = tokenizer.apply_chat_template(
        messages,
        tokenize=False,
        add_generation_prompt=False  # 训练时不需要生成提示
    )
    return {"text": formatted_text}

# 加载模型和分词器（使用之前下载的本地模型）
model_path = "./local_qwen3_32b"
tokenizer = AutoTokenizer.from_pretrained(model_path, trust_remote_code=True)
model = AutoModelForCausalLM.from_pretrained(
    model_path,
    device_map="auto",
    torch_dtype=torch.float16,
    trust_remote_code=True
)

# 设置分词器的padding token（如果未设置）
if tokenizer.pad_token is None:
    tokenizer.pad_token = tokenizer.eos_token

# 2. 配置LoRA
lora_config = LoraConfig(
    task_type=TaskType.CAUSAL_LM,  # 因果语言模型任务
    r=8,                           # LoRA的秩，越小参数量越少，一般8-32
    lora_alpha=32,                 # 缩放参数
    lora_dropout=0.1,              # Dropout率，防止过拟合
    target_modules=["q_proj", "v_proj"]  # 对模型中的query和value投影层进行微调
)

# 应用LoRA配置到模型
model = get_peft_model(model, lora_config)
model.print_trainable_parameters()  # 打印可训练参数量，会发现只占原模型的<1%

# 3. 准备数据集
dataset = Dataset.from_list(raw_data)
dataset = dataset.map(format_example)
# 拆分训练集和验证集（90%训练，10%验证）
split_dataset = dataset.train_test_split(test_size=0.1)
train_dataset = split_dataset["train"]
eval_dataset = split_dataset["test"]

# 4. 设置训练参数
training_args = TrainingArguments(
    output_dir="./lora_checkpoints",  # 检查点保存路径
    num_train_epochs=3,               # 训练轮数，数据少可以适当增加
    per_device_train_batch_size=2,    # 每设备批大小，根据显存调整
    per_device_eval_batch_size=2,
    gradient_accumulation_steps=4,    # 梯度累积步数，模拟更大批次
    warmup_steps=50,                  # 热身步数
    logging_steps=10,                 # 每10步记录一次日志
    save_steps=100,                   # 每100步保存一次检查点
    eval_steps=100,                   # 每100步评估一次
    evaluation_strategy="steps",
    save_strategy="steps",
    learning_rate=2e-4,               # 学习率，LoRA可以设大一点
    fp16=True,                        # 使用半精度训练（GPU）
    # bf16=True,                      # 如果显卡支持bfloat16，可以用这个（如A100）
    load_best_model_at_end=True,
    report_to="none",                 # 不报告到其他平台（如wandb）
)

# 5. 创建训练器
trainer = SFTTrainer(
    model=model,
    args=training_args,
    train_dataset=train_dataset,
    eval_dataset=eval_dataset,
    tokenizer=tokenizer,
    max_seq_length=1024,              # 最大序列长度
)

# 6. 开始训练！
print("开始LoRA微调训练...")
trainer.train()
print("训练完成！")

# 7. 保存LoRA适配器权重
model.save_pretrained("./avatar_lora_adapter")
print("LoRA适配器权重已保存至: ./avatar_lora_adapter")

运行这个训练脚本：python fine_tune_lora.py。训练时间取决于数据量大小和你的硬件。在消费级GPU上，几百条数据训练几轮可能只需要几十分钟到几小时。训练完成后，你会得到一个./avatar_lora_adapter文件夹，里面只包含微调过的少量参数（通常只有几十MB），而不是整个30GB的模型。

5. 构建Gradio交互界面：让创意生成触手可及

模型训练好了，但总不能每次都写代码调用。我们需要一个漂亮的网页界面，让任何人打开浏览器就能用。Gradio库能让我们用很少的代码就实现这个目标。

5.1 创建基础Web界面

我们先创建一个最简单的界面，包含输入框和输出框。

# app_basic.py
import gradio as gr
from transformers import AutoModelForCausalLM, AutoTokenizer
from peft import PeftModel
import torch

# 加载基础模型和LoRA适配器
def load_fine_tuned_model(base_model_path="./local_qwen3_32b", lora_path="./avatar_lora_adapter"):
    """加载基础模型并合并LoRA权重"""
    print("加载基础模型...")
    tokenizer = AutoTokenizer.from_pretrained(base_model_path, trust_remote_code=True)
    base_model = AutoModelForCausalLM.from_pretrained(
        base_model_path,
        device_map="auto",
        torch_dtype=torch.float16,
        trust_remote_code=True
    )
    
    print("加载LoRA适配器...")
    model = PeftModel.from_pretrained(base_model, lora_path)
    # 将LoRA权重与基础模型合并，这样推理时就不需要额外处理了
    model = model.merge_and_unload()
    
    return model, tokenizer

# 初始化模型（全局加载一次，避免每次调用都重复加载）
model, tokenizer = load_fine_tuned_model()
print("模型加载完毕，启动Gradio界面...")

def generate_avatar_desc(user_input):
    """核心生成函数"""
    # 构建更明确的系统提示，引导模型按照我们想要的格式输出
    system_prompt = """你是一个专业的头像设计师和AI绘图提示词专家。请根据用户的需求，生成一份详细的头像设计文案。
文案必须包含以下两个部分：
1. **详细描述**：分点描述人物特征、表情、背景、光影等。
2. **优化提示词**：提供一段优化后的英文提示词，可直接用于Midjourney、Stable Diffusion等AI绘图工具。
请确保描述生动具体，提示词专业有效。"""
    
    full_prompt = f"{system_prompt}\\n\\n用户需求：{user_input}"
    
    # 调用模型生成
    messages = [{"role": "user", "content": full_prompt}]
    text = tokenizer.apply_chat_template(
        messages,
        tokenize=False,
        add_generation_prompt=True
    )
    
    inputs = tokenizer(text, return_tensors="pt").to(model.device)
    
    with torch.no_grad():
        outputs = model.generate(
            **inputs,
            max_new_tokens=800,      # 生成更长、更详细的描述
            do_sample=True,
            temperature=0.7,
            top_p=0.9,
            repetition_penalty=1.1,   # 避免重复
        )
    
    generated_ids = outputs[0][inputs['input_ids'].shape[1]:]
    response = tokenizer.decode(generated_ids, skip_special_tokens=True)
    return response

# 创建Gradio界面
with gr.Blocks(title="AI头像创意生成器", theme=gr.themes.Soft()) as demo:
    gr.Markdown("# 🎨 AI头像创意生成器")
    gr.Markdown("描述你想要的风格，AI将生成详细的设计文案和AI绘图提示词。")
    
    with gr.Row():
        with gr.Column(scale=2):
            user_input = gr.Textbox(
                label="描述你的头像创意",
                placeholder="例如：一个在图书馆看书的古风少女，温柔安静的感觉...",
                lines=3
            )
            generate_btn = gr.Button("生成创意文案", variant="primary")
        
        with gr.Column(scale=3):
            output = gr.Textbox(label="生成结果", lines=18, interactive=False)
    
    # 绑定按钮点击事件
    generate_btn.click(fn=generate_avatar_desc, inputs=user_input, outputs=output)
    
    # 添加一些示例，方便用户参考
    gr.Examples(
        examples=[
            ["赛博朋克风格的机械师男生，戴着护目镜，背景是未来都市"],
            ["宫崎骏动画风格的可爱小女孩，抱着龙猫，在森林里"],
            ["专业职场LinkedIn头像，商务精英，自信微笑，浅灰色背景"],
            ["水墨画风格的武侠剑客，背影，在竹林里"],
        ],
        inputs=user_input,
        label="点击试试这些示例"
    )

# 启动服务
if __name__ == "__main__":
    demo.launch(server_name="0.0.0.0", server_port=8080, share=False)

运行这个应用：python app_basic.py。然后在浏览器中打开 http://localhost:8080，你就能看到第一个可用的头像生成器了！输入描述，点击按钮，就能得到专业的输出。

5.2 界面优化与功能增强

基础版能用，但还不够好。我们给它加点“特效”，让体验更上一层楼。

# app_enhanced.py
import gradio as gr
import random
from transformers import AutoModelForCausalLM, AutoTokenizer
from peft import PeftModel
import torch

# （模型加载函数与之前相同，此处省略...）
model, tokenizer = load_fine_tuned_model()

def generate_avatar_desc_enhanced(user_input, style_choice, detail_level):
    """增强版生成函数，支持风格选择和细节控制"""
    # 风格词典，为不同风格添加特定的引导词
    style_prompts = {
        "默认": "",
        "赛博朋克": "请采用赛博朋克风格，强调霓虹灯光、机械元素、未来都市感。",
        "古风": "请采用中国古风风格，强调水墨意境、传统服饰、古典雅致。",
        "动漫": "请采用动漫/二次元风格，线条清晰，色彩鲜明，人物可爱或帅气。",
        "写实": "请采用超写实摄影风格，注重皮肤质感、真实光影、细节刻画。",
        "简约": "请采用极简主义风格，构图简洁，色彩单纯，突出主体。"
    }
    
    # 细节级别控制生成长度和丰富度
    detail_length = {
        "简洁": 400,
        "标准": 700,
        "详细": 1000
    }
    
    system_prompt = f"""你是一个专业的头像设计师和AI绘图提示词专家。请根据用户的需求，生成一份详细的头像设计文案。
{style_prompts.get(style_choice, '')}
文案必须包含以下两个部分：
1. **详细描述**：分点描述人物特征、表情、背景、光影等。
2. **优化提示词**：提供一段优化后的英文提示词，可直接用于Midjourney、Stable Diffusion等AI绘图工具。
请确保描述生动具体，提示词专业有效。"""
    
    full_prompt = f"{system_prompt}\\n\\n用户需求：{user_input}"
    
    # 调用模型生成
    messages = [{"role": "user", "content": full_prompt}]
    text = tokenizer.apply_chat_template(messages, tokenize=False, add_generation_prompt=True)
    inputs = tokenizer(text, return_tensors="pt").to(model.device)
    
    with torch.no_grad():
        outputs = model.generate(
            **inputs,
            max_new_tokens=detail_length.get(detail_level, 700),
            do_sample=True,
            temperature=0.7,
            top_p=0.9,
            repetition_penalty=1.1,
        )
    
    generated_ids = outputs[0][inputs['input_ids'].shape[1]:]
    response = tokenizer.decode(generated_ids, skip_special_tokens=True)
    return response

def random_style_prompt():
    """随机返回一个风格示例，激发用户灵感"""
    prompts = [
        "一个在星空下弹钢琴的男孩，忧郁文艺风",
        "未来战士女角色，机甲风格，战斗姿态",
        "咖啡馆里的猫咪老板，拟人化，戴着眼镜",
        "山海经神兽拟人，白泽，仙气飘飘",
        "复古电子游戏像素风，8-bit英雄头像"
    ]
    return random.choice(prompts)

# 创建更丰富的Gradio界面
with gr.Blocks(title="AI头像创意生成器 - 增强版", theme=gr.themes.Soft(), css="footer {visibility: hidden}") as demo:
    gr.Markdown("""
    # 🎨 AI头像创意生成器 - 增强版
    ### 描述想法，获取专业级头像设计文案与AI绘图提示词
    """)
    
    with gr.Row():
        with gr.Column(scale=1):
            # 灵感激发区
            gr.Markdown("### 💡 灵感速递")
            example_display = gr.Textbox(label="随机灵感", interactive=False, lines=2)
            refresh_btn = gr.Button("换一个灵感", size="sm")
            
            # 风格选择区
            gr.Markdown("### 🎭 风格选择")
            style_choice = gr.Radio(
                choices=["默认", "赛博朋克", "古风", "动漫", "写实", "简约"],
                value="默认",
                label="偏好风格（可选）"
            )
            
            # 细节控制
            gr.Markdown("### 📝 细节控制")
            detail_level = gr.Radio(
                choices=["简洁", "标准", "详细"],
                value="标准",
                label="描述详细程度"
            )
            
            gr.Markdown("---")
            gr.Markdown("**小提示**：描述越具体，生成结果越符合预期！")
        
        with gr.Column(scale=2):
            # 主输入输出区
            user_input = gr.Textbox(
                label="描述你的头像创意",
                placeholder="例如：一个在图书馆看书的古风少女，温柔安静的感觉...",
                lines=4
            )
            
            with gr.Row():
                generate_btn = gr.Button("✨ 生成创意文案", variant="primary", size="lg")
                clear_btn = gr.Button("清空", size="lg")
            
            output = gr.Textbox(
                label="生成结果",
                lines=18,
                interactive=False,
                show_copy_button=True  # Gradio新功能，显示复制按钮
            )
    
    # 功能区
    with gr.Accordion("📋 常用提示词模板", open=False):
        gr.Markdown("""
        - **人物基础**：`[年龄][性别]，[发型][发色]，[脸型]，[五官特点]`
        - **表情神态**：`[表情]，眼神[特点]，嘴角[细节]`
        - **服装配饰**：`穿着[服装]，佩戴[配饰]，[材质][颜色]`
        - **背景环境**：`在[地点]，有[元素]，[时间][天气]`
        - **光影氛围**：`[光线]照射，[色调]，[氛围感]`
        - **构图风格**：`[构图方式]，[艺术风格]，[细节级别]`
        """)
    
    # 绑定交互事件
    refresh_btn.click(fn=random_style_prompt, outputs=example_display)
    # 点击灵感示例，自动填入输入框
    example_display.change(fn=lambda x: x, inputs=example_display, outputs=user_input)
    
    generate_btn.click(
        fn=generate_avatar_desc_enhanced,
        inputs=[user_input, style_choice, detail_level],
        outputs=output
    )
    clear_btn.click(fn=lambda: ("", ""), outputs=[user_input, output])

# 启动服务
if __name__ == "__main__":
    demo.launch(
        server_name="0.0.0.0",
        server_port=8080,
        share=False,
        show_error=True
    )

这个增强版界面多了风格选择、细节控制、灵感激发和提示词模板等功能，用户体验更加友好。运行python app_enhanced.py试试看吧！