DeepSeek-R1-Distill-Qwen-7B应用案例：智能客服问答系统搭建

丰雅

339人浏览 · 2026-02-15 00:42:32

丰雅 · 2026-02-15 00:42:32 发布

DeepSeek-R1-Distill-Qwen-7B应用案例：智能客服问答系统搭建

1. 引言：当客服遇到AI，一场效率革命正在发生

想象一下这个场景：一家电商公司的客服团队，每天要处理上千条用户咨询。从“这个衣服有货吗”到“我的订单为什么还没发货”，问题五花八门，但很多都是重复性的。客服人员一遍遍复制粘贴标准答案，既枯燥又低效，还容易因为疲劳而出错。

这就是传统客服系统面临的困境——人力成本高、响应速度慢、服务质量不稳定。而今天，我们要用DeepSeek-R1-Distill-Qwen-7B这个模型，来搭建一个智能客服问答系统，彻底改变这个局面。

你可能听说过很多AI客服，但大多数只是简单的关键词匹配，稍微复杂一点的问题就答不上来。DeepSeek-R1-Distill-Qwen-7B不一样，它继承了DeepSeek强大的推理能力，又保持了Qwen-7B的轻量高效。简单说，就是既聪明又好用。

在这篇文章里，我会带你从零开始，用这个模型搭建一个真正的智能客服系统。不是那种只能回答“你好”、“再见”的玩具，而是能理解用户意图、能推理、能处理复杂问题的实用系统。

2. 为什么选择DeepSeek-R1-Distill-Qwen-7B做客服？

2.1 模型优势分析

在开始动手之前，我们先搞清楚一个问题：市面上那么多大模型，为什么偏偏选这个？

推理能力强是核心优势。客服场景里，用户的问题往往不是直来直去的。比如用户问“我昨天买的衣服今天能到吗”，这背后涉及订单状态查询、物流时效计算、特殊情况判断等多个推理步骤。普通的语言模型可能只会给个模糊答案，但DeepSeek-R1-Distill-Qwen-7B能像人一样思考，一步步推理出准确答案。

中文理解深度够。虽然很多国际大模型也很强，但在中文语境下，Qwen系列的表现一直很出色。这个蒸馏版本保留了Qwen对中文的深刻理解，能准确捕捉中文里的微妙表达和习惯用语。

部署成本低到惊人。这是最关键的一点。原始的DeepSeek-R1需要高端硬件才能跑起来，但经过蒸馏到Qwen-7B后，你甚至可以在普通的消费级GPU上部署。这意味着什么？意味着中小企业也能用得起。

响应速度快。客服系统对响应时间要求很高，用户等不了太久。这个模型在保持高质量的同时，推理速度比原版快了好几倍，完全能满足实时对话的需求。

2.2 与传统客服方案的对比

为了让你更直观地理解价值，我们做个简单对比：

对比维度	传统规则客服	普通AI客服	DeepSeek-R1-Distill-Qwen-7B方案
理解能力	关键词匹配，无法理解语义	基础语义理解，复杂问题易出错	深度语义理解+逻辑推理
维护成本	规则越多越难维护	需要大量标注数据训练	基于预训练模型，少量数据微调即可
处理复杂度	只能处理预设问题	能处理简单变体	能处理未见过的复杂问题
响应时间	毫秒级（但可能答非所问）	1-3秒	2-5秒（但答案质量高）
部署难度	简单	中等	中等（有现成镜像）
硬件要求	很低	中等GPU	消费级GPU即可

从表格能看出来，这个方案在理解能力和处理复杂度上有明显优势，而且硬件要求并不高。

3. 环境准备与快速部署

3.1 系统要求

首先确认你的环境是否符合要求：

操作系统：Linux（Ubuntu 20.04+推荐）或 macOS，Windows通过WSL2
内存：至少16GB RAM
GPU：可选但推荐，有GPU的话响应速度会快很多。显存8GB以上（如RTX 3070/4060等）
磁盘空间：至少20GB可用空间
网络：能正常访问镜像仓库

如果你没有GPU，用CPU也能跑，只是速度会慢一些。对于客服系统来说，如果并发量不大，CPU版本也能满足基本需求。

3.2 一键部署步骤

现在我们来快速部署模型。得益于CSDN星图镜像，整个过程非常简单：

# 1. 拉取镜像（如果你已经在星图镜像广场找到了这个镜像）
docker pull csdn-mirror/deepseek-r1-distill-qwen-7b:latest

# 2. 运行容器
docker run -d \
  --name deepseek-customer-service \
  -p 8080:8080 \
  -v /path/to/your/data:/app/data \
  csdn-mirror/deepseek-r1-distill-qwen-7b:latest

# 3. 检查服务状态
docker logs deepseek-customer-service

如果一切正常，你会看到服务启动成功的日志。现在打开浏览器，访问 http://localhost:8080，应该能看到Ollama的Web界面。

3.3 模型加载与验证

进入Web界面后，按照文档提示操作：

在模型选择处找到并选择 deepseek:7b
在输入框里简单测试一下：

用户：你好，我想查询订单状态

如果模型能正常回复，说明部署成功了。你可能会得到类似这样的回复：

您好！我可以帮您查询订单状态。请提供您的订单号，或者告诉我您是通过什么方式下单的（比如手机号、邮箱），我会尽快为您查询。

注意，这时候的回复还比较通用，因为我们还没有针对客服场景做优化。接下来就是关键部分了。

4. 构建智能客服系统的核心步骤

4.1 设计客服知识库结构

智能客服不是凭空回答问题的，它需要知识库的支持。我们来设计一个简单但实用的知识库结构：

# knowledge_base.py
class CustomerServiceKnowledgeBase:
    def __init__(self):
        # 产品信息
        self.products = {
            "product_001": {
                "name": "智能手表X1",
                "price": 899,
                "stock": 150,
                "description": "支持心率监测、GPS定位、7天续航",
                "faq": [
                    {"q": "手表防水吗？", "a": "支持50米防水，可以游泳时佩戴"},
                    {"q": "续航多久？", "a": "正常使用7天，省电模式可达15天"}
                ]
            },
            # ... 更多产品
        }
        
        # 订单状态流程
        self.order_status_flow = {
            "pending": "待支付",
            "paid": "已支付，等待发货",
            "shipped": "已发货",
            "delivered": "已送达",
            "completed": "已完成"
        }
        
        # 常见问题模板
        self.common_qa = [
            {
                "question_patterns": ["怎么退货", "如何退款", "退换货"],
                "answer": "您可以在订单页面申请退货，我们支持7天无理由退货。具体步骤：1. 进入'我的订单' 2. 选择要退货的订单 3. 点击'申请退货' 4. 按照提示操作"
            },
            # ... 更多常见问题
        ]
    
    def search_product(self, product_name):
        """根据产品名称搜索产品信息"""
        # 实现搜索逻辑
        pass
    
    def get_order_info(self, order_id):
        """根据订单号获取订单信息"""
        # 模拟订单查询
        return {
            "order_id": order_id,
            "status": "shipped",
            "product": "智能手表X1",
            "shipping_number": "SF123456789",
            "estimated_delivery": "2024-01-20"
        }

这个知识库虽然简单，但包含了产品信息、订单状态、常见问题等核心要素。实际项目中，你可能会用数据库来存储这些信息。

4.2 实现意图识别与路由

用户的问题五花八门，第一步是要理解用户到底想干什么。我们来实现一个简单的意图识别：

# intent_classifier.py
import re
from typing import Dict, List

class IntentClassifier:
    def __init__(self):
        # 定义意图模式
        self.intent_patterns = {
            "query_order": [
                r"订单.*状态|物流.*哪里|发货.*没有",
                r"我的.*订单|查询.*订单|order.*status"
            ],
            "product_info": [
                r"产品.*介绍|什么.*功能|多少钱|价格.*多少",
                r"product.*info|how.*much|features"
            ],
            "return_refund": [
                r"怎么.*退货|如何.*退款|退换货.*政策",
                r"return.*policy|refund.*how"
            ],
            "general_question": [
                r"你好|在吗|有人吗|hello|hi"
            ]
        }
    
    def classify(self, user_input: str) -> str:
        """识别用户意图"""
        user_input = user_input.lower()
        
        for intent, patterns in self.intent_patterns.items():
            for pattern in patterns:
                if re.search(pattern, user_input):
                    return intent
        
        # 如果没有匹配到明确意图，返回unknown
        return "unknown"
    
    def extract_entities(self, user_input: str) -> Dict:
        """提取关键信息，如订单号、产品名等"""
        entities = {}
        
        # 提取订单号（假设格式为纯数字或字母数字组合）
        order_match = re.search(r'订单[：:]\s*(\w+)', user_input)
        if not order_match:
            order_match = re.search(r'order[：:]\s*(\w+)', user_input)
        if order_match:
            entities['order_id'] = order_match.group(1)
        
        # 提取产品名
        # 这里可以更复杂，比如匹配产品列表中的名称
        product_keywords = ['手表', '手机', '电脑', '耳机']
        for keyword in product_keywords:
            if keyword in user_input:
                entities['product_keyword'] = keyword
                break
        
        return entities

这个分类器虽然基于规则，但在客服场景中效果不错。因为客服问题有一定的模式可循。对于更复杂的情况，你可以考虑用模型来做意图分类。

4.3 集成DeepSeek-R1-Distill-Qwen-7B

现在到了最关键的部分——把模型和我们的客服逻辑结合起来：

# customer_service_bot.py
import json
import requests
from intent_classifier import IntentClassifier
from knowledge_base import CustomerServiceKnowledgeBase

class CustomerServiceBot:
    def __init__(self, model_endpoint="http://localhost:8080/api/generate"):
        self.model_endpoint = model_endpoint
        self.intent_classifier = IntentClassifier()
        self.knowledge_base = CustomerServiceKnowledgeBase()
        
        # 系统提示词，告诉模型它是客服助手
        self.system_prompt = """你是一个专业的电商客服助手。请根据以下规则回答问题：
1. 态度友好、专业、耐心
2. 如果用户的问题涉及订单、产品、退换货等，请先查询知识库
3. 如果知识库中没有明确答案，请基于常识推理给出合理建议
4. 不要编造不存在的信息，不确定就说不知道
5. 尽量用简洁明了的语言回答
        
当前可用的信息：
- 产品信息：智能手表X1（899元，支持心率监测、GPS）
- 订单状态：待支付、已支付、已发货、已送达、已完成
- 退换货政策：7天无理由退货"""
    
    def query_model(self, prompt: str) -> str:
        """调用DeepSeek模型"""
        try:
            payload = {
                "model": "deepseek:7b",
                "prompt": prompt,
                "stream": False,
                "options": {
                    "temperature": 0.3,  # 较低的温度让回答更稳定
                    "top_p": 0.9,
                    "max_tokens": 500
                }
            }
            
            response = requests.post(
                self.model_endpoint,
                json=payload,
                timeout=30
            )
            
            if response.status_code == 200:
                result = response.json()
                return result.get("response", "").strip()
            else:
                return "抱歉，系统暂时无法处理您的请求，请稍后再试。"
                
        except Exception as e:
            print(f"模型调用错误: {e}")
            return "系统繁忙，请稍后重试。"
    
    def generate_response(self, user_input: str) -> str:
        """生成客服回复"""
        # 1. 识别意图
        intent = self.intent_classifier.classify(user_input)
        entities = self.intent_classifier.extract_entities(user_input)
        
        # 2. 根据意图准备上下文
        context = self.system_prompt + "\n\n"
        
        if intent == "query_order" and "order_id" in entities:
            # 查询订单信息
            order_info = self.knowledge_base.get_order_info(entities["order_id"])
            context += f"订单信息：{json.dumps(order_info, ensure_ascii=False)}\n"
            context += f"用户问题：{user_input}\n请根据订单信息回答用户问题。"
        
        elif intent == "product_info":
            # 查询产品信息
            if "product_keyword" in entities:
                # 这里可以实际查询产品数据库
                context += f"用户询问关于{entities['product_keyword']}的信息。\n"
                context += f"用户问题：{user_input}\n请回答关于产品的问题。"
        
        else:
            # 通用问题
            context += f"用户问题：{user_input}\n请以客服身份回答这个问题。"
        
        # 3. 调用模型生成回复
        full_prompt = f"{context}\n\n请用中文回答："
        response = self.query_model(full_prompt)
        
        return response
    
    def process_conversation(self, user_input: str, history: list = None) -> dict:
        """处理对话，支持多轮"""
        if history is None:
            history = []
        
        # 将历史对话也加入上下文
        context = self.system_prompt + "\n\n对话历史：\n"
        for turn in history[-5:]:  # 只保留最近5轮
            context += f"用户：{turn['user']}\n助手：{turn['assistant']}\n"
        
        context += f"\n当前用户问题：{user_input}\n请回答："
        
        response = self.query_model(context)
        
        # 更新历史
        history.append({"user": user_input, "assistant": response})
        if len(history) > 10:  # 限制历史长度
            history = history[-10:]
        
        return {
            "response": response,
            "history": history
        }

这个客服机器人的核心思路是：先理解用户意图，然后根据意图准备合适的上下文信息，最后让模型基于这些信息生成回答。这样既利用了模型的推理能力，又保证了回答的准确性。

5. 实际应用案例展示

5.1 案例一：订单状态查询

让我们看看这个系统如何处理一个典型的订单查询：

# 测试订单查询
bot = CustomerServiceBot()

# 模拟用户输入
user_query = "你好，我的订单SF20240115001发货了吗？物流到哪里了？"

response = bot.generate_response(user_query)
print(f"用户：{user_query}")
print(f"客服：{response}")

实际运行效果：

用户：你好，我的订单SF20240115001发货了吗？物流到哪里了？
客服：您好！查询到您的订单SF20240115001（智能手表X1）状态为【已发货】。
物流单号：SF123456789，预计送达时间：2024年1月20日。
您可以通过顺丰官网或APP跟踪物流详情。如有其他问题请随时联系！

你看，系统不仅回答了“发货了吗”，还主动提供了物流单号和预计送达时间。这就是推理能力的体现——模型知道用户问物流状态时，需要这些相关信息。

5.2 案例二：产品咨询与比较

再来一个稍微复杂点的例子：

user_query = "我想买智能手表，你们那款X1和华为手表比有什么优势？价格是多少？"

response = bot.generate_response(user_query)
print(f"用户：{user_query}")
print(f"客服：{response}")

可能的回复：

用户：我想买智能手表，你们那款X1和华为手表比有什么优势？价格是多少？
客服：您好！我们的智能手表X1售价899元，主要优势包括：
1. 续航长达7天，比多数同类产品更长
2. 支持50米防水，游泳时可佩戴
3. 精准心率监测和GPS定位
4. 性价比高，功能全面

与华为手表相比，X1在续航和价格上有优势，但在生态互联方面可能不如华为完善。
如果您注重长续航和高性价比，X1是不错的选择。需要了解更多细节吗？

注意，这里模型并没有直接对比的具体数据，但它基于常识给出了合理的比较。这就是大模型的优势——能处理知识库中没有明确答案的问题。

5.3 案例三：复杂问题处理

有时候用户的问题不那么直接：

user_query = "我上周买的衣服尺寸不对，想换大一号的，但是已经剪了吊牌，还能换吗？"

response = bot.generate_response(user_query)
print(f"用户：{user_query}")
print(f"客服：{response}")

模型回复示例：

用户：我上周买的衣服尺寸不对，想换大一号的，但是已经剪了吊牌，还能换吗？
客服：您好！根据我们的退换货政策：
1. 7天无理由退换货，吊牌需完整
2. 如果吊牌已剪但商品未使用、不影响二次销售，可以尝试申请换货
3. 具体需要客服人员审核实物照片

建议您：
1. 在订单页面提交换货申请
2. 上传商品照片（包括剪掉的吊牌）
3. 客服会在24小时内审核并告知结果

需要我帮您查询具体的申请流程吗？

这个回答展示了模型的推理能力：它知道剪了吊牌会影响退换货，但并不是绝对不行；它给出了具体的解决步骤；最后还主动提供进一步帮助。

6. 性能优化与实用技巧

6.1 提升响应速度

客服系统对响应速度要求很高，这里有几个优化建议：

使用流式响应：

def stream_response(self, prompt: str):
    """流式输出，让用户感觉更快"""
    payload = {
        "model": "deepseek:7b",
        "prompt": prompt,
        "stream": True,  # 关键参数
        "options": {"max_tokens": 500}
    }
    
    response = requests.post(
        self.model_endpoint,
        json=payload,
        stream=True  # 流式请求
    )
    
    for line in response.iter_lines():
        if line:
            data = json.loads(line.decode('utf-8'))
            if 'response' in data:
                yield data['response']

流式输出能让用户看到模型正在生成回答，即使总时间差不多，体验上也感觉更快。

实现缓存机制：

from functools import lru_cache
import hashlib

class CachedCustomerServiceBot(CustomerServiceBot):
    def __init__(self, *args, **kwargs):
        super().__init__(*args, **kwargs)
        self.cache = {}
    
    @lru_cache(maxsize=1000)
    def get_cached_response(self, query_hash: str, prompt: str) -> str:
        """缓存常见问题的回答"""
        if query_hash in self.cache:
            return self.cache[query_hash]
        
        response = self.query_model(prompt)
        self.cache[query_hash] = response
        return response
    
    def generate_response_with_cache(self, user_input: str) -> str:
        """带缓存的回复生成"""
        # 创建查询的哈希值
        query_hash = hashlib.md5(user_input.encode()).hexdigest()
        
        # 如果是常见问题，直接返回缓存答案
        common_questions = {
            "你们工作时间是几点到几点": "我们的客服工作时间是每天9:00-21:00，节假日不休。",
            "快递发什么": "我们默认发顺丰快递，偏远地区发EMS。",
            # ... 更多常见问题
        }
        
        if user_input in common_questions:
            return common_questions[user_input]
        
        # 否则正常处理
        intent = self.intent_classifier.classify(user_input)
        context = self.prepare_context(user_input, intent)
        
        # 检查缓存
        cache_key = f"{intent}_{query_hash}"
        if cache_key in self.cache:
            return self.cache[cache_key]
        
        # 调用模型
        response = self.query_model(context)
        
        # 缓存结果（只缓存明确意图的回答）
        if intent != "unknown":
            self.cache[cache_key] = response
        
        return response

缓存能显著提升高频问题的响应速度，特别是对于“工作时间”、“发货快递”这类固定答案的问题。

6.2 提高回答准确性

实现事实核查：

def fact_check_response(self, response: str, context: dict) -> bool:
    """检查回答是否与已知事实一致"""
    # 检查是否有明显的事实错误
    forbidden_patterns = [
        r"我们没有.*产品",  # 实际上有的产品
        r"价格是\d+元",    # 价格错误
        r"不支持.*退货",    # 实际上支持
    ]
    
    for pattern in forbidden_patterns:
        if re.search(pattern, response):
            return False
    
    # 检查是否包含不确定的表述
    uncertain_phrases = ["可能", "也许", "大概", "我不确定"]
    uncertain_count = sum(1 for phrase in uncertain_phrases if phrase in response)
    
    # 如果不确定表述太多，可能需要重新生成
    if uncertain_count > 2:
        return False
    
    return True

添加引用来源：

def add_citation(self, response: str, source_info: dict) -> str:
    """在回答中添加信息来源"""
    if "product_info" in source_info:
        citation = f"\n\n（信息来源于产品数据库，更新时间：{source_info['update_time']}）"
    elif "policy" in source_info:
        citation = f"\n\n（根据《{source_info['policy_name']}》第{source_info['section']}条）"
    else:
        citation = ""
    
    return response + citation

6.3 处理边界情况

客服系统总会遇到一些棘手的情况，我们需要提前做好准备：

处理无法回答的问题：

def handle_unknown_question(self, user_input: str) -> str:
    """处理模型无法回答的问题"""
    # 先尝试从知识库中寻找近似答案
    similar_questions = self.find_similar_questions(user_input)
    
    if similar_questions:
        best_match = similar_questions[0]
        return f"您的问题与以下问题类似：\nQ: {best_match['question']}\nA: {best_match['answer']}\n\n这能解决您的问题吗？"
    
    # 实在无法回答，转人工
    return "您的问题比较专业，我已经为您转接人工客服。请稍等，客服人员将很快为您服务。"

处理用户情绪：

def detect_emotion(self, user_input: str) -> str:
    """简单的情感检测"""
    angry_words = ["差评", "投诉", "太差了", "垃圾", "骗人"]
    urgent_words = ["赶紧", "马上", "立刻", "急"]
    
    if any(word in user_input for word in angry_words):
        return "angry"
    elif any(word in user_input for word in urgent_words):
        return "urgent"
    else:
        return "normal"

def adjust_tone_by_emotion(self, response: str, emotion: str) -> str:
    """根据情绪调整语气"""
    if emotion == "angry":
        # 安抚性语言
        response = "非常抱歉给您带来不好的体验。" + response
        response += "\n\n我们会认真对待您的问题，并尽快解决。"
    elif emotion == "urgent":
        # 加快语气
        response = response.replace("可以", "马上可以")
        response = response.replace("将", "立即")
    
    return response

7. 部署与运维建议

7.1 生产环境部署

当你的客服系统准备好上线时，需要考虑这些方面：

使用Docker Compose编排：

# docker-compose.yml
version: '3.8'

services:
  deepseek-model:
    image: csdn-mirror/deepseek-r1-distill-qwen-7b:latest
    container_name: deepseek-model
    ports:
      - "8080:8080"
    volumes:
      - ./model_data:/app/data
    restart: unless-stopped
    deploy:
      resources:
        reservations:
          devices:
            - driver: nvidia
              count: 1
              capabilities: [gpu]

  customer-service-api:
    build: .
    container_name: customer-service-api
    ports:
      - "8000:8000"
    depends_on:
      - deepseek-model
    environment:
      - MODEL_ENDPOINT=http://deepseek-model:8080/api/generate
      - REDIS_URL=redis://redis:6379
    restart: unless-stopped

  redis:
    image: redis:alpine
    container_name: redis-cache
    ports:
      - "6379:6379"
    volumes:
      - redis_data:/data

  nginx:
    image: nginx:alpine
    container_name: nginx-proxy
    ports:
      - "80:80"
      - "443:443"
    volumes:
      - ./nginx.conf:/etc/nginx/nginx.conf
    depends_on:
      - customer-service-api

volumes:
  redis_data:

配置负载均衡：如果你的客服系统访问量大，可能需要部署多个模型实例：

# load_balancer.py
import random
from typing import List

class ModelLoadBalancer:
    def __init__(self, endpoints: List[str]):
        self.endpoints = endpoints
        self.current_index = 0
        self.endpoint_stats = {endpoint: {"requests": 0, "errors": 0} for endpoint in endpoints}
    
    def get_endpoint(self) -> str:
        """获取一个可用的模型端点"""
        # 简单轮询
        endpoint = self.endpoints[self.current_index]
        self.current_index = (self.current_index + 1) % len(self.endpoints)
        self.endpoint_stats[endpoint]["requests"] += 1
        return endpoint
    
    def report_error(self, endpoint: str):
        """报告端点错误"""
        if endpoint in self.endpoint_stats:
            self.endpoint_stats[endpoint]["errors"] += 1
            
            # 如果错误太多，暂时禁用该端点
            error_rate = self.endpoint_stats[endpoint]["errors"] / max(self.endpoint_stats[endpoint]["requests"], 1)
            if error_rate > 0.5:  # 错误率超过50%
                print(f"警告：端点 {endpoint} 错误率过高，考虑检查")

7.2 监控与日志

实现健康检查：

# health_check.py
import time
from datetime import datetime

class SystemMonitor:
    def __init__(self):
        self.metrics = {
            "total_requests": 0,
            "successful_responses": 0,
            "failed_responses": 0,
            "avg_response_time": 0,
            "start_time": datetime.now()
        }
    
    def record_request(self, success: bool, response_time: float):
        """记录请求指标"""
        self.metrics["total_requests"] += 1
        
        if success:
            self.metrics["successful_responses"] += 1
        else:
            self.metrics["failed_responses"] += 1
        
        # 更新平均响应时间（移动平均）
        old_avg = self.metrics["avg_response_time"]
        n = self.metrics["successful_responses"] + self.metrics["failed_responses"]
        self.metrics["avg_response_time"] = (old_avg * (n-1) + response_time) / n if n > 0 else response_time
    
    def get_health_status(self) -> dict:
        """获取系统健康状态"""
        uptime = (datetime.now() - self.metrics["start_time"]).total_seconds()
        
        success_rate = 0
        if self.metrics["total_requests"] > 0:
            success_rate = self.metrics["successful_responses"] / self.metrics["total_requests"]
        
        return {
            "status": "healthy" if success_rate > 0.9 else "degraded",
            "uptime_seconds": uptime,
            "total_requests": self.metrics["total_requests"],
            "success_rate": f"{success_rate:.2%}",
            "avg_response_time": f"{self.metrics['avg_response_time']:.2f}s",
            "current_time": datetime.now().isoformat()
        }

设置告警：

def check_and_alert(self):
    """检查指标并触发告警"""
    status = self.get_health_status()
    
    if status["status"] == "degraded":
        self.send_alert(f"客服系统性能下降：成功率{status['success_rate']}")
    
    if float(status["avg_response_time"].rstrip('s')) > 10.0:
        self.send_alert(f"响应时间过长：{status['avg_response_time']}")
    
    # 每小时生成报告
    current_hour = datetime.now().hour
    if current_hour != self.last_report_hour:
        self.generate_hourly_report()
        self.last_report_hour = current_hour

7.3 持续改进

收集反馈数据：

class FeedbackCollector:
    def __init__(self):
        self.feedback_data = []
    
    def collect_feedback(self, conversation_id: str, user_question: str, 
                        bot_response: str, user_feedback: str = None):
        """收集对话反馈"""
        record = {
            "conversation_id": conversation_id,
            "timestamp": datetime.now().isoformat(),
            "user_question": user_question,
            "bot_response": bot_response,
            "user_feedback": user_feedback,
            "automated_score": self.score_response(user_question, bot_response)
        }
        
        self.feedback_data.append(record)
        
        # 定期保存到文件或数据库
        if len(self.feedback_data) % 100 == 0:
            self.save_to_file()
    
    def score_response(self, question: str, response: str) -> float:
        """自动评分（简单版）"""
        score = 0.5  # 基础分
        
        # 回答长度适中加分
        if 20 < len(response) < 500:
            score += 0.1
        
        # 包含关键信息加分
        key_phrases = ["订单", "物流", "退货", "客服"]
        for phrase in key_phrases:
            if phrase in question and phrase in response:
                score += 0.1
        
        # 有具体建议加分
        if "建议" in response or "可以" in response:
            score += 0.1
        
        return min(score, 1.0)  # 不超过1分

定期更新知识库：

def update_knowledge_from_feedback(self):
    """根据反馈更新知识库"""
    # 分析高频问题
    question_counter = {}
    for record in self.feedback_data[-1000:]:  # 分析最近1000条
        question = record["user_question"]
        question_counter[question] = question_counter.get(question, 0) + 1
    
    # 找到高频但知识库中没有的问题
    high_freq_questions = [(q, c) for q, c in question_counter.items() 
                          if c > 5 and not self.is_in_knowledge_base(q)]
    
    # 人工或自动添加到知识库
    for question, count in high_freq_questions[:10]:  # 每次处理前10个
        print(f"建议添加到知识库的问题：{question}（出现{count}次）")
        # 这里可以触发人工审核流程