GLM-4-9B-Chat函数调用实战：自定义工具集成开发

阿qi 爱喝拿铁

262人浏览 · 2026-02-12 10:55:05

阿qi 爱喝拿铁 · 2026-02-12 10:55:05 发布

GLM-4-9B-Chat函数调用实战：自定义工具集成开发

1. 为什么需要函数调用能力

在实际业务场景中，大模型不能只停留在聊天层面。当用户问“今天北京天气怎么样”或“查一下订单号12345的状态”，模型需要跳出纯文本生成的局限，真正连接外部系统获取实时信息。GLM-4-9B-Chat的函数调用（Function Call）能力正是为了解决这个问题而设计的。

这种能力让模型不再只是个“回答问题的机器”，而是能主动判断何时需要调用外部工具、如何构造参数、怎样处理返回结果的智能协调者。它把大模型变成了一个可以调度各种服务的“AI指挥官”。

我第一次在项目里用上这个功能时，最直观的感受是：模型开始有了“行动力”。它不再满足于说“我可以帮你查天气”，而是真的去调用天气API，拿到数据后再组织成自然语言回复。这种从“知道”到“做到”的转变，正是函数调用带来的核心价值。

对于开发者来说，这意味着可以用更少的代码实现更复杂的AI应用。不需要自己写大量逻辑来判断用户意图、解析参数、调用服务，这些工作模型都能帮我们完成，我们只需要专注在工具本身的实现上。

2. 函数调用的工作原理与规范

2.1 模型如何理解工具需求

GLM-4-9B-Chat的函数调用不是简单的关键词匹配，而是一套完整的语义理解流程。当用户提供请求时，模型会经历三个关键阶段：

首先进行意图识别——判断用户是否需要调用工具，以及需要调用哪个工具。比如用户说“帮我查上海明天的温度”，模型要识别出这是天气查询意图，而不是闲聊。

然后是参数提取——从自然语言中精准提取结构化参数。模型需要理解“上海”是城市，“明天”是时间范围，而不是把它们当作普通词汇处理。

最后是调用决策——决定是直接调用单个工具，还是需要按顺序调用多个工具。比如用户问“先查北京天气，再告诉我附近有什么餐厅”，模型就需要规划两个调用步骤。

这个过程依赖于模型对工具描述的理解深度。工具描述越清晰、示例越丰富，模型的调用准确率就越高。我在实际项目中发现，给工具添加2-3个典型使用示例，比单纯写长篇描述效果更好。

2.2 工具定义的JSON Schema规范

要让模型正确调用工具，必须按照严格的JSON Schema格式定义工具接口。这不是可选项，而是模型理解工具能力的基础。

{
  "name": "get_weather",
  "description": "获取指定城市和日期的天气信息",
  "parameters": {
    "type": "object",
    "properties": {
      "city": {
        "type": "string",
        "description": "城市名称，如北京、上海"
      },
      "date": {
        "type": "string",
        "description": "日期，格式为YYYY-MM-DD，如2024-06-15"
      }
    },
    "required": ["city"]
  }
}

这里有几个关键点需要注意：description字段要简洁明确，避免模糊表述；required数组必须准确列出必填参数；每个参数的type和description都要具体，特别是字符串类型要说明期望的格式。

我曾经遇到过一个坑：把日期参数写成"type": "string"但没说明格式，结果模型有时传"明天"，有时传"2024-06-15"，导致后端解析失败。后来改成明确要求"YYYY-MM-DD"格式，问题就解决了。

2.3 安全校验机制的设计要点

函数调用引入了新的安全风险，必须建立多层防护机制。我在生产环境部署时，主要设置了三道防线：

第一道是输入参数校验。所有传入工具的参数都必须经过白名单验证。比如城市参数只能是预定义的城市列表，日期必须符合格式且在合理范围内（不能是100年后的日期）。这一步在模型调用前就过滤掉明显异常的请求。

第二道是调用频率限制。为每个工具设置QPS限制，防止被恶意高频调用。天气查询类工具设为每分钟5次，数据库操作类工具则严格限制为每分钟1次。同时记录调用日志，便于事后审计。

第三道是敏感操作拦截。对于涉及数据修改的工具（如数据库更新），必须要求用户进行二次确认。模型在调用前会生成确认提示：“即将更新用户表中的邮箱地址，确定要执行吗？请回复‘确认’继续。”这样既保证了安全性，又不影响正常用户体验。

3. 天气预报查询工具的完整实现

3.1 工具后端开发

天气查询是最典型的函数调用场景，我以它为例展示完整的实现流程。后端采用Python Flask框架，代码简洁明了：

from flask import Flask, request, jsonify
import requests
import os
from datetime import datetime, timedelta

app = Flask(__name__)

# 天气API密钥，从环境变量读取
WEATHER_API_KEY = os.getenv('WEATHER_API_KEY', 'your_api_key_here')

@app.route('/api/weather', methods=['POST'])
def get_weather():
    try:
        data = request.get_json()
        city = data.get('city')
        date_str = data.get('date')
        
        # 参数校验
        if not city:
            return jsonify({'error': '城市参数不能为空'}), 400
        
        # 日期处理：支持"今天"、"明天"等相对日期
        if date_str in ['今天', '现在']:
            target_date = datetime.now().strftime('%Y-%m-%d')
        elif date_str == '明天':
            target_date = (datetime.now() + timedelta(days=1)).strftime('%Y-%m-%d')
        else:
            # 验证日期格式
            try:
                datetime.strptime(date_str, '%Y-%m-%d')
                target_date = date_str
            except ValueError:
                return jsonify({'error': '日期格式错误，应为YYYY-MM-DD'}), 400
        
        # 调用第三方天气API
        url = f"http://api.weatherapi.com/v1/forecast.json"
        params = {
            'key': WEATHER_API_KEY,
            'q': city,
            'dt': target_date,
            'aqi': 'no'
        }
        
        response = requests.get(url, params=params, timeout=5)
        response.raise_for_status()
        
        weather_data = response.json()
        
        # 提取关键信息
        forecast = weather_data['forecast']['forecastday'][0]['day']
        current = weather_data['current']
        
        result = {
            'city': city,
            'date': target_date,
            'temperature_c': forecast['avgtemp_c'],
            'condition': forecast['condition']['text'],
            'humidity': forecast['avghumidity'],
            'wind_kph': forecast['maxwind_kph'],
            'uv': current['uv']
        }
        
        return jsonify(result)
    
    except requests.exceptions.Timeout:
        return jsonify({'error': '天气服务响应超时'}), 504
    except requests.exceptions.RequestException as e:
        return jsonify({'error': f'天气服务调用失败: {str(e)}'}), 502
    except Exception as e:
        return jsonify({'error': f'内部错误: {str(e)}'}), 500

if __name__ == '__main__':
    app.run(host='0.0.0.0', port=5000)

这个实现包含了几个实用技巧：支持相对日期（今天/明天）的智能转换、详细的错误处理、合理的超时设置。特别要注意的是，我把API密钥放在环境变量中，而不是硬编码在代码里，这是基本的安全实践。

3.2 前端调用与错误处理

前端调用需要处理三种典型错误场景：网络错误、API错误和业务逻辑错误。我封装了一个健壮的调用函数：

import json
import time
from typing import Dict, Any, Optional

def call_weather_tool(city: str, date: str) -> Dict[str, Any]:
    """
    调用天气查询工具，包含完整的错误处理和重试机制
    """
    # 参数预处理
    if not city.strip():
        return {"error": "城市名称不能为空"}
    
    # 构造请求数据
    payload = {
        "city": city.strip(),
        "date": date.strip()
    }
    
    # 重试机制：最多尝试3次
    for attempt in range(3):
        try:
            # 添加请求头，模拟真实浏览器
            headers = {
                'Content-Type': 'application/json',
                'User-Agent': 'GLM-4-Weather-Client/1.0'
            }
            
            response = requests.post(
                'http://localhost:5000/api/weather',
                json=payload,
                headers=headers,
                timeout=8
            )
            
            # 处理HTTP错误状态码
            if response.status_code == 400:
                return {"error": "参数错误：" + response.json().get('error', '未知参数错误')}
            elif response.status_code == 401:
                return {"error": "认证失败，请检查API密钥配置"}
            elif response.status_code == 429:
                return {"error": "请求过于频繁，请稍后再试"}
            elif response.status_code == 502:
                return {"error": "天气服务暂时不可用"}
            elif response.status_code == 504:
                return {"error": "天气服务响应超时"}
            elif response.status_code != 200:
                return {"error": f"天气服务返回错误状态码：{response.status_code}"}
            
            # 解析响应
            result = response.json()
            
            # 检查业务错误
            if 'error' in result:
                return {"error": result['error']}
            
            # 成功返回
            return {
                "success": True,
                "data": result
            }
            
        except requests.exceptions.Timeout:
            if attempt < 2:
                time.sleep(1)  # 等待1秒后重试
                continue
            return {"error": "请求超时，请检查网络连接"}
        except requests.exceptions.ConnectionError:
            return {"error": "无法连接到天气服务，请检查服务是否运行"}
        except json.JSONDecodeError:
            return {"error": "天气服务返回了无效的JSON数据"}
        except Exception as e:
            return {"error": f"调用过程中发生未知错误：{str(e)}"}
    
    return {"error": "多次尝试后仍无法获取天气信息"}

# 使用示例
if __name__ == "__main__":
    # 测试不同场景
    print("测试北京今天天气：")
    result = call_weather_tool("北京", "今天")
    print(json.dumps(result, ensure_ascii=False, indent=2))
    
    print("\n测试无效城市：")
    result = call_weather_tool("", "今天")
    print(json.dumps(result, ensure_ascii=False, indent=2))

这个调用函数的关键在于：它不假设一切都会顺利，而是为每种可能的失败情况都准备了应对策略。网络超时自动重试，API错误给出友好的中文提示，甚至考虑到了JSON解析失败这种边界情况。

3.3 模型调用效果对比

为了验证函数调用的实际效果，我设计了几组对比测试。下面是模型在不同输入下的表现：

输入1： “上海明天的天气怎么样？”

模型正确识别出需要调用get_weather工具
参数提取准确：{"city": "上海", "date": "明天"}
调用后返回数据并生成自然语言回复：“上海明天预计气温26°C，多云转晴，湿度65%，风速15公里/小时”

输入2： “查一下北京、上海、广州今天的天气”

模型识别出需要三次调用
自动拆分为三个独立请求，分别处理
最终汇总生成对比报告：“北京今天28°C晴，上海26°C多云，广州32°C雷阵雨”

输入3： “天气预报准不准？”

模型正确判断为闲聊问题，不调用任何工具
直接回答：“天气预报基于气象模型预测，短期预报准确率较高，但受多种因素影响可能存在偏差”

这种智能的调用决策能力，正是GLM-4-9B-Chat相比早期模型的重要进步。它不再是机械地匹配关键词，而是真正理解了用户意图的层次结构。

4. 数据库操作工具的工程实践

4.1 安全优先的数据库工具设计

数据库操作是高风险场景，必须采取比天气查询更严格的安全措施。我设计的数据库工具遵循“最小权限原则”，每个工具只拥有完成其任务所必需的最小权限。

from flask import Flask, request, jsonify
import sqlite3
import re
from typing import Dict, Any, List

app = Flask(__name__)

# 数据库连接池（简化版）
def get_db_connection():
    conn = sqlite3.connect('app.db')
    conn.row_factory = sqlite3.Row
    return conn

@app.route('/api/db/query', methods=['POST'])
def db_query():
    """安全的数据库查询接口"""
    try:
        data = request.get_json()
        sql = data.get('sql', '').strip()
        
        # 严格SQL白名单校验
        if not sql or not sql.upper().startswith(('SELECT', 'PRAGMA')):
            return jsonify({'error': '只允许执行SELECT和PRAGMA语句'}), 400
        
        # 禁止危险关键词
        dangerous_keywords = ['INSERT', 'UPDATE', 'DELETE', 'DROP', 'CREATE', 'ALTER', 'EXEC', 'UNION']
        for keyword in dangerous_keywords:
            if re.search(r'\b' + keyword + r'\b', sql, re.IGNORECASE):
                return jsonify({'error': f'禁止使用{keyword}语句'}), 400
        
        # 限制查询复杂度
        if sql.count(';') > 0:
            return jsonify({'error': '不允许执行多条SQL语句'}), 400
        
        if len(sql) > 500:
            return jsonify({'error': 'SQL语句过长'}), 400
        
        # 执行查询
        conn = get_db_connection()
        cursor = conn.cursor()
        cursor.execute(sql)
        rows = cursor.fetchall()
        conn.close()
        
        # 转换为字典列表
        result = [dict(row) for row in rows]
        
        return jsonify({
            'success': True,
            'count': len(result),
            'data': result[:100]  # 限制返回数量
        })
    
    except sqlite3.Error as e:
        return jsonify({'error': f'数据库查询错误：{str(e)}'}), 500
    except Exception as e:
        return jsonify({'error': f'内部错误：{str(e)}'}), 500

@app.route('/api/db/user', methods=['POST'])
def get_user_info():
    """专用用户信息查询接口（推荐方式）"""
    try:
        data = request.get_json()
        user_id = data.get('user_id')
        
        if not user_id or not isinstance(user_id, int) or user_id <= 0:
            return jsonify({'error': '用户ID必须是正整数'}), 400
        
        conn = get_db_connection()
        cursor = conn.cursor()
        cursor.execute(
            "SELECT id, username, email, created_at FROM users WHERE id = ?",
            (user_id,)
        )
        user = cursor.fetchone()
        conn.close()
        
        if user:
            return jsonify({
                'success': True,
                'user': dict(user)
            })
        else:
            return jsonify({'error': '未找到指定用户'}), 404
    
    except Exception as e:
        return jsonify({'error': f'查询用户信息失败：{str(e)}'}), 500

这个实现体现了几个重要的安全理念：SQL语句白名单而非黑名单、长度和复杂度限制、专用接口优于通用接口。特别是get_user_info这个专用接口，它比通用SQL查询更安全，因为参数类型和范围都得到了严格控制。

4.2 实际业务场景中的应用

在真实的电商后台系统中，我用这个数据库工具实现了几个关键功能：

订单状态查询： 用户问“我的订单12345现在什么状态”，模型自动调用订单查询工具，返回“已发货，预计明天送达”。

库存检查： “iPhone 15 Pro还有货吗”，模型查询库存表，如果库存大于0就回复“有货”，否则说“暂时缺货，预计3天后补货”。

用户信息核对： “我的注册邮箱是不是xxx@xxx.com”，模型查询用户表，对比邮箱字段后给出确认或修正建议。

这些场景的共同特点是：都需要实时数据，但数据量不大，查询模式固定。通过函数调用，我们避免了为每个小功能都开发独立API的繁琐工作，模型成了统一的查询入口。

4.3 错误处理与用户体验优化

数据库操作的错误处理需要特别关注用户体验。我总结了几个实用原则：

原则一：错误信息要具体但不暴露技术细节。 不要说“SQLite Error: no such table”，而是说“系统正在升级，暂时无法查询订单信息”。

原则二：提供替代方案。 当查询失败时，除了告知错误，还要给出下一步建议：“查询暂时不可用，您可以稍后重试，或者直接联系客服获取帮助。”

原则三：缓存常用查询结果。 对于不经常变化的数据（如商品分类、地区列表），添加Redis缓存，减少数据库压力，提高响应速度。

下面是一个优化后的错误处理示例：

def handle_db_error(error_msg: str, user_query: str) -> str:
    """
    根据错误类型生成用户友好的提示
    """
    if 'timeout' in error_msg.lower() or 'connection' in error_msg.lower():
        return f"系统当前比较繁忙，{user_query}的查询需要稍等片刻。您可以先看看其他商品，稍后再回来查看。"
    
    elif 'no such table' in error_msg.lower() or 'no such column' in error_msg.lower():
        return f"我们的系统正在进行维护升级，暂时无法处理{user_query}。预计30分钟后恢复正常，感谢您的耐心等待。"
    
    elif 'permission denied' in error_msg.lower():
        return f"您查询的信息涉及隐私保护，需要进一步的身份验证。请通过APP的‘我的账户’页面完成实名认证后重试。"
    
    else:
        return f"很抱歉，处理{user_query}时遇到了一些问题。我们的技术团队已经收到通知，正在紧急处理。您可以稍后再试，或者联系在线客服获取帮助。"

# 使用示例
error_message = "Database connection timeout"
user_question = "我的订单状态"
response = handle_db_error(error_message, user_question)
print(response)
# 输出：系统当前比较繁忙，我的订单状态的查询需要稍等片刻。您可以先看看其他商品，稍后再回来查看。

这种处理方式让错误不再是冰冷的技术信息，而是变成了有温度的服务提示。