AI Agent记忆系统：SQLite+FTS5为何比向量数据库更实用？

在构建AI应用时，数据库选型是关键技术决策之一。传统关系型数据库通过SQL语言提供强大的结构化查询和事务处理能力，而全文检索技术则能高效处理文本关键词匹配。这些基础技术组合，能为AI Agent的记忆系统提供事务一致性、复杂查询和精确检索等核心价值。在实际工程实践中，AI Agent的记忆模块需要处理事实性记忆、对话历史、工具调用记录和知识片段等多种数据类型，涉及精确匹配、范围查询和语义检索等混合

菩提风

571人浏览 · 2026-05-26 09:03:47

菩提风 · 2026-05-26 09:03:47 发布

1. 项目概述：一个关于数据库选型的“反直觉”发现

最近在折腾AI Agent（智能体）项目，尤其是那些需要长期记忆和复杂检索能力的场景，比如个人知识库助手、对话历史分析工具。和很多开发者一样，一开始我的目光也锁定在各种时髦的向量数据库（Vector DB）上，毕竟“向量检索”听起来就是为AI量身定做的。但在实际开发、压测，甚至处理真实用户数据的过程中，我反复碰壁：部署复杂、成本高昂、在简单精确匹配和混合查询时表现笨拙。

直到我把视线拉回一个“古老”的工具——SQLite，并搭配其内置的全文搜索引擎FTS5，进行了一系列对比实验。结果让我大吃一惊：在相当多的AI Agent记忆（Memory）应用场景中， SQLite + FTS5的组合，在性能、复杂度、成本和开发效率上，全面碾压了主流的向量数据库方案 。这听起来可能有点反直觉，毕竟向量数据库是当下的显学。但技术选型从来不是追新，而是解决问题。这篇文章，我就来详细拆解这个“反直觉”结论背后的逻辑、实操对比数据，以及SQLite+FTS5方案的具体落地方法。如果你正在为AI Agent的记忆模块选型而纠结，或者被向量数据库的复杂性困扰，这篇深度实践总结或许能给你带来全新的思路。

2. 核心需求解析：AI Agent记忆模块到底要什么？

在盲目选择技术栈之前，我们必须先厘清AI Agent的“记忆”（Memory）模块究竟需要承担哪些核心职责。这绝不仅仅是“存向量，查相似”那么简单。

2.1 记忆的多样性：不止于语义

一个功能完备的AI Agent记忆系统，通常需要处理多种类型的数据：

事实性记忆 ：用户明确提供的个人信息、偏好、历史事件（如“我住在北京”、“我的狗叫旺财”）。这类记忆需要 精确匹配和快速关联 。
对话历史 ：漫长的多轮对话记录。需要能按时间、会话ID进行 范围查询、分页和过滤 。
工具调用记录 ：Agent执行了哪些操作、结果如何。需要 结构化存储和事务性保证 。
知识片段 ：从文档、网页中提取的文本块。这里才涉及到 语义相似性检索 ，即传统向量数据库的用武之地。

很多教程把“记忆”简单等同于“向量检索”，这是极大的误解。实际上，语义搜索可能只占记忆访问模式的一小部分，大量操作是围绕结构化数据的增删改查展开的。

2.2 查询模式的复杂性：混合查询是常态

在实际应用中，用户的一个问题往往触发混合查询。例如：“帮我找一下上周我们讨论过的、关于 项目管理 的文档，我记得里面提到了 敏捷开发 和 甘特图 。” 这个查询包含了：

时间过滤 ：“上周”
元数据过滤 ：“我们讨论过的”（可能对应 session_id 或 user_id ）
精确关键词匹配 ：“项目管理”、“敏捷开发”、“甘特图”（这些是精确术语，全文检索比向量检索更直接有效）
潜在的语义扩展 ：用户可能记不清“敏捷开发”这个确切词，而说“快速迭代的方法”，这就需要语义检索。

一个理想的记忆系统应该能高效地处理这种 结构化过滤+全文检索+语义检索 的混合查询。纯向量数据库在处理前两项时非常吃力，通常需要引入另一个传统数据库（如PostgreSQL）来存元数据，架构立刻变得复杂。

2.3 对基础设施的务实要求

对于大多数创业团队、个人开发者或需要轻量级部署的场景，记忆模块还有几个关键诉求：

零运维与嵌入式 ：希望数据库能作为应用的一部分直接分发，无需独立部署、管理和维护一个数据库服务。降低运维成本和心智负担。
事务一致性 ：Agent的操作（如记录工具调用结果、更新用户状态）必须是原子性的，需要完整的ACID事务支持，避免数据错乱。
开发与调试友好 ：有简单通用的接口（如SQL），便于在开发过程中直接查看、修改和调试数据。这对于快速迭代的AI项目至关重要。

基于以上需求再去看技术选型，我们就会发现，向量数据库虽然解决了“语义检索”这一个点，但在其他多个维度的匹配上出现了错位。而SQLite，这个看似“过时”的嵌入式关系型数据库，在搭配FTS5扩展后，展现出了惊人的综合优势。

3. 方案对比：SQLite+FTS5 vs. 向量数据库

为了更直观地展示差异，我将从多个维度进行对比。这里的“向量数据库”以流行的ChromaDB、Weaviate或Qdrant为例，而SQLite方案指使用SQLite作为主存储，并启用FTS5虚拟表进行全文检索。

对比维度	SQLite + FTS5	典型向量数据库 (如ChromaDB)	分析与解读
架构与部署	嵌入式，单文件。随应用分发，无需独立进程或服务。	客户端-服务器架构。需单独部署、运行和维护数据库服务。	SQLite方案在部署上具有碾压性优势。对于桌面应用、移动应用、边缘计算场景或需要快速原型验证的项目，这是决定性因素。
数据模型	关系型+全文索引。数据以结构化表存储，FTS5提供针对文本列的倒排索引。	面向向量/文档。以“集合”和“向量”为核心，元数据作为附属。	SQLite能天然地处理复杂的关系和事务。向量数据库的元数据过滤功能往往较弱，且事务支持不完整。
查询能力	完整的SQL 。支持JOIN、复杂WHERE过滤、聚合、事务。FTS5支持布尔查询、短语搜索、前缀匹配等。	以向量相似度搜索为主。提供基础的元数据过滤，但功能有限。不支持JOIN等复杂操作。	SQLite在查询灵活性上完胜。混合查询（如“查找用户A最近10条包含‘错误’日志且相似于某段文本的记录”）在SQLite中是一条SQL的事，在向量数据库中可能需要多次查询或在应用层拼接。
语义检索	不支持。FTS5是基于关键词匹配的布尔模型和BM25相关度排序。	核心优势。专为基于嵌入向量的相似性搜索优化。	这是向量数据库唯一且最重要的优势。对于纯语义搜索场景，它不可替代。
精确匹配与关键词检索	核心优势。FTS5对关键词、短语的检索速度极快，结果精确。BM25算法对包含查询词多的文档排名高。	非常低效。需要将关键词转化为向量再进行近似搜索，结果不精确，可能遗漏完全匹配的文档。	在AI Agent记忆中，大量查询是精确的（如查找特定命令、代码片段、人名）。这方面FTS5是专业工具，向量数据库是“用锤子拧螺丝”。
性能	读写极快，资源占用极低。在千万级文本片段内做关键词检索，响应通常在毫秒级。	检索性能依赖索引和硬件。构建索引耗时，且服务本身占用内存较多。对于简单关键词查询是巨大浪费。	SQLite在常规操作上性能卓越。向量数据库的性能优势仅在大规模（百万级以上）高维向量最近邻搜索时才能体现，而这并非多数AI Agent的记忆规模。
成本	零额外成本。SQLite是公共领域软件，FTS5是内置扩展。	有显性和隐性成本。云服务收费，自托管需要服务器成本、运维人力成本。	对于预算敏感的项目或个人开发者，SQLite的成本优势巨大。
开发体验	极佳。使用熟悉的SQL，调试时可直接用图形化工具（如DB Browser）打开文件查看。数据一致性容易保证。	有学习成本。需要学习新的API和概念。调试数据不够直观，多客户端并发写入可能需额外处理。	开发效率是产品快速迭代的关键。SQLite降低了整个团队的认知和协作负担。

核心洞见 ：这个对比揭示了一个关键问题—— 技术栈的匹配度 。向量数据库是一个为“大规模向量相似性搜索”这一特定任务高度优化的专业工具。而AI Agent的记忆系统是一个需要 事务、关系、精确查询、全文检索和偶尔语义搜索 的混合系统。用一个专业工具去处理一个综合性问题，自然会捉襟见肘。SQLite+FTS5则像一个“瑞士军刀”，虽然单项（语义搜索）不顶尖，但综合能力均衡，且在许多单项（事务、精确查询、部署）上本身就是顶级。

4. 混合架构实战：用SQLite+FTS5构建AI Agent记忆系统

那么，如何具体用SQLite和FTS5来构建一个实用的AI Agent记忆系统呢？下面我将分享一套经过实战检验的架构和代码示例。

4.1 核心数据表设计

我们设计三张核心表来覆盖主要记忆类型：

-- 1. 记忆元数据表：存储所有记忆条目的结构化信息
CREATE TABLE memory_metadata (
    id INTEGER PRIMARY KEY AUTOINCREMENT,
    session_id TEXT NOT NULL,          -- 所属会话
    user_id TEXT NOT NULL,             -- 所属用户
    memory_type TEXT NOT NULL,         -- 类型：'fact', 'conversation', 'tool_call', 'knowledge'
    created_at TIMESTAMP DEFAULT CURRENT_TIMESTAMP,
    updated_at TIMESTAMP DEFAULT CURRENT_TIMESTAMP,
    metadata JSON TEXT                 -- 其他灵活的结构化信息（如工具名称、状态）
);

-- 为常用查询字段创建索引
CREATE INDEX idx_memory_session ON memory_metadata(session_id);
CREATE INDEX idx_memory_user ON memory_metadata(user_id);
CREATE INDEX idx_memory_type ON memory_metadata(memory_type);
CREATE INDEX idx_memory_time ON memory_metadata(created_at);

-- 2. 记忆内容表：存储文本内容，与元数据一对一关联
CREATE TABLE memory_content (
    memory_id INTEGER PRIMARY KEY,
    content TEXT NOT NULL,             -- 记忆的原始文本内容
    embedding BLOB,                    -- 可选的向量嵌入（用于备用或混合搜索）
    FOREIGN KEY (memory_id) REFERENCES memory_metadata(id) ON DELETE CASCADE
);

-- 3. FTS5全文搜索虚拟表：对记忆内容建立全文索引
CREATE VIRTUAL TABLE memory_content_fts USING fts5(
    content,                           -- 被索引的列
    content='memory_content',          -- 内容源表
    content_rowid='memory_id'          -- 关联的rowid
);

-- 创建触发器，确保memory_content表增删改时，FTS5索引自动同步
CREATE TRIGGER memory_content_ai AFTER INSERT ON memory_content BEGIN
    INSERT INTO memory_content_fts(rowid, content) VALUES (new.memory_id, new.content);
END;
CREATE TRIGGER memory_content_ad AFTER DELETE ON memory_content BEGIN
    INSERT INTO memory_content_fts(memory_content_fts, rowid, content) VALUES('delete', old.memory_id, old.content);
END;
CREATE TRIGGER memory_content_au AFTER UPDATE ON memory_content BEGIN
    INSERT INTO memory_content_fts(memory_content_fts, rowid, content) VALUES('delete', old.memory_id, old.content);
    INSERT INTO memory_content_fts(rowid, content) VALUES (new.memory_id, new.content);
END;

设计解读 ：

分离元数据与内容 ： memory_metadata 表负责所有结构化查询和关联， memory_content 表存储大文本。这种分离符合数据库设计范式，也便于维护。
FTS5虚拟表 ： memory_content_fts 是一个特殊的虚拟表，它并不实际存储数据，而是维护 memory_content.content 列的倒排索引，提供极快的全文检索能力。通过触发器，索引的维护对应用透明。
可选的embedding字段 ：我们在 memory_content 表中预留了 embedding 字段。 这不是为了在SQLite里做向量运算 ，而是作为一种“缓存”或“备用”。当我们需要执行一次纯粹的语义搜索时，可以读取这些嵌入向量，在应用层（例如用numpy）进行简单的相似度计算。这实现了“混合搜索”的灵活性。

4.2 实现混合查询：SQL的威力

假设我们要实现这个查询：“查找用户 alice 在 session_123 中，最近一周创建的，内容包含‘预算’和‘审批’，且与当前问题语义相关的对话记忆。”

在应用层，我们可能已经用模型生成了当前问题的嵌入向量 current_embedding 。

import sqlite3
import json
import numpy as np
from datetime import datetime, timedelta

def hybrid_search(db_path, user_id, session_id, query_terms, current_embedding, semantic_weight=0.3, limit=10):
    """
    执行混合搜索
    :param semantic_weight: 语义相似度分数的权重 (0-1)，其余权重分给全文检索相关度
    """
    conn = sqlite3.connect(db_path)
    conn.row_factory = sqlite3.Row
    
    # 1. 构建基础SQL：结构化过滤 + FTS5全文检索
    # FTS5的基本查询语法：`content MATCH '预算 AND 审批'`，支持AND/OR/NEAR等操作符。
    # bm25(memory_content_fts) 是FTS5内置的排名函数，值越小相关度越高。
    one_week_ago = (datetime.now() - timedelta(days=7)).isoformat()
    
    base_sql = """
        SELECT 
            mm.id,
            mm.session_id,
            mm.user_id,
            mm.memory_type,
            mm.created_at,
            mc.content,
            mc.embedding,
            bm25(memory_content_fts) AS fts_rank_score
        FROM memory_metadata mm
        JOIN memory_content mc ON mm.id = mc.memory_id
        JOIN memory_content_fts ON memory_content_fts.rowid = mc.memory_id
        WHERE mm.user_id = ?
          AND mm.session_id = ?
          AND mm.created_at > ?
          AND memory_content_fts MATCH ?  -- FTS5查询在此插入
        ORDER BY fts_rank_score ASC
        LIMIT 50  -- 先获取一个较大的全文检索候选集
    """
    
    # 构造FTS5查询字符串（简单处理，生产环境需转义）
    fts_query = ' AND '.join([f'"{term}"' for term in query_terms])
    
    # 执行第一阶段查询
    cursor = conn.execute(base_sql, (user_id, session_id, one_week_ago, fts_query))
    candidates = cursor.fetchall()
    
    if not candidates:
        return []
    
    # 2. 在应用层进行语义相似度重排序
    results = []
    for row in candidates:
        data = dict(row)
        # 计算全文检索得分（归一化，将bm25的负分转为正分，且分数越高越好）
        # bm25分数通常为负，绝对值越大越相关。我们进行转换。
        fts_score = max(0, -data['fts_rank_score'])  # 简单的转换
        
        # 计算语义相似度得分（如果存在嵌入向量）
        semantic_score = 0.0
        if data['embedding']:
            stored_embedding = np.frombuffer(data['embedding'], dtype=np.float32)
            # 使用余弦相似度
            cos_sim = np.dot(current_embedding, stored_embedding) / (np.linalg.norm(current_embedding) * np.linalg.norm(stored_embedding))
            semantic_score = (cos_sim + 1) / 2  # 归一化到[0, 1]
        
        # 计算混合分数
        hybrid_score = (1 - semantic_weight) * fts_score + semantic_weight * semantic_score
        data['hybrid_score'] = hybrid_score
        data['fts_score'] = fts_score
        data['semantic_score'] = semantic_score
        results.append(data)
    
    # 3. 按混合分数排序并返回Top-K
    results.sort(key=lambda x: x['hybrid_score'], reverse=True)
    return results[:limit]

# 使用示例
# 假设我们已经有了 current_embedding
current_embedding = np.random.randn(768).astype(np.float32)  # 模拟一个768维向量
search_results = hybrid_search(
    db_path='agent_memory.db',
    user_id='alice',
    session_id='session_123',
    query_terms=['预算', '审批'],
    current_embedding=current_embedding,
    semantic_weight=0.3  # 30%的权重分配给语义相似度
)

这个实现的关键优势 ：

数据库做它擅长的事 ：SQLite负责高效的结构化过滤和精确的全文关键词检索（通过FTS5）。这过滤掉了绝大部分不相关的记录。
应用层做灵活计算 ：将最耗资源的向量相似度计算（O(n)复杂度）限制在经全文检索筛选后的、少量（如50条）的候选集上，而不是全量表扫描。性能开销可控。
可调节的混合策略 ：通过 sematic_weight 参数，你可以根据查询类型动态调整策略。对于术语明确的查询（如“Python lambda函数用法”），可以调低语义权重；对于概念性查询（如“表达感谢的方式”），可以调高语义权重。

4.3 性能优化与实战技巧

要让这个方案在生产环境中跑得飞快，还需要一些优化技巧：

1. 连接与并发管理 SQLite在默认情况下，写操作会锁整个数据库文件。对于高并发的AI Agent应用，需要谨慎处理。

使用WAL模式 ：在连接数据库后立即执行 PRAGMA journal_mode=WAL; 。这可以允许读操作和写操作并发进行，大幅提升多线程读性能。
连接池 ：虽然SQLite本身是单文件，但可以为每个线程或请求创建独立的连接。避免跨线程共享连接，因为SQLite连接不是线程安全的。
控制写事务粒度 ：将多个写操作（如插入一条记忆及其内容）包裹在一个事务中，而不是自动提交每条语句。

import threading
from queue import Queue

class SQLiteConnectionPool:
    """一个简单的SQLite连接池"""
    def __init__(self, db_path, pool_size=5):
        self.db_path = db_path
        self.pool = Queue(maxsize=pool_size)
        for _ in range(pool_size):
            conn = sqlite3.connect(db_path, check_same_thread=False)
            conn.execute('PRAGMA journal_mode=WAL;')  # 启用WAL模式
            conn.execute('PRAGMA synchronous=NORMAL;') # 在WAL模式下，NORMAL是安全与性能的平衡点
            self.pool.put(conn)
    
    def get_conn(self):
        return self.pool.get()
    
    def return_conn(self, conn):
        self.pool.put(conn)

2. FTS5查询优化

使用前缀搜索和短语搜索 ： MATCH '"数据库*"' 可以进行前缀匹配。 MATCH '"分布式系统"' 可以进行精确短语匹配。合理使用可以提升准确率。
避免过于复杂的MATCH表达式 ：虽然FTS5支持 NEAR 等操作符，但复杂查询可能影响性能。对于复杂逻辑，可以考虑在应用层拆分多次查询后合并结果。
定期优化FTS5索引 ：在大量增删改操作后，可以运行 INSERT INTO memory_content_fts(memory_content_fts) VALUES('optimize'); 来合并索引片段，提升查询性能。

3. 向量字段的懒加载与缓存

不是每条记忆都需要语义检索。可以在插入记忆时，不立即计算和存储 embedding ，而是 按需计算 。当某条记忆第一次被纳入候选集进行语义排序时，再计算其嵌入向量并存入数据库。
对于高频访问的记忆，可以在应用层使用LRU缓存来存储其嵌入向量，避免重复从数据库读取和解码BLOB。

4. 分区与归档

对于会话型Agent，一个会话结束后，其记忆的活跃度会急剧下降。可以考虑按 session_id 或时间（如月份）对 memory_metadata 和 memory_content 表进行分区。将不活跃的数据迁移到归档表中，保持主表小巧，查询更快。

5. 适用场景与边界探讨

没有任何一个技术方案是银弹。SQLite+FTS5方案有其明确的优势区间和边界。

最适合的场景：

个人级或中小型AI应用 ：如个人知识库助手、桌面AI工具、小型聊天机器人。数据量在千万条文本记录以下。
需要复杂混合查询的Agent ：记忆访问模式多样，频繁需要结合时间、用户、类型等属性进行过滤和检索。
对部署和运维极度敏感的项目 ：希望产品开箱即用，无需用户自行配置数据库服务。
原型验证和快速迭代阶段 ：开发效率优先，需要灵活的数据模型和便捷的调试方式。

方案的局限性（何时该考虑向量数据库）：

超大规模向量搜索 ：当你的记忆库纯粹是海量（数亿级以上）的文档片段，且 核心且高频 的查询需求是“找到与一段话语义上最相似的Top-K段文本”，其他查询模式占比极低。这时，专业的向量数据库其优化的索引算法（如HNSW, IVF）能提供无可比拟的检索速度。
多模态记忆 ：当你的记忆单元不仅仅是文本，还包括图像、音频的嵌入向量，并且需要跨模态检索（以文搜图，以图搜文）。专门的向量数据库对这类场景支持更好。
需要分布式和高可用 ：当你的应用需要水平扩展，处理海量并发读写，并且要求极高的可用性。SQLite是单机嵌入式数据库，不具备这些特性。

我的核心建议是 ：不要默认选择向量数据库。首先用SQLite+FTS5实现你的AI Agent记忆系统。当且仅当你在实际性能测试和业务发展中，明确遇到了上述局限性，并且语义搜索成为不可妥协的性能瓶颈时，再考虑引入向量数据库作为 一个专门的语义检索子系统 ，与SQLite主存储协同工作。这种“SQLite主库 + 专用向量检索引擎”的混合架构，往往是更务实、更强大的选择。

6. 常见问题与避坑指南

在实际使用这套方案时，我踩过不少坑，也总结了一些关键问题的解决方法。

Q1: FTS5的搜索语法和普通LIKE查询有什么区别？性能差异大吗？ A1: 区别巨大。 LIKE '%关键词%' 会导致全表扫描，性能极差。FTS5使用的是倒排索引，它会把文本拆分成词元（token），并建立“词元 -> 文档ID”的映射。查询时直接定位到包含该词元的文档列表，速度极快。对于 MATCH '预算审批' 这样的查询，FTS5是毫秒级响应，而 LIKE 在十万级数据上就可能达到秒级。

Q2: 中文搜索支持吗？ A2: 默认的FTS5分词器适用于英文等以空格分隔的语言。对于中文，需要集成中文分词器。一个成熟且推荐的方法是使用 SQLite的FTS5扩展模块，如 fts5mmicu 或 sqlite3-fts5-mecab 。你需要在编译SQLite时加载这些扩展，或者使用预编译的版本。另一种更轻量级的方案是在应用层，使用 jieba 等分词库先将中文文本预处理成用空格分隔的词序列，再存入FTS5表。虽然牺牲了一些灵活性，但实现简单。

Q3: 如何更新记忆内容？ A3: 由于我们建立了触发器，你只需要更新 memory_content 表的内容， memory_content_fts 索引会自动同步。 但是，注意一个关键点 ：如果你更新了 memory_content.content ，而 embedding 字段是之前根据旧内容计算的，那么你必须 同时更新或清除 embedding 字段 ，否则会导致语义搜索的结果不一致。最好将更新 content 和 embedding 封装在一个事务中。

Q4: 这个方案能处理多轮对话中的长期依赖吗？ A4: 记忆的存储和检索是基础，而长期依赖的建模更多是Agent逻辑层的任务。SQLite+FTS5方案可以高效地为你提供“相关的记忆片段”。例如，你可以设计查询，优先检索当前会话中、近期发生的、且与当前话题（通过关键词或语义）相关的记忆。Agent的推理层（如LLM）再基于这些检索到的片段，去理解和构建长期依赖关系。我们的数据库方案提供了强大、灵活的“记忆提取”能力，而“记忆的理解与运用”则需要LLM来完成。

Q5: 数据安全性和备份怎么做？ A5: SQLite是单文件，这反而简化了备份。你可以定期使用 sqlite3 的 .backup 命令或在应用空闲时直接复制 .db 文件来完成备份。对于加密，SQLite官方提供了 SQLite Encryption Extension (SEE) ，但这是付费的。社区也有像 SQLCipher 这样的开源加密扩展，可以为整个数据库文件提供透明的AES-256加密，集成后对应用代码几乎无感，是保护敏感记忆数据（如个人聊天记录）的好选择。

回顾整个探索过程，从盲目追随向量数据库的热潮，到回归问题本质，重新审视SQLite这样经典工具的价值，这本身就是一个重要的技术思维训练。在AI开发如火如荼的今天，各种新框架、新工具层出不穷，但最合适的工具往往不是最炫酷的那个，而是最能优雅、高效、低成本解决你当前实际问题的那一个。SQLite+FTS5对于AI Agent记忆系统而言，就是这样一个被低估的“超级瑞士军刀”。它可能不会出现在炫酷的AI技术栈宣传图里，但它却能让你更快地交付一个稳定、高效、易于维护的产品。下次当你需要为Agent添加记忆时，不妨先试试这个方案，它带来的简洁和高效，可能会让你感到惊喜。

AI Agent技术社区

Agent 垂直技术社区，欢迎活跃、内容共建。

更多推荐

让 Codex 桌面版拥抱 DeepSeek-V4：协议桥接与模型网关接入实践

4SAPI 提供了一套标准的 Chat Completions 接口，完全兼容 DeepSeek V4 Pro 等模型，使用时只需将 base URL 和密钥替换为平台分配的值即可。这样一来，既保留了桥接层的协议转换能力，又获得了网关带来的额外弹性。这样的模型网关，则进一步提升了链路的稳定性和密钥管理的便捷度，尤其适合团队或对服务可用性有更高要求的场景。│Codex 桌面版│ ──────────

AI Agent技术社区

别再迷信“突破限制”：Gemini 3.5-flash 边界测试实战复盘

AI Agent技术社区

想要转型AI Agent开发？现在开始学，还不晚

用 @tool 装饰器定义工具@tool"""搜索互联网获取实时信息。当需要最新数据时使用此工具。"""# 实际接入 Tavily / Serper 等搜索 APIreturnf"搜索结果：关于 {query} 的最新信息..."@tool"""计算数学表达式，如 '2 + 3 * 4'"""# 绑定工具到模型# 模型会自动决定是否调用工具response = llm_with_tools.inv