Gemini 3.5 Flash 开发者实战指南：比上一代快 4 倍，免费 API 就能跑

Agent 化。Gemini 3.5 Flash 不再只是一个「聊天机器人」，而是一个能调用工具、执行代码、搜索网络的自主工作单元。对个人开发者来说，最实在的好处是：以前你要搭 LangChain 或者自己写 Agent 框架才能实现的功能，现在 Gemini 3.5 Flash 原生就支持，几行代码就能跑起来。

Aliaoo

431人浏览 · 2026-05-29 09:31:31

Aliaoo · 2026-05-29 09:31:31 发布

Gemini 3.5 Flash 开发者实战指南：比上一代快 4 倍，免费 API 就能跑

Google I/O 2026 刚过去一周，如果你还没关注这次发布的新东西，你可能已经错过了今年最重要的一个开发者工具更新。

简单说：Google 发了一个叫 Gemini 3.5 Flash 的新模型，性能超越了上一代旗舰 Gemini 3.1 Pro，但速度是它的 4 倍，而且完全免费就能用。

我花了两天时间把这东西从头到尾跑了一遍，这篇文章就是我的实战记录——从注册到写出第一个可以自动调用工具的 Agent，每一步都有代码，每一步都能复现。

先搞清楚这玩意儿强在哪

发布会上的数据我就不复读了，说几个对开发者真正有用的点：

1. 速度碾压同类模型。 Google 官方说输出速度比其他前沿模型快 4 倍。我自己实测，同样一个「帮我写一个 Python FastAPI 后端，带 JWT 鉴权」的 prompt，Gemini 3.5 Flash 返回完整代码只用了 8 秒，作为对比，某个大家常用的竞品模型用了 32 秒。

2. 100 万 token 上下文窗口。 这意味着你可以把整本《三体》第一部扔进去让它分析，或者把一个 5 万行的代码仓库塞进去让它帮你找 bug。实际使用中，我没测到那么极端，但扔进去一个 3000 行的 Python 项目让它做代码审查，完全没问题。

3. 原生 Agent 能力。 这是我最看重的一点。Gemini 3.5 Flash 可以直接调用外部工具（Function Calling）、执行代码、搜索网页——而且这些能力是「内置」的，不需要自己搭框架。后面我会演示具体怎么做。

4. 免费。 在 Google AI Studio 里用，每分钟 20 次请求，每天 1500 次，对个人开发者和学习来说完全够。付费 API 的价格也非常低，100 万 token 输入不到 1 块钱人民币。

第一步：拿到 API Key（2 分钟）

去 Google AI Studio ，用 Google 账号登录，点击左侧「Get API Key」，复制那一串字符串。

如果你只是想先在网页上试试效果，AI Studio 本身就提供了一个聊天界面，不需要写任何代码。但我建议你直接走 API，后面能做的事情多得多。

第二步：装上 SDK，跑通第一个请求

pip install google-genai

然后写一个最简单的调用：

from google import genai

client = genai.Client(api_key="你的API_KEY")

response = client.models.generate_content(
    model="gemini-3.5-flash",
    contents="用 Python 写一个冒泡排序，并解释时间复杂度"
)

print(response.text)

跑一下，你会看到它返回了完整的代码 + 解释。这个没啥稀奇的，所有大模型都能做。真正厉害的在后面。

重点来了：Function Calling——让模型调用你的工具

这是 Gemini 3.5 Flash 最实用的功能。简单说就是：你定义一些函数（比如查天气、查数据库、发邮件），模型可以根据用户的自然语言指令，自动决定调用哪个函数、传什么参数。

我写一个你马上就能用的例子：一个能查询股票价格的 AI 助手。

from google import genai
from google.genai import types
import yfinance as yf

# 定义工具函数
def get_stock_price(ticker: str) -> dict:
    """获取指定股票的最新价格"""
    stock = yf.Ticker(ticker)
    info = stock.info
    return {
        "ticker": ticker,
        "price": info.get("currentPrice", info.get("regularMarketPrice", 0)),
        "company": info.get("longName", ticker)
    }

# 注册为 Gemini 工具
stock_tool = types.Tool(
    function_declarations=[{
        "name": "get_stock_price",
        "description": "获取指定股票的最新价格",
        "parameters": {
            "type": "object",
            "properties": {
                "ticker": {
                    "type": "string",
                    "description": "股票代码，如 AAPL、GOOGL、TSLA"
                }
            },
            "required": ["ticker"]
        }
    }]
)

client = genai.Client(api_key="你的API_KEY")

# 第一轮：模型告诉你它想调用哪个函数
response = client.models.generate_content(
    model="gemini-3.5-flash",
    contents="帮我查一下苹果和特斯拉的股价",
    config=types.GenerateContentConfig(tools=[stock_tool])
)

# 解析模型的函数调用请求
for part in response.candidates[0].content.parts:
    if part.function_call:
        func_name = part.function_call.name
        args = dict(part.function_call.args)
        print(f"模型想调用: {func_name}({args})")
        
        # 实际执行函数
        if func_name == "get_stock_price":
            result = get_stock_price(**args)
            print(f"返回结果: {result}")

运行结果大概是这样：

模型想调用: get_stock_price({'ticker': 'AAPL'})
返回结果: {'ticker': 'AAPL', 'price': 228.5, 'company': 'Apple Inc.'}
模型想调用: get_stock_price({'ticker': 'TSLA'})
返回结果: {'ticker': 'TSLA', 'price': 342.8, 'company': 'Tesla, Inc.'}

这就是 Function Calling 的核心流程：用户说人话 → 模型决定调用哪个工具 → 你的代码执行工具 → 模型根据结果组织回答。

进阶玩法：Managed Agents——一个 API 调起完整 Agent

这是 Google I/O 上我觉得最酷的一个新功能。以前你要让 AI 写代码、执行代码、看结果、继续改，得自己写一堆循环逻辑。现在 Gemini 3.5 Flash 内置了这个能力，一个 API 调用就搞定。

from google import genai
from google.genai import types

client = genai.Client(api_key="你的API_KEY")

# 开启代码执行工具
response = client.models.generate_content(
    model="gemini-3.5-flash",
    contents="用 Python 画一张 2024 年比特币价格走势图，并标注最高点和最低点。把数据和图都展示出来。",
    config=types.GenerateContentConfig(
        tools=[types.Tool(code_execution={})]  # 开启代码执行
    )
)

# 模型会自动写代码、执行、返回结果
for part in response.candidates[0].content.parts:
    if part.text:
        print(part.text)
    if part.executable_code:
        print(f"\n[执行代码]:\n{part.executable_code.code[:200]}...")
    if part.code_execution_result:
        print(f"[执行结果]: {part.code_execution_result.output[:300]}")

你不需要装 Python 环境，不需要配 matplotlib，模型会在 Google 的沙箱里帮你写完代码、跑完、把结果（包括图表）一起返回给你。这个体验和 Claude 的 Artifacts 有点像，但它走的是 API，可以嵌入到你自己的产品里。

结合搜索：让 AI 的回答永远是最新的

大模型有一个通病：训练数据有截止日期。Gemini 3.5 Flash 可以直接调用 Google 搜索来解决这个问题。

response = client.models.generate_content(
    model="gemini-3.5-flash",
    contents="今天 Google 的股价是多少？最近有什么重大新闻？",
    config=types.GenerateContentConfig(
        tools=[types.Tool(google_search={})]  # 开启搜索
    )
)

print(response.text)

模型会自动搜索最新信息，然后基于搜索结果组织回答。这个功能对我这种每天要写技术文章的人来说，简直是信息收集的神器。

实际开发场景：一个完整的 AI 命令行工具

说了这么多，来个综合的例子：一个命令行工具，输入自然语言，自动搜索信息、执行计算、查询外部 API。

import sys
from google import genai
from google.genai import types
import requests

# 自定义工具：查 GitHub Trending
def get_github_trending(language: str = "") -> dict:
    """获取 GitHub Trending 项目"""
    url = "https://api.github.com/search/repositories"
    params = {
        "q": f"stars:>1000 created:>2026-05-01 language:{language}" if language else "stars:>1000 created:>2026-05-01",
        "sort": "stars",
        "order": "desc",
        "per_page": 5
    }
    resp = requests.get(url).json()
    return {"repos": [{"name": r["full_name"], "stars": r["stargazers_count"]} for r in resp.get("items", [])]}

# 注册所有工具
tools = types.Tool(
    function_declarations=[
        {
            "name": "get_github_trending",
            "description": "获取 GitHub 上最近的热门项目",
            "parameters": {
                "type": "object",
                "properties": {
                    "language": {"type": "string", "description": "编程语言过滤，如 python、javascript"}
                }
            }
        }
    ],
    google_search={},      # 开启搜索
    code_execution={}       # 开启代码执行
)

client = genai.Client(api_key="你的API_KEY")
query = sys.argv[1] if len(sys.argv) > 1 else "GitHub 上最近有什么热门的 Python AI 项目？"

response = client.models.generate_content(
    model="gemini-3.5-flash",
    contents=query,
    config=types.GenerateContentConfig(tools=[tools])
)

print(response.text)

把这个脚本保存为 ai.py，然后：

python ai.py "帮我分析一下特斯拉最近的股价走势"
python ai.py "给我写一个 Flask 的 hello world"
python ai.py "GitHub 上这周最火的 AI 开源项目有哪些"

一个命令，三种能力（搜索 + 代码执行 + 自定义工具），这就是 Gemini 3.5 Flash 的完整形态。

一些踩坑记录

API Key 要开计费。 虽然 AI Studio 是免费的，但要启用代码执行和搜索功能，需要在 Google Cloud Console 里绑定一个计费账户（不会真扣钱，有个免费额度）。
Function Calling 的参数定义要精确。 我一开始把参数类型写成 integer，但实际传的是字符串，模型就懵了。建议先在 AI Studio 里用可视化界面测试，确认没问题再写代码。
模型有时会「编造」函数调用结果。 如果你在代码里没有正确把函数执行结果传回给模型，它会自己脑补一个结果。所以一定要做完整的调用循环：用户输入 → 模型决定调哪个函数 → 你执行函数 → 把结果传回模型 → 模型输出最终答案。
代码执行超时。 沙箱环境有 30 秒的执行限制。复杂的数据处理建议走 Function Calling + 自己的后端。

总结

Google I/O 2026 的这波更新，核心就三个字：Agent 化。Gemini 3.5 Flash 不再只是一个「聊天机器人」，而是一个能调用工具、执行代码、搜索网络的自主工作单元。

对个人开发者来说，最实在的好处是：以前你要搭 LangChain 或者自己写 Agent 框架才能实现的功能，现在 Gemini 3.5 Flash 原生就支持，几行代码就能跑起来。

和 Claude Code / Codex 的对比

很多人问：这东西跟 Claude Code、GitHub Copilot、OpenAI Codex 比怎么样？简单说下我的理解：

Gemini 3.5 Flash 不是 IDE 插件，是底层模型+Agent 框架。 Claude Code 和 Codex 是一整套开发环境（终端里跑、读你的文件、帮你改代码），而 Gemini 3.5 Flash 提供的是原材料——你可以用它来搭建自己的 AI 应用。如果你只是想在终端里让 AI 帮你写代码，Claude Code 或 Codex 更合适。但如果你想做一个能自动处理用户工单的系统，或者一个能查询数据库并生成报表的内部工具，Gemini 3.5 Flash 的原生 Agent 能力会省你很多事。

另外，价格是一个很现实的考量。Gemini 3.5 Flash 的 API 定价大约是同类竞品的 1/5 到 1/10。如果你要做高并发、高吞吐的 AI 应用，这个差价很快就能体现出来。

下一步

下篇我会写一个更完整的项目：用 Gemini 3.5 Flash + GitHub API 做一个自动生成技术周报的工具。关注我，别错过。

📌 作者：Aliaoo
🚀 专注 AI 工具实战、云部署、自动化脚本。每篇都是亲测可跑的教程。

🖥️ 需要云服务器跑项目？ 👉 CSDN 开发云常年折扣，新用户首单特惠

📬 觉得有用就点个赞，想追更就点个关注——下次搜到我不靠缘分。

AI Agent技术社区

Agent 垂直技术社区，欢迎活跃、内容共建。

更多推荐

从Anthropic官方文档看Claude的安全机制：隔离、模型与外部内容的三层防御体系

十二个月前，如果有人提议让Claude拥有足以搞垮Anthropic内部服务的权限，我们一定会断然拒绝。而今天，这种访问级别已经成为常态，Anthropic内部的开发者们正因为这种部署而大幅提升了生产力。这是我读完Anthropic官方工程博客《How we contain Claude across products》（2026年5月25日发布）后的第一感受。当AI Agent的能力越强大，它的