Gemini 3.5 Flash 开发者实战指南:比上一代快 4 倍,免费 API 就能跑

Google I/O 2026 刚过去一周,如果你还没关注这次发布的新东西,你可能已经错过了今年最重要的一个开发者工具更新。

简单说:Google 发了一个叫 Gemini 3.5 Flash 的新模型,性能超越了上一代旗舰 Gemini 3.1 Pro,但速度是它的 4 倍,而且完全免费就能用。

我花了两天时间把这东西从头到尾跑了一遍,这篇文章就是我的实战记录——从注册到写出第一个可以自动调用工具的 Agent,每一步都有代码,每一步都能复现。


先搞清楚这玩意儿强在哪

发布会上的数据我就不复读了,说几个对开发者真正有用的点:

1. 速度碾压同类模型。 Google 官方说输出速度比其他前沿模型快 4 倍。我自己实测,同样一个「帮我写一个 Python FastAPI 后端,带 JWT 鉴权」的 prompt,Gemini 3.5 Flash 返回完整代码只用了 8 秒,作为对比,某个大家常用的竞品模型用了 32 秒。

2. 100 万 token 上下文窗口。 这意味着你可以把整本《三体》第一部扔进去让它分析,或者把一个 5 万行的代码仓库塞进去让它帮你找 bug。实际使用中,我没测到那么极端,但扔进去一个 3000 行的 Python 项目让它做代码审查,完全没问题。

3. 原生 Agent 能力。 这是我最看重的一点。Gemini 3.5 Flash 可以直接调用外部工具(Function Calling)、执行代码、搜索网页——而且这些能力是「内置」的,不需要自己搭框架。后面我会演示具体怎么做。

4. 免费。 在 Google AI Studio 里用,每分钟 20 次请求,每天 1500 次,对个人开发者和学习来说完全够。付费 API 的价格也非常低,100 万 token 输入不到 1 块钱人民币。


第一步:拿到 API Key(2 分钟)

Google AI Studio ,用 Google 账号登录,点击左侧「Get API Key」,复制那一串字符串。

如果你只是想先在网页上试试效果,AI Studio 本身就提供了一个聊天界面,不需要写任何代码。但我建议你直接走 API,后面能做的事情多得多。


第二步:装上 SDK,跑通第一个请求

pip install google-genai

然后写一个最简单的调用:

from google import genai

client = genai.Client(api_key="你的API_KEY")

response = client.models.generate_content(
    model="gemini-3.5-flash",
    contents="用 Python 写一个冒泡排序,并解释时间复杂度"
)

print(response.text)

跑一下,你会看到它返回了完整的代码 + 解释。这个没啥稀奇的,所有大模型都能做。真正厉害的在后面。


重点来了:Function Calling——让模型调用你的工具

这是 Gemini 3.5 Flash 最实用的功能。简单说就是:你定义一些函数(比如查天气、查数据库、发邮件),模型可以根据用户的自然语言指令,自动决定调用哪个函数、传什么参数。

我写一个你马上就能用的例子:一个能查询股票价格的 AI 助手。

from google import genai
from google.genai import types
import yfinance as yf

# 定义工具函数
def get_stock_price(ticker: str) -> dict:
    """获取指定股票的最新价格"""
    stock = yf.Ticker(ticker)
    info = stock.info
    return {
        "ticker": ticker,
        "price": info.get("currentPrice", info.get("regularMarketPrice", 0)),
        "company": info.get("longName", ticker)
    }

# 注册为 Gemini 工具
stock_tool = types.Tool(
    function_declarations=[{
        "name": "get_stock_price",
        "description": "获取指定股票的最新价格",
        "parameters": {
            "type": "object",
            "properties": {
                "ticker": {
                    "type": "string",
                    "description": "股票代码,如 AAPL、GOOGL、TSLA"
                }
            },
            "required": ["ticker"]
        }
    }]
)

client = genai.Client(api_key="你的API_KEY")

# 第一轮:模型告诉你它想调用哪个函数
response = client.models.generate_content(
    model="gemini-3.5-flash",
    contents="帮我查一下苹果和特斯拉的股价",
    config=types.GenerateContentConfig(tools=[stock_tool])
)

# 解析模型的函数调用请求
for part in response.candidates[0].content.parts:
    if part.function_call:
        func_name = part.function_call.name
        args = dict(part.function_call.args)
        print(f"模型想调用: {func_name}({args})")
        
        # 实际执行函数
        if func_name == "get_stock_price":
            result = get_stock_price(**args)
            print(f"返回结果: {result}")

运行结果大概是这样:

模型想调用: get_stock_price({'ticker': 'AAPL'})
返回结果: {'ticker': 'AAPL', 'price': 228.5, 'company': 'Apple Inc.'}
模型想调用: get_stock_price({'ticker': 'TSLA'})
返回结果: {'ticker': 'TSLA', 'price': 342.8, 'company': 'Tesla, Inc.'}

这就是 Function Calling 的核心流程:用户说人话 → 模型决定调用哪个工具 → 你的代码执行工具 → 模型根据结果组织回答。


进阶玩法:Managed Agents——一个 API 调起完整 Agent

这是 Google I/O 上我觉得最酷的一个新功能。以前你要让 AI 写代码、执行代码、看结果、继续改,得自己写一堆循环逻辑。现在 Gemini 3.5 Flash 内置了这个能力,一个 API 调用就搞定。

from google import genai
from google.genai import types

client = genai.Client(api_key="你的API_KEY")

# 开启代码执行工具
response = client.models.generate_content(
    model="gemini-3.5-flash",
    contents="用 Python 画一张 2024 年比特币价格走势图,并标注最高点和最低点。把数据和图都展示出来。",
    config=types.GenerateContentConfig(
        tools=[types.Tool(code_execution={})]  # 开启代码执行
    )
)

# 模型会自动写代码、执行、返回结果
for part in response.candidates[0].content.parts:
    if part.text:
        print(part.text)
    if part.executable_code:
        print(f"\n[执行代码]:\n{part.executable_code.code[:200]}...")
    if part.code_execution_result:
        print(f"[执行结果]: {part.code_execution_result.output[:300]}")

你不需要装 Python 环境,不需要配 matplotlib,模型会在 Google 的沙箱里帮你写完代码、跑完、把结果(包括图表)一起返回给你。这个体验和 Claude 的 Artifacts 有点像,但它走的是 API,可以嵌入到你自己的产品里。


结合搜索:让 AI 的回答永远是最新的

大模型有一个通病:训练数据有截止日期。Gemini 3.5 Flash 可以直接调用 Google 搜索来解决这个问题。

response = client.models.generate_content(
    model="gemini-3.5-flash",
    contents="今天 Google 的股价是多少?最近有什么重大新闻?",
    config=types.GenerateContentConfig(
        tools=[types.Tool(google_search={})]  # 开启搜索
    )
)

print(response.text)

模型会自动搜索最新信息,然后基于搜索结果组织回答。这个功能对我这种每天要写技术文章的人来说,简直是信息收集的神器。


实际开发场景:一个完整的 AI 命令行工具

说了这么多,来个综合的例子:一个命令行工具,输入自然语言,自动搜索信息、执行计算、查询外部 API。

import sys
from google import genai
from google.genai import types
import requests

# 自定义工具:查 GitHub Trending
def get_github_trending(language: str = "") -> dict:
    """获取 GitHub Trending 项目"""
    url = "https://api.github.com/search/repositories"
    params = {
        "q": f"stars:>1000 created:>2026-05-01 language:{language}" if language else "stars:>1000 created:>2026-05-01",
        "sort": "stars",
        "order": "desc",
        "per_page": 5
    }
    resp = requests.get(url).json()
    return {"repos": [{"name": r["full_name"], "stars": r["stargazers_count"]} for r in resp.get("items", [])]}

# 注册所有工具
tools = types.Tool(
    function_declarations=[
        {
            "name": "get_github_trending",
            "description": "获取 GitHub 上最近的热门项目",
            "parameters": {
                "type": "object",
                "properties": {
                    "language": {"type": "string", "description": "编程语言过滤,如 python、javascript"}
                }
            }
        }
    ],
    google_search={},      # 开启搜索
    code_execution={}       # 开启代码执行
)

client = genai.Client(api_key="你的API_KEY")
query = sys.argv[1] if len(sys.argv) > 1 else "GitHub 上最近有什么热门的 Python AI 项目?"

response = client.models.generate_content(
    model="gemini-3.5-flash",
    contents=query,
    config=types.GenerateContentConfig(tools=[tools])
)

print(response.text)

把这个脚本保存为 ai.py,然后:

python ai.py "帮我分析一下特斯拉最近的股价走势"
python ai.py "给我写一个 Flask 的 hello world"
python ai.py "GitHub 上这周最火的 AI 开源项目有哪些"

一个命令,三种能力(搜索 + 代码执行 + 自定义工具),这就是 Gemini 3.5 Flash 的完整形态。


一些踩坑记录

  1. API Key 要开计费。 虽然 AI Studio 是免费的,但要启用代码执行和搜索功能,需要在 Google Cloud Console 里绑定一个计费账户(不会真扣钱,有个免费额度)。

  2. Function Calling 的参数定义要精确。 我一开始把参数类型写成 integer,但实际传的是字符串,模型就懵了。建议先在 AI Studio 里用可视化界面测试,确认没问题再写代码。

  3. 模型有时会「编造」函数调用结果。 如果你在代码里没有正确把函数执行结果传回给模型,它会自己脑补一个结果。所以一定要做完整的调用循环:用户输入 → 模型决定调哪个函数 → 你执行函数 → 把结果传回模型 → 模型输出最终答案。

  4. 代码执行超时。 沙箱环境有 30 秒的执行限制。复杂的数据处理建议走 Function Calling + 自己的后端。


总结

Google I/O 2026 的这波更新,核心就三个字:Agent 化。Gemini 3.5 Flash 不再只是一个「聊天机器人」,而是一个能调用工具、执行代码、搜索网络的自主工作单元。

对个人开发者来说,最实在的好处是:以前你要搭 LangChain 或者自己写 Agent 框架才能实现的功能,现在 Gemini 3.5 Flash 原生就支持,几行代码就能跑起来。

和 Claude Code / Codex 的对比

很多人问:这东西跟 Claude Code、GitHub Copilot、OpenAI Codex 比怎么样?简单说下我的理解:

Gemini 3.5 Flash 不是 IDE 插件,是底层模型+Agent 框架。 Claude Code 和 Codex 是一整套开发环境(终端里跑、读你的文件、帮你改代码),而 Gemini 3.5 Flash 提供的是原材料——你可以用它来搭建自己的 AI 应用。如果你只是想在终端里让 AI 帮你写代码,Claude Code 或 Codex 更合适。但如果你想做一个能自动处理用户工单的系统,或者一个能查询数据库并生成报表的内部工具,Gemini 3.5 Flash 的原生 Agent 能力会省你很多事。

另外,价格是一个很现实的考量。Gemini 3.5 Flash 的 API 定价大约是同类竞品的 1/5 到 1/10。如果你要做高并发、高吞吐的 AI 应用,这个差价很快就能体现出来。

下一步

下篇我会写一个更完整的项目:用 Gemini 3.5 Flash + GitHub API 做一个自动生成技术周报的工具。关注我,别错过。


📌 作者:Aliaoo
🚀 专注 AI 工具实战、云部署、自动化脚本。每篇都是亲测可跑的教程。

CSDN开发云

🖥️ 需要云服务器跑项目? 👉 CSDN 开发云常年折扣,新用户首单特惠

📬 觉得有用就点个赞,想追更就点个关注——下次搜到我不靠缘分。

Logo

Agent 垂直技术社区,欢迎活跃、内容共建。

更多推荐