Gemini 3.5 Flash 开发者实战指南:比上一代快 4 倍,免费 API 就能跑
Agent 化。Gemini 3.5 Flash 不再只是一个「聊天机器人」,而是一个能调用工具、执行代码、搜索网络的自主工作单元。对个人开发者来说,最实在的好处是:以前你要搭 LangChain 或者自己写 Agent 框架才能实现的功能,现在 Gemini 3.5 Flash 原生就支持,几行代码就能跑起来。
Gemini 3.5 Flash 开发者实战指南:比上一代快 4 倍,免费 API 就能跑
Google I/O 2026 刚过去一周,如果你还没关注这次发布的新东西,你可能已经错过了今年最重要的一个开发者工具更新。
简单说:Google 发了一个叫 Gemini 3.5 Flash 的新模型,性能超越了上一代旗舰 Gemini 3.1 Pro,但速度是它的 4 倍,而且完全免费就能用。
我花了两天时间把这东西从头到尾跑了一遍,这篇文章就是我的实战记录——从注册到写出第一个可以自动调用工具的 Agent,每一步都有代码,每一步都能复现。
先搞清楚这玩意儿强在哪
发布会上的数据我就不复读了,说几个对开发者真正有用的点:
1. 速度碾压同类模型。 Google 官方说输出速度比其他前沿模型快 4 倍。我自己实测,同样一个「帮我写一个 Python FastAPI 后端,带 JWT 鉴权」的 prompt,Gemini 3.5 Flash 返回完整代码只用了 8 秒,作为对比,某个大家常用的竞品模型用了 32 秒。
2. 100 万 token 上下文窗口。 这意味着你可以把整本《三体》第一部扔进去让它分析,或者把一个 5 万行的代码仓库塞进去让它帮你找 bug。实际使用中,我没测到那么极端,但扔进去一个 3000 行的 Python 项目让它做代码审查,完全没问题。
3. 原生 Agent 能力。 这是我最看重的一点。Gemini 3.5 Flash 可以直接调用外部工具(Function Calling)、执行代码、搜索网页——而且这些能力是「内置」的,不需要自己搭框架。后面我会演示具体怎么做。
4. 免费。 在 Google AI Studio 里用,每分钟 20 次请求,每天 1500 次,对个人开发者和学习来说完全够。付费 API 的价格也非常低,100 万 token 输入不到 1 块钱人民币。
第一步:拿到 API Key(2 分钟)
去 Google AI Studio ,用 Google 账号登录,点击左侧「Get API Key」,复制那一串字符串。
如果你只是想先在网页上试试效果,AI Studio 本身就提供了一个聊天界面,不需要写任何代码。但我建议你直接走 API,后面能做的事情多得多。
第二步:装上 SDK,跑通第一个请求
pip install google-genai
然后写一个最简单的调用:
from google import genai
client = genai.Client(api_key="你的API_KEY")
response = client.models.generate_content(
model="gemini-3.5-flash",
contents="用 Python 写一个冒泡排序,并解释时间复杂度"
)
print(response.text)
跑一下,你会看到它返回了完整的代码 + 解释。这个没啥稀奇的,所有大模型都能做。真正厉害的在后面。
重点来了:Function Calling——让模型调用你的工具
这是 Gemini 3.5 Flash 最实用的功能。简单说就是:你定义一些函数(比如查天气、查数据库、发邮件),模型可以根据用户的自然语言指令,自动决定调用哪个函数、传什么参数。
我写一个你马上就能用的例子:一个能查询股票价格的 AI 助手。
from google import genai
from google.genai import types
import yfinance as yf
# 定义工具函数
def get_stock_price(ticker: str) -> dict:
"""获取指定股票的最新价格"""
stock = yf.Ticker(ticker)
info = stock.info
return {
"ticker": ticker,
"price": info.get("currentPrice", info.get("regularMarketPrice", 0)),
"company": info.get("longName", ticker)
}
# 注册为 Gemini 工具
stock_tool = types.Tool(
function_declarations=[{
"name": "get_stock_price",
"description": "获取指定股票的最新价格",
"parameters": {
"type": "object",
"properties": {
"ticker": {
"type": "string",
"description": "股票代码,如 AAPL、GOOGL、TSLA"
}
},
"required": ["ticker"]
}
}]
)
client = genai.Client(api_key="你的API_KEY")
# 第一轮:模型告诉你它想调用哪个函数
response = client.models.generate_content(
model="gemini-3.5-flash",
contents="帮我查一下苹果和特斯拉的股价",
config=types.GenerateContentConfig(tools=[stock_tool])
)
# 解析模型的函数调用请求
for part in response.candidates[0].content.parts:
if part.function_call:
func_name = part.function_call.name
args = dict(part.function_call.args)
print(f"模型想调用: {func_name}({args})")
# 实际执行函数
if func_name == "get_stock_price":
result = get_stock_price(**args)
print(f"返回结果: {result}")
运行结果大概是这样:
模型想调用: get_stock_price({'ticker': 'AAPL'})
返回结果: {'ticker': 'AAPL', 'price': 228.5, 'company': 'Apple Inc.'}
模型想调用: get_stock_price({'ticker': 'TSLA'})
返回结果: {'ticker': 'TSLA', 'price': 342.8, 'company': 'Tesla, Inc.'}
这就是 Function Calling 的核心流程:用户说人话 → 模型决定调用哪个工具 → 你的代码执行工具 → 模型根据结果组织回答。
进阶玩法:Managed Agents——一个 API 调起完整 Agent
这是 Google I/O 上我觉得最酷的一个新功能。以前你要让 AI 写代码、执行代码、看结果、继续改,得自己写一堆循环逻辑。现在 Gemini 3.5 Flash 内置了这个能力,一个 API 调用就搞定。
from google import genai
from google.genai import types
client = genai.Client(api_key="你的API_KEY")
# 开启代码执行工具
response = client.models.generate_content(
model="gemini-3.5-flash",
contents="用 Python 画一张 2024 年比特币价格走势图,并标注最高点和最低点。把数据和图都展示出来。",
config=types.GenerateContentConfig(
tools=[types.Tool(code_execution={})] # 开启代码执行
)
)
# 模型会自动写代码、执行、返回结果
for part in response.candidates[0].content.parts:
if part.text:
print(part.text)
if part.executable_code:
print(f"\n[执行代码]:\n{part.executable_code.code[:200]}...")
if part.code_execution_result:
print(f"[执行结果]: {part.code_execution_result.output[:300]}")
你不需要装 Python 环境,不需要配 matplotlib,模型会在 Google 的沙箱里帮你写完代码、跑完、把结果(包括图表)一起返回给你。这个体验和 Claude 的 Artifacts 有点像,但它走的是 API,可以嵌入到你自己的产品里。
结合搜索:让 AI 的回答永远是最新的
大模型有一个通病:训练数据有截止日期。Gemini 3.5 Flash 可以直接调用 Google 搜索来解决这个问题。
response = client.models.generate_content(
model="gemini-3.5-flash",
contents="今天 Google 的股价是多少?最近有什么重大新闻?",
config=types.GenerateContentConfig(
tools=[types.Tool(google_search={})] # 开启搜索
)
)
print(response.text)
模型会自动搜索最新信息,然后基于搜索结果组织回答。这个功能对我这种每天要写技术文章的人来说,简直是信息收集的神器。
实际开发场景:一个完整的 AI 命令行工具
说了这么多,来个综合的例子:一个命令行工具,输入自然语言,自动搜索信息、执行计算、查询外部 API。
import sys
from google import genai
from google.genai import types
import requests
# 自定义工具:查 GitHub Trending
def get_github_trending(language: str = "") -> dict:
"""获取 GitHub Trending 项目"""
url = "https://api.github.com/search/repositories"
params = {
"q": f"stars:>1000 created:>2026-05-01 language:{language}" if language else "stars:>1000 created:>2026-05-01",
"sort": "stars",
"order": "desc",
"per_page": 5
}
resp = requests.get(url).json()
return {"repos": [{"name": r["full_name"], "stars": r["stargazers_count"]} for r in resp.get("items", [])]}
# 注册所有工具
tools = types.Tool(
function_declarations=[
{
"name": "get_github_trending",
"description": "获取 GitHub 上最近的热门项目",
"parameters": {
"type": "object",
"properties": {
"language": {"type": "string", "description": "编程语言过滤,如 python、javascript"}
}
}
}
],
google_search={}, # 开启搜索
code_execution={} # 开启代码执行
)
client = genai.Client(api_key="你的API_KEY")
query = sys.argv[1] if len(sys.argv) > 1 else "GitHub 上最近有什么热门的 Python AI 项目?"
response = client.models.generate_content(
model="gemini-3.5-flash",
contents=query,
config=types.GenerateContentConfig(tools=[tools])
)
print(response.text)
把这个脚本保存为 ai.py,然后:
python ai.py "帮我分析一下特斯拉最近的股价走势"
python ai.py "给我写一个 Flask 的 hello world"
python ai.py "GitHub 上这周最火的 AI 开源项目有哪些"
一个命令,三种能力(搜索 + 代码执行 + 自定义工具),这就是 Gemini 3.5 Flash 的完整形态。
一些踩坑记录
-
API Key 要开计费。 虽然 AI Studio 是免费的,但要启用代码执行和搜索功能,需要在 Google Cloud Console 里绑定一个计费账户(不会真扣钱,有个免费额度)。
-
Function Calling 的参数定义要精确。 我一开始把参数类型写成
integer,但实际传的是字符串,模型就懵了。建议先在 AI Studio 里用可视化界面测试,确认没问题再写代码。 -
模型有时会「编造」函数调用结果。 如果你在代码里没有正确把函数执行结果传回给模型,它会自己脑补一个结果。所以一定要做完整的调用循环:用户输入 → 模型决定调哪个函数 → 你执行函数 → 把结果传回模型 → 模型输出最终答案。
-
代码执行超时。 沙箱环境有 30 秒的执行限制。复杂的数据处理建议走 Function Calling + 自己的后端。
总结
Google I/O 2026 的这波更新,核心就三个字:Agent 化。Gemini 3.5 Flash 不再只是一个「聊天机器人」,而是一个能调用工具、执行代码、搜索网络的自主工作单元。
对个人开发者来说,最实在的好处是:以前你要搭 LangChain 或者自己写 Agent 框架才能实现的功能,现在 Gemini 3.5 Flash 原生就支持,几行代码就能跑起来。
和 Claude Code / Codex 的对比
很多人问:这东西跟 Claude Code、GitHub Copilot、OpenAI Codex 比怎么样?简单说下我的理解:
Gemini 3.5 Flash 不是 IDE 插件,是底层模型+Agent 框架。 Claude Code 和 Codex 是一整套开发环境(终端里跑、读你的文件、帮你改代码),而 Gemini 3.5 Flash 提供的是原材料——你可以用它来搭建自己的 AI 应用。如果你只是想在终端里让 AI 帮你写代码,Claude Code 或 Codex 更合适。但如果你想做一个能自动处理用户工单的系统,或者一个能查询数据库并生成报表的内部工具,Gemini 3.5 Flash 的原生 Agent 能力会省你很多事。
另外,价格是一个很现实的考量。Gemini 3.5 Flash 的 API 定价大约是同类竞品的 1/5 到 1/10。如果你要做高并发、高吞吐的 AI 应用,这个差价很快就能体现出来。
下一步
下篇我会写一个更完整的项目:用 Gemini 3.5 Flash + GitHub API 做一个自动生成技术周报的工具。关注我,别错过。
📌 作者:Aliaoo
🚀 专注 AI 工具实战、云部署、自动化脚本。每篇都是亲测可跑的教程。
🖥️ 需要云服务器跑项目? 👉 CSDN 开发云常年折扣,新用户首单特惠
📬 觉得有用就点个赞,想追更就点个关注——下次搜到我不靠缘分。
更多推荐



所有评论(0)