谷歌今年的 I/O,表面上看是一场 AI 新品发布会,但真正的主角,其实只有一个:Gemini。

更准确地说,是一整套围绕 Gemini 构建的 AI 系统:Gemini Flash、Gemini Omni、Gemini Audio、Nano Banana、Antigravity,以及 Gemini App、Gemini API、AI Studio、Android Studio、AI Mode、Gemini Enterprise 等入口。

Google 已经不再只是展示“一个更聪明的大模型”,而是在展示一套完整的 AI 操作层:模型不仅能聊天,还能看图、听音频、写代码、调用工具、连接搜索、执行工作流,甚至并行运行多个 Agent。

而这次 I/O 最值得关注的核心,其实是 Gemini Flash 的定位变化。

过去 Flash 系列更多被视为“轻量、高速、低成本”的 Gemini 版本,但这次 Google 明显开始把它推向生产级 Agent 工作流中心。Google 官方重点强调的方向已经不再只是推理能力,而是 coding、tool use、workflow execution 与 multi-agent orchestration。

Gemini Flash 核心规格

这次 Google 一个非常明显的变化,是 Benchmark 体系开始从“考试型评测”转向“真实工作任务评测”。

过去的大模型 benchmark 更像 AI 高考,重点是数学、知识、推理和选择题;但这次 Google 重点展示的大多数 benchmark,都明显偏向 Agent 与 workflow 场景。

Gemini Flash 关键 Benchmark 成绩

这些 benchmark 的共同特点,是模型不仅需要“会回答”,而是真正完成任务,包括调用工具、执行代码、操作终端、检索信息以及完成完整 workflow。

这也是 Google 这次评测逻辑变化最大的地方:重点已经不再是“模型会不会答题”,而是“模型能不能真正工作”。

除了 Agent 能力,Google 也继续强化多模态与推理能力。长上下文依然是 Gemini 的重点方向,但已经逐渐进入 Long Context Engineering 阶段,真正困难的已经不是 context window 数字本身,而是模型如何在超长上下文中持续检索、保持 attention 稳定,以及维持长期任务一致性。

另一个非常值得关注的点,是 Gemini Flash 在多个 Agent benchmark 上已经开始超越此前的 Pro 系列。

Gemini Flash vs Gemini Pro

这意味着 Google 正在把 Flash 从“轻量模型”升级为默认生产模型。因为对于真实 Agent 系统来说,开发者真正需要的并不只是更强 benchmark,而是更低延迟、更低成本、更稳定的 tool use 与 workflow execution。

相比 Flash 的 Agent 定位,Gemini Omni 更偏向统一多模态生成。Google 在现场反复强调“Create anything from anything”,本质上是希望统一文本、图像、视频与音频生成能力,并与 Veo、Imagen、Lyria、Nano Banana、Gemini Audio 组成完整生成矩阵。

另一个非常值得关注的系统,则是 Antigravity。Google 现场直接展示了多个 sub-agents 并行运行,包括 artifact generation、workflow execution 与 multi-agent coordination。这其实也是为什么 Google 开始重点强调 Terminal-bench、SWE-Bench、MCP Atlas、OSWorld 等 benchmark——因为这些评测更接近未来真实 Agent 系统的运行环境。

Google 已经不再只想证明“Gemini 很聪明”,而是想证明“Gemini 能真正工作”。

而 Google 最大的优势,其实也不仅仅是模型本身,相比其他 AI 公司,Google 天然拥有:

当 Gemini 与这些系统深度结合后,Google 想做的,其实已经非常接近一套“AI Native Operating Layer”。Google I/O 2026 的核心叙事,其实可以浓缩成一句话:Google 已经不再只是发布一个更强的大模型,而是在构建一整套 AI 时代的操作系统。

不过也需要注意,Agent benchmark 对 toolset、runtime、scaffold、orchestration 依赖非常强,因此这些 benchmark 更适合观察能力趋势,而不适合直接视为绝对排名。不过至少从这次 I/O 来看,Google 已经非常明确地给出了自己的下一阶段方向:从模型竞争转向 Agent 基础设施竞争。

Logo

Agent 垂直技术社区,欢迎活跃、内容共建。

更多推荐