Gemini3：下一世代 Google 闭源模型正式登场

Google Gemini 3.0 重磅登场：AI 的新纪元

2025 年 11 月 18 日，Google 正式推出了 Gemini 3.0 系列，其中旗舰版本 Gemini 3 Pro 引起了广泛关注。这一次，Google 不只是提升参数量，而是在思考能力、多模态理解、Agent 架构上做了重大升级。以下是 Gemini 3.0 的核心亮点，以及对开发者和普通用户的意义。

一、Gemini 3.0 Pro：技术亮点一览

多模态和大上下文理解

Gemini 3 Pro 支持 文字、图像、音频、视频 输入，真正实现多种形式信息的融合。
最多允许 百万级 token 的上下文窗口，意味着它能够一次处理非常长的文本或多模态内容。

高效与节省成本的架构

采用稀疏专家混合（Sparse MoE）架构，每次推理只激活部分专家单元。
这种设计让模型既能保持非常强的能力，又能使运算速度快、使用成本更低。

强大的思考力与推理能力

在数学、逻辑推理等领域，Gemini 3 Pro 表现非常突出。它能处理复杂问题，更像一个“思考型”模型。
它还大幅提升了与外部工具协作的能力，也就是说，Agent（AI 代理）能力更强、更灵活。

二、使用方式 — 怎么体验 Gemini 3.0

Google AI Studio：这是最快上手 Gemini 3 的入口，适合做原型、试 Prompt。

0179565c-2eba-472f-ab6a-f787687137fb.png

Vertex AI Studio：适合与 Google Cloud 生态整合的开发者/团队。

image.png

Gemini CLI：可以通过 API 使用 Gemini 3，但目前需要付费授权。

image.png

Gemini App：可在 Gemini 官方 App 中体验 3.0 模型（部分用户社区反馈正在分批上线）。 > 有用户反映：

“I still only have access to 2.5 … how long will it take … to have access to 3.0 and 3.0 pro？” (Reddit)
也有人确认：「Gemini 3.0 Pro is out … in AI Studio … but not yet everywhere」(Reddit)

三、性能评测与用户反馈

在多个基准测试中，Gemini 3 Pro 的 数学能力大幅提升，远超很多前代模型。根据媒体报道，其在 MathArena 的成绩非常抢眼。(Sina Finance)
社区用户也有真实体验，例如：

“Gemini 3.0 Pro 成功解开了别人模型不能破解的挑战题，而且速度很快。” (Reddit)
在评价速度上，有开发者指出其在短文本、图像分析、代码生成方面都比上一代或竞争模型快。(csguide.cn)

以下为 Google 官方提供的模型评测数据。

image.png

从评分可以看到几个关键点：

1. 数学与逻辑推理（Mathematics & Reasoning）

这是 Gemini 3 Pro 表现最惊人的领域：

MathArena Apex（高难度数学竞赛）：Gemini 3 Pro 得分 23.4%，其他模型（包括 GPT-5.1）都低于 2%，显示它在处理极难数学问题上有显著优势。
Humanity’s Last Exam（学术推理）：得分 37.5%，远高于 GPT-5.1 的 26.5%。
ARC-AGI-2（视觉推理）：得分 31.1%，约为其他模型（13%–17%）的两倍，说明在新颖场景下适应能力很强。
AIME 2025：无工具时达 95.0%，若配合代码执行则达 100%（与 Claude Sonnet 4.5 并列满分）。

2. 多模态与视觉理解（Multimodal & Vision）

Gemini 3 Pro 在图像、视频与屏幕理解上表现突出：

ScreenSpot-Pro（屏幕理解）：Gemini 3 Pro 达到 72.7%，第二名 Claude 为 36.2%，GPT-5.1 仅 3.5%，说明非常适合用作电脑操作代理（Computer Use Agents）。
Video-MMMU（视频知识）：得分 87.6%，领先群雄。
OmniDocBench 1.5（OCR 文本识别）：编辑距离（Edit Distance）仅 0.115，为所有模型中最低。

3. 代理能力与编码（Agentic & Coding）

LiveCodeBench Pro（编程竞赛）：Elo 分数 2,439，显著高于 GPT-5.1 的 2,243。
Vending-Bench 2：以净值衡量，Gemini 3 Pro 平均达到 $5,478.16，远高于 Claude 的$ 3,838 与 GPT-5.1 的 $1,473，显示其在执行长期复杂任务方面效率与成功率很高。
例外项：在 SWE-Bench Verified（软件工程代理）中，Gemini 3 Pro 得 76.2%，以微小差距不及 Claude Sonnet 4.5（77.2%），这是少数未夺冠的项目之一。

四、安全与责任：Google 的承诺

Google 对 Gemini 3 进行了严格的安全审查，包括 红队测试（人工 + 自动化）和持续评估。
核心安全政策覆盖儿童安全（CSAM）、仇恨言论、暴力内容、骚扰、医疗误导等敏感内容。
同时，Google 还通过数据过滤、人类反馈强化学习等技术来降低风险。

五、新工具平台：Google Antigravity

与 Gemini 3.0 一同发布的还有 Google Antigravity，这是一个 “代理优先（agent-first）” 的开发平台。其设计理念和功能很有意思：

在编辑器（IDE）中嵌入同步代理，实时协助开发；
支持异步代理，可控制浏览器、执行后台任务；
通过 “Artifacts”（如计划清单、屏幕截图、浏览器记录）来记录代理行为，便于验证和信任；
有中央知识库，用来存储项目知识、总结经验，使代理长期学习和优化。

对开发者来说，这相当于把繁琐重复的任务交给 AI 代理，把自己更好地解放出来，专注于规划和创造。

六、为什么 Gemini 3.0 对你重要？

普通用户：更强大的理解能力 + 多模态输入，让 AI 更像你生活中的智能助理，不仅能对话，还能看图、听声音、理解视频。
内容创作者 /写作者：大上下文窗口允许一次处理很长内容，写论文、长文案、报告更方便。
开发者 /企业：Agent 能力 + Antigravity 平台带来新的工作方式，把复杂任务拆给 AI，实现自动化协作。
长期 AI 应用：强大的推理、工具调用能力，让 Gemini 3.0 更适合复杂、多步骤的业务流程。

七、结语

Gemini 3.0 的发布，是 Google 在 AI “思考力”、多模态理解和 Agent 架构上的一次重要跨越。它不仅提升了模型本身的能力，也通过 Antigravity 平台带来了新的协作 paradigm。

如果你还没体验，建议你：

尝试在 Google AI Studio 或 Gemini App 中切换到 3.0 Pro（如果已开放的话）；
如果你是开发者，关注 Antigravity：这是未来构建智能代理工作流的重要路径；
如果你是内容工作者，尝试把长文、复杂素材交给 Gemini 处理 – 看看它能给你带来怎样的效率提升。

欢迎你在评论里留下你的体验 😄

Gemini3：下一世代 Google 闭源模型正式登场