11月19日消息,今天,谷歌正式發布 Gemini 3。它不僅是全球領先的多模態理解模型,更是谷歌迄今為止最強大的智能體(Agentic)和氛圍編程(Vibe Coding)模型,能夠提供更豐富的可視化效果和更深度的交互體驗——而這一切都構建在最先進的推理能力之上。

谷歌于今日推出 Gemini 3 Pro 預覽版,將其集成到 Google 的全棧產品中。用戶在日常生活中即可使用它來學習、構建和規劃一切事務。
同時,谷歌還推出了 Gemini 3 Deep Think 模式——這一增強型推理模式將 Gemini 3 的性能再次提升至全新高度。該模式在向 Google AI Ultra 訂閱用戶開放前,會首先供安全測試人員試用。
推理能力
憑借領先的推理能力和強大的多模態功能,Gemini 3 Pro 能夠將任何創意變為現實。在每個關鍵的 AI 基準測試中,它的性能均顯著超越 2.5 Pro。
它在 LMArena 排行榜上以 1501 的突破性 Elo 評分高居榜首。其在推理能力上展現出博士水平,在“人類終極考試”中(未使用任何工具的情況下得分率達 37.5%)及 GPQA Diamond 基準測試中(準確率高達 91.9%)均獲得最高分。
此外,它在數學領域為前沿模型樹立了全新標桿,在 MathArena Apex 測試中,以 23.4% 達到了最先進水平(State-of-the-Art)。
除了文本能力,Gemini 3 Pro 在 MMMU-Pro 上取得 81% 的成績,在 Video-MMMU 上達到 87.6%。同時,該模型在 SimpleQA Verified 基準測試中也斬獲了當前最先進的 72.1% 得分,展現出其在事實準確性方面的顯著進步。
這意味著 Gemini 3 Pro 具備高度可靠性,能夠有效解決跨越科學和數學等廣泛主題的復雜問題。

Gemini 3 在一系列關鍵 AI 基準測試中達到了最先進水平
Gemini 3 Pro 為每一次交互帶來了全新的深度和細致入微的體驗。它的回復智能、簡潔、直接,它會告訴用戶真正需要了解的信息,而不僅僅是用戶希望聽到的。Gemini 3 Pro 提供了理解信息和自我表達的全新途徑,無論是通過生成高保真可視化代碼來解析深奧的科學概念,還是進行創意頭腦風暴,都能為用戶提供強大助力。
深度思考
Gemini 3 的“深度思考模式”(Deep Think mode)進一步拓展了智能的邊界,為 Gemini 3 的推理和多模態理解能力帶來了跨越式提升,能夠助力您攻克更復雜的難題。

Gemini 3 的“深度思考模式”(Deep Think mode)在一些最具挑戰性的 AI 基準測試中表現出色
在測試中,Gemini 3 Deep Think 在“人類最終考試”(Humanity's Last Exam)中的表現(未使用工具的情況下達到 41.0%)以及在 GPQA Diamond 測試中的表現(達到 93.8%),均超越了 Gemini 3 Pro 已經令人印象深刻的成績。
此外,它還在 ARC-AGI -2 基準測試中取得了 45.1% 的突破性成績(啟用代碼執行),充分展現了其解決新型挑戰的能力。
學習一切
Gemini 從設計之初,就致力于無縫整合任何主題的跨模態信息,涵蓋文本、圖像、視頻、音頻和代碼。Gemini 3 以其領先的推理能力、視覺與空間理解能力、多語言性能以及 100 萬令牌的上下文窗口,進一步突破了多模態推理的前沿,幫助您以最適合自己的方式進行學習。
舉例來說,如果您想學習烹飪家族傳統菜肴,Gemini 3 可以解讀并翻譯不同語言的手寫菜譜,整理成一本可分享的家族食譜。又或者,當您希望研究一個新主題時,只需提供學術論文、冗長的視頻講座或教程,它便能生成用于交互式閃卡、可視化圖表或其他形式的代碼,幫助您快速掌握素材。它甚至可以分析您匹克球比賽的視頻,識別技術短板,并生成全面提升動作技巧的訓練計劃。
為了幫助您更好地理解網絡信息,Search 中的 AI 模式 (AI Mode) 現已整合 Gemini 3,帶來全新的生成式用戶界面(Generative UI)體驗,例如沉浸式視覺布局、交互式工具和模擬,所有內容均可根據您的查詢實時生成。
構建一切
在 2.5 Pro 成功的基礎上,Gemini 3 兌現了幫助開發者將創意變為現實的承諾。它在零樣本生成(Zero-shot Generation)方面表現出色,能夠處理復雜的提示和指令,從而渲染出更豐富、更具交互性的網頁用戶界面(Web UI)。
Gemini 3 是我們迄今為止構建的最出色的氛圍編程(Vibe Coding)和智能體編程(Agentic Coding)模型——讓我們的產品更具自主性,同時提高開發者生產力。它在 WebDev Arena 排行榜上以令人矚目的 1487 ELO 名列前茅。
在 Terminal-Bench 2.0 測試中(一個測試模型通過終端操作計算機的工具使用能力)上也取得 54.2% 的好成績;同時,在衡量編程智能體(coding agents)的 SWE-bench Verified(76.2%)基準測試中,其表現遠超 2.5 Pro。
您現在可以通過 Google AI Studio、Vertex AI、Gemini CLI 以及我們全新的智能體開發平臺 Google Antigravity 中使用 Gemini 3 進行開發和構建。同時,它也已在 Cursor、GitHub、JetBrains、Manus、Replit 等第三方平臺上線。
全新的以智能體為核心的開發體驗
隨著 Gemini 3 模型智能的不斷加速,我們有機會重新構想整個開發者體驗(developer experience)。今天,我們正式發布 Google Antigravity,我們全新的智能體開發平臺,讓開發者能夠在更高層次上,以任務為導向的方式進行開發。
Google Antigravity 利用 Gemini 3 的高級推理、工具使用和智能編碼能力,將 AI 輔助從開發者工具包中的工具轉變為一個活躍的伙伴。盡管 Google Antigravity 的核心仍沿用熟悉的 AI 集成開發環境(IDE),但其智能體已被提升到一個專屬的界面,并被賦予直接訪問編輯器、終端和瀏覽器的權限。
現在,智能體能夠代表您自主規劃和執行復雜的端到端軟件任務,并在此過程中自行驗證代碼。
除了 Gemini 3 Pro 之外,Google Antigravity 還深度整合了我們最新的用于瀏覽器控制的 Gemini 2.5 Computer Use 模型,以及我們廣受好評的圖像編輯模型 Nano Banana(Gemini 2.5 Image)。
規劃一切
自從 Gemini 2 開啟智能體時代以來,我們取得了巨大的進展,不僅提升了 Gemini 的編碼智能體(coding agent)能力,還提高了它在更長周期內可靠地提前規劃能力。Gemini 3 在 Vending-Bench 2 排行榜上名列榜首,印證了這一點。
該基準測試通過管理模擬自動售貨機業務來測試長周期規劃能力。Gemini 3 在整整一年的模擬運營過程中,保持了工具使用和決策的一致性,在沒有偏離任務的前提下,帶來了更高的回報。