Google發(fā)布Gemini 3大模型,性能遠(yuǎn)超GPT-5.1,已接入Google搜索快訊
用戶已經(jīng)可以通過(guò) Google AI Studio、Vertex AI、Gemini CLI 以及Google全新的智能體開(kāi)發(fā)平臺(tái) Google Antigravity 中使用 Gemini 3 進(jìn)行開(kāi)發(fā)和構(gòu)建,Gemini 3 今天也同步向 Gemini app 用戶、AI Studio 和 Vertex AI 的開(kāi)發(fā)者、以及我們?nèi)碌闹悄荏w開(kāi)發(fā)平臺(tái) Google Antigravit。
【TechWeb】11月19日消息,Google正式發(fā)布Gemini 3大模型,該模型包含了原生多模態(tài)、推理、Agent等多種能力,性能大幅領(lǐng)先Anthropic的Claude Sonnet 4.5模型和OpenAI的GPT-5.1模型。
Google DeepMind研究團(tuán)隊(duì)稱:“Gemini 3是全球領(lǐng)先的多模態(tài)理解模型,更是Google迄今為止最強(qiáng)大的智能體(Agentic)和氛圍編程(Vibe Coding)模型,能夠提供更豐富的可視化效果和更深度的交互體驗(yàn),而這一切都構(gòu)建在最先進(jìn)的推理能力之上。”
Google 和 Alphabet 首席執(zhí)行官Sundar Pichai表示:“從今天起,我們將 Gemini 全面融入谷歌的產(chǎn)品生態(tài)。其中包括在搜索的 AI 模式(AI Mode)下的 Gemini 3,具備更復(fù)雜的推理能力和全新的動(dòng)態(tài)體驗(yàn)。這是我們首次在產(chǎn)品發(fā)布當(dāng)日就將 Gemini 引入搜索。此外,Gemini 3 今天也同步向 Gemini app 用戶、AI Studio 和 Vertex AI 的開(kāi)發(fā)者、以及我們?nèi)碌闹悄荏w開(kāi)發(fā)平臺(tái) Google Antigravity 中同步推出。”
Sundar Pichai還透露,自兩年前推出Gemini大模型以來(lái),現(xiàn)在,每月有 20 億用戶使用 AI 概覽(AI Overviews)。Gemini app 的月用戶量已突破 6.5 億,超過(guò) 70% 的 Cloud 客戶使用我們的 AI,1300 萬(wàn)開(kāi)發(fā)者在使用我們的生成模型進(jìn)行構(gòu)建。
對(duì)于Gemini 3 的發(fā)布,OpenAICEO薩姆?奧特曼(Sam Altman)、xAI創(chuàng)始人、CEO埃隆?馬斯克(Elon Musk)在X上都發(fā)來(lái)點(diǎn)贊。奧特曼發(fā)推評(píng)價(jià)“Gemini 3看起來(lái)很不錯(cuò)”,馬斯克轉(zhuǎn)發(fā)了谷歌DeepMind CEO的推文稱“Nice work”。
Gemini 3 Pro性能超GPT-5.1,Claude Sonnet 4.5
此次推出的Gemini 3包括Gemini 3 Pro 預(yù)覽版、Gemini 3 Deep Think 模式。
其中,Gemini 3 Pro 預(yù)覽版將集成到 Google 的全棧產(chǎn)品中。用戶在日常生活中即可使用它來(lái)學(xué)習(xí)、構(gòu)建和規(guī)劃一切事務(wù)。Gemini 3 Deep Think 模式——這一增強(qiáng)型推理模式將 Gemini 3 的性能再次提升至全新高度,該模式首先供安全測(cè)試人員試用,預(yù)計(jì)將在未來(lái)幾周內(nèi)向 Google AI Ultra 訂閱用戶開(kāi)放該功能。
Google公開(kāi)的信息顯示,在每個(gè)關(guān)鍵的 AI 基準(zhǔn)測(cè)試中,Gemini 3 Pro 的性能均顯著超越 2.5 Pro,并且也大幅領(lǐng)先競(jìng)爭(zhēng)對(duì)手Anthropic的Claude Sonnet 4.5模型和OpenAI的GPT-5.1。
Gemini 3 Pro在 LMArena 排行榜上以 1501 的突破性 Elo 評(píng)分高居榜首。其在推理能力上展現(xiàn)出博士水平,在“人類終極考試”中(未使用任何工具的情況下得分率達(dá) 37.5%)及 GPQA Diamond 基準(zhǔn)測(cè)試中(準(zhǔn)確率高達(dá) 91.9%)均獲得最高分。此外,它在數(shù)學(xué)領(lǐng)域?yàn)榍把啬P蜆?shù)立了全新標(biāo)桿,在 MathArena Apex 測(cè)試中,以 23.4% 達(dá)到了最先進(jìn)水平(State-of-the-Art)。
除了文本能力,Gemini 3 Pro 在 MMMU-Pro 上取得 81% 的成績(jī),在 Video-MMMU 上達(dá)到 87.6%。同時(shí),該模型在 SimpleQA Verified 基準(zhǔn)測(cè)試中也斬獲了當(dāng)前最先進(jìn)的 72.1% 得分,展現(xiàn)出其在事實(shí)準(zhǔn)確性方面的顯著進(jìn)步。這意味著 Gemini 3 Pro 具備高度可靠性,能夠有效解決跨越科學(xué)和數(shù)學(xué)等廣泛主題的復(fù)雜問(wèn)題。
在測(cè)試中,Gemini 3 Deep Think 在“人類最終考試”(Humanity’s Last Exam)中的表現(xiàn)(未使用工具的情況下達(dá)到 41.0%)以及在 GPQA Diamond 測(cè)試中的表現(xiàn)(達(dá)到 93.8%),均超越了 Gemini 3 Pro。此外,它還在 ARC-AGI -2 基準(zhǔn)測(cè)試中取得了 45.1% 的突破性成績(jī)(啟用代碼執(zhí)行)。這三項(xiàng)測(cè)試中,Gemini 3 Deep Think表現(xiàn)均超越Claude Sonnet 4.5和GPT-5.1模型。
發(fā)布全新智能體開(kāi)發(fā)平臺(tái)Google Antigravity
Google DeepMind研究團(tuán)隊(duì)表示,Gemini 3 是Google迄今為止構(gòu)建的最出色的氛圍編程(Vibe Coding)和智能體編程(Agentic Coding)模型。
它在 WebDev Arena 排行榜上以1487 ELO 名列前茅。在 Terminal-Bench 2.0 測(cè)試中(一個(gè)測(cè)試模型通過(guò)終端操作計(jì)算機(jī)的工具使用能力)上也取得 54.2% 的好成績(jī);同時(shí),在衡量編程智能體(coding agents)的 SWE-bench Verified(76.2%)基準(zhǔn)測(cè)試中,其表現(xiàn)遠(yuǎn)超 2.5 Pro。
現(xiàn)場(chǎng),Google還正式發(fā)布 Google Antigravity——全新的智能體開(kāi)發(fā)平臺(tái),讓開(kāi)發(fā)者能夠在更高層次上,以任務(wù)為導(dǎo)向的方式進(jìn)行開(kāi)發(fā)。
Google Antigravity 利用 Gemini 3 的高級(jí)推理、工具使用和智能編碼能力,將 AI 輔助從開(kāi)發(fā)者工具包中的工具轉(zhuǎn)變?yōu)橐粋€(gè)活躍的伙伴。盡管 Google Antigravity 的核心仍沿用熟悉的 AI 集成開(kāi)發(fā)環(huán)境(IDE),但其智能體已被提升到一個(gè)專屬的界面,并被賦予直接訪問(wèn)編輯器、終端和瀏覽器的權(quán)限?,F(xiàn)在,智能體能夠代表您自主規(guī)劃和執(zhí)行復(fù)雜的端到端軟件任務(wù),并在此過(guò)程中自行驗(yàn)證代碼。
除了 Gemini 3 Pro 之外,Google Antigravity 還深度整合了最新的用于瀏覽器控制的 Gemini 2.5 Computer Use 模型,以及圖像編輯模型 Nano Banana(Gemini 2.5 Image)。
現(xiàn)場(chǎng)演示了Google Antigravity 使用 Gemini 3 來(lái)驅(qū)動(dòng)航班追蹤應(yīng)用所需的端到端智能體工作流程。該智能體能夠獨(dú)立規(guī)劃、編寫應(yīng)用程序代碼,并通過(guò)基于瀏覽器的計(jì)算機(jī)使用來(lái)驗(yàn)證其執(zhí)行效果。
現(xiàn)在,用戶已經(jīng)可以通過(guò) Google AI Studio、Vertex AI、Gemini CLI 以及Google全新的智能體開(kāi)發(fā)平臺(tái) Google Antigravity 中使用 Gemini 3 進(jìn)行開(kāi)發(fā)和構(gòu)建。同時(shí),Gemini 3也已在 Cursor、GitHub、JetBrains、Manus、Replit 等第三方平臺(tái)上線。
Google 和 Alphabet 首席執(zhí)行官Sundar Pichai總結(jié)Gemini的發(fā)展,他稱:“Gemini 1 在原生多模態(tài)和長(zhǎng)上下文窗口方面的突破,擴(kuò)展了可處理的信息種類及其信息量。Gemini 2 則為智能體能力奠定了基礎(chǔ),并在推理和思考方面推動(dòng)了前沿,幫助處理更復(fù)雜的任務(wù)和想法?,F(xiàn)在,Gemini 3具備最先進(jìn)的推理能力,能夠理解深層次內(nèi)容與細(xì)微差別——無(wú)論是感知?jiǎng)?chuàng)意中細(xì)微的線索,還是剖析復(fù)雜難題中相互交織的結(jié)構(gòu)維度。Gemini 3 在理解用戶請(qǐng)求的上下文和真實(shí)意圖方面也更為出色,您只需更精簡(jiǎn)的提示就能獲取所需結(jié)果。更令人驚嘆的是,僅僅用了兩年時(shí)間,AI 已經(jīng)從單純的文本和圖像識(shí)別,發(fā)展到能夠洞察語(yǔ)境?!保ü啵?/p>
1.TMT觀察網(wǎng)遵循行業(yè)規(guī)范,任何轉(zhuǎn)載的稿件都會(huì)明確標(biāo)注作者和來(lái)源;
2.TMT觀察網(wǎng)的原創(chuàng)文章,請(qǐng)轉(zhuǎn)載時(shí)務(wù)必注明文章作者和"來(lái)源:TMT觀察網(wǎng)",不尊重原創(chuàng)的行為TMT觀察網(wǎng)或?qū)⒆肪控?zé)任;
3.作者投稿可能會(huì)經(jīng)TMT觀察網(wǎng)編輯修改或補(bǔ)充。
