久久久99国产精品免费,日韩欧美一区二区三区久久,香蕉成人影院

Google發(fā)布Gemini 3大模型，性能遠(yuǎn)超GPT-5.1，已接入Google搜索快訊

TechWeb.com.cn 2025-11-19 11:15

分享到：

導(dǎo)讀

用戶已經(jīng)可以通過(guò) Google AI Studio、Vertex AI、Gemini CLI 以及Google全新的智能體開(kāi)發(fā)平臺(tái) Google Antigravity 中使用 Gemini 3 進(jìn)行開(kāi)發(fā)和構(gòu)建，Gemini 3 今天也同步向 Gemini app 用戶、AI Studio 和 Vertex AI 的開(kāi)發(fā)者、以及我們?nèi)碌闹悄荏w開(kāi)發(fā)平臺(tái) Google Antigravit。

【TechWeb】11月19日消息，Google正式發(fā)布Gemini 3大模型，該模型包含了原生多模態(tài)、推理、Agent等多種能力，性能大幅領(lǐng)先Anthropic的Claude Sonnet 4.5模型和OpenAI的GPT-5.1模型。

Google DeepMind研究團(tuán)隊(duì)稱：“Gemini 3是全球領(lǐng)先的多模態(tài)理解模型，更是Google迄今為止最強(qiáng)大的智能體（Agentic）和氛圍編程（Vibe Coding）模型，能夠提供更豐富的可視化效果和更深度的交互體驗(yàn)，而這一切都構(gòu)建在最先進(jìn)的推理能力之上。”

Google 和 Alphabet 首席執(zhí)行官Sundar Pichai表示：“從今天起，我們將 Gemini 全面融入谷歌的產(chǎn)品生態(tài)。其中包括在搜索的 AI 模式（AI Mode）下的 Gemini 3，具備更復(fù)雜的推理能力和全新的動(dòng)態(tài)體驗(yàn)。這是我們首次在產(chǎn)品發(fā)布當(dāng)日就將 Gemini 引入搜索。此外，Gemini 3 今天也同步向 Gemini app 用戶、AI Studio 和 Vertex AI 的開(kāi)發(fā)者、以及我們?nèi)碌闹悄荏w開(kāi)發(fā)平臺(tái) Google Antigravity 中同步推出。”

Sundar Pichai還透露，自兩年前推出Gemini大模型以來(lái)，現(xiàn)在，每月有 20 億用戶使用 AI 概覽（AI Overviews）。Gemini app 的月用戶量已突破 6.5 億，超過(guò) 70% 的 Cloud 客戶使用我們的 AI，1300 萬(wàn)開(kāi)發(fā)者在使用我們的生成模型進(jìn)行構(gòu)建。

對(duì)于Gemini 3 的發(fā)布，OpenAICEO薩姆?奧特曼（Sam Altman）、xAI創(chuàng)始人、CEO埃隆?馬斯克（Elon Musk）在X上都發(fā)來(lái)點(diǎn)贊。奧特曼發(fā)推評(píng)價(jià)“Gemini 3看起來(lái)很不錯(cuò)”，馬斯克轉(zhuǎn)發(fā)了谷歌DeepMind CEO的推文稱“Nice work”。

Gemini 3 Pro性能超GPT-5.1，Claude Sonnet 4.5

此次推出的Gemini 3包括Gemini 3 Pro 預(yù)覽版、Gemini 3 Deep Think 模式。

其中，Gemini 3 Pro 預(yù)覽版將集成到 Google 的全棧產(chǎn)品中。用戶在日常生活中即可使用它來(lái)學(xué)習(xí)、構(gòu)建和規(guī)劃一切事務(wù)。Gemini 3 Deep Think 模式——這一增強(qiáng)型推理模式將 Gemini 3 的性能再次提升至全新高度，該模式首先供安全測(cè)試人員試用，預(yù)計(jì)將在未來(lái)幾周內(nèi)向 Google AI Ultra 訂閱用戶開(kāi)放該功能。

Google公開(kāi)的信息顯示，在每個(gè)關(guān)鍵的 AI 基準(zhǔn)測(cè)試中，Gemini 3 Pro 的性能均顯著超越 2.5 Pro，并且也大幅領(lǐng)先競(jìng)爭(zhēng)對(duì)手Anthropic的Claude Sonnet 4.5模型和OpenAI的GPT-5.1。

Gemini 3 Pro在 LMArena 排行榜上以 1501 的突破性 Elo 評(píng)分高居榜首。其在推理能力上展現(xiàn)出博士水平，在“人類終極考試”中（未使用任何工具的情況下得分率達(dá) 37.5%）及 GPQA Diamond 基準(zhǔn)測(cè)試中（準(zhǔn)確率高達(dá) 91.9%）均獲得最高分。此外，它在數(shù)學(xué)領(lǐng)域?yàn)榍把啬Ｐ蜆?shù)立了全新標(biāo)桿，在 MathArena Apex 測(cè)試中，以 23.4% 達(dá)到了最先進(jìn)水平（State-of-the-Art）。

除了文本能力，Gemini 3 Pro 在 MMMU-Pro 上取得 81% 的成績(jī)，在 Video-MMMU 上達(dá)到 87.6%。同時(shí)，該模型在 SimpleQA Verified 基準(zhǔn)測(cè)試中也斬獲了當(dāng)前最先進(jìn)的 72.1% 得分，展現(xiàn)出其在事實(shí)準(zhǔn)確性方面的顯著進(jìn)步。這意味著 Gemini 3 Pro 具備高度可靠性，能夠有效解決跨越科學(xué)和數(shù)學(xué)等廣泛主題的復(fù)雜問(wèn)題。

在測(cè)試中，Gemini 3 Deep Think 在“人類最終考試”（Humanity’s Last Exam）中的表現(xiàn)（未使用工具的情況下達(dá)到 41.0%）以及在 GPQA Diamond 測(cè)試中的表現(xiàn)（達(dá)到 93.8%），均超越了 Gemini 3 Pro。此外，它還在 ARC-AGI -2 基準(zhǔn)測(cè)試中取得了 45.1% 的突破性成績(jī)（啟用代碼執(zhí)行）。這三項(xiàng)測(cè)試中，Gemini 3 Deep Think表現(xiàn)均超越Claude Sonnet 4.5和GPT-5.1模型。

發(fā)布全新智能體開(kāi)發(fā)平臺(tái)Google Antigravity

Google DeepMind研究團(tuán)隊(duì)表示，Gemini 3 是Google迄今為止構(gòu)建的最出色的氛圍編程（Vibe Coding）和智能體編程（Agentic Coding）模型。

它在 WebDev Arena 排行榜上以1487 ELO 名列前茅。在 Terminal-Bench 2.0 測(cè)試中（一個(gè)測(cè)試模型通過(guò)終端操作計(jì)算機(jī)的工具使用能力）上也取得 54.2% 的好成績(jī)；同時(shí)，在衡量編程智能體（coding agents）的 SWE-bench Verified（76.2%）基準(zhǔn)測(cè)試中，其表現(xiàn)遠(yuǎn)超 2.5 Pro。

現(xiàn)場(chǎng)，Google還正式發(fā)布 Google Antigravity——全新的智能體開(kāi)發(fā)平臺(tái)，讓開(kāi)發(fā)者能夠在更高層次上，以任務(wù)為導(dǎo)向的方式進(jìn)行開(kāi)發(fā)。

Google Antigravity 利用 Gemini 3 的高級(jí)推理、工具使用和智能編碼能力，將 AI 輔助從開(kāi)發(fā)者工具包中的工具轉(zhuǎn)變?yōu)橐粋€(gè)活躍的伙伴。盡管 Google Antigravity 的核心仍沿用熟悉的 AI 集成開(kāi)發(fā)環(huán)境（IDE），但其智能體已被提升到一個(gè)專屬的界面，并被賦予直接訪問(wèn)編輯器、終端和瀏覽器的權(quán)限?，F(xiàn)在，智能體能夠代表您自主規(guī)劃和執(zhí)行復(fù)雜的端到端軟件任務(wù)，并在此過(guò)程中自行驗(yàn)證代碼。

除了 Gemini 3 Pro 之外，Google Antigravity 還深度整合了最新的用于瀏覽器控制的 Gemini 2.5 Computer Use 模型，以及圖像編輯模型 Nano Banana（Gemini 2.5 Image）。

現(xiàn)場(chǎng)演示了Google Antigravity 使用 Gemini 3 來(lái)驅(qū)動(dòng)航班追蹤應(yīng)用所需的端到端智能體工作流程。該智能體能夠獨(dú)立規(guī)劃、編寫應(yīng)用程序代碼，并通過(guò)基于瀏覽器的計(jì)算機(jī)使用來(lái)驗(yàn)證其執(zhí)行效果。

現(xiàn)在，用戶已經(jīng)可以通過(guò) Google AI Studio、Vertex AI、Gemini CLI 以及Google全新的智能體開(kāi)發(fā)平臺(tái) Google Antigravity 中使用 Gemini 3 進(jìn)行開(kāi)發(fā)和構(gòu)建。同時(shí)，Gemini 3也已在 Cursor、GitHub、JetBrains、Manus、Replit 等第三方平臺(tái)上線。

Google 和 Alphabet 首席執(zhí)行官Sundar Pichai總結(jié)Gemini的發(fā)展，他稱：“Gemini 1 在原生多模態(tài)和長(zhǎng)上下文窗口方面的突破，擴(kuò)展了可處理的信息種類及其信息量。Gemini 2 則為智能體能力奠定了基礎(chǔ)，并在推理和思考方面推動(dòng)了前沿，幫助處理更復(fù)雜的任務(wù)和想法?，F(xiàn)在，Gemini 3具備最先進(jìn)的推理能力，能夠理解深層次內(nèi)容與細(xì)微差別——無(wú)論是感知?jiǎng)?chuàng)意中細(xì)微的線索，還是剖析復(fù)雜難題中相互交織的結(jié)構(gòu)維度。Gemini 3 在理解用戶請(qǐng)求的上下文和真實(shí)意圖方面也更為出色，您只需更精簡(jiǎn)的提示就能獲取所需結(jié)果。更令人驚嘆的是，僅僅用了兩年時(shí)間，AI 已經(jīng)從單純的文本和圖像識(shí)別，發(fā)展到能夠洞察語(yǔ)境?！保ü啵?/p>

Gemini Google 模型智能 AI

分享到：

1.TMT觀察網(wǎng)遵循行業(yè)規(guī)范，任何轉(zhuǎn)載的稿件都會(huì)明確標(biāo)注作者和來(lái)源；
2.TMT觀察網(wǎng)的原創(chuàng)文章，請(qǐng)轉(zhuǎn)載時(shí)務(wù)必注明文章作者和"來(lái)源：TMT觀察網(wǎng)"，不尊重原創(chuàng)的行為TMT觀察網(wǎng)或?qū)⒆肪控?zé)任；
3.作者投稿可能會(huì)經(jīng)TMT觀察網(wǎng)編輯修改或補(bǔ)充。

欧美亚洲丝袜传媒另类_日韩在线免费视频_国内一区在线_亚洲一区二区三区日本久久九

Google發(fā)布Gemini 3大模型，性能遠(yuǎn)超GPT-5.1，已接入Google搜索快訊

Google發(fā)布Gemini 3大模型，性能遠(yuǎn)超GPT-5.1，已接入Google搜索快訊