久久国产精品免费一区二区三区_久久综合久久性久99毛片_久久精品7亚洲午夜a_亚洲精品日韩中文字幕久久久

新模型“屠榜”,對話谷歌團隊:AI“新旗手”如何誕生
來源:第一財經作者:劉曉潔2025-11-19 14:12

11月19日,預熱已久、全網熱議的Gemini 3終于正式亮相。谷歌這次打出的不是小修小補的普通升級,而是一張“王牌”——在幾乎所有主流基準測試中實現全面領先,大模型的競爭格局可能就此改寫。甚至有業內人士預言:“未來六個月內,很難有公司能夠超越這一成績?!?/p>

發布不久,OpenAI CEO 奧爾特曼與特斯拉CEO 馬斯克便先后公開表示祝賀。奧爾特曼稱其“看起來是個很棒的模型”,評論區則調侃“這句來自競爭對手的夸獎真是暖心”。馬斯克也一如既往地送上“Nice work”的評價。

一向風格嚴謹的谷歌,這次也顯得格外高調。官方博客標題直接打出“開啟智慧新紀元”,內容中多次強調“最佳”“最先進”。谷歌員工也紛紛在社交媒體上為自家產品助陣,谷歌CEO桑達爾·皮查伊(Sundar Pichai)今天已經連發了8條帖子介紹Gemini 3。

在正式發布前,第一財經參與了谷歌面向媒體的小范圍溝通會,盡管對模型進展已有預期,但行業的熱烈反響仍超出想象。大家驚嘆于谷歌的進步速度,三個月前做不到的設計現在可以一鍵生成了,AI編程也是“Next Level”了,有人感慨“這行業發展速度太快了”。

谷歌在三年間完成了從追趕到領先的反超,谷歌DeepMind的CTO 科雷·卡武克喬格魯(Koray Kavukcuoglu)在媒體溝通會上認為,谷歌差異化的全棧市技術方案很重要,從硬件到研究所有環節環環相扣。第一財經也問及如何看待縮放定律(Scaling laws)放緩的問題,他回答稱,技術進步不一定體現在全新能力的誕生,更體現在 “模型能賦能的新場景”上。

新模型“屠榜”

今天凌晨皮查伊發了條帖子,內容只有一張圖,但這張圖足夠有說服力,Gemini 3 Pro幾乎“屠榜”,在所有主要競技場排行榜上排名第一。

具體來看,在 “人類最后一次考試”(Humanities's Last Exam,一項衡量深度理解能力的基準測試,要求模型具備多步驟邏輯推理與專家級演繹能力)中,Gemini 3 Pro 在不使用工具的情況下取得了 37.5%的成績,而排名第二的GPT.5.1只有26.5%,領先了10個百分點。

在衡量研究生水平推理與知識儲備的 GPQA Diamond 測試中,Gemini 3 Pro的得分更是達到 91.9%,緊隨其后的GPT.5.1是88.1%。這意味著,Gemini 3 Pro 在解決科學與數學問題時,不僅能力強,而且可靠性極高。

在多模態能力上,它的理解和推理都達到新高度:Gemini 3 Pro以81%的MMMU-Pro分數和87.6%的Video-MMMU分數直接刷新了多模態推理的紀錄。

在推理能力上,Gemini 3 Pro刷新了Grok4.1剛剛取得的成績,以1501分登頂LMArena排行榜,而Grok4.1的思考模型是1484分。

榜單僅僅是能力的一部分,谷歌對新模型的定義是,“Gemini 3 能將任何想法變為現實”,因此,作為用戶的實際體驗更為重要。

有用戶測試了一款高難度光影質感的海報,在3個月前,谷歌的Nano Banana還和GPT有明顯的差距,但現在已經成了,“沒想到這段很長的路谷歌只走了三個月”。還有一位博主感慨“Gemini 3 Pro實在是太強了”,讓模型復刻一個Mac OS的網頁,“預期已經很高了,它仍然超過了我的預期”?!坝H眼看Gemini 3 Pro一口氣寫完一個web操作系統,腦子里嗡嗡的”,另一個用戶表示。

在溝通會中,媒體也問及產品團隊訓練這款新模型過程中的一些“頓悟時刻”(Aha moments),谷歌DeepMindGemini模型產品總監圖西·多西(TulseeDoshi)表示,第一次用它進行代碼生成時,最令人驚嘆的是,只需簡單提示,就能生成各類游戲,且在精細度上極具優勢。比如,生成 3D 可視化內容,還能在其中直接玩游戲,這種體驗非常棒。

谷歌DeepMindCEO戴密斯·哈薩比斯(Demis Hassabis)也在用模型做游戲,他在帖子中很自豪地表示,模型“當然在各大排行榜上都名列前茅”,但除了這些基準測試之外,它也憑借獨特的風格和強大的功能,在日常任務中有出色表現。他提及自己最近一直在用 Gemini 3玩一些編程,比如用了幾個小時就重現了一款游戲,且細節呈現很出色。

Gemini智能體還有哪些潛在使用場景?斯特魯哈爾在會上提到,他個人已經在用模型處理兩類事情,效果很好。一個是購買票務,另一個是用智能體模式整理郵件收件箱。

“我每天早上醒來都會收到 50 多封郵件,逐一查看、判斷該如何處理要花很久?,F在我會用智能體幫忙梳理:它會提煉出郵件里的待辦任務,篩選出需要我回復的郵件,還會標注出可以忽略的郵件,這真的節省了大量時間?!彼固佤敼柋硎荆约阂矔媚P蛠碣I演唱會門票,讓智能體根據家庭成員直接篩選出合適的票務組合,而他只需點擊一個“購買”。

谷歌團隊的期望是,用戶可以用新的模型來處理生活中遇到的 “多步驟復雜的任務”,這是這款模型的強項。

AI行業“新的旗手”來了?

除了能力上的躍升,谷歌此次還有兩個動作較為值得關注,一個是在發布的第一天就將Gemini 3帶入谷歌搜索,另一個則是發布了全新的“類IDE”AI編程產品Antigravity,押注編程領域。

這意味著,新發布的模型已經足夠成熟,能在商業化的場景中應用。官方表示,Gemini 3為搜索引擎帶來了很強的推理能力,還解鎖了新的生成UI體驗,用戶可以使用專門生成的交互式工具和模擬來獲得動態視覺布局。

比如,當用戶詢問關于物理學里的三體問題,能直接得到一個可以交互的模擬界面,用戶能通過改變變量來觀察結果。

團隊認為,此次發布的模型也是內部迄今為止最強的“氛圍式代碼生成”模型,而谷歌基于此推出的Antigravity則更進一步完善產品體驗,類似AI IDE,智能體可以代表用戶自主地規劃和執行復雜的端到端軟件任務。

在溝通會中談及Antigravity時,卡武克喬格魯認為,大語言模型已經徹底改變了編程方式,它們能讓工程師和軟件開發者 “站在更高層面”工作,在智能體的幫助下處理復雜任務,而 Antigravity正是在這一基礎上構建的。

目前市場上也有其他 IDE 產品,卡武克喬格魯表示,谷歌的模型仍將在各類 IDE 中可用,也會通過 API 向開發者開放,但Antigravity能為團隊提供“另一種與開發者互動的方式”,團隊能借此了解用戶的使用場景、真實任務需求和面臨的挑戰,進而反過來優化模型。

谷歌此次的動作也讓外界開始猜測是否在AI編程領域與Anthropic和Cursor這樣的編程模型和工具展開競爭。

卡武克喬格魯回應表示,在這次發布中谷歌仍與 Cursor 保持著緊密的合作關系。他們的目的不是競爭,對團隊來說看重的是“在用戶所在的場景觸達他們”。目前,人工智能開發仍處于早期階段,它對不同領域、不同行業的影響還在探索中?!拔覀冋J為,保持開放實驗的態度很重要?!?/p>

但無論如何,谷歌確實已經甩開了競爭對手一步,這些動作也必然會讓同類產品有所忌憚,比如“Anthropic或許已經滿頭大汗了”,此前靠著在編程領域的領先性能,Anthropic的營收快速增長,估值也一路走高,但看起來這個優勢已經被谷歌追平了。

市場認為,對于谷歌而言,Gemini 3或許也是重要的里程碑。自2022年底ChatGPT發布以來,谷歌一直被認為“起大早趕晚集”,在AI競賽中處于追趕OpenAI的狀態,但新的模型可能會改寫格局,谷歌有機會奪得領先地位,尤其是OpenAI的GPT-5被指“噱頭大于實際”的情況下,AI產業正需要一個新的旗手。

甚至有聲音稱“谷歌正在托起AI牛市敘事”,近日海外的Loop Capital (路普資本)將谷歌母公司的評級從“持有”上調至“買入”,目標股價從每股 260美元上調至 320美元。而谷歌前幾日股價一度大漲,市值突破3.5萬億美元,創歷史新高,目前回落到3.43萬億美元,但仍然是歷史高位。

此前巴菲特旗下伯克希爾·哈撒韋披露已經重倉買入谷歌,成為該公司第十大股票持倉,引發資本市場圍觀。Loop Capital的分析指出,“搜索擔憂不再有效”,因為 Gemini 的流量份額同比翻了一番。這種日益增長的參與度凸顯了一個關鍵洞察:谷歌正在有效利用其龐大的用戶基礎和產品生態系統來推動AI的采用,將生成能力直接嵌入數百萬人的日常數字體驗中。

在溝通會上,卡武克喬格魯公布了Gemini用戶的數據:月活躍用戶已超過 6.5 億,有超過 1300 萬名開發者正在基于 Gemini 構建模型與人工智能應用,而由 Gemini 支持的搜索中的AI概覽功能,每月用戶量超過 20 億。

谷歌為什么能在三年之間就完成了從追趕到領先的反超?卡武克喬格魯分析認為,核心原因之一是團隊始終保持著極快的發展節奏,而其中最關鍵的支撐,是谷歌極具差異化的全棧式技術方案。

這套全棧方案從硬件投資開始:首先是數據中心的基礎設施建設,接著是芯片,尤其是谷歌高性能TPU(張量處理單元),這些芯片之間的網絡連接方式構建成了支持模型訓練的計算集群,進而支撐谷歌前沿的AI研究。簡單來說,從硬件的設計,到大規模訓練的實現,再到突破性的研究成果,最后到基礎模型的能力提升,所有環節環環相扣、協同作用。

就在這半年,Gemini 應用的用戶增長顯著,斯特魯哈爾認為其中一個關鍵因素是生圖產品Nano Banana帶來的病毒式傳播效應,尤其是在泰國、印度尼西亞、印度等國家,這是一款非常成功的產品,很多人都喜歡用它互動,還會分享給朋友,并且引發了手辦的潮流。

從去年底開始,就有聲音認為,大模型的迭代速度已經放緩,縮放定律也不再有效,但谷歌此次的大模型似乎仍取得了一些顯著的進步,谷歌如何看待目前的發展趨勢?

卡武克喬格魯對第一財經記者表示,觀察一個領域的發展,關鍵要看它對各個行業的實際影響,而AI領域的影響正在日益擴大,越來越多的職業人士用 AI 輔助工作。

“AI 模型在日常生活中的影響力越來越大,從這個角度來看,技術進步的速度其實非???。從我們自身的模型能力迭代來看,也能看到很多令人興奮的進展?!笨ㄎ淇藛谈耵斦J為,不應該將技術進步限制在全新能力的誕生,“模型能賦能的新場景”同樣是一個指標。從預訓練到后訓練的整個模型開發流程中,他們都看到了全方位的積極進展,而且這種趨勢還會持續一段時間。

谷歌認為,Gemini 3 是團隊邁向通用人工智能 (AGI)的下一步。目前這一步顯然比OpenAI和xAI這樣的同類競爭對手更快。

在奧爾特曼恭喜谷歌新模型發布的評論區里,熱門評論是,“你的口袋里還有什么”?下一步該輪到對手們出牌了。

責任編輯: 鄧衛平
聲明:證券時報力求信息真實、準確,文章提及內容僅供參考,不構成實質性投資建議,據此操作風險自擔
下載“證券時報”官方APP,或關注官方微信公眾號,即可隨時了解股市動態,洞察政策信息,把握財富機會。
網友評論
登錄后可以發言
發送
網友評論僅供其表達個人看法,并不表明證券時報立場
暫無評論
為你推薦
時報熱榜
換一換
    熱點視頻
    換一換
    久久国产精品免费一区二区三区_久久综合久久性久99毛片_久久精品7亚洲午夜a_亚洲精品日韩中文字幕久久久

        91精品中文字幕一区二区三区| 国产激情91久久精品导航| 国产av一区二区三区传媒| 好吊色视频在线观看| 国产午夜精品美女毛片视频| 麻豆久久一区二区| 美国黄色一级毛片| 7777精品伊人久久久大香线蕉完整版 | 自拍偷拍亚洲综合| 成人免费视频一区二区| 日本中文在线视频| 国产精品色哟哟网站| 国产成人精品影院| 国产精品视频一区二区在线观看| 久久久久国产精品麻豆| 国产伦精品一区二区三区在线观看| 欧美极品jizzhd欧美18| 日本一二三不卡| 风间由美中文字幕在线看视频国产欧美| 国产jizz18女人高潮| 国产精品美女久久久久aⅴ国产馆 国产精品美女久久久久av爽李琼 国产精品美女久久久久高潮 | 91精品国产91久久久久久一区二区| 亚洲午夜精品久久久久久久久| 久久久久亚洲av无码麻豆| 欧美在线免费观看视频| 亚洲一区二区三区四区在线 | 欧美成人精品1314www| 美日韩一级片在线观看| 影音先锋制服丝袜| 日本一区免费视频| 成人免费毛片片v| 在线中文字幕一区| 亚洲成人av在线电影| 欧美 日本 国产| 久久综合色婷婷| 国产精品一线二线三线精华| 亚洲欧美一区二区三区四区五区| 亚洲精选在线视频| 大尺度做爰床戏呻吟舒畅| 精品久久久久久久人人人人传媒| 国产做a爰片久久毛片| 欧美爱爱免费视频| 亚洲一区自拍偷拍| 成年人网站免费在线观看| 国产欧美视频一区二区| 99麻豆久久久国产精品免费优播| 欧美视频在线一区| 美腿丝袜亚洲三区| 久久免费看少妇高潮v片特黄| 亚洲精品视频一区二区| 久久偷拍免费视频| 欧美激情中文不卡| 性生交大片免费看l| 日韩欧美国产小视频| 国产mv日韩mv欧美| 欧美精品自拍偷拍| 国产最新精品免费| 欧美午夜精品理论片a级按摩| 日本一不卡视频| 国产喷水在线观看| 亚欧色一区w666天堂| 青青青视频在线播放| 伊人开心综合网| 精品一区二区三区蜜桃在线| 亚洲欧美日韩久久| 成年人免费观看视频网站| 国产精品成人午夜| 青青草成人免费视频| 国产精品久久久久久久久免费桃花| 91九色蝌蚪porny| 欧美激情一区二区三区蜜桃视频| 26uuu国产| 国产亚洲欧洲997久久综合| 韩国黄色一级片| 国产欧美日韩麻豆91| 伊人网综合视频| 中文字幕亚洲精品在线观看| a视频免费观看| 国产精品久久久久久亚洲伦| 少妇毛片一区二区三区| 亚洲精选免费视频| 免费一级特黄3大片视频| 亚洲最快最全在线视频| fc2ppv在线播放| 日韩极品在线观看| 欧洲精品一区二区| 国产精品77777竹菊影视小说| 91精品国产福利| 99re成人精品视频| 欧美极品xxx| 丰满少妇一区二区| 亚洲国产一区二区三区青草影视| 99鲁鲁精品一区二区三区| 麻豆精品久久久| 欧美日韩精品福利| aaa亚洲精品| 国产日产精品一区| 亚洲第一成人网站| 亚洲成av人片一区二区三区| 精品欧美一区二区久久久久| 精品一区二区三区av| 欧美久久久影院| 又黄又爽又色的视频| 国产精品你懂的在线| 国产美女永久免费无遮挡| 三级久久三级久久| 欧美日韩五月天| aaa亚洲精品| 国产精品九色蝌蚪自拍| 美女av免费看| 狠狠色狠狠色综合日日91app| 欧美一级免费观看| 中文字幕人妻一区二区三区| 一区二区三区四区在线免费观看| 国产黄色小视频网站| 国产伦精一区二区三区| 久久久精品国产99久久精品芒果 | 在线播放亚洲一区| 性生交大片免费看l| 亚洲激情第一区| 色伊人久久综合中文字幕| 国产91丝袜在线观看| 国产日韩欧美综合在线| 亚洲av熟女国产一区二区性色 | 成人无码www在线看免费| 亚洲成人免费视| 欧美日本一区二区| 青青草精品在线| 一区二区三区中文字幕精品精品| 色诱视频网站一区| 99re在线精品| 洋洋av久久久久久久一区| 欧美在线色视频| 精品无码av一区二区三区不卡| 亚洲综合在线免费观看| 欧美日韩极品在线观看一区| 91成人在线观看喷潮蘑菇| 亚洲高清久久久| 欧美精品aⅴ在线视频| 成人在线视频免费播放| 日韩高清在线一区| 欧美不卡视频一区| 加勒比综合在线| 国产在线精品免费av| 亚洲国产高清在线| 色综合久久66| 蜜桃视频无码区在线观看| 亚洲成人1区2区| 日韩欧美一级在线播放| 蜜桃精品一区二区| 国产乱子轮精品视频| 中文字幕中文字幕一区二区| 日本韩国欧美三级| 国产女人18毛片水真多18 | 亚洲一级电影视频| 欧美一级黄色片| 美国黄色特级片| 成人福利视频在线看| 亚洲精品高清在线观看| 欧美乱妇20p| 级毛片内射视频| 成人一区在线观看| 一区二区三区91| 日韩欧美在线123| 免费观看特级毛片| 91亚洲男人天堂| 日欧美一区二区| 国产日韩欧美不卡在线| 色噜噜狠狠一区二区三区果冻| www.com日本| 极品少妇一区二区三区精品视频| 国产精品久久一级| 欧美伦理电影网| 极品尤物一区二区| 99国产精品99久久久久久| 日韩国产欧美一区二区三区| 国产视频一区在线观看| 欧美亚洲愉拍一区二区| 尤物视频最新网址| 成人av中文字幕| 日韩精品成人一区二区三区| 久久精品一区八戒影视| 欧美性大战久久久| 一区二区精品免费| 91在线云播放| 久久99久久99精品免视看婷婷 | 日韩欧美高清在线| 久久国产美女视频| 亚洲一区二区乱码| 成人影视亚洲图片在线| 视频在线观看一区二区三区| 欧美国产视频在线| 欧美一区二区三区在线电影| 黑人狂躁日本娇小| 欧美双性人妖o0| 成人高清视频免费观看| 男男gaygay亚洲| 亚洲嫩草精品久久| 国产亚洲欧美激情| 51午夜精品国产|