全球人工智能算力芯片龍頭英偉達周二宣布,推出專為長上下文工作負載設計的專用GPU Rubin CPX,用于翻倍提升當前AI推理運算的工作效率,特別是編程、視頻生成等需要超長上下文窗口的應用。
NVIDIA Vera Rubin NVL144 CPX機架與托盤,來源:公司博客
英偉達CEO黃仁勛表示,CPX是首款專為需要一次性處理大量知識(數百萬級別tokens),并進行人工智能推理的模型而構建的芯片。
需要說明的是,Rubin就是英偉達將在明年發售的下一代頂級算力芯片,所以基于Rubin的CPX預計也要到2026年底出貨。下一代英偉達旗艦AI服務器的全稱叫做NVIDIA Vera Rubin NVL144 CPX——集成36個Vera CPU、144塊Rubin GPU和144塊Rubin CPX GPU。
英偉達透露,搭載Rubin CPX的Rubin機架在處理大上下文窗口時的性能,能比當前旗艦機架GB300 NVL72高出最多6.5倍。
據悉,下一代旗艦機架將提供8exaFLOPs的NVFP4算力,比GB300 NVL72高出7.5倍。同時單個機架就能提供100TB的高速內存和1.7PB/s的內存帶寬。
作為行業首創之舉,英偉達的新品在硬件層面上分拆了人工智能推理的計算負載。
英偉達介紹稱,推理過程包括兩個截然不同的階段:上下文階段與生成階段,兩者對基礎設施的要求本質上完全不同。
據悉,Rubin CPX專門針對“數百萬tokens”級別的長上下文性能進行優化,具備30petaFLOPs的NVFP4算力、128GB GDDR7內存。
英偉達估計,大約有20%的AI應用會“坐等”首個token出現。例如解碼10萬行代碼可能需要5-10分鐘。而多幀、多秒的視頻,預處理和逐幀嵌入會迅速增加延遲,這也是為什么當前的視頻大模型通常僅用于制作短片。
英偉達計劃以兩種形式提供Rubin CPX,一種是與Vera Rubin裝在同一個托盤上。對于已經下單NVL144的用戶,英偉達也會單獨出售一整個機架的CPX芯片,數量正好匹配Rubin機架。
美國東部時間8月27日美股盤后,英偉達發布2026財年第二季度財報。第二季度,英偉達收入達到467億美元,超過此前市場預期的461億美元,比去年同期增長55%;凈利潤(按美國標準會計準則GAAP衡量)為264億美元,同比增長60%,換算成每股收益(EPS)為1.04美元,也超出了市場預期的1.01美元。
毛利率則有所下滑,該季度為72.4%,去年同期為75.2%。對下一季度的業績展望,英偉達預計第三季度收入將達到540億美元,毛利率預計在73.3%至73.5%之間。截至收盤,英偉達漲0.77%,公司最新市值4.09萬億美元。
4日,博通盤后公布的第三財季業績超出預期,并為第四財季提供了強勁的指引。公司預計,第四財季的人工智能芯片業務繼續提速。
在財報電話會上,博通首席執行官陳福陽(Hock Tan)表示,公司已從一家神秘的新客戶那里獲得了100億美元的定制芯片訂單,這一消息令投資者們感到驚喜。
電話會后不久,業內人士透露,這名新客戶極大可能就是人工智能領軍企業OpenAI——消息稱,OpenAI與博通共同設計的芯片將在明年首次上市,以減少對英偉達產品的依賴。
這意味著,博通將更直接地與人工智能(AI)硬件龍頭英偉達競爭。
Clearstead Advisors高管Jim Awad表示,投資者需要準備好面對英偉達在該領域出現更多競爭的局面,但由于AI市場本身的快速擴張,即便失去部分市場份額,公司依然能保持穩定增長。
“我認為這(英偉達股價下跌)只是膝跳反應,不是賣出的理由,”Awad說道,“關鍵要看博通和OpenAI接下來的執行情況,目前沒人能在一夜之間奪走英偉達的生意。”