黃仁勳公佈輝達Groq 3推論晶片 代號Rosa
▲輝達GTC大會、黃仁勳。(圖/路透社,下同)
記者葉國吏/綜合報導
輝達(NVIDIA)執行長黃仁勳於GTC大會正式揭曉整合Groq語言處理技術的新晶片「NVIDIA Groq 3 LPU」,並宣告次世代GPU架構「Feynman」將整合代號「Rosa」的CPU,AI產業的轉折點正式宣告到來。
黃仁勳以「五層蛋糕」概念形容AI技術堆疊,指出2023年由新創公司「OpenAI」啓動生成式AI,今年進入推論時代,2025年則由「Anthropic」的開發工具「Claude Code」推動代理能力,三大階段合力引爆運算需求。
三星代工新晶片下半年出貨 整合Groq技術降成本在硬體進展方面,AI超級電腦「Vera Rubin」家族迎來新成員「NVIDIA Groq 3 LPU」,使家族晶片增加至7款。這款推論晶片將由韓國「三星」(Samsung)代工,預計今年下半年正式出貨。
黃仁勳進一步闡述GPU技術路線圖,揭露次世代「Feynman」架構將與下一代CPU「Rosa」及新一代LPU共同運作,構建更強大的平臺系統。透過不同處理單元的協作,輝達旨在打造出全方位的運算環境,以因應未來更復雜的人工智慧代理任務與大規模資料處理需求。
機架系統效能提升35倍 鎖定加速運算里程碑輝達同時宣佈推出「NVIDIA Groq 3 LPX」機架系統,該系統搭載256顆LPU,被視爲加速運算的重要里程碑。這套系統能與「Vera Rubin NVL72」機架系統協同作業,讓人工智慧處理任務的量能大幅提高35倍。此舉不僅強化了硬體效能,也爲大規模企業級應用提供更具效率的基礎設施。
黃仁勳強調,輝達與晶片設計商「Groq」達成技術授權協議後,雙方在推論技術上的合作已取得實質突破。隨着新架構與機架系統陸續到位,輝達將持續引領AI運算市場,協助全球開發者與企業在推論需求爆發的浪潮中,取得更強大的技術支援與競爭優勢。