根據《路透社》週二引述兩位知情人士的報導指出,全球人工智慧晶片領導者 NVIDIA 正計畫在今年 5 月針對中國市場推出一款基於 Groq 技術的全新 AI 晶片。這項布局不僅代表 NVIDIA 試圖繞過美國日益嚴苛的出口管制,更顯示出執行長黃仁勳(Jensen Huang)對於「AI 推論」市場志在必得的決心。
這項策略的根源可以追溯到 2025 年底,當時 NVIDIA 斥資高達 170 億美元,取得了 AI 晶片新創公司 Groq 的關鍵技術授權。Groq 以其獨特的 LPU(語言處理單元)架構聞名,這種架構在處理大規模語言模型(LLM)的「推論」速度上,遠高於傳統的 GPU。
在本週於加州聖荷西盛大舉行的 GTC 2026 年度開發者大會上,NVIDIA 首度對外展示了一系列整合 Groq 技術的產品線。知情人士向外媒透露,NVIDIA 計畫將這套技術轉化為可銷往中國的版本。雖然 NVIDIA 目前最頂尖、預計於下半年問世的 Vera Rubin 旗艦晶片,因為運算性能過強,幾乎確定無法通過美國商務部的出口審核,但 Groq 技術的靈活性,給了 NVIDIA 一個「技術變通」的空間,使其能在不觸動禁令紅線的前提下,滿足中國客戶對 AI 運算的渴求。
除了 Groq 晶片的新消息,黃仁勳也在大會期間親自證實,NVIDIA 已經重新啟動了 H200 晶片的生產。H200 作為目前主流旗艦產品的前一代型號,此前曾因出口管制而在中國市場陷入停滯。
黃仁勳指出,在獲得美國總統川普(Donald Trump)政府核發的出口許可,並掌握中國各大科技巨頭的採購訂單後,供應鏈已經全面復工。然而,重返中國市場的代價並不低。根據美方目前的「以稅代禁」政策,NVIDIA 銷往中國的每一顆高效能晶片,都必須將銷售收入的 25% 作為「特別關稅」上繳美國聯邦政府。即便稅負沉重,NVIDIA 依然執意供貨,主要原因在於中國市場對於實現 NVIDIA 在 2027 年達成「一兆美元營收」的願景至關重要。
NVIDIA 這次鎖定的核心是「推論(Inference)」市場。所謂推論,是指 AI 模型在開發完成後,實際應用於回答問題、撰寫程式碼、或是執行用戶指令的運算過程。黃仁勳在演講中直言:「推論技術的轉折點已經浮現,且全球需求正呈現爆炸性成長。」
相較於需要數萬顆晶片串聯的「模型訓練」市場,推論市場更看重低延遲與高性價比。目前 NVIDIA 雖然在訓練領域掌握絕對霸權,但在推論領域卻正面臨百度(Baidu)、華為等中國本土科技巨頭的強力夾擊。百度旗下的昆崙芯晶片早已在中國內部的搜尋與自動駕駛系統中大規模部署,為了防止中國客戶因為禁令而全面倒向本土硬體商,NVIDIA 必須透過 Groq 技術提供一套高相容性、且效能優於本土產品的解決方案。
關於這款即將在 5 月上市的晶片,消息人士特別澄清,它並非外界想像中那種刻意降低效能的「閹割版」。相反地,這款晶片被設計為具備極高系統協作能力的「技術變體」,能夠與中國現有的基礎設施無縫銜接,並在特定應用場景下提供強大的推論能力。
這種策略反映了 NVIDIA 正在改變其在中國的生存法則:不再單純追求單一晶片的最高性能,而是透過軟硬體組合與技術變體,在地緣政治的限制下提供最優化的服務。
針對上述傳聞與報導內容,目前 NVIDIA 尚未做出正式回應。
核稿編輯:Sisley
加入 INSIDE 會員,獨享 INSIDE 科技趨勢電子報,點擊立刻成為會員!
延伸閱讀:


