中國 AI 新創 DeepSeek 去年以低成本模型震驚全球科技界,如今再度引發關注。根據《路透社》獨家報導,DeepSeek 在即將發布新版旗艦模型前,刻意打破業界慣例,沒有提前讓美國晶片大廠 NVIDIA 和 AMD 取得模型進行效能優化,而是將這個機會留給了包括華為在內的中國本土晶片供應商,讓後者提前數週開始針對自家處理器進行軟體調校。
更敏感的是,一名川普政府高層官員同步向路透社表示,DeepSeek 這款新模型疑似是以 NVIDIA 旗艦晶片 Blackwell 在中國訓練而成,涉嫌違反美國出口管制規定。據同一名官員指出,DeepSeek 有可能試圖抹除模型內顯示使用美國晶片的技術痕跡,並計劃對外宣稱以華為晶片完成訓練。
按照 AI 產業標準做法,重大模型發布前,開發商通常會提前讓 NVIDIA、AMD 等主流晶片廠商測試預發行版本,確保模型能在大規模部署的硬體上高效運行。DeepSeek 此前也曾與 NVIDIA 技術團隊密切合作,此次轉向因此格外引人矚目。
研究機構 Creative Strategies 執行長 Ben Bajarin 認為,短期內商業衝擊有限,因為 DeepSeek 在企業端的實際部署率並不高,「它更像是業界用來做基準測試的參考模型」。
但他警告,此舉背後顯露的是中國政府的盤算,意在「讓美國硬體和模型在中國市場持續處於劣勢」。
在市場影響力方面,DeepSeek 自 2025 年 1 月走紅以來,其模型在開源平台 Hugging Face 上的累積下載量已突破 7,500 萬次,並帶動中國開源模型整體崛起,過去一年下載量已超越其他所有國家。
目前美國已允許 NVIDIA H20 與 AMD MI308 這兩款推論用晶片重新對中出貨,但更先進處理器的出口許可仍受嚴格限制。MI308 的市場需求強勁,AMD 最新財報顯示單季銷售額已達 3.9 億美元,而 DeepSeek 是否已合法取得購買這些晶片的資格,目前仍不得而知。
責任編輯:Sisley
本文初稿由 INSIDE 使用 AI 協助編撰,並經人工審校確認;加入 INSIDE 會員,獨享 INSIDE 科技趨勢電子報,點擊立刻成為會員!
延伸閱讀:
Anthropic 揭中國 AI 實驗室「大規模蒸餾」:技術剽竊與美中晶片角力
中國「AI 六小虎」第一股智譜上市,投資人為何更愛硬體不愛軟體?
Meta 砸錢買下 Manus!這家中國 AI 新創憑什麼讓祖克柏出手?


