中國初創公司 DeepSeek 推出 V4 模型預覽版,華為晶片獲確認支援
China's DeepSeek releases preview of long-awaited V4 model as AI race intensifies
作者: Dylan Butts | 時間: Fri, 24 Apr 2026 08:01:50 GMT | 來源: CNBC
f t
中國人工智能初創公司 DeepSeek 於周五推出了備受矚目的 V4 大型語言模型預覽版,讓用戶得以測試其新功能與能力。
此次發布距離該公司位於杭州總公司推出 R1 推理模型已超過一年,當時 R1 模型憑藉驚人的性能與成本效益震撼了全球科技市場。
與 DeepSeek 之前的模型發布類似,這次升級也是開源的,開發者可下載程式碼、在本機運行並在多數情況下進行修改。
該模型提供「專業版」與「閃電版」兩種版本,視大小而定,DeepSeek 聲稱 V4 在針對國內競爭對手方面表現出色,特別是在智能體任務、知識處理和推論方面。
「DeepSeek 的 V4 預覽版是一次嚴重的炫耀,」Counterpoint 研究副總裁 Neil Shah 對 CNBC 表示,其推論成本低於之前的模型。
推論成本指的是運行訓練好的 AI 模型以生成輸出所涉及的計算和財務開支。
DeepSeek 也表示,V4 已針對與流行代理工具(如 Anthropic 的 Claude Code 和 OpenClaw)配合使用進行了優化。
根據 Counterpoint 首席 AI 分析師 Wei Sun 的說法,V4 的基準配置文件表明它可能以「顯著降低的成本提供優秀的代理能力」。
DeepSeek 成立於 2023 年,2024 年底憑藉免費開源的 V3 模型引起關注,聲稱該模型使用功率較低的晶片訓練,且成本僅為 OpenAI 和 Google 等公司建造模型成本的幾分之一。
幾週後,2025 年 1 月,它發布了推理模型 R1,達到了類似的基準或超越了許多全球領先的大型語言模型。
當 DeepSeek 透露使用容量較低的 Nvidia 晶片僅用了兩個月、甚至不到 600 萬美元就建成了該模型時,R1 模型令投資者震驚。這引發了對美國在 AI 領域主導地位以及大型科技公司對 AI 基礎設施的大量支出的質疑。
此後,DeepSeek 推出了一系列模型升級,但均未與 R1 的影響力相匹配。
Morningstar 高級股票分析師 Ivan Su 對 CNBC 表示,由於交易員已經定價了中國 AI 具有競爭力且使用成本較低的現實,V4 的首次亮相不太可能產生與 R1 相同的市場影響。
然而,DeepSeek 的最新定位將其他中國開源模型置於直接競爭對手的地位,Su 表示。
「這是一種與 R1 時不存在的新定位,這本身就告訴您國內競爭已如何加劇,」他補充道。
自 R1 發布以來,DeepSeek 面臨中國蓬勃發展的 AI 領域的競爭增加,阿里巴巴和字節跳動等參與者今年也發布了新模型。
周五在港交所交易時,幾家其他中國 AI 參與者的股價下跌。MiniMax 和亦稱智譜的知識圖譜科技,各下跌約 8%,而位於杭州的開發商萬芯科技暴跌 9%。
圍繞 DeepSeek V4 模型發布的主要問題之一是用於訓練和支撐它的晶片是哪些。
中國科技巨頭華為於周五確認,其最新的 AI 計算集群(由昇騰 AI 處理器驅動)可以支援 DeepSeek 的 V4 模型。
然而,與來自美國 AI 晶片領導者 Nvidia 的產品相比,華為晶片在訓練中的使用程度仍不清楚。
由於華盛頓不斷變化的出口管制,中國開發者已受到限制,無法直接購買 Nvidia 最先進的 AI 晶片。
同時,北京加大努力發展其本土晶片產業,並據報推動中國科技公司採用來自華為等晶片廠商的本土替代產品。
Counterpoint 的 Wei Sun 表示,V4 能夠在本土晶片上原生運行的能力可能具有巨大影響,有助於北京實現更多 AI 主權並進一步減少對 Nvidia 的依賴。
「這最終將加速全球 AI 發展,」她補充道。
DeepSeek 宣布發布 V4 之後,中國合約晶片製造商的股價在港交所上漲,中芯國際和華虹半導體分別上漲 9% 和 15%。