阿里巴巴雲投資新型人工智慧:打造能還原真實世界的「世界模型」
Alibaba leads $290 million investment for building a new kind of AI model as LLM limits emerge
作者: Evelyn Cheng | 時間: Fri, 10 Apr 2026 02:00:43 GMT | 來源: CNBC
f t
北京——阿里巴巴雲正投入資金研發一種新型人工智慧,旨在以與 OpenAI ChatGPT 等聊天機器人不同的方法更好地還原真實世界。
這一轉變承認了主要基於文本訓練的「大語言模型」的極限。相反,開發者開始更關注建立在影片和現實物理場景之上的「世界模型」。
為了搭上這一趨勢,阿里巴巴領先進行總計 20 億元人民幣(約 2.9 億美元)投資入股聖手,該公司背後是 AI 影片生成工具 Vidu 的開發者,公司週五宣佈。TAL 教育集團與百度資本也參與了 Series B 融資輪次。
此次投資發生在聖手兩個月前從奇錘風險投資及其他支持者處籌得 6 億元人民幣之後。該創業公司拒絕披露其估值。
聖手表示,最新融資將支持開發「通用世界模型」,利用人工智慧橋接兩個目前分離的領域:遊戲與 AI 生成影片的數位世界,以及自動駕駛與機器人的實體世界。
「聖手認為,建立在視覺、聽覺和觸覺等多模態數據之上的通用世界模型,比大語言模型更能自然地捕捉物理世界的運作方式,」這項成立三年的創業公司在聲明中表示。
「我們的目標是連接感知與行動,」聖手創辦人朱駿在聲明中補充道,使 AI 系統能夠持續且一致地更好地模擬和預測現實世界的行為。
根據 Artificial Analysis,聖手最新於一月推出的 Vidu Q3 Pro 模型,在文字與圖像生成影片的人工智慧模型中排名前 10。
該公司數月早於 OpenAI 推出現已關閉的 Sora 工具之前,就在全球推出了 Vidu。中國短片公司快手與字節跳動也發布了類似的競爭性 AI 影片生成工具。
阿里巴巴已擴大對相關創業公司的投資。
中國科技巨頭阿里巴巴與百度資本上個月領先進行 5000 萬美元投資 Tripo AI,該平台利用 AI 快速從照片生成數位 3D 模型。Tripo 表示它也正在脫離語言模型技術,轉向基於實體空間的 AI 工具,並開發自己的世界模型。
9 月,阿里巴巴還主導了對 PixVerse 的 6000 萬美元投資,該公司於今年早些時候發布了一個 AI 世界模型,允許用戶在影片生成過程中指導影片展開方式。
從電商起家的阿里巴巴還推出了免費、開放源的影片生成 AI 模型,並於二月推出了一款供機器人驅動的模型。
聖手週五表示,與開發具身人工智慧——如與人類互動的物理世界機器人的系統——的企業建立了戰略合作夥伴關係,應用於工業、商業和家庭環境。
世界模型對機器人技術至關重要,因為除了大語言模型之外該技術還需要更多東西才能運作,美國科技雜誌 Wired 聯合創辦人凱文·凱利上月在其 Substack 文章中如此寫道。
最終,為了複製人類智慧,人工智慧需要三樣東西:推理、對物理世界的理解以及持續學習,凱利表示。雖然學習類別的人工智慧尚未開發完成,但基於 LLM 的聊天機器人已創造了知識元素,他表示,因此世界模型是需要突破的關鍵領域。