阿里巴巴雲投資新型人工智慧：打造能還原真實世界的「世界模型」

作者: Evelyn Cheng | 時間: Fri, 10 Apr 2026 02:00:43 GMT | 來源: CNBC

北京——阿里巴巴雲正投入資金研發一種新型人工智慧，旨在以與 OpenAI ChatGPT 等聊天機器人不同的方法更好地還原真實世界。

這一轉變承認了主要基於文本訓練的「大語言模型」的極限。相反，開發者開始更關注建立在影片和現實物理場景之上的「世界模型」。

為了搭上這一趨勢，阿里巴巴領先進行總計 20 億元人民幣（約 2.9 億美元）投資入股聖手，該公司背後是 AI 影片生成工具 Vidu 的開發者，公司週五宣佈。TAL 教育集團與百度資本也參與了 Series B 融資輪次。

此次投資發生在聖手兩個月前從奇錘風險投資及其他支持者處籌得 6 億元人民幣之後。該創業公司拒絕披露其估值。

聖手表示，最新融資將支持開發「通用世界模型」，利用人工智慧橋接兩個目前分離的領域：遊戲與 AI 生成影片的數位世界，以及自動駕駛與機器人的實體世界。

「聖手認為，建立在視覺、聽覺和觸覺等多模態數據之上的通用世界模型，比大語言模型更能自然地捕捉物理世界的運作方式，」這項成立三年的創業公司在聲明中表示。

「我們的目標是連接感知與行動，」聖手創辦人朱駿在聲明中補充道，使 AI 系統能夠持續且一致地更好地模擬和預測現實世界的行為。

根據 Artificial Analysis，聖手最新於一月推出的 Vidu Q3 Pro 模型，在文字與圖像生成影片的人工智慧模型中排名前 10。

該公司數月早於 OpenAI 推出現已關閉的 Sora 工具之前，就在全球推出了 Vidu。中國短片公司快手與字節跳動也發布了類似的競爭性 AI 影片生成工具。

阿里巴巴已擴大對相關創業公司的投資。

中國科技巨頭阿里巴巴與百度資本上個月領先進行 5000 萬美元投資 Tripo AI，該平台利用 AI 快速從照片生成數位 3D 模型。Tripo 表示它也正在脫離語言模型技術，轉向基於實體空間的 AI 工具，並開發自己的世界模型。

9 月，阿里巴巴還主導了對 PixVerse 的 6000 萬美元投資，該公司於今年早些時候發布了一個 AI 世界模型，允許用戶在影片生成過程中指導影片展開方式。

從電商起家的阿里巴巴還推出了免費、開放源的影片生成 AI 模型，並於二月推出了一款供機器人驅動的模型。

聖手週五表示，與開發具身人工智慧——如與人類互動的物理世界機器人的系統——的企業建立了戰略合作夥伴關係，應用於工業、商業和家庭環境。

世界模型對機器人技術至關重要，因為除了大語言模型之外該技術還需要更多東西才能運作，美國科技雜誌 Wired 聯合創辦人凱文·凱利上月在其 Substack 文章中如此寫道。

最終，為了複製人類智慧，人工智慧需要三樣東西：推理、對物理世界的理解以及持續學習，凱利表示。雖然學習類別的人工智慧尚未開發完成，但基於 LLM 的聊天機器人已創造了知識元素，他表示，因此世界模型是需要突破的關鍵領域。

阿里巴巴雲投資新型人工智慧：打造能還原真實世界的「世界模型」

Alibaba leads $290 million investment for building a new kind of AI model as LLM limits emerge

你可能也有興趣：