SURL News

圖靈獎得主 LeCun 開發新型 AI 系統,旨在提升機器人理解物理世界能力

AI is 'not smart' so what's next in artificial intelligence?

作者: https://www.facebook.com/bbcnews | 時間: Thu, 02 Jul 2026 23:02:09 GMT | 來源: BBC

圖靈獎得主 LeCun 開發新型 AI 系統,旨在提升機器人理解物理世界能力

圖靈獎得主亞恩·勒昆(Yann LeCun)是 AMI 實驗室創辦人,正在開發新型人工智慧系統,目標是超越現行的大型語言模型。他曾任 Meta 首席 AI 科學家,於 2025 年離職後創立該實驗室。勒昆認為,ChatGPT 等模型雖然擅長編程或文本生成,卻無法處理現實物理情境。他的目標是開發基於世界模型的 AI,讓機器人能夠理解物理環境並執行家務。該實驗室籌得超過 10 億美元。勒昆強調,未來 AI 雖可能更聰明,但人類仍需提問與創造方向,AI 則扮演執行與輔助角色,與人類協作共存。

「我們還沒有接近像老鼠一樣善於理解物理世界的機器人,」Yann LeCun 表示,他是人工智慧領域的領軍人物之一。

他在擁有者 Facebook 的 Meta 工作了十年,擔任首席 AI 科學家,但於 2025 年離職並創立了先進機器智慧實驗室(AMI Labs)。

他的目標是將 AI 帶離目前類似 ChatGPT、Claude 和 Gemini 的系統。他說這些系統有其用途,但永遠無法應付現實世界的複雜情境,例如讓機器人執行家務。

它們不是通往人類級別或類人智慧的途徑,甚至也不是動物級別的智慧,因為它們無法處理真實世界數據,它們並非為此設計。這是他在法國 VivaTech 科技大會的場合間接受到採訪時所說。

因此,位於巴黎的 AMI 實驗室正致力於開發一種不依賴 ChatGPT 及其對手背後的技術的新型人工智慧。

投資者認為其潛力巨大。今年早些時候,AMI 實驗室宣布籌資超過 17.6 億美元,投資者包括美國晶片巨頭 Nvidia 和管理亞馬遜創辦人傑夫·貝佐斯私人財富的基金。

這被稱為種子輪融資,是歐洲最大之一的早期創業融資。

勒昆指出,大型語言模型(LLMs)如 ChatGPT 在編程、數學問題和文本生成等特定方面表現極佳。

但他表示,這些問題是定義明確且可預測的。

它基本上只是累積知識...它可能吐露一些東西,你訓練它來吐露,但它並不特別聰明。它沒有底層理解力。

勒昆表示,現實世界中任何行動都有令人困惑的結果,這需要一種更靈活的人工智慧。

勒昆將一支筆直立於筆尖上。他問,當你鬆手時會發生什麼?即使幼兒也知道筆會倒下。但沒有人會操心猜測筆可能會朝哪個方向落下,這是無法預料的。

但 LLM 可能會嘗試根據訓練數據中的統計模式生成關於筆下一個行動的單一預測。

這個預測幾乎肯定會錯了,因為該系統並沒有推理現實狀況的物理性質,而是在生成看似統計上合理的事情。

勒昆表示,他的公司正在開發的系統稱為聯合嵌入預測架構(JEPA),正是為了解決這類問題而設計的。

它創建了現實世界的抽象概念,使其能夠評估行動的結果。

創建這些抽象概念涉及困難的數學,但本質上它們過濾掉了無用的信息,僅留下 AI 有用的世界圖像。

在筆的情況下,AI 會知道沒必要嘗試預測筆會朝哪個方向倒下。

人形機器人需要能夠在現實世界導航的人工智慧。

建立更靈活的人工智慧是機器人產業的優先事項。

數十億美元已投入於構建人形機器人,他們的成就每年都更令人印象深刻。

但訓練他們安全地執行熨衣或疊放洗碗機等家務任務被證明困難且昂貴。

根據勒昆的說法,目前 AI 模型在這種環境中不太可能有任何表現。

LLM 對機器人來說幾乎無用,他說。

人們聲稱僅僅通過擴展 LLM,我們就能達到超人類智慧,這絕對不會發生。

牛津大學應用人工智慧教授的 Ingmar Posner 也屬於其中。他是牛津大學應用 AI 實驗室主任,同時也是外部亞馬遜學者。

我的觀點是,未來十年將真正關於能夠解釋的系統……您需要能夠回答以下問題的模型:什麼很重要?什麼導致什麼?如果我做別的事情會發生什麼——比如如果我採取不同的行動。

Posner 和他的約 10 名研究人員的團隊已經花費四年時間在開發一種新 AI 模型,屬於被稱為世界模型的鬆散類別。

雖然世界模型在概念上已存在數十年,但這項工作的一個靈感來源於 David Ha 和 Jurgen Schmidhuber 在 2018 年發表的一篇有影響力的論文。

他們的洞察是,鑑於機器學習和算力的進步,AI 可以僅從學習到的關於世界看起來是什麼的 mentally 模擬中學習如何做某事。

自 2018 年以來,這一想法已催化了大量關於世界模型的研究,包括 Google 的 Dreamer World 模型。去年,Dreamer 的一個變體通過想象未來情境來幫助決策,學會了如何在遊戲 Minecraft 中收集鑽石。

Posner 希望他的團隊正在開發的 AI 系統是向前邁進的又一步。他稱之為機械世界模型,這將以 AI 可以高效使用的方式組織知識。

你需要能夠將知識分區和組織成當需要時可以召回、組合和修改的系統,Posner 說。

很難說需要多久才能開發這些新模型,他補充道。

如果問 2017 或 2018 年任何人,什麼時候會有 ChatGPT 類型的事情,他們會回答:幾十年,幾十年的工作。

ChatGPT 的原始版本於 2022 年 11 月推出。

DeepMind(Google 母公司 Alphabet 的一部分)也在進行世界模型方面的其他工作,其 Genie 模型,倫敦的 Wayve 也有一個名為 Gaia 的系統。

同時,AI 先驅 Fei-Fei Li 於 2023 年在舊金山創立了 World Labs,以開發新 AI 模型。

勒昆表示,AMI 實驗室將在明年年底前完善他們的 AI 模型,並希望在明年投入使用,首先在工業環境中。

如果成功,那麼就是時候想大事了。

最終,在未來的某個時候,我們將擁有可以應用於世界上幾乎任何事情的一般通用智能系統,只需最少培訓或微調。

在一個機器人可以獨立運行的世界中,人類會發生什麼?

我們仍然需要人類找出要問什麼問題,要建立什麼,要創造什麼,這真的是真正的人性方面,他說。

AI 會為我們工作,他補充道。

我們與未來 AI 系統的互動——即使它們比我們聰明——將像企業家或政治領袖與他們的助手 staff 之間的互動一樣——其中許多助手比他們更聰明。

原文與圖片連結

> 回首頁看更多新聞 <

你可能也有興趣: