SURL News

企業美國掀起新支出紀律,CFO 與董事會開始嚴控低效 AI 開支,重塑 AI 產業格局

Model routing is a fix for AI overspending. That's a problem for OpenAI and Anthropic

作者: Jasmine Wu,Deirdre Bosa | 時間: Fri, 05 Jun 2026 18:24:25 GMT | 來源: CNBC

美國企業界正形成新的支出紀律,首席財務長和董事會開始遏制低效的人為智能開支。這種變化有潛力重塑 AI 產業。

過去兩年的操作規則是默認使用最強大的 AI 模型並直接通過它處理所有查詢,無論複雜程度如何。現在,由於 AI 賬單遠超預算,公司開始詢問每項任務是否真的需要頂級或前沿模型。兩位處於 AI 建設核心的領導人告訴 CNBC 說,解決方案正在出現:模型路由。

路由是一種匹配工作與模型的化工具,將難題發送至昂貴的前沿模型,將簡單任務發送至更快、更便宜的替代方案。

Cognition 的首席執行官斯科特·吳(Scott Wu)表示,在例行工作中的收益巨大。對於大量模板性工作,他表示公司在使用對於任務仍然足夠好的模型時,可以獲得五到十倍更好的成本效率。

如今大多數公司根本沒有進行路由。Glean 的 CEO 阿溫德·賈因(Arvind Jain)估計,約 95% 的企業 AI 使用仍運行在最昂貴的前沿模型上,即使對於較便宜替代方案也能輕鬆處理的任務。吳舉例說,讓模型說出美國第三任總統的名字,無論多昂貴,每個都會告訴你那是湯馬斯·傑斐遜。

推動這一轉變的壓力來自一條甚至讓最大科技企業都驚訝的成本曲線。思科首席產品官傑圖·佩泰爾(Jeetu Patel)列出了數學計算。每位員工每週約消耗 200 美元的 Token 使用量,這意味著每人每年約 10,000 美元。擁有 90,000 名員工的公司,每年面臨 9 億美元。Token 是模型用於生成信息的數據塊。使用量按處理的 Token 數量收費。

佩泰爾表示,思科超出預算,並不得不調整,現在有 30,000 名工程師構建主要由 AI 編寫的產品。思科重新分配資源,優先考慮 Token 而非其他開支。

AI 公司意識到這種焦慮。

Cognition 宣佈了他們所謂的 AI 生產力保證。如果 Devin 交付的工程價值低於客戶支付的費用,Cognition 將資助使用量高達 1,000 萬美元,直到達到標準。吳將其視為解決困擾行業的指標問題的一種方式:投資回報率。

吳表示,Cognition 並不衡量像消耗的 Token 或代碼行數這樣的活動,而是估計其代理實際上節省的人類工程小時數,並用退還款項作為背書。他表示,你可以花數十億美元的 Token 卻沒有任何產出。公司應該追求產出,而不是活動。

如果公司開始將簡單、高體量的工作轉向來自中國或其他地區的較便宜開源模型,那麼 OpenAI 和 Anthropic 就不再為每項任務賺取費用。他們只獲得更複雜的工作。這兩家公司建立了他們的業務,以及圍繞他們的上市預期,都是建立在高端價格巨大需求的假設之上。

佩泰爾並不認為這會讓前沿實驗室陷入困境,並表示最先進的技術將保持寶貴。但他看到定價模型正在發生轉變。實驗室必須提高模型使用效率,而不是僅僅提高收費,佩泰爾預測這將導致產業共同努力。

問題曾是公司是否會隨著 AI 賬單上升而持續支出。現在似乎許多人只是會找到聰明的方式去花費。定價權力正從出售高端 AI 的公司轉向購買它們的公司。

前沿實驗室仍將對最艱難的工作收取溢價。但市場中其他部分佔多少份額?答案對於決定領先 AI 公司的估值將至關重要。

原文與圖片連結

> 回首頁看更多新聞 <

你可能也有興趣: