通用 Agent(智能體)的火爆,仍在繼續(xù)。
引爆這一領(lǐng)域的明星初創(chuàng)公司 Manus AI,近期被曝出完成了新一輪 7500 萬美元融資,估值在短短不到 2 個月內(nèi),飆升至 5 億美元。
被 Manus 打開未來想象空間的通用 Agent 市場,正在吸引一眾科技大廠的入局。最新加入進來的是百度。
近日,百度對外推出了類通用 Agent 產(chǎn)品 " 心響 "。百度之前,字節(jié)搶跑一眾國內(nèi)科技大廠,率先上線了自家的 Agent 產(chǎn)品 " 扣子空間 "。
相比傳統(tǒng) Agent 產(chǎn)品,通用 Agent 本質(zhì)區(qū)別在于其定位從 " 工具 " 向 " 伙伴 " 的角色轉(zhuǎn)變,能夠處理復(fù)雜、多步驟的任務(wù)場景。
背靠大廠已有的產(chǎn)品生態(tài),字節(jié)和百度共同盯上了同一目標,即借 AI Agent 尋找自家 AI 產(chǎn)品體系的新增長點:字節(jié)試圖將通用 Agent 概念嵌入工作流,尋找專業(yè)場景的落地應(yīng)用;百度則想要在普通消費者中率先破局。
兩者都在嘗試打破各自內(nèi)部的生態(tài)壁壘,構(gòu)建更廣泛的 AI Agent 生態(tài)體系,將通用 Agent 概念徹底打入用戶的心智。
然而,受限于大模型技術(shù)的成熟度,包括字節(jié)、百度在內(nèi)的所有參與者,都不得不在探索的路上,不斷地捫心自問:AI Agent 的真正應(yīng)用場景是什么?
一、追逐 AI Agent 的場景答案
在找尋差異化應(yīng)用場景的道路上,字節(jié)與百度在這一問題上選擇了不同的路徑。
字節(jié)的扣子空間主要入口為網(wǎng)頁端,更易于接觸日常辦公場景下的軟件資源;百度的心響主要面向手機端,目前仍只支持安卓系統(tǒng),意圖將自身產(chǎn)品打入用戶的日常場景體驗之中。
字節(jié)希望用 AI 深度嵌入工作流已成為業(yè)界共識。扣子空間 " 和 Agent 一起開始你的工作 " 這句宣傳語精準地貫穿了產(chǎn)品邏輯。
扣子空間的最大目標:生產(chǎn)力全面提升。其 MCP 擴展中,飛書云文檔、多維表格和電子表格尤為令人關(guān)注。如果能夠與飛書平臺進行高度整合的話,打通生態(tài)間壁壘,扣子空間將會成為企業(yè)效率的 " 智能中樞 "。
我們讓扣子空間作為一位藝術(shù)類型公眾號撰稿者,搜集日本藝術(shù)家的文字與圖片信息,制作成一份文字與藝術(shù)作品圖片交叉的稿件。
在實際測試中,它對提示詞的遵循能力優(yōu)異,能夠自動檢索網(wǎng)頁、制作可視化報告,流程流暢幾乎沒有卡頓,給出了一份完整的、規(guī)規(guī)矩矩的文字報告以及作品時間軸。
字節(jié)希望把 Agent 當作辦公過程中的 "AI 實習(xí)生 ",主動幫助用戶處理文件檢索、表格制作、報告生成等任務(wù)。其背后的邏輯是:在企業(yè)私域內(nèi),聰明的 AI 輔助工具才更容易產(chǎn)生價值。
百度則選擇進一步降低使用門檻,從更廣泛的普通 C 端用戶切入,其產(chǎn)品心響專為移動端設(shè)計,在實際測試中的產(chǎn)品邏輯有些不同:" 把難題留給心響,把時間留給生活。"
從功能模塊的設(shè)計來看,心響相對于字節(jié)的扣子空間一個最大的區(qū)別是 " 靈感廣場 " 模塊。在該模塊內(nèi),百度的產(chǎn)品設(shè)計者集成了大量的任務(wù)模板:晚安故事集、AI 繪本、AI 相親等等。
不過,百度的 C 端策略既聚焦于用戶習(xí)慣的培養(yǎng),也有在一定程度上限制了產(chǎn)品的想象空間的嫌疑。技術(shù)上來看,心響給了外界一個明顯的感受:主模型的指令遵循能力似乎并不如字節(jié)扣子空間那樣精準,它的思維更加發(fā)散。
相比于扣子空間迅捷的內(nèi)容生成速度,百度的心響在響應(yīng)速度上顯得相對緩慢的多,生成過程耗時更長。
然而,與扣子空間嚴格遵循提示詞、輸出規(guī)整的報告不同,心響在生成結(jié)果時額外設(shè)計了交互元素和視覺優(yōu)化,在輸出中融入更多細節(jié)和附加價值。
這樣的產(chǎn)品邏輯,非常適配于日常場景,因為用戶往往被認為在與 AI 的交互中,提示詞工程的經(jīng)驗較弱,甚至很多時候自己都不清楚自己想要的是什么。
二、大廠摸著 Manus 過河
盡管產(chǎn)品體驗上仍有不完美之處,令字節(jié)、百度們爭搶推出相應(yīng) Agent 產(chǎn)品的一大原因,則離不開其在商業(yè)變現(xiàn)上的天花板足夠高。
要知道,競爭打到現(xiàn)在,無論國外的 OpenAI,還是國內(nèi)的字節(jié)、百度,其在大模型上都處于虧錢投入階段。如何尋找到足夠強的付費變現(xiàn)模式,無疑是一眾大模型廠商的當務(wù)之急。
Manus 成功拿下 7500 萬美元融資的現(xiàn)身說法,讓科技大廠看到了進軍 Agent 領(lǐng)域的一絲曙光。最近 OpenAI 的一份預(yù)期收入報告,則讓這絲曙光變得更明亮了些。
據(jù) The Information 報道,OpenAI 預(yù)測至 2029 年,AI Agent 及其他新產(chǎn)品的銷售額將超越 ChatGPT,推高總營收至 1250 億美元,2030 年總營收有望達到 1740 億美元。Agent,正被視為繼對話式大模型產(chǎn)品之后的下一個大金礦。
而且,對于字節(jié)和百度這樣生態(tài)龐大的公司而言,在各自的生態(tài)體系下,借助需要外部 MCP 交互的 Agent,還可以達到盤活現(xiàn)有產(chǎn)品矩陣的效果。
但是,MCP 本身不足以實現(xiàn) " 世界的互通互聯(lián) "。其需要大模型在多模態(tài)(尤其是推理能力)以及成本價格方面,給予支持。這也反過來說明,為什么是此時此刻,字節(jié)和百度才有能力推出 " 扣子空間 " 和 " 心響 "。
根據(jù) The Information 報道,Manus 僅僅在 Claude 大模型的調(diào)用上,兩周內(nèi)就燒掉了超過百萬美元。AI Agent 的基礎(chǔ)工作流中的必要部分——多步推理涉及多次模型調(diào)用,處理復(fù)雜任務(wù)時需結(jié)合文本、圖像等多模態(tài)數(shù)據(jù),導(dǎo)致計算量激增,消耗大量 GPU 資源,說得直白點:AI 智能體需要強算力資源、高多模態(tài)能力、強推理能力、低成本價格。
進入 2025 年,推理模型尤其是視覺推理領(lǐng)域的進步,使得 Agent 在實際產(chǎn)品中的部署變得技術(shù)上可行且經(jīng)濟上可持續(xù)。字節(jié)與百度在多模態(tài)大模型領(lǐng)域的早期投入開始有了回報,AI Agent 的基礎(chǔ)產(chǎn)品形態(tài)有了現(xiàn)實支撐。
近期,百度發(fā)布了文心 4.5 Turbo 及 X1 Turbo,強調(diào)推理性能與成本優(yōu)化。代碼智能體文心快碼更是接入 MCP,李彥宏本人直接提出 " 創(chuàng)新的核心在于成本下降 "。
字節(jié)同樣在 4 月中旬更新了豆包 1.5 · 深度思考模型,同樣主打一個多模態(tài)和性價比。據(jù)晚點 LatePost 報道,扣子空間對比了六款國內(nèi)大模型,最終還是選用了自家的豆包作為基座模型技術(shù)支撐,原因是后者推理成本較低,大規(guī)模調(diào)用可行性高。
三、大廠尋找新 " 增長點 " 旅途坎坷
AI Agent 概念雖然打得火熱,但其定義正被泛化、濫用。通用 Agent 的資本故事里每一個字都異常美妙,市場潛力巨大,其仍然面臨多重技術(shù)挑戰(zhàn),包括高任務(wù)失敗率、上下文理解不足、數(shù)據(jù)安全風險及潛在的偏見放大問題。例如,無論是 Manus、還是字節(jié)的扣子空間、百度的心響,這些產(chǎn)品在復(fù)雜任務(wù)中的可靠性仍說不上有多高。
從較短的時間尺度上來看,AI Agent 在復(fù)雜任務(wù)中的表現(xiàn)仍難以配得上 " 通用 " 二字。但如果將目光放得更長遠,其作為大廠們 AI 產(chǎn)品體系的新增長點的潛力無法被忽視。
沒有大廠愿意冒著落后的風險,而不選擇跟進。這一點深刻地體現(xiàn)在了字節(jié)、百度這樣的中國科技大廠身上。根據(jù)晚點 LatePost 報道,Manus 出圈前后,字節(jié)就搞了至少 5 個團隊在開發(fā)不同 Agent 產(chǎn)品;百度的心響則由一群 95 后組成的團隊,在 30 天內(nèi)研發(fā)出來。
對大廠而言,技術(shù)優(yōu)化迭代是必由之路,挖掘差異化的應(yīng)用場景才是打開這條路的起始。誰能率先找到復(fù)雜用戶場景的解決方案,誰就能從這塊蛋糕里分走一部分。
這也意味著,字節(jié)和百度絕不會是這條賽道里的唯二玩家。國內(nèi)方面,阿里和騰訊同樣虎視眈眈。國外,不光是率先確立了 A2A 協(xié)議的 Google,MCP 協(xié)議的 Anthropic,OpenAI 對 Agent 也下了重注。一個月前,The Information 報道稱,OpenAI 已經(jīng)在與投資者商議了三類未來的 Agent 產(chǎn)品的發(fā)布,價格從每月 2000 美元到 20000 美元不等。
可以想見的是,技術(shù)、資本、場景、標準正在 AI Agent 領(lǐng)域進行混合博弈,對于大廠們而言,這不僅僅是燒錢的開始,也是為產(chǎn)品體系找到全新商業(yè)引擎的起點。
來源:直面 AI