聲明:本文來自于微信公眾號 光錐智能,作者:魏琳華,授權(quán)站長之家轉(zhuǎn)載發(fā)布。
在DeepSeek和Manus的沖擊之下,“沉寂”已久的字節(jié),做出了首個由大廠發(fā)布的Agent爆款。
從4月18號扣子Agent上線以來,各個AI交流群都開始搶起了扣子的邀請碼。用戶們蹲在各個群里等待5個一組的邀請碼放出,又在幾秒鐘被橫掃一空。
與之對應(yīng)的是,即便算力充沛如字節(jié),也沒頂住用戶對Agent嘗鮮的熱情。幾天內(nèi),扣子出現(xiàn)過幾次因人多而服務(wù)器爆滿的情況,可見,其算力消耗也遠(yuǎn)遠(yuǎn)超過了字節(jié)原本的預(yù)期。
在Manus之后,字節(jié)新上線的Agent,靠著優(yōu)化的產(chǎn)品思路和量大便宜的優(yōu)勢,暫時成功吃下了昂貴的Manus遺留的空白市場。
一時的熱鬧后,扣子空間會曇花一現(xiàn),還是成為字節(jié)屹立不倒的招牌?
邀請碼被瘋搶,扣子
補(bǔ)上了Agent市場的空白
在扣子本次更新的多款產(chǎn)品和功能中,“扣子空間”成為了引爆用戶熱情的關(guān)鍵產(chǎn)品。
“扣子空間”,是字節(jié)的智能體平臺扣子推出的Agent,目前已經(jīng)滿足了規(guī)劃、使用工具和記憶等關(guān)鍵的自主能力。
根據(jù)扣子官網(wǎng)給出的各種使用體驗案例,扣子既可以用來寫游戲攻略、市場調(diào)研報告,也能基于字節(jié)提供的數(shù)十種MCP實現(xiàn)更加復(fù)雜的需求,比如用高德地圖MCP+Agent寫一份旅游指南,用飛書多維表格統(tǒng)計數(shù)據(jù)等等。
實際體驗下來,扣子的Agent更接近于OpenAI發(fā)布的智能體DeepResearch和Manus的結(jié)合體。
拿到體驗碼后,光錐智能以“字節(jié)一年To B的AI戰(zhàn)略”為要求,讓Agent幫忙收集信息并生成一份分析報告。Agent將任務(wù)拆解成4個步驟,并在測試者的意見修改下,給出最終的拆解結(jié)果:
通過在瀏覽器搜索信息,扣子Agent用了十幾分鐘,把上述三個步驟收集到的信息各整理成文件留存,供使用者隨時查看。最后,Agent調(diào)用了網(wǎng)頁生成工具,輸出了一份長達(dá)10個小節(jié)的報告。雖然概況的內(nèi)容還較為簡略,但Agent的調(diào)查報告已經(jīng)能做到基本覆蓋各個維度的信息。
于產(chǎn)品設(shè)計思路上,字節(jié)整體的設(shè)計方式更加接近DeepResearch。比如兩者都將Agent的思考過程和收集內(nèi)容放到了整體界面的右側(cè),讓使用者能夠更加清晰地看到AI的每一步操作。
在此基礎(chǔ)上,扣子的Agent還延續(xù)了字節(jié)一貫突出的產(chǎn)品設(shè)計思路,進(jìn)一步提升了用戶的交互體驗。
當(dāng)前,一般的Agent雖然生成速度快,但往往難以滿足用戶的復(fù)雜需求;深度思考的Agent又往往效率不如前者,需要花幾十分鐘才能給出結(jié)果。
考慮到用戶對于生成效率和質(zhì)量兩種不同的需求,扣子的智能體史無前例地在Agent使用界面中開啟了兩種模式——“探索模式”和“規(guī)劃模式”。
對比起來,前者的思考速度快,但只能處理需求較為簡單的任務(wù),而后者則能根據(jù)用戶需求將任務(wù)拆分成詳細(xì)步驟,還能在生成規(guī)劃后讓用戶根據(jù)需求修改。加入用戶的修改意見后,也能提升AI操作的準(zhǔn)確性。
不過,如果以智能體目前的三個關(guān)鍵能力指標(biāo),即規(guī)劃、工具調(diào)用和記憶來衡量,字節(jié)的Agent表現(xiàn)還無法比肩DeepResearch和Manus。
在工具調(diào)用上,目前字節(jié)平臺給出的可直接調(diào)用的MCP只有十多種,還需要進(jìn)一步擴(kuò)充。
交給扣子Agent生成內(nèi)容的體驗中,目前它搜索的文字內(nèi)容也多直接來自互聯(lián)網(wǎng)引擎搜索,沒辦法像DeepResearch一樣直接在特定的垂類網(wǎng)站搜索信息,也沒有橫跨各個平臺的內(nèi)容搜索。內(nèi)容池窄了,生成的內(nèi)容質(zhì)量自然有限。
而在記憶問題上,也有不少體驗扣子的用戶表示,在測試了十幾輪上下文對話后,Agent就會出現(xiàn)“失憶”的情況,無法記住之前的交流內(nèi)容。
實際上,這也是由于扣子Agent的底層模型決定。
當(dāng)下的共識是,Agent的能力依賴于底層模型的水平。但和用自研模型的OpenAI,以及調(diào)用Claude3.7等模型的Manus相比,扣子的底層模型使用的是豆包最新發(fā)布的深度思考模型Doubao-1.5-thinking-pro,從效果和部分開發(fā)者反饋效果來看,無論在文本理解思考能力還是代碼輸出等能力上,扣子Agent表現(xiàn)還稍遜于前者。
不過,為了提升Agent使用體驗,字節(jié)在多模態(tài)能力上下了功夫。比如字節(jié)在上一周發(fā)布了專門為Agent設(shè)計的GUI(圖形交互界面)模型,這也讓扣子Agent在視覺理解和圖片生成能力上表現(xiàn)更加突出。
在上述光錐智能實際體驗后,扣子Agent按照要求生成的報告不僅詳細(xì)分好了對應(yīng)的報告節(jié)點(diǎn),且在UI設(shè)計上體驗拉滿,給到了圖文并茂的調(diào)研報告。
雖然,扣子的Agent目前表現(xiàn)還沒辦法追趕上Manus,但在一片基本空白的自主Agent市場中,扣子Agent的表現(xiàn)已經(jīng)足夠驚艷。它做到了火山引擎最愛強(qiáng)調(diào)的那句“成本低、易落地”,先把具備自主執(zhí)行能力的Agent端上來,讓人們能夠體驗并反饋。
如同字節(jié)給扣子空間的定位“一個通用的實習(xí)生配合各領(lǐng)域的專家”,現(xiàn)階段的扣子Agent,做到了這個執(zhí)行標(biāo)準(zhǔn)。
搶占時間窗口,
扣子拿下大廠智能體首勝
“扣子空間”的誕生,是大廠在智能體路線上的一次“糾偏”。
為什么Manus沒有出生在大廠?這個在Manus爆火后常常被人提起的問題,要從大廠做智能體的思路說起。
從OpenAI發(fā)布GPTs商店開始,大廠在2024年上半年紛紛跟進(jìn)智能體。字節(jié)跳動的扣子、騰訊云的騰訊元器、百度智能云千帆AgentBuilder、阿里云大模型平臺百煉,都是在這個時間段先后發(fā)布。
字節(jié)海外版平臺Coze
但大廠們對這些智能體的定位,仍然停留在做開發(fā)者生態(tài)的平臺上——智能體商店。
通過接入市面上多種大模型能力和各種Agent開放工具,智能體平臺們不斷吸納開發(fā)者,寄希望于靠開發(fā)者們做出應(yīng)用生態(tài),再借著各種功能的智能體來吸引用戶,智能體平臺則順勢成為流量生態(tài)的入口。
之所以做出這樣的選擇,是大廠一貫的“平臺思維”的慣性——做好平臺和基礎(chǔ)工具,并不親自下場。這就像淘寶和京東一開始的區(qū)別。
另外一方面也是由于模型能力的制約。彼時,在多模態(tài)能力尚未完善的情況下,大模型還無法“理解”手機(jī)和電腦的操作界面信息,也就無法完成各種自主操作。
所以,扣子們重點(diǎn)做的是通用工具的打磨,完善各種工作流,降低開發(fā)者們的開發(fā)門檻。再采用流量分成的方式,吸引開發(fā)者接入。
但在去年11月,智譜發(fā)布的Agent“AutoGLM”開始能夠?qū)崿F(xiàn)點(diǎn)外賣、發(fā)紅包等自主操作后,大廠們肯定看到了相關(guān)的潛力,但從行動上來看,大廠的速度顯然沒有Manus更快,產(chǎn)品也沒有Manus深。
在現(xiàn)象級爆款產(chǎn)品面前,各家大廠都開始坐不住了。向來求穩(wěn),發(fā)產(chǎn)品從來不發(fā)“半成品”的字節(jié),這次搶著把還不夠完善的扣子Agent發(fā)了出來。
如今的扣子Agent,就是一個滿足“60分及格”的產(chǎn)品,它要做的就是搶占時間窗口。
此前,譚待曾在采訪中表示,做B端,搶先發(fā)優(yōu)勢的前提是產(chǎn)品或服務(wù)要達(dá)到及格線。
“做B端更要為結(jié)果負(fù)責(zé)。”譚待說,“如果你的產(chǎn)品足夠‘可用’,搶占先發(fā)優(yōu)勢肯定是有價值的。”
這次,字節(jié)選對了。
Manus雖然在短時間內(nèi)在市場點(diǎn)燃了熱度,成功驗證PMF,但它的技術(shù)護(hù)城河并不高,在強(qiáng)手云集的AI行業(yè)中,多家大廠都開始著手準(zhǔn)備復(fù)刻Manus類產(chǎn)品。
從一開始的爆火,Manus要想真的在行業(yè)中“長青”,關(guān)鍵在于兩點(diǎn),一是保證技術(shù)優(yōu)勢持續(xù)領(lǐng)先,二則是解決Agent成本高企的問題,快速鋪開市場規(guī)模。
但現(xiàn)在,Manus仍然深受成本問題制約。在Manus的閉門會上,其工作人員分享Manus單次運(yùn)行成本在2美元左右。高昂的成本,注定了Manus只能在起步階段向少量用戶開放。即使開放商業(yè)計劃,它的定價也不會是一筆普通用戶能承擔(dān)的費(fèi)用。
開出最低一個月39美金的會員定價的情況下,Manus還無法進(jìn)一步提升市場占有率。
Manus的兩個會員訂閱方案
而成本,就是大廠的優(yōu)勢,更何況是背靠火山引擎的云底座,可以把現(xiàn)有產(chǎn)品做得更便宜、好上手。
有意思的是,這次扣子Agent在營銷上也似乎有意在參考Manus的“饑餓營銷”。從最開始上線就發(fā)出了大量邀請碼,且一個用戶使用后就能再拿到5個邀請碼繼續(xù)分享裂變??梢哉f,字節(jié)為這次扣子的上線煞費(fèi)苦心,也準(zhǔn)備了不少彈藥。
字節(jié)的后發(fā)優(yōu)勢,讓Manus類的自主智能體不再停留在Demo中,從而在市場中率先分得一杯羹。
不過,“扣子空間”Agent能火多久,還是一個問題。
在一次采訪中,火山引擎總裁討論過“先發(fā)優(yōu)勢和后發(fā)優(yōu)勢”。面對“第二名是否永遠(yuǎn)是投入產(chǎn)出比最高”的問題,譚待給出了如下回答。
“第一名有很大優(yōu)勢,但第二名應(yīng)該把跟隨優(yōu)勢發(fā)揮好,前提是第二名足夠優(yōu)秀,普通賽車手也很難反超?!?/p>
足夠優(yōu)秀的“第二名”字節(jié),能在接下來的迭代中保住市場優(yōu)勢嗎?
企業(yè)級智能體
火山引擎的野心
從去年的試水觀望,到今年紛紛接入Agent,DeepSeek和Manus讓企業(yè)們看到了Agent落地的可能性,模型能力的提升也降低了實現(xiàn)的門檻。
2025年,Agent迎來爆發(fā)之年。
但企業(yè)做Agent,最大的問題就是卡在如何接入內(nèi)部系統(tǒng)上。
和開發(fā)者做Agent不一樣的是,企業(yè)對數(shù)據(jù)安全的要求高,這就意味著可能需要私有化部署大模型;再從落地效果上來說,企業(yè)需要Agent做到準(zhǔn)確度接近100%的級別,因為商用領(lǐng)域承擔(dān)不起錯誤結(jié)果;最后,面對很多復(fù)雜的需求,Agent想要一一實現(xiàn),需要技術(shù)團(tuán)隊針對具體場景琢磨用哪些實現(xiàn)方式完成。
但在去年整體大模型能力有限的情況下,Agent要想真正接入企業(yè),靠的還不是當(dāng)下流行的自主Agent,而是根據(jù)業(yè)務(wù)需求編寫工作流完成。
對于沒有AI大模型基礎(chǔ)的企業(yè)來說,沒有專門的技術(shù)人才,想做明白Agent就是難上加難。
專注智能體B端生意的廠商們,都很清楚上述的問題。
所以,在字節(jié)從扣子上看到了Agent潛力之后,推出的扣子專業(yè)版一是只能在公有云上調(diào)用,二是這個智能體平臺只是工具的集合體,對于想真正落地的企業(yè)來說,空有工具又不會用,也是問題。
一位字節(jié)跳動旗下的智能體平臺扣子的研發(fā)人員曾對光錐智能表示,“我們在市場開拓期,會免費(fèi)給客戶接入豆包大模型,還會做一對一的調(diào)試和服務(wù)?!?/p>
但只是這樣還不夠,字節(jié)要想進(jìn)一步收獲更多客戶,就得推出一個更聚焦企業(yè)的版本,于是就有了去年5月上線的HiAgent。
HiAgent上線,先解決了一個關(guān)鍵的問題,就是能夠把豆包私有化部署到企業(yè)中,這才能夠上企業(yè)安全的門檻。
比起之前扣子企業(yè)版明碼標(biāo)價的包月制服務(wù),HiAgent再準(zhǔn)備著手解決的是落地方面的問題。比如給缺少相關(guān)技術(shù)指導(dǎo)的企業(yè)直接派人才幫忙,再比如直接針對各行業(yè)做了適配行業(yè)特點(diǎn)的上百個模版。
坦白來說,字節(jié)搭建Agent企服的思路不稀奇,這也是多家B端行業(yè)一直沿用的方式,即全方位包攬落地,再加以人力精準(zhǔn)輔助。
不過對比同期的云廠商來說,字節(jié)無論是在扣子平臺還是在HiAgent的服務(wù)搭建上,都做得夠快、夠全,這也是字節(jié)能搶下大量智能體市場訂單的原因。
字節(jié)逐漸提升Agent地位的半年時間內(nèi),也迎合上了行業(yè)內(nèi)智能體的增長。據(jù)大單網(wǎng)統(tǒng)計,下半年,下半年 AI 智能體應(yīng)用落地大幅提速,增幅達(dá)330+%。
而在競爭者云集的市場中,火山引擎在2024年一共吃下了32個項目,各廠商智能體項目數(shù)量上位列第一。但和位列第二的科大訊飛相比,兩者的訂單數(shù)量差距只有2個。換言之,字節(jié)在Agent企服領(lǐng)域的優(yōu)勢存在,但并不算穩(wěn)固。
不過,在一眾云廠商里,字節(jié)已經(jīng)算得上是行動上夠快、業(yè)務(wù)布局也更廣的一個。比起第四名百度,字節(jié)比后者吃下的智能體訂單數(shù)量多了1/3。
而在當(dāng)下Agent爆發(fā)的節(jié)點(diǎn),字節(jié)更不會懈怠。它需要一個扣子在前臺吸引開發(fā)者,再通過推出企業(yè)端服務(wù)拉攏客戶,最終,火山引擎則奔著Agent爆發(fā)背后的可觀算力消耗而去。這次,扣子平臺引發(fā)的多次服務(wù)器崩潰,側(cè)面也印證了這次算力消耗情況,已經(jīng)超出了字節(jié)的預(yù)期。
這一次的時間窗口,字節(jié)能享有多久,就要看其他廠商接下來的行動了。
(舉報)