聲明:本文來自于微信公眾號AI新榜,作者:石瀨,授權(quán)站長之家轉(zhuǎn)載發(fā)布。
這屆打工人,可以使喚的“AI牛馬”越來越多了。
“AI牛馬”,顧名思義,是指那些像牛馬一樣辛勤工作、不知疲倦的AI。從今年年初DeepSeek R1橫空出世,“AI牛馬”這個概念就在小紅書等平臺上不斷刷屏,不少打工人也開始把工作“外包”給AI。
不過現(xiàn)在最卷的“AI牛馬”賽道已經(jīng)不是DeepSeek、ChatGPT等AI聊天機器人了,而是被Manus帶火AI Agent賽道。簡單來說,主打Agent功能或特點的AI產(chǎn)品,不僅能“想”(規(guī)劃),更能“做”(執(zhí)行)。相比AI聊天機器人,這類產(chǎn)品里的AI更想直接幫你把活干了。
這個賽道最近有多卷?
從Manus一夜爆火,到字節(jié)跳動、百度相繼布局通用AI Agent領(lǐng)域,短短兩個月內(nèi),眾多標(biāo)榜“Agent”概念的產(chǎn)品如雨后春筍般涌現(xiàn)。其中前百度高管景鯤創(chuàng)辦的Genspark,從AI搜索轉(zhuǎn)型為通用型AI Agent產(chǎn)品后,僅用9天就突破了1000萬美金ARR(年度經(jīng)常性收入)。
接著,智譜Agent產(chǎn)品“AutoGLM沉思”也正式上線。發(fā)布時,智譜還披露了一個由“沉思”運營的小紅書賬號,并稱該賬號在短短兩周內(nèi)吸引了5000名粉絲,并接到了多個商業(yè)推廣邀請,成功變現(xiàn)500元。
同樣引人注目的還有一款由中國95后團隊打造、號稱“全球首個Agentic瀏覽器”的產(chǎn)品Fellou,也在AI圈獲得了一定關(guān)注度,它的內(nèi)測邀請碼最近已經(jīng)在某二手平臺上被炒到29.99元。
這些打著Agent名頭的“AI牛馬”真的好用嗎?它們分別擅長哪些應(yīng)用場景?相比通用AI Agent產(chǎn)品,與瀏覽器等場景深度結(jié)合的垂類Agent應(yīng)用是否更為可靠?帶著這些問題,我進行了一番實測。
最新“AI牛馬”實測:
把工作外包給AI,是噱頭還是生產(chǎn)力革命?
從Manus到扣子空間,我發(fā)現(xiàn)當(dāng)前通用型AI Agent產(chǎn)品普遍只做到了“通”,而在解決具體問題、達成實際效果層面并沒有做到“好用”。
所以在以下實測過程中,我會更聚焦于AI牛馬們在實際應(yīng)用中究竟“能做什么”與“不能做什么”,力求為大家排雷避坑、減少試錯成本。
Fellou:聰明能干活但是“職場糊弄大師”
Fellou主打特點是“會思考更會執(zhí)行的Agentic瀏覽器”。
從互聯(lián)網(wǎng)誕生起,瀏覽器就是一個重要的信息入口。也因此,F(xiàn)ellou的核心設(shè)計顯得很巧妙。它整合了瀏覽器、Agent和工作流自動化等三大產(chǎn)品能力,從而實現(xiàn)“思考”、“操作”和“執(zhí)行”閉環(huán)。
https://fellou.ai/
進入Fellou主頁面,功能分區(qū)很清爽。右側(cè)是與AI交互的對話框(可固定),方便用戶隨時與AI進行溝通和交互;左側(cè)是搜索框,在這里你可以搜索瀏覽信息、也可以“監(jiān)工”AI是怎么干活的。
Fellou目前僅支持Mac OS系統(tǒng)且有一定硬件限制
這也和不同Agent工作方式有關(guān)。Fellou的Agent是基于圖形用戶界面(GUI)而非API進行操作的。這意味著它能夠像人類用戶一樣直接與軟件界面進行交互,模擬鼠標(biāo)點擊、鍵盤輸入等操作來完成任務(wù)。
最終它生成了一份網(wǎng)頁報告,精準(zhǔn)地篩選出了符合提示詞要求的資訊,甚至連像“OpenAI圖像生成API發(fā)布”這樣非常新的重磅消息也能迅速捕獲。
在此基礎(chǔ)上,你還能讓AI把報告換一個主題色、增加更多信息、或是添加一條時間線直觀展示重要新聞事件。
詳細報告地址:
https://chat.fellou.ai/report/4550ae9b-2b3d-42c7-82cb-bdff022c5c70
值得注意的是,這份看似很專業(yè)的報告,卻在一些細節(jié)上存在“致命”錯誤。例如,把數(shù)據(jù)“1.3億”誤寫成了“130萬”。如果這種錯誤如果出現(xiàn)在真實的公司報告中,可能會成為“世界是個巨大的草臺班子”的又一大例證。
Techcrunch原文寫的是“130million”(即1.3億)
除了搜索整合信息生成報告外,你還可以讓它去社交平臺搜集特定領(lǐng)域的KOL,以及幫你完成發(fā)推文等任務(wù)。
提示詞:幫我找到過去兩周在推特上曝光量超過5萬的10位科技領(lǐng)域的關(guān)鍵意見領(lǐng)袖(KOL)
需要用戶授權(quán)才能登錄具體網(wǎng)站獲得信息
但相比新聞資訊收集,這類任務(wù)數(shù)據(jù)不準(zhǔn)確問題更明顯、參考鏈接也不完整。
不過,F(xiàn)ellou搜集出來的KOL還是有一定價值的,它給我的列表里有納瓦爾、吳恩達等科技圈大佬。報告網(wǎng)頁也做得有模有樣,甚至有一些簡單的交互和(有Bug的)搜索功能。
詳細報告地址:
https://chat.fellou.ai/report/f0cbdd1d-2e52-45bb-a7e5-b2898123e2e8
讓AI接管社交媒體運營倒是一個很新奇的體驗,但我實際體驗下來感覺用處不大:
Fellou執(zhí)行發(fā)布單條推文這類簡單指令基本沒問題,可一旦涉及更復(fù)雜的工作流——比如需要策略性地轉(zhuǎn)發(fā)多位AI頭部博主的推文并附上恰當(dāng)評論,這類既耗時又需要重復(fù)操作的“養(yǎng)號”任務(wù)時,AI就顯得有些力不從心,要么陷入卡Bug式的循環(huán)運行、要么糊弄人“說自己完成任務(wù)了”,離真正的智能高效還有相當(dāng)一段距離。
它給自己規(guī)劃了8個任務(wù)步驟,實際僅做到第4步
不過值得一提的是,在Fellou上你可以通過輸入“/”搜索指定的內(nèi)容源(包括X、Reddit等社交平臺)或是直接檢索自己過往在Fellou中生成的報告,并基于這些歷史報告向AI進一步提問(輸入“@”可將報告作為上下文信息引入到對話),從而構(gòu)建起一個可迭代的個人知識庫。
AutoGLM沉思:智譜不語,只是一味干活
從任務(wù)完成情況和效率來看,AutoGLM沉思恐怕坐實了“職場老黃?!鄙矸?。
https://autoglm-research.zhipuai.cn/
不論問題難度如何,AutoGLM沉思都會自動開啟“一味干活”模式。
像“特朗普為什么在國內(nèi)被叫做川普”這類簡單問題,AutoGLM沉思也會走完全流程:從深度思考、推理規(guī)劃,到上網(wǎng)檢索、整理信息,最后生成結(jié)論,一個不落。
一頓操作猛如虎,最后給出的答案,和直接問元寶幾秒鐘得到的答案差別不大。
AutoGLM沉思使用安裝上也更有操作門檻一些,不僅需要下載智譜清言Mac/Win客戶端,還要安裝Chrome瀏覽器插件,之后才能在客戶端中使用。
而需要安裝瀏覽器插件原因在于,AutoGLM沉思和Fellou一樣,要替你瀏覽網(wǎng)頁、收集信息。
但兩者不同的是,AutoGLM沉思并沒有以虛擬窗口的形式降低AI的存在感,反而是會占用用戶的瀏覽器,影響整體使用體驗。
左側(cè)是AutoGLM沉思在操作瀏覽器
當(dāng)然我也測試了AutoGLM沉思在更復(fù)雜場景下的表現(xiàn)。比如讓它從零開始策劃并運營一個定位為“銷售3D打印掛件的科技博主”的小紅書賬號。
任務(wù)啟動后,AutoGLM沉思表現(xiàn)得很專業(yè):它會打開小紅書并要求用戶授權(quán)登錄,進去后就是一頓操作,研究同賽道賬號,初看頗有章法。
AutoGLM沉思在瀏覽小紅書
但到了實際產(chǎn)出環(huán)節(jié),效果卻不盡如人意。最終給出的關(guān)于用戶名、頭像選擇以及賬號簡介的建議,比較寬泛,缺乏針對性和創(chuàng)意亮點。
看到“小紅的3D世界”那一刻,
影視解說里的小美小帥都變高級了
此外實測中AutoGLM沉思并沒有完成賬號的創(chuàng)建動作,它僅僅停留在提供建議和操作步驟的層面,最終設(shè)置和修改都需要用戶自己動手完成。
不過,AutoGLM沉思這種“不替用戶操作”的特性放到別的場景倒成了優(yōu)點。特別驚艷我的一個案例是:我之前研究了很久的AI電腦裝機配置,交給AutoGLM沉思不到10分鐘就整理出來了,并且貼心地打開了每一個配件對應(yīng)的淘寶商品頁面。
但它僅僅止步于此——提供信息和購買入口,而沒有把這些商品自動加入購物車,在涉及購買決策這種場景下,體現(xiàn)出了恰到好處的“邊界感”。
Genspark:新晉“不加預(yù)算請不起的留子”
比起ChatGPT,Genspark才是符合定義的“不加預(yù)算請不起的留子”。
畢竟,它是華人團隊面向海外市場推出的一款通用AI Agent產(chǎn)品,相對而言更符合“留子”這一人設(shè)。
Genspark之前定位更偏AI搜索,如今Agent賽道大火之后,不止宣發(fā)重點,Genspark的產(chǎn)品界面也逐漸偏離搜索,更多地向Agent產(chǎn)品形態(tài)靠攏。
產(chǎn)品地址:https://www.genspark.ai/
和其他定位通用AI Agent的產(chǎn)品一樣,你可以把旅行規(guī)劃、制作報告、數(shù)據(jù)圖表這類復(fù)雜任務(wù)丟給它,能不能做得完美另說,但它一定能做出來。
在沒有多余提示詞調(diào)教的情況下,Genspark生成的報告和數(shù)據(jù)圖表,整體審美都很在線,且肉眼不容易發(fā)現(xiàn)明顯的數(shù)據(jù)錯誤或制圖瑕疵。
完成任務(wù)的速度也很快。以下這份報告是Genspark花了2分鐘完成信息搜索,并通過代碼驅(qū)動的方式自動化生成的PPT,整個工作流耗時控制在10分鐘以內(nèi)。
詳細報告地址:
https://ajpbouva.genspark.space/
同類產(chǎn)品中,Genspark還支持一個少見的“AI打電話”能力。從官方Demo演示來看,Genspark已經(jīng)可以流暢地幫用戶預(yù)訂餐廳和酒店,這種從虛擬走向現(xiàn)實,打破次元壁的能力,增強了AI在日常生活中的實用性。
不過,雇傭Genspark干活的費用并不低。官方每天會給免費用戶發(fā)放200積分,只夠生成一次常規(guī)報告。目前Genspark提供的訂閱方案中,最便宜的年付會員也要19.99美元/月。
AI Agent賽道火了,
但它還沒有那么“萬能”
去年Sora,今年Manus,這兩款現(xiàn)象級AI應(yīng)用都帶火了一個賽道。
相似的劇情也在重演:對大多數(shù)人來說,Sora是只有少數(shù)邀測藝術(shù)家能用的“期貨”,Manus的邀請碼也只流向了少數(shù)幸運兒。
一邊是業(yè)界被點燃的熱情。國內(nèi)大廠如字節(jié)、阿里、百度已經(jīng)出手,不僅布局產(chǎn)品還要卷MCP生態(tài);初創(chuàng)公司則涌現(xiàn)了Fellou、Genspark等有華人背景的出海產(chǎn)品;開源方面也有不少項目如Suna,已經(jīng)上線Github,狂攬7.5K星標(biāo)。
開源地址:
https://github.com/kortix-ai/suna/?utm_source
另一邊是,AI Agent產(chǎn)品還沒有成熟到可以讓C端用戶體驗到“wow moment”。這背后,既有技術(shù)的局限,也有互聯(lián)網(wǎng)時代遺留下來的老問題。
互聯(lián)網(wǎng)公域中有價值、可信賴的信息數(shù)量在下降,而各大平臺間的信息壁壘依舊森嚴(yán),形成一座座“數(shù)據(jù)孤島”,這成為通用AI Agent發(fā)展繞不開的核心挑戰(zhàn)之一。
技術(shù)方面,底層大模型仍然決定著AI Agent產(chǎn)品的上線,受限于當(dāng)前大模型的智能水平和上下文記憶能力,AI Agent在面對邏輯鏈條過長的復(fù)雜任務(wù)時,往往容易“掉鏈子”或偏離目標(biāo)。
同時由于AI幻覺問題的存在,“AI生成的內(nèi)容不能全信”也應(yīng)該成為每個首席牛馬官的基本常識。
一個能自主完成任務(wù)的AI Agent打開了一個想象:把現(xiàn)代人從日益繁重的工作內(nèi)卷中解放出來。但至少從目前來看,AI Agent產(chǎn)品們,還沒有真正抵達那個“足夠好用”、“足夠可靠”的階段。
(舉報)