把工作外包給AI，到底靠不靠譜？實測3款人氣的“AI牛馬”

2025-04-28 14:09 · 稿源： AI新榜公眾號

聲明:本文來自于微信公眾號AI新榜，作者:石瀨，授權(quán)站長之家轉(zhuǎn)載發(fā)布。

這屆打工人，可以使喚的“AI牛馬”越來越多了。

“AI牛馬”，顧名思義，是指那些像牛馬一樣辛勤工作、不知疲倦的AI。從今年年初DeepSeek R1橫空出世，“AI牛馬”這個概念就在小紅書等平臺上不斷刷屏，不少打工人也開始把工作“外包”給AI。

不過現(xiàn)在最卷的“AI牛馬”賽道已經(jīng)不是DeepSeek、ChatGPT等AI聊天機器人了，而是被Manus帶火AI Agent賽道。簡單來說，主打Agent功能或特點的AI產(chǎn)品，不僅能“想”（規(guī)劃），更能“做”(執(zhí)行)。相比AI聊天機器人，這類產(chǎn)品里的AI更想直接幫你把活干了。

這個賽道最近有多卷?

從Manus一夜爆火，到字節(jié)跳動、百度相繼布局通用AI Agent領(lǐng)域，短短兩個月內(nèi)，眾多標(biāo)榜“Agent”概念的產(chǎn)品如雨后春筍般涌現(xiàn)。其中前百度高管景鯤創(chuàng)辦的Genspark，從AI搜索轉(zhuǎn)型為通用型AI Agent產(chǎn)品后，僅用9天就突破了1000萬美金ARR（年度經(jīng)常性收入）。

接著，智譜Agent產(chǎn)品“AutoGLM沉思”也正式上線。發(fā)布時，智譜還披露了一個由“沉思”運營的小紅書賬號，并稱該賬號在短短兩周內(nèi)吸引了5000名粉絲，并接到了多個商業(yè)推廣邀請，成功變現(xiàn)500元。

同樣引人注目的還有一款由中國95后團隊打造、號稱“全球首個Agentic瀏覽器”的產(chǎn)品Fellou，也在AI圈獲得了一定關(guān)注度，它的內(nèi)測邀請碼最近已經(jīng)在某二手平臺上被炒到29.99元。

這些打著Agent名頭的“AI牛馬”真的好用嗎?它們分別擅長哪些應(yīng)用場景?相比通用AI Agent產(chǎn)品，與瀏覽器等場景深度結(jié)合的垂類Agent應(yīng)用是否更為可靠?帶著這些問題，我進行了一番實測。

把工作外包給AI，是噱頭還是生產(chǎn)力革命?

從Manus到扣子空間，我發(fā)現(xiàn)當(dāng)前通用型AI Agent產(chǎn)品普遍只做到了“通”，而在解決具體問題、達成實際效果層面并沒有做到“好用”。

所以在以下實測過程中，我會更聚焦于AI牛馬們在實際應(yīng)用中究竟“能做什么”與“不能做什么”，力求為大家排雷避坑、減少試錯成本。

Fellou:聰明能干活但是“職場糊弄大師”

Fellou主打特點是“會思考更會執(zhí)行的Agentic瀏覽器”。

從互聯(lián)網(wǎng)誕生起，瀏覽器就是一個重要的信息入口。也因此，F(xiàn)ellou的核心設(shè)計顯得很巧妙。它整合了瀏覽器、Agent和工作流自動化等三大產(chǎn)品能力，從而實現(xiàn)“思考”、“操作”和“執(zhí)行”閉環(huán)。

https://fellou.ai/

進入Fellou主頁面，功能分區(qū)很清爽。右側(cè)是與AI交互的對話框（可固定），方便用戶隨時與AI進行溝通和交互;左側(cè)是搜索框，在這里你可以搜索瀏覽信息、也可以“監(jiān)工”AI是怎么干活的。

Fellou目前僅支持Mac OS系統(tǒng)且有一定硬件限制

這也和不同Agent工作方式有關(guān)。Fellou的Agent是基于圖形用戶界面（GUI）而非API進行操作的。這意味著它能夠像人類用戶一樣直接與軟件界面進行交互，模擬鼠標(biāo)點擊、鍵盤輸入等操作來完成任務(wù)。

最終它生成了一份網(wǎng)頁報告，精準(zhǔn)地篩選出了符合提示詞要求的資訊，甚至連像“OpenAI圖像生成API發(fā)布”這樣非常新的重磅消息也能迅速捕獲。

在此基礎(chǔ)上，你還能讓AI把報告換一個主題色、增加更多信息、或是添加一條時間線直觀展示重要新聞事件。

詳細報告地址:

https://chat.fellou.ai/report/4550ae9b-2b3d-42c7-82cb-bdff022c5c70

值得注意的是，這份看似很專業(yè)的報告，卻在一些細節(jié)上存在“致命”錯誤。例如，把數(shù)據(jù)“1.3億”誤寫成了“130萬”。如果這種錯誤如果出現(xiàn)在真實的公司報告中，可能會成為“世界是個巨大的草臺班子”的又一大例證。

Techcrunch原文寫的是“130million”（即1.3億）

除了搜索整合信息生成報告外，你還可以讓它去社交平臺搜集特定領(lǐng)域的KOL，以及幫你完成發(fā)推文等任務(wù)。

提示詞:幫我找到過去兩周在推特上曝光量超過5萬的10位科技領(lǐng)域的關(guān)鍵意見領(lǐng)袖（KOL）

需要用戶授權(quán)才能登錄具體網(wǎng)站獲得信息

但相比新聞資訊收集，這類任務(wù)數(shù)據(jù)不準(zhǔn)確問題更明顯、參考鏈接也不完整。

不過，F(xiàn)ellou搜集出來的KOL還是有一定價值的，它給我的列表里有納瓦爾、吳恩達等科技圈大佬。報告網(wǎng)頁也做得有模有樣，甚至有一些簡單的交互和（有Bug的）搜索功能。

詳細報告地址:

https://chat.fellou.ai/report/f0cbdd1d-2e52-45bb-a7e5-b2898123e2e8

讓AI接管社交媒體運營倒是一個很新奇的體驗，但我實際體驗下來感覺用處不大:

Fellou執(zhí)行發(fā)布單條推文這類簡單指令基本沒問題，可一旦涉及更復(fù)雜的工作流——比如需要策略性地轉(zhuǎn)發(fā)多位AI頭部博主的推文并附上恰當(dāng)評論，這類既耗時又需要重復(fù)操作的“養(yǎng)號”任務(wù)時，AI就顯得有些力不從心，要么陷入卡Bug式的循環(huán)運行、要么糊弄人“說自己完成任務(wù)了”，離真正的智能高效還有相當(dāng)一段距離。

它給自己規(guī)劃了8個任務(wù)步驟，實際僅做到第4步

不過值得一提的是，在Fellou上你可以通過輸入“/”搜索指定的內(nèi)容源（包括X、Reddit等社交平臺）或是直接檢索自己過往在Fellou中生成的報告，并基于這些歷史報告向AI進一步提問(輸入“@”可將報告作為上下文信息引入到對話)，從而構(gòu)建起一個可迭代的個人知識庫。

AutoGLM沉思:智譜不語，只是一味干活

從任務(wù)完成情況和效率來看，AutoGLM沉思恐怕坐實了“職場老黃?！鄙矸?。

https://autoglm-research.zhipuai.cn/

不論問題難度如何，AutoGLM沉思都會自動開啟“一味干活”模式。

像“特朗普為什么在國內(nèi)被叫做川普”這類簡單問題，AutoGLM沉思也會走完全流程:從深度思考、推理規(guī)劃，到上網(wǎng)檢索、整理信息，最后生成結(jié)論，一個不落。

一頓操作猛如虎，最后給出的答案，和直接問元寶幾秒鐘得到的答案差別不大。

AutoGLM沉思使用安裝上也更有操作門檻一些，不僅需要下載智譜清言Mac/Win客戶端，還要安裝Chrome瀏覽器插件，之后才能在客戶端中使用。

而需要安裝瀏覽器插件原因在于，AutoGLM沉思和Fellou一樣，要替你瀏覽網(wǎng)頁、收集信息。

但兩者不同的是，AutoGLM沉思并沒有以虛擬窗口的形式降低AI的存在感，反而是會占用用戶的瀏覽器，影響整體使用體驗。

左側(cè)是AutoGLM沉思在操作瀏覽器

當(dāng)然我也測試了AutoGLM沉思在更復(fù)雜場景下的表現(xiàn)。比如讓它從零開始策劃并運營一個定位為“銷售3D打印掛件的科技博主”的小紅書賬號。

任務(wù)啟動后，AutoGLM沉思表現(xiàn)得很專業(yè):它會打開小紅書并要求用戶授權(quán)登錄，進去后就是一頓操作，研究同賽道賬號，初看頗有章法。

AutoGLM沉思在瀏覽小紅書

但到了實際產(chǎn)出環(huán)節(jié)，效果卻不盡如人意。最終給出的關(guān)于用戶名、頭像選擇以及賬號簡介的建議，比較寬泛，缺乏針對性和創(chuàng)意亮點。

看到“小紅的3D世界”那一刻，

影視解說里的小美小帥都變高級了

此外實測中AutoGLM沉思并沒有完成賬號的創(chuàng)建動作，它僅僅停留在提供建議和操作步驟的層面，最終設(shè)置和修改都需要用戶自己動手完成。

不過，AutoGLM沉思這種“不替用戶操作”的特性放到別的場景倒成了優(yōu)點。特別驚艷我的一個案例是:我之前研究了很久的AI電腦裝機配置，交給AutoGLM沉思不到10分鐘就整理出來了，并且貼心地打開了每一個配件對應(yīng)的淘寶商品頁面。

但它僅僅止步于此——提供信息和購買入口，而沒有把這些商品自動加入購物車，在涉及購買決策這種場景下，體現(xiàn)出了恰到好處的“邊界感”。

Genspark:新晉“不加預(yù)算請不起的留子”

比起ChatGPT，Genspark才是符合定義的“不加預(yù)算請不起的留子”。

畢竟，它是華人團隊面向海外市場推出的一款通用AI Agent產(chǎn)品，相對而言更符合“留子”這一人設(shè)。

Genspark之前定位更偏AI搜索，如今Agent賽道大火之后，不止宣發(fā)重點，Genspark的產(chǎn)品界面也逐漸偏離搜索，更多地向Agent產(chǎn)品形態(tài)靠攏。

產(chǎn)品地址:https://www.genspark.ai/

和其他定位通用AI Agent的產(chǎn)品一樣，你可以把旅行規(guī)劃、制作報告、數(shù)據(jù)圖表這類復(fù)雜任務(wù)丟給它，能不能做得完美另說，但它一定能做出來。

在沒有多余提示詞調(diào)教的情況下，Genspark生成的報告和數(shù)據(jù)圖表，整體審美都很在線，且肉眼不容易發(fā)現(xiàn)明顯的數(shù)據(jù)錯誤或制圖瑕疵。

完成任務(wù)的速度也很快。以下這份報告是Genspark花了2分鐘完成信息搜索，并通過代碼驅(qū)動的方式自動化生成的PPT，整個工作流耗時控制在10分鐘以內(nèi)。

詳細報告地址:

https://ajpbouva.genspark.space/

同類產(chǎn)品中，Genspark還支持一個少見的“AI打電話”能力。從官方Demo演示來看，Genspark已經(jīng)可以流暢地幫用戶預(yù)訂餐廳和酒店，這種從虛擬走向現(xiàn)實，打破次元壁的能力，增強了AI在日常生活中的實用性。

不過，雇傭Genspark干活的費用并不低。官方每天會給免費用戶發(fā)放200積分，只夠生成一次常規(guī)報告。目前Genspark提供的訂閱方案中，最便宜的年付會員也要19.99美元/月。

AI Agent賽道火了，

但它還沒有那么“萬能”

去年Sora，今年Manus，這兩款現(xiàn)象級AI應(yīng)用都帶火了一個賽道。

相似的劇情也在重演:對大多數(shù)人來說，Sora是只有少數(shù)邀測藝術(shù)家能用的“期貨”，Manus的邀請碼也只流向了少數(shù)幸運兒。

一邊是業(yè)界被點燃的熱情。國內(nèi)大廠如字節(jié)、阿里、百度已經(jīng)出手，不僅布局產(chǎn)品還要卷MCP生態(tài);初創(chuàng)公司則涌現(xiàn)了Fellou、Genspark等有華人背景的出海產(chǎn)品;開源方面也有不少項目如Suna，已經(jīng)上線Github，狂攬7.5K星標(biāo)。

開源地址:

https://github.com/kortix-ai/suna/?utm_source

另一邊是，AI Agent產(chǎn)品還沒有成熟到可以讓C端用戶體驗到“wow moment”。這背后，既有技術(shù)的局限，也有互聯(lián)網(wǎng)時代遺留下來的老問題。

互聯(lián)網(wǎng)公域中有價值、可信賴的信息數(shù)量在下降，而各大平臺間的信息壁壘依舊森嚴(yán)，形成一座座“數(shù)據(jù)孤島”，這成為通用AI Agent發(fā)展繞不開的核心挑戰(zhàn)之一。

技術(shù)方面，底層大模型仍然決定著AI Agent產(chǎn)品的上線，受限于當(dāng)前大模型的智能水平和上下文記憶能力，AI Agent在面對邏輯鏈條過長的復(fù)雜任務(wù)時，往往容易“掉鏈子”或偏離目標(biāo)。

同時由于AI幻覺問題的存在，“AI生成的內(nèi)容不能全信”也應(yīng)該成為每個首席牛馬官的基本常識。

一個能自主完成任務(wù)的AI Agent打開了一個想象:把現(xiàn)代人從日益繁重的工作內(nèi)卷中解放出來。但至少從目前來看，AI Agent產(chǎn)品們，還沒有真正抵達那個“足夠好用”、“足夠可靠”的階段。

（舉報）

相關(guān)推薦

關(guān)鍵詞：

純視覺不靠譜！華為車BU CEO靳玉志：走向L3/L4自動駕駛汽車一定要有激光雷達

華為智能汽車BU CEO靳玉志近日表示，實現(xiàn)L3/L4自動駕駛必須配備激光雷達，主要原因有二：一是激光雷達無需識別障礙物即可檢測，而純視覺方案需大量數(shù)據(jù)訓(xùn)練，仍存在極端場景下的識別風(fēng)險；二是視覺方案在暗光、暴雨等環(huán)境下清晰度受限。激光雷達結(jié)合毫米波雷達等傳感器能提升極端場景下的可靠性。目前特斯拉FSD、百度Apollo Lite和Mobileye SuperVision是主流純視覺方案代表。

?激光雷達 ?自動駕駛 ?L3自動駕駛
比爾·蓋茨：我們生來不是為工作 AI將包攬大部分事情

據(jù)報道，微軟聯(lián)合創(chuàng)始人比爾?蓋茨分享了關(guān)于AI如何影響工作的有趣見解。比爾蓋茨表示，我們生來不是為了做工作。最后是生物學(xué)家，即生命探索者，雖然AI可以分析大量數(shù)據(jù)并協(xié)助診斷疾病，但生物學(xué)家在醫(yī)學(xué)研究和科學(xué)發(fā)現(xiàn)領(lǐng)域需要依賴創(chuàng)造力、直覺和批判性思維，這些是AI難以復(fù)制的特質(zhì)。

?比爾蓋茨 ?人工智能 ?未來工作
薦AI 潛入Reddit，騙過99%人類！蘇黎世大學(xué)操縱實測“AI洗腦術(shù)”，網(wǎng)友怒炸：我們是實驗鼠？

蘇黎世大學(xué)研究團隊在Reddit的"ChangeMyView"論壇進行未經(jīng)授權(quán)的AI操控實驗，引發(fā)爭議。研究人員偽裝成普通用戶發(fā)布1783條評論，成功改變137名用戶觀點，說服率達18%。實驗采用三類AI角色：通用AI、模仿社區(qū)風(fēng)格的AI和個性化AI（根據(jù)用戶歷史定制說服策略）。最受爭議的是AI會虛構(gòu)身份（如性侵幸存者、殘疾人士等）博取信任。盡管校方辯稱實驗旨在警示AI操控風(fēng)險且內(nèi)?

?AI實驗 ?社交媒體影響 ?觀點操控
薦AI暫時生成不了魯迅和張愛玲，但別高興太早

“你看看篇文章，像不像是AI寫的?”一個普通的工作日，我把一篇稿子發(fā)給編輯部的同事，隨后對此展開AI文風(fēng)大討論。這篇稿子短短兩千字，卻出現(xiàn)了三個“有人認為”，外加三個“有網(wǎng)友認為”。倘若不加以修正，人類語料所要經(jīng)受的“大屠殺”，或許也將成為AI時代的固有可能。

?AI寫作 ?文風(fēng)分析 ?媒體討論
程序員危！微軟CEO納德拉：公司高達30%代碼是AI寫的

微軟CEO納德拉在Meta的LlamaCon大會上透露，微軟代碼庫中20%-30%的代碼由AI生成，其中Python應(yīng)用進展最快，C語言相對較慢。微軟CTO凱文·斯科特預(yù)測到2030年，95%代碼將由AI生成。谷歌CEO皮查伊也表示，谷歌超30%代碼由AI生成。Meta CEO扎克伯格則未透露具體數(shù)據(jù)。由于缺乏統(tǒng)一的AI代碼衡量標(biāo)準(zhǔn)，這些數(shù)據(jù)僅供參考。（140字）

?AI ?代碼生成 ?微軟與Meta
薦瑞幸的Ai革命：AI正在淘汰最會排班的店長

最近網(wǎng)上在熱議，瑞幸的AI排班系統(tǒng)，它要求門店實際值班人員必須與AI系統(tǒng)一致，如果需調(diào)整，必須要備注申請。AI比店長更懂高峰，這么做能提高門店效率。我會在下篇文章再討論。

?AI排班系統(tǒng) ?瑞幸咖啡 ?門店管理
勾勒AI產(chǎn)業(yè)“新高地”藍圖，首屆酒仙橋論壇定義AI發(fā)展四大趨勢

4 月15日，為期 6 天的 2025 酒仙橋論壇在北京數(shù)字經(jīng)濟算力中心正式啟幕。論壇匯聚產(chǎn)學(xué)研各界領(lǐng)袖及頭部企業(yè)代表，聚焦人工智能產(chǎn)業(yè)“未來前景、創(chuàng)新應(yīng)用、生態(tài)發(fā)展”三大核心領(lǐng)域，探索加快培育新質(zhì)生產(chǎn)力的實踐路徑。AI已進入黃金發(fā)展期，如何推動AI從技術(shù)轉(zhuǎn)化為生產(chǎn)力，是行業(yè)內(nèi)備受重視的議題。在這場以“開啟AI生產(chǎn)力元年”為主題的論壇上，與會嘉賓紛紛從模型?

?人工智能 ?生產(chǎn)力 ?創(chuàng)新應(yīng)用
薦擠爆字節(jié)服務(wù)器的Agent到底啥水平？一手實測來了

字節(jié)推出"量子位"智能協(xié)作系統(tǒng)"扣子空間"，具備信息整理、任務(wù)執(zhí)行、工具調(diào)用等多項能力。測試顯示其自主任務(wù)規(guī)劃和資料搜集表現(xiàn)驚艷，已具備解決實際任務(wù)的潛力。系統(tǒng)分為探索和規(guī)劃兩種模式，前者重效率，后者可詳細拆解任務(wù)。實測中能自動整理信息生成報告，并直接制作包含豐富內(nèi)容的網(wǎng)頁或PPT。在虛擬沙盒環(huán)境中還能操作電腦、瀏覽網(wǎng)頁、訂票?

?字節(jié)版Manus ?扣子智能體 ?量子位測試
過去3年利潤持續(xù)2位數(shù)高增！全面擁抱AI的海爾智家，還有多少潛力？

3月27日，海爾智家發(fā)布2024年財報。2024年海爾智家實現(xiàn)營收2859.81億元，同比增長4.29%；歸母凈利潤187.41億元，同比增長12.92%，營收和利潤均創(chuàng)歷史新高。隨著海外歐洲業(yè)務(wù)整合完成、落地數(shù)字化變革等，收入和盈利仍有潛力，2025年海爾智家將更值得期待。

?海爾智家 ?2024年財報 ?營收增長
AMD兩款Z2系列掌機CPU新品蓄勢待發(fā)！包含“AI優(yōu)化”Z2 AI Extreme

最新爆料顯示，繼今年1月在CES2025上發(fā)布三款面向掌機市場的Z2處理器后，AMD計劃再推出兩款新型號Z2A和AIZ2Extreme。從命名可以看出，AIZ2Extreme將是專注于AI性能的掌機處理器，預(yù)計將配備XDNA2神經(jīng)處理單元，能夠提供更強大的AI加速功能。它預(yù)計會配備8核Zen4架構(gòu)CPU和12核RDNA3架構(gòu)GPU，能夠滿足大多數(shù)掌機用戶的基本需求。

?AMD ?Z2處理器 ?AI性能

熱文

3 天
7天

站長商機

商務(wù)合作侵權(quán)投訴廣告服務(wù) 版權(quán)聲明招聘

无码在线播放二区|久久亚洲精品国产精品|无码视频在线观看一区二区|在线观看国产日韩亚洲中