无码在线播放二区|久久亚洲精品国产精品|无码视频在线观看一区二区|在线观看国产日韩亚洲中

  • <menu id="yw4o4"></menu>
  • 
    <menu id="yw4o4"><em id="yw4o4"></em></menu>
  • 首頁 > 業(yè)界 > 關(guān)鍵詞  > AI最新資訊  > 正文

    把工作外包給AI,到底靠不靠譜?實測3款人氣的“AI牛馬”

    2025-04-28 14:09 · 稿源: AI新榜公眾號

    聲明:本文來自于微信公眾號AI新榜,作者:石瀨,授權(quán)站長之家轉(zhuǎn)載發(fā)布。

    這屆打工人,可以使喚的“AI牛馬”越來越多了。

    “AI牛馬”,顧名思義,是指那些像牛馬一樣辛勤工作、不知疲倦的AI。從今年年初DeepSeek R1橫空出世,“AI牛馬”這個概念就在小紅書等平臺上不斷刷屏,不少打工人也開始把工作“外包”給AI。

    不過現(xiàn)在最卷的“AI牛馬”賽道已經(jīng)不是DeepSeek、ChatGPT等AI聊天機器人了,而是被Manus帶火AI Agent賽道。簡單來說,主打Agent功能或特點的AI產(chǎn)品,不僅能“想”(規(guī)劃),更能“做”(執(zhí)行)。相比AI聊天機器人,這類產(chǎn)品里的AI更想直接幫你把活干了。

    這個賽道最近有多卷?

    從Manus一夜爆火,到字節(jié)跳動、百度相繼布局通用AI Agent領(lǐng)域,短短兩個月內(nèi),眾多標(biāo)榜“Agent”概念的產(chǎn)品如雨后春筍般涌現(xiàn)。其中前百度高管景鯤創(chuàng)辦的Genspark,從AI搜索轉(zhuǎn)型為通用型AI Agent產(chǎn)品后,僅用9天就突破了1000萬美金ARR(年度經(jīng)常性收入)。

    接著,智譜Agent產(chǎn)品“AutoGLM沉思”也正式上線。發(fā)布時,智譜還披露了一個由“沉思”運營的小紅書賬號,并稱該賬號在短短兩周內(nèi)吸引了5000名粉絲,并接到了多個商業(yè)推廣邀請,成功變現(xiàn)500元。

    同樣引人注目的還有一款由中國95后團隊打造、號稱“全球首個Agentic瀏覽器”的產(chǎn)品Fellou,也在AI圈獲得了一定關(guān)注度,它的內(nèi)測邀請碼最近已經(jīng)在某二手平臺上被炒到29.99元。

    這些打著Agent名頭的“AI牛馬”真的好用嗎?它們分別擅長哪些應(yīng)用場景?相比通用AI Agent產(chǎn)品,與瀏覽器等場景深度結(jié)合的垂類Agent應(yīng)用是否更為可靠?帶著這些問題,我進行了一番實測。

    最新“AI牛馬”實測:

    把工作外包給AI,是噱頭還是生產(chǎn)力革命?

    從Manus到扣子空間,我發(fā)現(xiàn)當(dāng)前通用型AI Agent產(chǎn)品普遍只做到了“通”,而在解決具體問題、達成實際效果層面并沒有做到“好用”。

    所以在以下實測過程中,我會更聚焦于AI牛馬們在實際應(yīng)用中究竟“能做什么”與“不能做什么”,力求為大家排雷避坑、減少試錯成本。

    Fellou:聰明能干活但是“職場糊弄大師”

    Fellou主打特點是“會思考更會執(zhí)行的Agentic瀏覽器”。

    從互聯(lián)網(wǎng)誕生起,瀏覽器就是一個重要的信息入口。也因此,F(xiàn)ellou的核心設(shè)計顯得很巧妙。它整合了瀏覽器、Agent和工作流自動化等三大產(chǎn)品能力,從而實現(xiàn)“思考”、“操作”和“執(zhí)行”閉環(huán)。

    圖片

    https://fellou.ai/

    進入Fellou主頁面,功能分區(qū)很清爽。右側(cè)是與AI交互的對話框(可固定),方便用戶隨時與AI進行溝通和交互;左側(cè)是搜索框,在這里你可以搜索瀏覽信息、也可以“監(jiān)工”AI是怎么干活的。

    圖片

    Fellou目前僅支持Mac OS系統(tǒng)且有一定硬件限制

    這也和不同Agent工作方式有關(guān)。Fellou的Agent是基于圖形用戶界面(GUI)而非API進行操作的。這意味著它能夠像人類用戶一樣直接與軟件界面進行交互,模擬鼠標(biāo)點擊、鍵盤輸入等操作來完成任務(wù)。

    最終它生成了一份網(wǎng)頁報告,精準(zhǔn)地篩選出了符合提示詞要求的資訊,甚至連像“OpenAI圖像生成API發(fā)布”這樣非常新的重磅消息也能迅速捕獲。

    圖片

    在此基礎(chǔ)上,你還能讓AI把報告換一個主題色、增加更多信息、或是添加一條時間線直觀展示重要新聞事件。

    圖片

    詳細報告地址:

    https://chat.fellou.ai/report/4550ae9b-2b3d-42c7-82cb-bdff022c5c70

    值得注意的是,這份看似很專業(yè)的報告,卻在一些細節(jié)上存在“致命”錯誤。例如,把數(shù)據(jù)“1.3億”誤寫成了“130萬”。如果這種錯誤如果出現(xiàn)在真實的公司報告中,可能會成為“世界是個巨大的草臺班子”的又一大例證。

    圖片

    Techcrunch原文寫的是“130million”(即1.3億)

    除了搜索整合信息生成報告外,你還可以讓它去社交平臺搜集特定領(lǐng)域的KOL,以及幫你完成發(fā)推文等任務(wù)。

    提示詞:幫我找到過去兩周在推特上曝光量超過5萬的10位科技領(lǐng)域的關(guān)鍵意見領(lǐng)袖(KOL)

    圖片

    需要用戶授權(quán)才能登錄具體網(wǎng)站獲得信息

    但相比新聞資訊收集,這類任務(wù)數(shù)據(jù)不準(zhǔn)確問題更明顯、參考鏈接也不完整。

    不過,F(xiàn)ellou搜集出來的KOL還是有一定價值的,它給我的列表里有納瓦爾、吳恩達等科技圈大佬。報告網(wǎng)頁也做得有模有樣,甚至有一些簡單的交互和(有Bug的)搜索功能。

    圖片

    詳細報告地址:

    https://chat.fellou.ai/report/f0cbdd1d-2e52-45bb-a7e5-b2898123e2e8

    讓AI接管社交媒體運營倒是一個很新奇的體驗,但我實際體驗下來感覺用處不大:

    Fellou執(zhí)行發(fā)布單條推文這類簡單指令基本沒問題,可一旦涉及更復(fù)雜的工作流——比如需要策略性地轉(zhuǎn)發(fā)多位AI頭部博主的推文并附上恰當(dāng)評論,這類既耗時又需要重復(fù)操作的“養(yǎng)號”任務(wù)時,AI就顯得有些力不從心,要么陷入卡Bug式的循環(huán)運行、要么糊弄人“說自己完成任務(wù)了”,離真正的智能高效還有相當(dāng)一段距離。

    圖片

    它給自己規(guī)劃了8個任務(wù)步驟,實際僅做到第4步

    不過值得一提的是,在Fellou上你可以通過輸入“/”搜索指定的內(nèi)容源(包括X、Reddit等社交平臺)或是直接檢索自己過往在Fellou中生成的報告,并基于這些歷史報告向AI進一步提問(輸入“@”可將報告作為上下文信息引入到對話),從而構(gòu)建起一個可迭代的個人知識庫。

    AutoGLM沉思:智譜不語,只是一味干活

    從任務(wù)完成情況和效率來看,AutoGLM沉思恐怕坐實了“職場老黃?!鄙矸?。

    圖片

    https://autoglm-research.zhipuai.cn/

    不論問題難度如何,AutoGLM沉思都會自動開啟“一味干活”模式。

    像“特朗普為什么在國內(nèi)被叫做川普”這類簡單問題,AutoGLM沉思也會走完全流程:從深度思考、推理規(guī)劃,到上網(wǎng)檢索、整理信息,最后生成結(jié)論,一個不落。

    圖片

    一頓操作猛如虎,最后給出的答案,和直接問元寶幾秒鐘得到的答案差別不大。

    圖片

    AutoGLM沉思使用安裝上也更有操作門檻一些,不僅需要下載智譜清言Mac/Win客戶端,還要安裝Chrome瀏覽器插件,之后才能在客戶端中使用。

    而需要安裝瀏覽器插件原因在于,AutoGLM沉思和Fellou一樣,要替你瀏覽網(wǎng)頁、收集信息。

    但兩者不同的是,AutoGLM沉思并沒有以虛擬窗口的形式降低AI的存在感,反而是會占用用戶的瀏覽器,影響整體使用體驗。

    圖片

    左側(cè)是AutoGLM沉思在操作瀏覽器

    當(dāng)然我也測試了AutoGLM沉思在更復(fù)雜場景下的表現(xiàn)。比如讓它從零開始策劃并運營一個定位為“銷售3D打印掛件的科技博主”的小紅書賬號。

    任務(wù)啟動后,AutoGLM沉思表現(xiàn)得很專業(yè):它會打開小紅書并要求用戶授權(quán)登錄,進去后就是一頓操作,研究同賽道賬號,初看頗有章法。

    圖片

    AutoGLM沉思在瀏覽小紅書

    但到了實際產(chǎn)出環(huán)節(jié),效果卻不盡如人意。最終給出的關(guān)于用戶名、頭像選擇以及賬號簡介的建議,比較寬泛,缺乏針對性和創(chuàng)意亮點。

    圖片

    看到“小紅的3D世界”那一刻,

    影視解說里的小美小帥都變高級

    此外實測中AutoGLM沉思并沒有完成賬號的創(chuàng)建動作,它僅僅停留在提供建議和操作步驟的層面,最終設(shè)置和修改都需要用戶自己動手完成。

    不過,AutoGLM沉思這種“不替用戶操作”的特性放到別的場景倒成了優(yōu)點。特別驚艷我的一個案例是:我之前研究了很久的AI電腦裝機配置,交給AutoGLM沉思不到10分鐘就整理出來了,并且貼心地打開了每一個配件對應(yīng)的淘寶商品頁面。

    圖片

    但它僅僅止步于此——提供信息和購買入口,而沒有把這些商品自動加入購物車,在涉及購買決策這種場景下,體現(xiàn)出了恰到好處的“邊界感”。

    Genspark:新晉“不加預(yù)算請不起的留子”

    比起ChatGPT,Genspark才是符合定義的“不加預(yù)算請不起的留子”。

    畢竟,它是華人團隊面向海外市場推出的一款通用AI Agent產(chǎn)品,相對而言更符合“留子”這一人設(shè)。

    Genspark之前定位更偏AI搜索,如今Agent賽道大火之后,不止宣發(fā)重點,Genspark的產(chǎn)品界面也逐漸偏離搜索,更多地向Agent產(chǎn)品形態(tài)靠攏。

    圖片

    產(chǎn)品地址:https://www.genspark.ai/

    和其他定位通用AI Agent的產(chǎn)品一樣,你可以把旅行規(guī)劃、制作報告、數(shù)據(jù)圖表這類復(fù)雜任務(wù)丟給它,能不能做得完美另說,但它一定能做出來。

    在沒有多余提示詞調(diào)教的情況下,Genspark生成的報告和數(shù)據(jù)圖表,整體審美都很在線,且肉眼不容易發(fā)現(xiàn)明顯的數(shù)據(jù)錯誤或制圖瑕疵。

    圖片

    完成任務(wù)的速度也很快。以下這份報告是Genspark花了2分鐘完成信息搜索,并通過代碼驅(qū)動的方式自動化生成的PPT,整個工作流耗時控制在10分鐘以內(nèi)。

    圖片

    詳細報告地址:

    https://ajpbouva.genspark.space/

    同類產(chǎn)品中,Genspark還支持一個少見的“AI打電話”能力。從官方Demo演示來看,Genspark已經(jīng)可以流暢地幫用戶預(yù)訂餐廳和酒店,這種從虛擬走向現(xiàn)實,打破次元壁的能力,增強了AI在日常生活中的實用性。

    不過,雇傭Genspark干活的費用并不低。官方每天會給免費用戶發(fā)放200積分,只夠生成一次常規(guī)報告。目前Genspark提供的訂閱方案中,最便宜的年付會員也要19.99美元/月。

    AI Agent賽道火了,

    但它還沒有那么“萬能

    去年Sora,今年Manus,這兩款現(xiàn)象級AI應(yīng)用都帶火了一個賽道。

    相似的劇情也在重演:對大多數(shù)人來說,Sora是只有少數(shù)邀測藝術(shù)家能用的“期貨”,Manus的邀請碼也只流向了少數(shù)幸運兒。

    一邊是業(yè)界被點燃的熱情。國內(nèi)大廠如字節(jié)、阿里、百度已經(jīng)出手,不僅布局產(chǎn)品還要卷MCP生態(tài);初創(chuàng)公司則涌現(xiàn)了Fellou、Genspark等有華人背景的出海產(chǎn)品;開源方面也有不少項目如Suna,已經(jīng)上線Github,狂攬7.5K星標(biāo)。

    圖片

    開源地址:

    https://github.com/kortix-ai/suna/?utm_source

    另一邊是,AI Agent產(chǎn)品還沒有成熟到可以讓C端用戶體驗到“wow moment”。這背后,既有技術(shù)的局限,也有互聯(lián)網(wǎng)時代遺留下來的老問題。

    互聯(lián)網(wǎng)公域中有價值、可信賴的信息數(shù)量在下降,而各大平臺間的信息壁壘依舊森嚴(yán),形成一座座“數(shù)據(jù)孤島”,這成為通用AI Agent發(fā)展繞不開的核心挑戰(zhàn)之一。

    技術(shù)方面,底層大模型仍然決定著AI Agent產(chǎn)品的上線,受限于當(dāng)前大模型的智能水平和上下文記憶能力,AI Agent在面對邏輯鏈條過長的復(fù)雜任務(wù)時,往往容易“掉鏈子”或偏離目標(biāo)。

    同時由于AI幻覺問題的存在,“AI生成的內(nèi)容不能全信”也應(yīng)該成為每個首席牛馬官的基本常識。

    一個能自主完成任務(wù)的AI Agent打開了一個想象:把現(xiàn)代人從日益繁重的工作內(nèi)卷中解放出來。但至少從目前來看,AI Agent產(chǎn)品們,還沒有真正抵達那個“足夠好用”、“足夠可靠”的階段。

    舉報

    • 相關(guān)推薦