4 月 22 日,Aloudata大應科技自研推出的Aloudata Agent正式發(fā)布。這是一款基于NoETL明細語義層、以“萬數(shù)皆可問”為目標的分析決策智能體,致力于讓企業(yè)通過自然語言即可完成查數(shù)取數(shù)、歸因診斷、數(shù)據(jù)解讀、報告生成,驅動經(jīng)營管理決策。
從企業(yè)發(fā)展歷程來看,數(shù)據(jù)分析經(jīng)歷了三個階段:傳統(tǒng) BI 階段、敏捷 BI 階段以及當前的智能 BI 階段。在傳統(tǒng) BI 和敏捷 BI 階段,數(shù)據(jù)分析主要聚焦于讓有一定技術能力和分析技能的專業(yè)人員通過編寫 SQL 或拖拉拽等方式查看和分析數(shù)據(jù)。進入智能 BI 階段后,依托大模型的能力,企業(yè)數(shù)據(jù)分析邁向了面向更廣泛的人群進行主動洞察和智能洞察的新階段。
隨著 DeepSeek的出現(xiàn), 加速了大模型的平權,企業(yè)實現(xiàn)“人人都是分析師”的愿景正逐步成為可能,數(shù)據(jù)民主化進程顯著加速。
企業(yè)數(shù)據(jù)分析 Agent 建設挑戰(zhàn)
在Aloudata看來,企業(yè)級數(shù)據(jù)分析是一個低容錯度的場景,盡管大模型目前的智能化水平有了快速的提升,但實現(xiàn)企業(yè)級分析場景的落地還面臨著很大的挑戰(zhàn)。
首先是意圖理解挑戰(zhàn)。業(yè)務人員通常以口語化、業(yè)務化的方式表達需求,而數(shù)倉資產(chǎn)中的數(shù)據(jù)語言與之存在巨大差異,導致大模型難以直接跨越這一鴻溝實現(xiàn)準確理解。
其次,數(shù)據(jù)口徑一致性挑戰(zhàn)。同一問題在不同時間或由不同業(yè)務人員提出時,可能得到差異化的結果,這種“幻覺”現(xiàn)象影響了分析結論的可靠性。
第三,場景覆蓋度挑戰(zhàn)。當前有些企業(yè)已經(jīng)進行了初步探索,但限制于比較小的場景和有限范圍的嘗試。當分析需求擴展至更多業(yè)務場景或更大用戶群體時,企業(yè)需投入高昂成本才能維持 80% 以上的準確度,場景覆蓋能力有待提升。
第四,性能優(yōu)化和成本平衡的挑戰(zhàn)。大模型本身并不擅長數(shù)據(jù)查詢性能優(yōu)化,直接生成查詢 SQL 較難確保穩(wěn)定的性能輸出與成本之間的平衡。
第五,數(shù)據(jù)權限管控的挑戰(zhàn)。智能分析場景一定解決數(shù)據(jù)權限管控問題,避免問數(shù)時出現(xiàn)數(shù)據(jù)越權泄露。
企業(yè)數(shù)據(jù)分析 Agent 落地路徑
目前,業(yè)界探索數(shù)據(jù)分析 Agent 主要采用 NL2SQL、NL2DSL2SQL 及 NL2MQL2SQL 三種路徑。
第 一, NL2SQL 路徑。通過自然語言生成查詢 SQL 來實現(xiàn)問數(shù),完全依賴大模型能力。此方案下,業(yè)務語義與數(shù)據(jù)語義難以對齊,問數(shù)準確率較低;同時,大模型生成的查詢 SQL 難以實現(xiàn)性能優(yōu)化;此外,由于缺乏權限管控機制,存在數(shù)據(jù)安全風險。
第二, NL2DSL2SQL 路徑。借助 BI 系統(tǒng)沉淀的數(shù)據(jù)集和報表作為大模型的知識庫,大模型生成 BI 查詢 DSL 再轉換成數(shù)據(jù)查詢 SQL。這種方案可以一定程度地提高問數(shù)的準確性。然而,該路徑依賴于BI 中的數(shù)據(jù)集和報表,前期準備成本較高;同時受限于數(shù)據(jù)集和報表的覆蓋范圍,分析場景的靈活性和擴展性不足;此外,該方案仍無法解決報表指標口徑不一致的問題。
第三, NL2MQL2SQL 路徑。這是包括Aloudata在內(nèi)的一些廠商探索的一個新方向,這種方式先由大模型將自然語言轉化為對指標語義層的查詢請求(MQL,Metrics Query Language),再由指標平臺將指標和維度的查詢與計算邏輯轉化為準確的 SQL 查詢語句。其最 大優(yōu)點在于引入指標語義層,實現(xiàn)自然語言意圖與指標口徑的準確對齊,從而顯著提升了問數(shù)的準確性和可靠性。同時,指標語義層具備查詢性能優(yōu)化能力,并支持基于指標的權限管理,既可解決數(shù)據(jù)口徑不一致問題,又能確保數(shù)據(jù)安全管控。
三種路徑的差異表明,企業(yè)數(shù)據(jù)分析 Agent 的核心競爭力不在于模型或算力,而在于企業(yè)知識庫的構建。那怎樣的企業(yè)知識庫才能實現(xiàn)更好的智能問數(shù)效果。
第 一種,基于報表語義層的知識庫雖能實現(xiàn)基礎語義映射,但受限于預定義指標的固定性,難以支持業(yè)務人員動態(tài)組合指標與維度的深度分析需求,且無法解決報表間數(shù)據(jù)口徑不一致的固有缺陷,因此難以滿足智能洞察場景的靈活性與準確性要求。
第二種,基于寬表模型構建的語義層仍存在顯著局限:其一,分析靈活性受限于寬表已固化加工的指標與維度組合,業(yè)務人員無法突破預定義的模型框架自由組合;其二,寬表模型存在指標冗余定義,同一指標(如銷售額)在不同寬表中可能按會員、商品等不同維度重復構建,大模型在多指標場景下會召回存在口徑?jīng)_突的結果。
因此,理想的企業(yè)語義知識庫應該是基于數(shù)倉明細數(shù)據(jù)沉淀的指標語義層。
其一,支持從明細數(shù)據(jù)逐層聚合的彈性分析,業(yè)務人員可自由組合指標、維度與統(tǒng)計周期,實現(xiàn)從宏觀匯總數(shù)據(jù)到明細下鉆的全場景覆蓋;
其二,知識庫維護成本顯著降低,僅需定義原子指標和維度即可,問數(shù)的同時 Agent 可基于原子指標動態(tài)添加統(tǒng)計周期、篩選條件、同環(huán)比、排名等分析要素,無需預先固化所有分析路徑;
其三,指標要素化設計,標準化定義,既保障了數(shù)據(jù)口徑的一致性,又賦予業(yè)務人員近乎無限的分析組合能力,從而在語義對齊與靈活性之間達成最 優(yōu)平衡。
具體來看,明細級語義層的能力體現(xiàn)在以下方面:
第 一,標準化指標定義。一方面降低指標定義門檻,零代碼界面化操作,通過業(yè)務語義完成指標口徑邏輯表達;另一方面在定義指標的時候可以對指標名稱和口徑進行判重,確保沉淀的語義資產(chǎn)具有唯 一性,避免歧義。
第二,明細級語義沉淀。通過明細事實表與維度表的關聯(lián)機制,可實現(xiàn)公共層數(shù)據(jù)資源的全場景覆蓋:任意事實與維度組合的跨表的動態(tài)分析需求均能得到滿足。
第三,智能化加速路由。針對明細級指標定義可能引發(fā)的查詢性能擔憂,NoETL 指標平臺通過物化加速和智能路由技術,將用戶提交的明細數(shù)據(jù)查詢請求自動改寫為預計算表查詢路徑,預計算表的生成與維護過程完全由系統(tǒng)自主完成,無需人工干預。既滿足業(yè)務場景的靈活分析需求,又規(guī)避了明細數(shù)據(jù)查詢的性能瓶頸。
第四,靈活查詢時衍生。無需預定義全部指標,僅需維護原子指標和維度即可支撐復雜業(yè)務場景的靈活問答,無需投入巨大精力構建企業(yè)知識庫。
Aloudata Agent 關鍵創(chuàng)新
關鍵創(chuàng)新一:NL2MQL,實現(xiàn)準確、靈活、快速、安全的數(shù)據(jù)問答
在技術實現(xiàn)層面,采用 NL2MQL2SQL 的技術路線。首先,指標語義層沉淀了最全、最豐富的指標和維度的元數(shù)據(jù),作為大模型的知識圖譜底座,幫助大模型提升意圖識別準確度。
用戶查詢經(jīng)大模型語義解析后,將其轉換為指標、維度及篩選條件的組合表達,并生成面向指標平臺的 MQL,Aloudata CAN 指標平臺的語義引擎將 MQL 轉換為準確和可執(zhí)行的查詢 SQL,語義引擎內(nèi)置函數(shù)體系與 SQL 解析器,確保語義轉換的 100 % 準確性。生成的 SQL 經(jīng)智能物化加速、查詢改寫等優(yōu)化后,由數(shù)據(jù)庫引擎執(zhí)行查詢,最終返回結果嚴格遵循指標粒度的行級/列級數(shù)據(jù)權限控制,如客戶經(jīng)理僅能獲取其負責客戶的銷售數(shù)據(jù)。
關鍵創(chuàng)新二:基于COT和ReACT的多Agent 架構,有效解決復雜分析問題
Aloudata Agent 充分利用大模型的思維鏈能力規(guī)劃查詢過程。針對復雜業(yè)務問題,通過 COT 將問題拆解為子任務,基于 ReAct 調用各子 Agent ,結合短期記憶(會話上下文)與長期記憶(含用戶歷史問題、部門偏好術語、企業(yè)通用表達)并行執(zhí)行。該架構能夠將復雜的問題簡單化,通過有效規(guī)避了模型幻覺問題,支持從數(shù)據(jù)查詢到洞察生成的完整分析鏈路,各子 Agent 在協(xié)同過程中持續(xù)積累業(yè)務經(jīng)驗,提升復雜問題處理能力。
關鍵創(chuàng)新三:基于指標語義層和 RAG,提升意圖識別的準確性
通過結合指標語義層和 RAG(檢索增強生成),顯著提升了大模型意圖識別的準確率和指標與維度召回的準確度。具體流程如下:
當用戶提出問題時,Agent 首先判斷用戶意圖,例如區(qū)分是查詢指標口徑、獲取數(shù)據(jù)還是生成綜合分析報告。
隨后,通過向量檢索、ES 文本檢索以及 KV 關聯(lián)指標檢索等多路召回技術有效檢索指標語義層沉淀的指標元數(shù)據(jù)信息、維度元數(shù)據(jù)信息、指標血緣關系和邏輯模型關聯(lián)關系,確保指標與維度的準確召回。
在檢索到相關指標和維度后,Agent 會進行二次選擇,確保準確定位用戶需求。根據(jù)問題的復雜度,可能生成一個或多個 MQL(Metrics Query Language)查詢。隨后,Aloudata CAN 指標平臺語義引擎將 MQL 自動轉換為底層 MPP 引擎可執(zhí)行的 SQL,返回查詢結果,再由 Agent 將查詢結果生成符合用戶意圖的回答(如指標口徑、指標值、圖表或分析報告)返回給用戶。
關鍵創(chuàng)新四:以指標為中心高階分析能力集成,促進更深度的分析洞見
第 一,智能指標關鍵維度挖掘。基于既有維度和歷史指標查詢行為,自動識別關鍵分析維度。由于數(shù)據(jù)表中字段眾多,但并非每個字段都具有相同的分析權重,所以 NoETL 指標平臺會捕捉記憶常用查詢維度,如產(chǎn)品、區(qū)域、客戶群等。通過挖掘關鍵維度,在用戶詢問如銷售額時,能夠結合熱門維度呈現(xiàn)和歸納。
第二,智能指標關聯(lián)因子挖掘。在 NoETL 指標平臺中已經(jīng)沉淀了指標的血緣關系??汕逦R別指標間的層級關聯(lián)與依賴關系。例如,將多組指標進行組合分析時,可發(fā)現(xiàn)指標間存在的關聯(lián)關系和因子關系。基于指標血緣與查詢行為的分析,可為深度洞察業(yè)務現(xiàn)象及分析問題根因提供數(shù)據(jù)支撐。
Aloudata Agent 產(chǎn)品能力
從產(chǎn)品架構層面,Aloudata 智能數(shù)據(jù)分析方案包含兩層能力。
第 一層為指標語義層(Aloudata CAN 指標平臺),作為企業(yè)級知識庫承擔 DWD 層模型接入與語義建模的職能:直接對接明細數(shù)據(jù),基于星型模型、雪花模型等構建語義模型,生成虛擬大寬表;建立標準化指標管理體系,形成可復用的知識資產(chǎn)庫。
往上, Aloudata Agent 這一層,開放對接各種大模型(千問、DeepSeek 、GPT 等)。通過標準化接口與協(xié)議適配,實現(xiàn)多模型能力統(tǒng)一調用,利用大模型在自然語言理解、任務規(guī)劃及工具鏈編排方面的優(yōu)勢,完成用戶意圖理解、復雜任務拆解及工具調用。該層已沉淀四大核心能力模塊:自然語言的智能問數(shù)、智能歸因、智能的數(shù)據(jù)解讀和智能的報告生成。
基于上述能力體系,未來Aloudata也會進一步圍繞著企業(yè)的應用場景打磨子 Agent。例如:針對經(jīng)營分析場景的 Agent,針對門店管理的 Agent 以及針對風控需求的風險預警 Agent。
Aloudata Agent 產(chǎn)品特性
一是分析過程透明化,向用戶完整呈現(xiàn)數(shù)據(jù)處理邏輯;二是指標口徑可追溯,所有指標均附帶定義口徑說明,確保不同業(yè)務角色對同一指標的認知統(tǒng)一;三是交互式引導與追問,在分析過程中嵌入交互式的引導與追問功能,提升操作便捷性;四是用戶可理解可干預,用戶可直接對大模型返回的初始結果進行修正,支持時間維度擴展(如將“本月至今”調整為“全年”)、指標切換等界面操作,無需重新輸入查詢條件。
總結與展望
總結一下,Aloudata Agent 依托企業(yè)明細級指標語義層知識庫及大模型能力,形成五大核心優(yōu)勢:
第 一是準確,基于 NL2MQL2SQL 的路徑,解決業(yè)務語言與數(shù)據(jù)語言間的語義鴻溝,提升意圖識別精度,實現(xiàn) SQL 翻譯零誤差。
第二是全面,基于明細指標語義層,支持用戶通過多維度、多指標組合篩選生成派生或衍生指標,以維護有限知識庫覆蓋多樣化業(yè)務場景。
第三是聰明,采用 COT 與 ReAct 架構,將復雜分析問題拆解為可執(zhí)行子任務,增強復雜問題處理能力。
第四是友好,提供交互式引導功能,支持引用、跳轉、下鉆等操作,優(yōu)化用戶體驗。
第五是安全,通過指標語義層行級/列級權限控制,確保數(shù)據(jù)訪問嚴格遵循企業(yè)安全策略,杜絕數(shù)據(jù)越權風險。
展望未來,Aloudata Agent 的核心發(fā)展方向是打破數(shù)據(jù)分析場景限制,將其能力深度嵌入企業(yè)業(yè)務流程中。為此,Aloudata計劃于今年下半年推出 Aloudata Agent 的 MCP(模型上下文協(xié)議),通過開放 MCP 助力企業(yè)快速基于自身業(yè)務場景構建 AI 應用生態(tài),例如策略優(yōu)化 AI、商品管理 AI、風險控制 AI 等場景應用。同時,將持續(xù)優(yōu)化 Aloudata Agent 的基礎能力:強化異常診斷功能;增強分析報告可視化效果等。
作為產(chǎn)品首秀,即日起開放產(chǎn)品體驗通道,訪問Aloudata大應科技官網(wǎng)即可預約咨詢與試用。
(推廣)