无码在线播放二区|久久亚洲精品国产精品|无码视频在线观看一区二区|在线观看国产日韩亚洲中

  • <menu id="yw4o4"></menu>
  • 
    <menu id="yw4o4"><em id="yw4o4"></em></menu>
  • 首頁(yè) > 業(yè)界 > 關(guān)鍵詞  > 智源研究院最新資訊  > 正文

    智源開源檢索排序模型 BGE Re-Ranker v2.0

    2024-03-21 09:46 · 稿源:站長(zhǎng)之家

    站長(zhǎng)之家(ChinaZ.com) 3月21日 消息:智源研究院推出了新一代檢索排序模型 BGE Re-Ranker v2.0,支持100+ 種語(yǔ)言,文本長(zhǎng)度更長(zhǎng),并在多項(xiàng)評(píng)測(cè)中達(dá)到了 SOTA(state-of-the-art)的結(jié)果。該模型是智源團(tuán)隊(duì)在 BGE(BAAI General Embedding)系列基礎(chǔ)上的新嘗試,擴(kuò)展了向量模型的 “文本 + 圖片” 混合檢索能力。

    BGE Re-Ranker v2.0采用分層自蒸餾策略優(yōu)化推理效率,通過不同尺寸的模型基座(如 MiniCPM-2B、Gemma-2B、BGE-M3-0.5B)支持多語(yǔ)言檢索能力。此外,該模型還新增了對(duì) “文本 + 圖片” 混合檢索功能的支持,通過引入 CLIP 模型生成的 visual token 實(shí)現(xiàn)。

    微信截圖_20240321094710.png

    在性能評(píng)測(cè)方面,BGE Re-Ranker v2.0在英文、中文、多語(yǔ)言主流基準(zhǔn)上取得了優(yōu)秀的檢索效果。例如,在 MTEB、C-MTEB、MIRACL、LLaMA-Index 等評(píng)測(cè)基準(zhǔn)中,BGE Re-Ranker v2.0在重排 BGE-v1.5-large 的 top-100候選集時(shí)表現(xiàn)優(yōu)異,提升了檢索精度。同時(shí),模型在 RAG 場(chǎng)景下也能夠顯著提升各種 embedding 模型的召回結(jié)果,配合 BGE-M3可以獲得最佳的端到端檢索質(zhì)量。

    BGE 系列模型的優(yōu)秀性能和通用性也受到了社區(qū)的廣泛關(guān)注,Vespa、Milvus 等主流向量數(shù)據(jù)庫(kù)框架已經(jīng)集成了 BGE-M3模型,為用戶搭建 “三位一體” 的檢索流水線提供了便利。

    綜上所述,智源研究院推出的 BGE Re-Ranker v2.0檢索排序模型具有強(qiáng)大的多語(yǔ)言支持、更長(zhǎng)文本長(zhǎng)度、優(yōu)秀的檢索效果和靈活的 “文本 + 圖片” 混合檢索功能,為信息檢索領(lǐng)域帶來了新的利器。

    項(xiàng)目地址:

    https://github.com/FlagOpen/FlagEmbedding

    https://huggingface.co/BAAI

    舉報(bào)

    • 相關(guān)推薦
    • DeepSeek上新!開源發(fā)布DeepSeek-Prover-V2-671B模型

      快科技4月30日消息,今日,DeepSeek 今日在 AI 開源社區(qū) Hugging Face 發(fā)布了一個(gè)名為 DeepSeek-Prover-V2-671B 的新模型。據(jù)介紹,DeepSeek-Prover-V2-671B 其參數(shù)量達(dá)到6710億,使用了更高效的 safetensors 文件格式,并支持 BF16、FP8、F32 等多種計(jì)算精度,方便模型更快、更省資源地訓(xùn)練和部署。在模型架構(gòu)上,該模型使用了DeepSeek-V3架構(gòu),采用MoE(混合專家)模式,具有61層Transformer層,7168維隱藏層。同時(shí)支持超長(zhǎng)上下文,最大位置嵌入達(dá)163840,使其能處理復(fù)雜的數(shù)學(xué)證明,并且采用了FP8量化,可通過量化技術(shù)減小模型大小,提

    • 10倍精度升級(jí)!騰訊混元3D模型v2.5版本發(fā)布

      騰訊混元3D模型升級(jí)至v2.5版本,建模精度和貼圖真實(shí)度顯著提升。新版本參數(shù)體量從1B增至10B,有效面片數(shù)增加超10倍,支持1024幾何分辨率。紋理系統(tǒng)支持4K高清貼圖和凹凸細(xì)節(jié),率先支持多視圖生成PBR模型。針對(duì)動(dòng)畫場(chǎng)景優(yōu)化骨骼蒙皮系統(tǒng),支持非標(biāo)準(zhǔn)姿態(tài)自動(dòng)綁定。新增文生/圖生3D減面模型、多視圖建模模板等專業(yè)工作流?;煸?D v2.5已全面更新至騰訊AI創(chuàng)作引擎,免費(fèi)生成額度提升至每日20次,并正式上線騰訊云API面向企業(yè)開放。GitHub開源版本累計(jì)Star超1.2萬(wàn)。

    • 阿里千問3登頂全球最強(qiáng)開源模型 已在通義App上線

      阿里集團(tuán)推出新一代開源AI模型"通義千問3"(Qwen3),包含8款不同規(guī)格的混合推理模型。旗艦型號(hào)Qwen3-235B采用混合專家架構(gòu),創(chuàng)下國(guó)產(chǎn)模型性能新紀(jì)錄;Qwen3-32B則以部署成本低、運(yùn)行穩(wěn)定見長(zhǎng)。該系列在邏輯推理、編程、翻譯等專業(yè)領(lǐng)域表現(xiàn)卓越,用戶可通過通義App和網(wǎng)頁(yè)版體驗(yàn)。升級(jí)后的通義App整合問答對(duì)話、圖像理解與生成等多項(xiàng)功能,持續(xù)強(qiáng)化代碼生成、數(shù)學(xué)解題等專業(yè)場(chǎng)景應(yīng)用能力,致力于打造實(shí)用性強(qiáng)的個(gè)人AI助手。

    • AI日?qǐng)?bào):阿里新模型Qwen3即將來襲;GitHub開源MCP服務(wù)器;Runway發(fā)布Gen-4 Turbo

      歡迎來到【AI日?qǐng)?bào)】欄目!這里是你每天探索人工智能世界的指南,每天我們?yōu)槟愠尸F(xiàn)AI領(lǐng)域的熱點(diǎn)內(nèi)容,聚焦開發(fā)者,助你洞悉技術(shù)趨勢(shì)、了解創(chuàng)新AI產(chǎn)品應(yīng)用。新鮮AI產(chǎn)品點(diǎn)擊了解:https://top.aibase.com/1、Qwen3即將來襲:阿里云新模型相關(guān)支持已正式合并至vLLM代碼庫(kù)阿里云的Qwen3模型即將發(fā)布,標(biāo)志著其在AI領(lǐng)域的又一重要進(jìn)展。新推出的AI聽歌報(bào)告能夠精準(zhǔn)識(shí)別用戶音樂偏好,場(chǎng)景

    • 奧特曼:ChatGPT不是AGI!OpenAI最強(qiáng)開源模型直擊DeepSeek

      【新智元導(dǎo)讀】代碼截圖泄露,滿血版o3、o4-mini鎖定下周!更勁爆的是,一款據(jù)稱是OpenAI的神秘模型一夜爆紅,每日處理高達(dá)260億token,是Claude用量4倍。奧特曼在TED放話:將推超強(qiáng)開源模型,直面DeepSeek挑戰(zhàn)。持續(xù)的創(chuàng)新、豐富的資源和智能AI將會(huì)無(wú)縫融入日常生活,未來一代人將會(huì)覺得當(dāng)前人們又辛苦又落后。

    • 合合信息發(fā)布“大模型加速器 2.0”,助力大模型跨越“幻覺”障礙

      近日,上海合合信息科技股份有限公司(簡(jiǎn)稱“合合信息”)TextIn“大模型加速器 2.0”版本正式上線,憑借其多維度升級(jí),為降低大模型“幻覺”風(fēng)險(xiǎn)、推動(dòng)大模型精準(zhǔn)應(yīng)用提供了強(qiáng)大助力。訓(xùn)練數(shù)據(jù)是影響大模型“認(rèn)知能力”的關(guān)鍵,合合信息“大模型加速器 2.0”基于領(lǐng)先的智能文檔處理技術(shù),從數(shù)據(jù)源頭入手,對(duì)復(fù)雜文檔的版式、布局和元素進(jìn)行精準(zhǔn)解析及結(jié)構(gòu)化處理,

    • “谷歌版MCP”來了,開源A2A,不同廠商Agent也能協(xié)作

      “谷歌版MCP”來了!谷歌推出A2A協(xié)議,即Agent2Agent,能讓AIAgent在不同生態(tài)系統(tǒng)間安全協(xié)作無(wú)需考慮框架或供應(yīng)商。不同平臺(tái)構(gòu)建的AIAgent之間可以進(jìn)行通信、發(fā)現(xiàn)彼此的能力、協(xié)商任務(wù)并開展協(xié)作,企業(yè)可通過專業(yè)Agent團(tuán)隊(duì)處理復(fù)雜工作流。從各大廠最近動(dòng)作來看,蕪湖,不愧是Agent元年。

    • 谷歌開源發(fā)布A2A協(xié)議 Agent2Agent智能體交互協(xié)議詳細(xì)介紹

      在GoogleCloudNext25大會(huì)上,谷歌宣布開源了首個(gè)標(biāo)準(zhǔn)智能體交互協(xié)議——Agent2AgentProtocol,這一舉措有望徹底改變智能體之間的交互方式,打破系統(tǒng)孤島,對(duì)智能體的能力、跨平臺(tái)協(xié)作以及執(zhí)行效率產(chǎn)生質(zhì)的飛躍。A2A協(xié)議是一種開放標(biāo)準(zhǔn),旨在為智能體提供一種通用的交互方式,使它們能夠在不同的底層框架和供應(yīng)商之間無(wú)縫協(xié)作。每個(gè)部分都有指定的內(nèi)容類型,這使得客戶端和遠(yuǎn)程智能體能夠協(xié)商所需的正確格式,并且明確包括用戶界面能力的協(xié)商,比如iframe、視頻、網(wǎng)絡(luò)表單等,從根據(jù)用戶的需求和設(shè)備的能力,提供最佳的用戶體驗(yàn)。

    • AI日?qǐng)?bào):昆侖萬(wàn)維開源SkyReels-V2;訊飛星火X1全新升級(jí);扣子空間Coze Space內(nèi)測(cè)

      本文介紹了多個(gè)前沿的人工智能產(chǎn)品和技術(shù)動(dòng)態(tài),包括SkyReels-V2視頻生成模型、訊飛星火大模型升級(jí)、宇樹科技人形機(jī)器人比賽計(jì)劃、Coze Space AI協(xié)作平臺(tái)、Gemma3 QAT優(yōu)化模型、英特爾AI Playground工具、Reachy2人形機(jī)器人發(fā)布、ChatTS-14B語(yǔ)音研究項(xiàng)目、Figma推出AI設(shè)計(jì)工具以及MarkItDown MCP文檔轉(zhuǎn)換工具,展示了AI技術(shù)在多領(lǐng)域的廣泛應(yīng)用與創(chuàng)新發(fā)展?jié)摿Α?/p>

    • 提升大模型自動(dòng)修Bug能力 豆包正式開源首個(gè)多語(yǔ)言類SWE數(shù)據(jù)集

      今日,字節(jié)跳動(dòng)豆包大模型團(tuán)隊(duì)宣布,正式開源首個(gè)多語(yǔ)言類SWE數(shù)據(jù)集Multi-SWE-bench,可用于評(píng)估和提升大模型自動(dòng)修Bug”能力。在SWE-bench基礎(chǔ)上,Multi-SWE-bench首次覆蓋Python之外的7種主流編程語(yǔ)言,是真正面向全棧工程”的評(píng)測(cè)基準(zhǔn)。相比于以往聚焦Python的單語(yǔ)言任務(wù),Multi-SWE-bench更貼近現(xiàn)實(shí)中的多語(yǔ)言開發(fā)場(chǎng)景,也更能反映當(dāng)前模型在自動(dòng)化軟件工程”方向上的實(shí)際能力邊界。