无码在线播放二区|久久亚洲精品国产精品|无码视频在线观看一区二区|在线观看国产日韩亚洲中

  • <menu id="yw4o4"></menu>
  • 
    <menu id="yw4o4"><em id="yw4o4"></em></menu>
  • 首頁 > 業(yè)界 > 關(guān)鍵詞  > Qwen1.5-MoE-A2.7B最新資訊  > 正文

    阿里通義千問開源Qwen1.5-MoE-A2.7B模型

    2024-03-29 17:17 · 稿源:站長之家

    站長之家(ChinaZ.com) 3月29日 消息:通義千問團隊推出了 Qwen 系列的首個 MoE 模型,命名為 Qwen1.5-MoE-A2.7B。這個模型只有27億個激活參數(shù),但性能卻與當(dāng)前最先進的70億參數(shù)模型相媲美。與 Qwen1.5-7B 相比,Qwen1.5-MoE-A2.7B 只有20億個非嵌入?yún)?shù),大約是原模型大小的三分之一。此外,相較于 Qwen1.5-7B,Qwen1.5-MoE-A2.7B 的訓(xùn)練成本降低了75%,推理速度提升了1.74倍。

    阿里云、通義千問

    Qwen1.5-MoE 模型采用了特別設(shè)計的 MoE 架構(gòu)。與傳統(tǒng) MoE 方法不同的是,Qwen1.5-MoE 使用了64個 finegrained experts,并引入了新的 routing 機制 DeepSeek-MoE 和 DBRX。這種 finegrained experts 設(shè)計的目的是在不增加參數(shù)數(shù)量的情況下生成更多 expert。Qwen1.5-MoE 模型在訓(xùn)練成本和推理效率方面表現(xiàn)出色,性能接近最先進的7B 模型。

    Qwen1.5-MoE-A2.7B 模型擁有14.3億激活參數(shù)和2億非嵌入?yún)?shù),訓(xùn)練成本降低了75%。在實驗中,使用單個 NVIDIA A100-80G GPU 測試時,Qwen1.5-MoE-A2.7B 的推理速度提高了約1.74倍。Qwen1.5-MoE 模型已在 ModelScope 社區(qū)開源,可直接下載使用。

    除了性能和效率,Qwen1.5-MoE 模型還將持續(xù)更新對第三方框架的支持,包括 llama.cpp、MLX 等。

    總體來說,Qwen1.5-MoE 模型在性能、效率和推理速度方面取得了顯著的優(yōu)勢,是推理訓(xùn)練的最佳實踐之一。

    Qwen1.5-MoE體驗鏈接:

    https://modelscope.cn/studios/qwen/qwen1.5-MoE-A2.7B-Chat-GPTQ-Int4-demo

    舉報

    • 相關(guān)推薦
    • GPTBots 集成阿里通義千問 3.0,持續(xù)為企業(yè)提供頂尖 AI 服務(wù)

      GPTBots.ai平臺宣布完成與阿里通義千問3.0系列模型的技術(shù)集成,成為企業(yè)級AI智能體構(gòu)建領(lǐng)域的標(biāo)桿平臺。該平臺通過混合推理架構(gòu)和多語言交互技術(shù),支持119種語言服務(wù),覆蓋全球主要市場。平臺提供雙模式智能任務(wù)處理:針對復(fù)雜業(yè)務(wù)場景的"深度思考"模式,以及高頻咨詢的"即時響應(yīng)"模式。搭載Qwen-3-235B旗艦?zāi)P秃蚎wen-3-30B輕量版,在代碼生成、數(shù)學(xué)推理等核心能力上達到行業(yè)頂尖水平。平臺實現(xiàn)與企業(yè)ERP、CRM等系統(tǒng)的無縫對接,推動數(shù)據(jù)價值變現(xiàn)。通過標(biāo)準(zhǔn)化流程自動化、全球化服務(wù)等核心價值,幫助企業(yè)提升運營效率70%、降低客服成本70%,并實現(xiàn)數(shù)據(jù)驅(qū)動的決策升級。

    • AI日報:通義千問Qwen3重磅發(fā)布;抖音AI搜索能力開放;ChatGPT 搜索新增網(wǎng)購功能;Suno V4.5版本將發(fā)布

      本期AI日報重點內(nèi)容: 1. 通義千問發(fā)布Qwen3大模型,在代碼、數(shù)學(xué)和通用能力方面表現(xiàn)突出,支持兩種思考模式并開源多個模型權(quán)重 2. 抖音開放AI搜索能力接口,為第三方應(yīng)用提供豐富內(nèi)容資源 3. ChatGPT新增網(wǎng)購功能,通過對話獲取個性化商品推薦 4. Suno AI即將推出V4.5版本,提升音樂生成真實度 5. Simular AI登陸macOS,打造本地化智能助手 6. 暗月之面開源Kimi-VL模型,可處理文本、圖像和視頻 7. UCLA與Meta推出d1框架,提升大語言模型推理速度 8. 通義靈碼上線Qwen3編程智能體 9. Gen-4References圖像生成技術(shù)驚艷亮相 10. Hugging Face推出可編程機械臂SO-101 11. Windsurf推出全新品牌標(biāo)志 12. Ollama全面支持Qwen3模型本地部署

    • 阿里千問3登頂全球最強開源模型 已在通義App上線

      阿里集團推出新一代開源AI模型"通義千問3"(Qwen3),包含8款不同規(guī)格的混合推理模型。旗艦型號Qwen3-235B采用混合專家架構(gòu),創(chuàng)下國產(chǎn)模型性能新紀(jì)錄;Qwen3-32B則以部署成本低、運行穩(wěn)定見長。該系列在邏輯推理、編程、翻譯等專業(yè)領(lǐng)域表現(xiàn)卓越,用戶可通過通義App和網(wǎng)頁版體驗。升級后的通義App整合問答對話、圖像理解與生成等多項功能,持續(xù)強化代碼生成、數(shù)學(xué)解題等專業(yè)場景應(yīng)用能力,致力于打造實用性強的個人AI助手。

    • AI日報:阿里通義萬相首尾幀生視頻模型;豆包開源Seed智能體模型UI-TARS-1.5;OpenAI首發(fā)“智能體實踐指南”

      歡迎來到【AI日報】欄目!這里是你每天探索人工智能世界的指南,每天我們?yōu)槟愠尸F(xiàn)AI領(lǐng)域的熱點內(nèi)容,聚焦開發(fā)者,助你洞悉技術(shù)趨勢、了解創(chuàng)新AI產(chǎn)品應(yīng)用。新鮮AI產(chǎn)品點擊了解:https://top.aibase.com/1、阿里通義萬相首尾幀生視頻模型Wan2.1-FLF2V-14B開源阿里巴巴的通義實驗室在Hugging Face和GitHub上開源了Wan2.1-FLF2V-14B模型,標(biāo)志著AI視頻生成技術(shù)的重大進步。該模型支持高清視頻生成

    • 阿里巴巴正式開源千問3 僅需4張H20即可部署滿血版

      阿里巴巴開源新一代通義千問模型Qwen3,采用混合推理架構(gòu),集成"快思考"與"慢思考"模式,能根據(jù)任務(wù)復(fù)雜度自動調(diào)整計算資源。該模型參數(shù)規(guī)模235B,在GPQA等權(quán)威評測中表現(xiàn)優(yōu)異,以更小規(guī)模實現(xiàn)超越上一代模型的性能。Qwen3包含2款MoE模型和6款密集模型,部署成本大幅降低,僅需4張H20顯卡即可運行滿血版,顯存占用僅為同類模型的三分之一。新模型通過智能分配算力,在簡單任務(wù)上快速響應(yīng),復(fù)雜問題上深度思考,顯著提升能效比。

    • Qwen3深夜正式開源,小尺寸也能大力出奇跡。

      阿里發(fā)布通義千問Qwen3大模型系列,包含8個不同規(guī)模的模型,從0.6B到235B參數(shù)全覆蓋。亮點包括:1)全球頂尖模型能力;2)首個開源的混合推理模型;3)支持119種語言;4)部署成本僅為DeepSeek+R1的三分之一;5)支持MCP協(xié)議。其中235B旗艦?zāi)P托阅軐?biāo)頂級閉源模型,30B-MoE模型激活參數(shù)僅3B。所有模型均采用Apache2.0協(xié)議開源,支持商用。實測顯示Qwen3在代碼和寫作方面優(yōu)于DeepSeek

    • AI日報:阿里模型Qwen3即將來襲;GitHub開源MCP服務(wù)器;Runway發(fā)布Gen-4 Turbo

      歡迎來到【AI日報】欄目!這里是你每天探索人工智能世界的指南,每天我們?yōu)槟愠尸F(xiàn)AI領(lǐng)域的熱點內(nèi)容,聚焦開發(fā)者,助你洞悉技術(shù)趨勢、了解創(chuàng)新AI產(chǎn)品應(yīng)用。新鮮AI產(chǎn)品點擊了解:https://top.aibase.com/1、Qwen3即將來襲:阿里云新模型相關(guān)支持已正式合并至vLLM代碼庫阿里云的Qwen3模型即將發(fā)布,標(biāo)志著其在AI領(lǐng)域的又一重要進展。新推出的AI聽歌報告能夠精準(zhǔn)識別用戶音樂偏好,場景

    • 阿里開源通義模型:指定首尾圖片生成視頻

      快科技4月18日消息,據(jù)報道,阿里巴巴旗下通義萬相宣布開源其創(chuàng)新視頻生成技術(shù)首尾幀生視頻14B模型。這項突破性AI技術(shù)能夠根據(jù)用戶提供的起始和結(jié)束畫面,智能生成720p高清過渡視頻,為視頻創(chuàng)作帶來全新可能。該模型通過先進的深度學(xué)習(xí)算法,能夠精準(zhǔn)理解輸入畫面的內(nèi)容、風(fēng)格及主題特征。當(dāng)用戶提供首尾兩幀圖像后,模型會智能分析畫面中的視覺元素,包括物體形?

    • 阿里Qwen3發(fā)布后 馬斯克立刻官宣:下周推出Grok 3.5

      快科技4月29日消息,馬斯克剛剛在社交平臺X上稱,下周將向SuperGrok訂閱者推出Grok 3.5,并將該條信息頂置。據(jù)馬斯克稱,Grok 3.5是第一個能夠準(zhǔn)確回答有關(guān)火箭發(fā)動機或電化學(xué)技術(shù)問題的人工智能。同時,Grok可以從第一原理推理并得出互聯(lián)網(wǎng)上根本不存在的答案。Grok 3.5被馬斯克旗下的xAI宣傳為全球首個人工智能能從第一性原理推理,生成網(wǎng)絡(luò)上不存在的答案”。而今年2月18日,xAI正式發(fā)布Grok 3,并在兩天后把Grok 3免費向所有公眾開放,超越ChatGPT,登頂蘋果應(yīng)用商店免費應(yīng)用下載排行榜第一名。馬斯克曾稱Grok 3為地球上最聰明的人工智

    • 聯(lián)發(fā)科:天璣9400已率先完成阿里Qwen3端側(cè)部署

      阿里巴巴通義千問團隊開源發(fā)布新一代Qwen3系列混合推理模型,包含2個MoE模型和6個dense模型,參數(shù)規(guī)模從0.6B到235B。該系列采用前沿的混合專家架構(gòu),預(yù)訓(xùn)練數(shù)據(jù)量達36T tokens,在推理、指令遵循、多語言能力等方面顯著提升。聯(lián)發(fā)科宣布天璣9400芯片率先完成Qwen3端側(cè)部署,其搭載的第八代AI處理器NPU+890在ETHZ AI Benchmark測試中表現(xiàn)優(yōu)異。天璣9400憑借強大AI算力,可讓用戶在手機等終端設(shè)備上高效使用Qwen3模型。旗艦?zāi)P蚎wen3-235B-A22B在編碼、數(shù)學(xué)等基準(zhǔn)測試中展現(xiàn)出與DeepSeek、Grok-3等模型的競爭優(yōu)勢,同時部署成本大幅降低,顯存占用僅為性能相近模型的三分之一。