无码在线播放二区|久久亚洲精品国产精品|无码视频在线观看一区二区|在线观看国产日韩亚洲中

<menu id="yw4o4"></menu>

<menu id="yw4o4"><em id="yw4o4"></em></menu>

<rp id="fnclw"></rp>

<span id="fnclw"><kbd id="fnclw"></kbd></span>

阿里通義千問開源Qwen1.5-MoE-A2.7B模型

2024-03-29 17:17 · 稿源：站長之家

站長之家(ChinaZ.com) 3月29日消息:通義千問團隊推出了 Qwen 系列的首個 MoE 模型，命名為 Qwen1.5-MoE-A2.7B。這個模型只有27億個激活參數(shù)，但性能卻與當(dāng)前最先進的70億參數(shù)模型相媲美。與 Qwen1.5-7B 相比，Qwen1.5-MoE-A2.7B 只有20億個非嵌入?yún)?shù)，大約是原模型大小的三分之一。此外，相較于 Qwen1.5-7B，Qwen1.5-MoE-A2.7B 的訓(xùn)練成本降低了75%，推理速度提升了1.74倍。

阿里云、通義千問

Qwen1.5-MoE 模型采用了特別設(shè)計的 MoE 架構(gòu)。與傳統(tǒng) MoE 方法不同的是，Qwen1.5-MoE 使用了64個 finegrained experts，并引入了新的 routing 機制 DeepSeek-MoE 和 DBRX。這種 finegrained experts 設(shè)計的目的是在不增加參數(shù)數(shù)量的情況下生成更多 expert。Qwen1.5-MoE 模型在訓(xùn)練成本和推理效率方面表現(xiàn)出色，性能接近最先進的7B 模型。

Qwen1.5-MoE-A2.7B 模型擁有14.3億激活參數(shù)和2億非嵌入?yún)?shù)，訓(xùn)練成本降低了75%。在實驗中，使用單個 NVIDIA A100-80G GPU 測試時，Qwen1.5-MoE-A2.7B 的推理速度提高了約1.74倍。Qwen1.5-MoE 模型已在 ModelScope 社區(qū)開源，可直接下載使用。

除了性能和效率，Qwen1.5-MoE 模型還將持續(xù)更新對第三方框架的支持，包括 llama.cpp、MLX 等。

總體來說，Qwen1.5-MoE 模型在性能、效率和推理速度方面取得了顯著的優(yōu)勢，是推理訓(xùn)練的最佳實踐之一。

Qwen1.5-MoE體驗鏈接:

https://modelscope.cn/studios/qwen/qwen1.5-MoE-A2.7B-Chat-GPTQ-Int4-demo

（舉報）

相關(guān)推薦

關(guān)鍵詞：

GPTBots 集成阿里通義千問 3.0，持續(xù)為企業(yè)提供頂尖 AI 服務(wù)

GPTBots.ai平臺宣布完成與阿里通義千問3.0系列模型的技術(shù)集成，成為企業(yè)級AI智能體構(gòu)建領(lǐng)域的標(biāo)桿平臺。該平臺通過混合推理架構(gòu)和多語言交互技術(shù)，支持119種語言服務(wù)，覆蓋全球主要市場。平臺提供雙模式智能任務(wù)處理：針對復(fù)雜業(yè)務(wù)場景的"深度思考"模式，以及高頻咨詢的"即時響應(yīng)"模式。搭載Qwen-3-235B旗艦?zāi)Ｐ秃蚎wen-3-30B輕量版，在代碼生成、數(shù)學(xué)推理等核心能力上達到行業(yè)頂尖水平。平臺實現(xiàn)與企業(yè)ERP、CRM等系統(tǒng)的無縫對接，推動數(shù)據(jù)價值變現(xiàn)。通過標(biāo)準(zhǔn)化流程自動化、全球化服務(wù)等核心價值，幫助企業(yè)提升運營效率70%、降低客服成本70%，并實現(xiàn)數(shù)據(jù)驅(qū)動的決策升級。

?GPTBots ?阿里通義千問 ?AI服務(wù)
薦AI日報：通義千問Qwen3重磅發(fā)布；抖音AI搜索能力開放；ChatGPT 搜索新增網(wǎng)購功能；Suno V4.5版本將發(fā)布

本期AI日報重點內(nèi)容： 1. 通義千問發(fā)布Qwen3大模型，在代碼、數(shù)學(xué)和通用能力方面表現(xiàn)突出，支持兩種思考模式并開源多個模型權(quán)重 2. 抖音開放AI搜索能力接口，為第三方應(yīng)用提供豐富內(nèi)容資源 3. ChatGPT新增網(wǎng)購功能，通過對話獲取個性化商品推薦 4. Suno AI即將推出V4.5版本，提升音樂生成真實度 5. Simular AI登陸macOS，打造本地化智能助手 6. 暗月之面開源Kimi-VL模型，可處理文本、圖像和視頻 7. UCLA與Meta推出d1框架，提升大語言模型推理速度 8. 通義靈碼上線Qwen3編程智能體 9. Gen-4References圖像生成技術(shù)驚艷亮相 10. Hugging Face推出可編程機械臂SO-101 11. Windsurf推出全新品牌標(biāo)志 12. Ollama全面支持Qwen3模型本地部署

?人工智能 ?大型語言模型 ?Qwen3
阿里千問3登頂全球最強開源模型已在通義App上線

阿里集團推出新一代開源AI模型"通義千問3"(Qwen3)，包含8款不同規(guī)格的混合推理模型。旗艦型號Qwen3-235B采用混合專家架構(gòu)，創(chuàng)下國產(chǎn)模型性能新紀(jì)錄；Qwen3-32B則以部署成本低、運行穩(wěn)定見長。該系列在邏輯推理、編程、翻譯等專業(yè)領(lǐng)域表現(xiàn)卓越，用戶可通過通義App和網(wǎng)頁版體驗。升級后的通義App整合問答對話、圖像理解與生成等多項功能，持續(xù)強化代碼生成、數(shù)學(xué)解題等專業(yè)場景應(yīng)用能力，致力于打造實用性強的個人AI助手。
薦AI日報：阿里通義萬相首尾幀生視頻模型；豆包開源Seed智能體模型UI-TARS-1.5；OpenAI首發(fā)“智能體實踐指南”

歡迎來到【AI日報】欄目!這里是你每天探索人工智能世界的指南，每天我們?yōu)槟愠尸F(xiàn)AI領(lǐng)域的熱點內(nèi)容，聚焦開發(fā)者，助你洞悉技術(shù)趨勢、了解創(chuàng)新AI產(chǎn)品應(yīng)用。新鮮AI產(chǎn)品點擊了解:https://top.aibase.com/1、阿里通義萬相首尾幀生視頻模型Wan2.1-FLF2V-14B開源阿里巴巴的通義實驗室在Hugging Face和GitHub上開源了Wan2.1-FLF2V-14B模型，標(biāo)志著AI視頻生成技術(shù)的重大進步。該模型支持高清視頻生成

?AI視頻生成 ?開源模型 ?阿里巴巴
阿里巴巴正式開源千問3 僅需4張H20即可部署滿血版

阿里巴巴開源新一代通義千問模型Qwen3，采用混合推理架構(gòu)，集成"快思考"與"慢思考"模式，能根據(jù)任務(wù)復(fù)雜度自動調(diào)整計算資源。該模型參數(shù)規(guī)模235B，在GPQA等權(quán)威評測中表現(xiàn)優(yōu)異，以更小規(guī)模實現(xiàn)超越上一代模型的性能。Qwen3包含2款MoE模型和6款密集模型，部署成本大幅降低，僅需4張H20顯卡即可運行滿血版，顯存占用僅為同類模型的三分之一。新模型通過智能分配算力，在簡單任務(wù)上快速響應(yīng)，復(fù)雜問題上深度思考，顯著提升能效比。

?阿里巴巴 ?開源模型 ?混合推理模型
薦Qwen3深夜正式開源，小尺寸也能大力出奇跡。

阿里發(fā)布通義千問Qwen3大模型系列，包含8個不同規(guī)模的模型，從0.6B到235B參數(shù)全覆蓋。亮點包括：1）全球頂尖模型能力；2）首個開源的混合推理模型；3）支持119種語言；4）部署成本僅為DeepSeek+R1的三分之一；5）支持MCP協(xié)議。其中235B旗艦?zāi)Ｐ托阅軐?biāo)頂級閉源模型，30B-MoE模型激活參數(shù)僅3B。所有模型均采用Apache2.0協(xié)議開源，支持商用。實測顯示Qwen3在代碼和寫作方面優(yōu)于DeepSeek

?阿里 ?Qwen3 ?模型能力
薦AI日報：阿里新模型Qwen3即將來襲；GitHub開源MCP服務(wù)器；Runway發(fā)布Gen-4 Turbo

歡迎來到【AI日報】欄目!這里是你每天探索人工智能世界的指南，每天我們?yōu)槟愠尸F(xiàn)AI領(lǐng)域的熱點內(nèi)容，聚焦開發(fā)者，助你洞悉技術(shù)趨勢、了解創(chuàng)新AI產(chǎn)品應(yīng)用。新鮮AI產(chǎn)品點擊了解:https://top.aibase.com/1、Qwen3即將來襲:阿里云新模型相關(guān)支持已正式合并至vLLM代碼庫阿里云的Qwen3模型即將發(fā)布，標(biāo)志著其在AI領(lǐng)域的又一重要進展。新推出的AI聽歌報告能夠精準(zhǔn)識別用戶音樂偏好，場景

?人工智能 ?阿里云 ?Qwen3
阿里開源通義新模型：指定首尾圖片生成視頻

快科技4月18日消息，據(jù)報道，阿里巴巴旗下通義萬相宣布開源其創(chuàng)新視頻生成技術(shù)首尾幀生視頻14B模型。這項突破性AI技術(shù)能夠根據(jù)用戶提供的起始和結(jié)束畫面，智能生成720p高清過渡視頻，為視頻創(chuàng)作帶來全新可能。該模型通過先進的深度學(xué)習(xí)算法，能夠精準(zhǔn)理解輸入畫面的內(nèi)容、風(fēng)格及主題特征。當(dāng)用戶提供首尾兩幀圖像后，模型會智能分析畫面中的視覺元素，包括物體形?

?阿里巴巴 ?通義萬相 ?視頻生成技術(shù)
阿里Qwen3發(fā)布后馬斯克立刻官宣：下周推出Grok 3.5

快科技4月29日消息，馬斯克剛剛在社交平臺X上稱，下周將向SuperGrok訂閱者推出Grok 3.5，并將該條信息頂置。據(jù)馬斯克稱，Grok 3.5是第一個能夠準(zhǔn)確回答有關(guān)火箭發(fā)動機或電化學(xué)技術(shù)問題的人工智能。同時，Grok可以從第一原理推理并得出互聯(lián)網(wǎng)上根本不存在的答案。Grok 3.5被馬斯克旗下的xAI宣傳為全球首個人工智能能從第一性原理推理，生成網(wǎng)絡(luò)上不存在的答案”。而今年2月18日，xAI正式發(fā)布Grok 3，并在兩天后把Grok 3免費向所有公眾開放，超越ChatGPT,登頂蘋果應(yīng)用商店免費應(yīng)用下載排行榜第一名。馬斯克曾稱Grok 3為地球上最聰明的人工智

?馬斯克 ?Grok ?3.5
聯(lián)發(fā)科：天璣9400已率先完成阿里Qwen3端側(cè)部署

阿里巴巴通義千問團隊開源發(fā)布新一代Qwen3系列混合推理模型，包含2個MoE模型和6個dense模型，參數(shù)規(guī)模從0.6B到235B。該系列采用前沿的混合專家架構(gòu)，預(yù)訓(xùn)練數(shù)據(jù)量達36T tokens，在推理、指令遵循、多語言能力等方面顯著提升。聯(lián)發(fā)科宣布天璣9400芯片率先完成Qwen3端側(cè)部署，其搭載的第八代AI處理器NPU+890在ETHZ AI Benchmark測試中表現(xiàn)優(yōu)異。天璣9400憑借強大AI算力，可讓用戶在手機等終端設(shè)備上高效使用Qwen3模型。旗艦?zāi)Ｐ蚎wen3-235B-A22B在編碼、數(shù)學(xué)等基準(zhǔn)測試中展現(xiàn)出與DeepSeek、Grok-3等模型的競爭優(yōu)勢，同時部署成本大幅降低，顯存占用僅為性能相近模型的三分之一。

?阿里巴巴 ?天璣9400 ?Qwen3模型

熱文

3 天
7天

站長商機

廣告

商務(wù)合作侵權(quán)投訴廣告服務(wù) 版權(quán)聲明招聘

?CopyRight 2002-2020 CHINAZ.COM