快科技4月30日消息,日前,阿里巴巴通義千問團(tuán)隊(duì)正式發(fā)布并開源了新版Qwen3系列混合推理模型”。
隨后聯(lián)發(fā)科宣布,天璣9400已率先完成阿里Qwen3端側(cè)部署,為用戶帶來更加出色的端側(cè)AI體驗(yàn)。
天璣9400作為旗艦5G智能體AI芯片,搭載聯(lián)發(fā)科全新的第八代AI處理器NPU 890,在蘇黎世ETHZ AI Benchmark v6.0芯片AI性能的測試中以絕對高分的成績領(lǐng)先,可部署多種端側(cè)大模型。
天璣9400憑借自身強(qiáng)大的AI運(yùn)算能力,可以讓用戶在手機(jī)等終端設(shè)備上就能快速、高效地使用Qwen3模型。
據(jù)悉,Qwen3系列模型由阿里巴巴通義千問團(tuán)隊(duì)開發(fā),包括2個MoE模型和6個dense模型,參數(shù)量從0.6B到235B。
該系列模型采用前沿的混合專家(MoE)架構(gòu),預(yù)訓(xùn)練數(shù)據(jù)量高達(dá)36T tokens,并在后訓(xùn)練階段歷經(jīng)多輪強(qiáng)化學(xué)習(xí),將非思考模式巧妙無縫整合到思考模型中。
在推理、指令遵循、工具調(diào)用、多語言能力等諸多方面,Qwen3均實(shí)現(xiàn)了大幅增強(qiáng)。
不僅如此,在性能大幅提升的同時,其部署成本還大幅下降,顯存占用僅為性能相近模型的三分之一。
例如,旗艦?zāi)P蚎wen3-235B-A22B在與DeepSeek-R1、o1、o3-mini、Grok-3和Gemini-2.5-Pro等其他模型進(jìn)行的編碼、數(shù)學(xué)、通用能力等基準(zhǔn)評估中,取得了極具競爭力的結(jié)果,能夠與DeepSeek-R1、o1、o3-mini、Grok-3和Gemini-2.5-Pro等模型媲美。
(舉報(bào))