无码在线播放二区|久久亚洲精品国产精品|无码视频在线观看一区二区|在线观看国产日韩亚洲中

<menu id="yw4o4"></menu>

<menu id="yw4o4"><em id="yw4o4"></em></menu>

實(shí)錘了，Llama 4重測(cè)排名掉至32名！遠(yuǎn)不及DeepSeek和Qwen

2025-04-13 09:26 · 稿源： TechWeb.com.cn

4月13日消息，LMArena 更新了Meta最新發(fā)布的開(kāi)源大模型 Llama-4-Maverick的排名，從此前的第2名，直線掉到了第32名！

這也實(shí)錘了此前開(kāi)發(fā)者對(duì)Meta為刷榜排名向LMArena提供了“特供版”的Llama 4大模型的質(zhì)疑。（詳情：Llama 4大模型跌落神壇：作弊刷榜、代碼能力極差、和DeepSeek比就是偽開(kāi)源）

4月6日，Meta發(fā)布了最新的大模型Llama 4，包含Scout、Maverick和Behemoth三個(gè)版本。其中，Llama-4-Maverick在LMArena公布的Chatbot Arena LLM 排行榜中的排名第二，僅次于Gemini 2.5 Pro。

然而，隨著開(kāi)發(fā)者實(shí)際使用Llama 4大模型開(kāi)源版的效果陸續(xù)曝出，Llama 4口碑急轉(zhuǎn)直下。有開(kāi)發(fā)者發(fā)現(xiàn)Meta提供給LMArena的Llama 4版本與提交給社區(qū)的開(kāi)源版本不同，因而Meta被質(zhì)疑為刷榜作弊。

4月8日，Chatbot Arena官方發(fā)文確認(rèn)了用戶的上述質(zhì)疑，公開(kāi)表示Meta提供給他們的是“特供版”，并考慮更新排行榜。

根據(jù)Chatbot Arena官方消息，Meta首次提交LMArena的Llama-4-Maverick-03-26-Experimental是一個(gè)實(shí)驗(yàn)性聊天優(yōu)化版本，當(dāng)時(shí)該版本的排名為第二。修正后的模型為HuggingFace開(kāi)源版同款Llama-4-Maverick-17B-128E-Instruct，是17B激活參數(shù)、128個(gè)MoE專家的指令微調(diào)模型。

目前，開(kāi)源版同款Llama-4-Maverick-17B-128E-Instruct在LMArena的排名為32名，遠(yuǎn)低于Gemini 2.5 Pro（1）、GPT4o（2）、DeepSeek-V3-0324（5）、DeepSeek-R1（7）、Qwen2.5-Max（11），甚至連英偉達(dá)基于上一代Llama 3.3改造的Llama-3.3-Nemotron-Super-49B-v1（17）都不如。

LMArena詳細(xì)排名如下：

（舉報(bào)）

相關(guān)推薦

關(guān)鍵詞：

薦反擊DeepSeek失??！Llama 4效果不好，Meta承認(rèn)有問(wèn)題

今天凌晨1點(diǎn)半，Meta生成式AI領(lǐng)導(dǎo)者AhmadAl-Dahle在社交平臺(tái)發(fā)布了一篇長(zhǎng)文，對(duì)前天剛開(kāi)源的Llama4質(zhì)疑進(jìn)行了官方回應(yīng)。Ahmad表示，Llama4一開(kāi)發(fā)完就發(fā)布了，所以，不同服務(wù)中模型質(zhì)量難免會(huì)有一些差異。由于關(guān)稅大戰(zhàn)的原因，Meta的股票遭遇重創(chuàng)，他們也需要一個(gè)利好消息來(lái)拉升股票，現(xiàn)在適得其反。

?Meta ?Llama4 ?生成式AI
Llama 4大模型跌落神壇：作弊刷榜、代碼能力極差、和DeepSeek比就是偽開(kāi)源

被寄予厚望的美國(guó)Meta公司的最新開(kāi)源大模型Llama4發(fā)布不到2天時(shí)間，口碑急轉(zhuǎn)直下，被質(zhì)疑為刷榜作弊實(shí)際效果差、開(kāi)源條件多部署門(mén)檻高是偽開(kāi)源等。大模型評(píng)測(cè)平臺(tái)LMArena親自下場(chǎng)發(fā)文，打臉Meta提供給平臺(tái)的Llama4是“特供版”。Meta若繼續(xù)在商業(yè)控制與技術(shù)開(kāi)放之間搖擺，恐將在AI競(jìng)賽中進(jìn)一步失去開(kāi)發(fā)者支持。

?Meta ?Llama ?4
薦剛剛，Llama 4深夜開(kāi)源擊敗DeepSeek V3！2萬(wàn)億多模態(tài)巨獸搶回王座

Llama4重磅發(fā)布了!Meta官宣開(kāi)源首個(gè)原生多模態(tài)Llama4，首次采用的MoE架構(gòu)，支持12種語(yǔ)言，首批發(fā)布一共兩款:Llama4Scout:共有1090億參數(shù)，17B活躍參數(shù)，16個(gè)專家，1000萬(wàn)上下Llama4Maverick:共有4000億參數(shù)，17B活躍參數(shù)，128個(gè)專家，100萬(wàn)上下文另外，2萬(wàn)億參數(shù)Llama4Behemoth將在未來(lái)幾個(gè)月面世，288B活躍參數(shù)，16個(gè)專家。Llama4的橫空出世，成為迄今為止開(kāi)源最強(qiáng)，多模態(tài)能力最好的模型之一。L

?Llama4 ?多模態(tài)AI ?Meta開(kāi)源
DeepSeek上新！開(kāi)源發(fā)布DeepSeek-Prover-V2-671B新模型

快科技4月30日消息，今日，DeepSeek 今日在 AI 開(kāi)源社區(qū) Hugging Face 發(fā)布了一個(gè)名為 DeepSeek-Prover-V2-671B 的新模型。據(jù)介紹，DeepSeek-Prover-V2-671B 其參數(shù)量達(dá)到6710億，使用了更高效的 safetensors 文件格式，并支持 BF16、FP8、F32 等多種計(jì)算精度，方便模型更快、更省資源地訓(xùn)練和部署。在模型架構(gòu)上，該模型使用了DeepSeek-V3架構(gòu)，采用MoE（混合專家）模式，具有61層Transformer層，7168維隱藏層。同時(shí)支持超長(zhǎng)上下文，最大位置嵌入達(dá)163840，使其能處理復(fù)雜的數(shù)學(xué)證明，并且采用了FP8量化，可通過(guò)量化技術(shù)減小模型大小，提

?DeepSeek ?AI模型發(fā)布 ?開(kāi)源社區(qū)
薦DeepSeek帶飛寒武紀(jì)

寒武紀(jì)憑借AI芯片業(yè)務(wù)實(shí)現(xiàn)扭虧為盈，2024年首次實(shí)現(xiàn)上市后盈利，2025年Q1營(yíng)收11.11億元同比暴增4230%，凈利潤(rùn)3.55億元。這家曾連虧8年、累計(jì)虧損54億元的"中國(guó)版英偉達(dá)"，因美國(guó)對(duì)H20芯片出口管制獲得市場(chǎng)紅利，但客戶集中度過(guò)高（前五大客戶貢獻(xiàn)94.63%營(yíng)收）和現(xiàn)金流波動(dòng)仍是隱憂。當(dāng)前國(guó)產(chǎn)芯片迎來(lái)發(fā)展機(jī)遇，華為昇騰、壁仞等企業(yè)紛紛搶占市場(chǎng)，行業(yè)競(jìng)爭(zhēng)日趨激烈。

?DeepSeek紅利 ?寒武紀(jì)盈利 ?AI芯片市場(chǎng)
薦DeepSeek紅利耗盡后，元寶拿什么和豆包斗？

短短60天內(nèi)，中國(guó)AI原生應(yīng)用下載排行榜的位次排名，就三易其主。最新情況是，截至4月15日中午，中國(guó)區(qū)蘋(píng)果應(yīng)用商店免費(fèi)APP下載排行榜上，豆包再次超越DeepSeek，位列第二，緊隨其后的DeepSeek被擠到了第三的位置，騰訊元寶則滑落到了第七名。2月13日，作為首家在C端主力產(chǎn)品中接入DeepSeek-R1滿血版的元寶，一度趁著DeepSeek東風(fēng)崛起:3月3日力壓DeepSeek和豆包，首度登頂。但好景?

?AI應(yīng)用 ?下載排行榜 ?豆包
DeepSeek的極致諂媚，正在摧毀我們的判斷力。

昨天別人給我發(fā)了一個(gè)很好玩的帖子。就是如果你問(wèn)DeepSeek一個(gè)問(wèn)題:“北京大學(xué)和清華大學(xué)哪個(gè)更好，二選一，不需要說(shuō)明理由”DeepSeek在思考了15秒之后，會(huì)給出答案。

?人工智能 ?DeepSeek ?大學(xué)比較
深度deepin 23.1正式發(fā)布！AI默認(rèn)引擎切換至DeepSeek、修復(fù)超百項(xiàng)問(wèn)題

快科技4月16日消息，今天，深度操作系統(tǒng)宣布，deepin 23.1版本已正式發(fā)布。此版本聚焦于解決基礎(chǔ)組件更新后的安裝效率問(wèn)題，大幅提升新用戶安裝體驗(yàn)，同時(shí)集成多項(xiàng)功能優(yōu)化與問(wèn)題修復(fù)，進(jìn)一步優(yōu)化系統(tǒng)使用。本次版本的重點(diǎn)改進(jìn)包括內(nèi)核優(yōu)化、AI 默認(rèn)引擎切換至DeepSeek、修復(fù)超百項(xiàng)用戶反饋問(wèn)題等，具體重點(diǎn)改進(jìn)如下：硬件兼容性與內(nèi)核優(yōu)化：集成6.6/6.12內(nèi)核更新、NVIDIA顯卡驅(qū)動(dòng)升級(jí)、Intel/AMD CPU微碼更新，全面提升硬件支持與底層性能；核心功能增強(qiáng)：DDE新增智能鏡像源管理、緊湊模式入口，全局搜索支持離線自然語(yǔ)言與AI處理能力；?

?深度操作系統(tǒng) ?deepin ?23.1
薦AI進(jìn)化論——音樂(lè)、繪畫(huà)和舞蹈的DeepSeek時(shí)刻

“昔者倉(cāng)頡作書(shū)天雨粟，鬼夜哭”——人類掌握文字后，天地為之動(dòng)容，因?yàn)閷儆谌祟惖奈拿髡Q生了?！皞}(cāng)頡作書(shū)”出自西漢《淮南子》，距離人類掌握文字已經(jīng)過(guò)去了千年。AI進(jìn)化的答案，或許早就鐫刻在人類文明的起點(diǎn)里。

?大語(yǔ)言模型 ?人工智能 ?文字掌握
國(guó)羽加油口號(hào)是DeepSeek想的網(wǎng)友：這個(gè)口號(hào)好厲害

中國(guó)羽毛球隊(duì)在2025年蘇迪曼杯首輪比賽中5-0戰(zhàn)勝阿爾及利亞隊(duì)，賽前全隊(duì)高喊"羽嘯鼓浪巔，中國(guó)劍指天！"的霸氣口號(hào)。這句由DeepSeek團(tuán)隊(duì)借助科技力量創(chuàng)作的口號(hào)，既體現(xiàn)了羽毛球運(yùn)動(dòng)精神，又展現(xiàn)了隊(duì)員們的昂揚(yáng)斗志?？谔?hào)成為國(guó)羽標(biāo)志性語(yǔ)言，激勵(lì)隊(duì)員為國(guó)爭(zhēng)光。此次合作彰顯科技與體育的完美結(jié)合，也體現(xiàn)了DeepSeek對(duì)體育事業(yè)的支持。未來(lái)期待DeepSeek繼續(xù)發(fā)揮創(chuàng)意技術(shù)優(yōu)勢(shì)，為更多體育賽事提供支持，共同推動(dòng)中國(guó)體育事業(yè)發(fā)展。

?蘇迪曼杯 ?中國(guó)羽毛球隊(duì) ?加油口號(hào)

熱文

3 天
7天

站長(zhǎng)商機(jī)

廣告

商務(wù)合作侵權(quán)投訴廣告服務(wù) 版權(quán)聲明招聘

?CopyRight 2002-2020 CHINAZ.COM

<center id="ikom4"></center>

<rt id="ikom4"><rt id="ikom4"></rt></rt>