无码在线播放二区|久久亚洲精品国产精品|无码视频在线观看一区二区|在线观看国产日韩亚洲中

  • <menu id="yw4o4"></menu>
  • 
    <menu id="yw4o4"><em id="yw4o4"></em></menu>
  • 首頁 > 業(yè)界 > 關(guān)鍵詞  > 李開復(fù)最新資訊  > 正文

    勝率達94.08%!李開復(fù)Yi-34B成績超過LLaMA2等主流大模型

    2023-12-11 14:31 · 稿源:站長之家

    要點:

    • 李開復(fù)的Yi-34B-Chat模型在多個評測中取得顯著成績,勝率達94.08%,超越主流大模型如LLaMA2和ChatGPT。

    • 該模型在加州大學(xué)伯克利分校主導(dǎo)的LMSYS ORG排行榜中以1102的Elo評分追平GPT-3.5,展現(xiàn)強大性能。在中文能力評測中,Yi-34B-Chat在SuperCLUE排行榜上以31.82%的對戰(zhàn)勝率僅次于GPT4-Turbo。

    • Yi-34B-Chat的成功得益于零一萬物團隊的AI Alignment團隊采用創(chuàng)新對齊策略,包括輕量化指令微調(diào)方案、多能力融合、對數(shù)據(jù)的關(guān)注等。

    站長之家(ChinaZ.com)12月11日 消息:近期,李開復(fù)的Yi-34B-Chat模型在多個評測中大放異彩。其94.08%的勝率超越了LLaMA2和ChatGPT等主流大模型,尤其在加州大學(xué)伯克利分校主導(dǎo)的LMSYS ORG排行榜中,以1102的Elo評分追平了GPT-3.5。此外,在中文SuperCLUE排行榜上,Yi-34B-Chat以31.82%的勝率僅次于GPT4-Turbo。

    通過對話場景實測,Yi-34B-Chat在不同對話場景中展現(xiàn)出優(yōu)越的實力。從對Transformer模型結(jié)構(gòu)的發(fā)展方向到生成小紅書文案,Yi-34B-Chat的回答均顯示其有理有據(jù),符合當(dāng)前主流風(fēng)格。在中文理解方面,Yi-34B-Chat在復(fù)雜的中文理解問題上也展現(xiàn)了出色的精準(zhǔn)性。

    image.png

    項目地址:https://huggingface.co/01-ai

    Yi-34B-Chat模型的卓越表現(xiàn)不僅僅源于其強基座系列,還得益于人工智能對齊團隊的創(chuàng)新對齊策略。采用輕量化指令微調(diào)方案,單項能力提升和多項能力融合兩個階段的創(chuàng)新訓(xùn)練方式,以及關(guān)注數(shù)據(jù)質(zhì)量和指令多樣性等方面的獨特設(shè)計,使Yi-34B-Chat在各方面均有出色表現(xiàn)。

    Yi-34B模型開源首月表現(xiàn)亮眼,在Hugging Face社區(qū)下載量高達16.8萬,魔搭社區(qū)下載量也達到1.2萬,GitHub上獲得超過4900個Stars。多家知名公司和機構(gòu)基于Yi模型基座推出的微調(diào)模型,如獵戶星空公司的OrionStar-Yi-34B-Chat模型、IDEA研究院的SUS-Chat-34B等,性能表現(xiàn)優(yōu)異。在GPU加速大模型的實驗中,Yi-6B成為范例項目。

    開發(fā)者Eric Hartford提出Yi模型使用了與LLaMA模型相同的架構(gòu),引發(fā)了一場關(guān)于“抄襲”的質(zhì)疑。零一萬物團隊意識到問題,及時在各開源平臺重新提交模型及代碼,完成了版本更新。然而,這一小問題在國內(nèi)被曲解,引發(fā)了一場輿論風(fēng)暴。團隊強調(diào),他們是從零開始打造Yi系列模型,重新命名僅為對比實驗需求。

    這一系列的成績和問題共同勾勒出Yi-34B-Chat模型的成功軌跡,盡管受到一些質(zhì)疑,但其在技術(shù)創(chuàng)新和用戶體驗方面的表現(xiàn)仍然備受矚目。

    舉報

    • 相關(guān)推薦
    • 苦等一年 Meta終于放大招 正式發(fā)布開源大模型Llama 4

      美國科技巨擘Meta重磅推出其迄今最為強大的開源AI模型Llama4,恰逢Llama3上市一周年之際。Llama4系列采用了先進的混合專家架構(gòu),這一架構(gòu)在模型訓(xùn)練及用戶查詢回答過程中展現(xiàn)出更高效率,通過將模型劃分為多個專注于特定任務(wù)的專家”子模型,實現(xiàn)精準(zhǔn)高效的處理。Meta首席執(zhí)行官扎克伯格表示:他們的目標(biāo)是建立世界領(lǐng)先的人工智能,將其開源,并使其普遍可用,以便世界上每個人都能受益。

    • Llama 4大模型跌落神壇:作弊刷榜、代碼能力極差、和DeepSeek比就是偽開源

      被寄予厚望的美國Meta公司的最新開源大模型Llama4發(fā)布不到2天時間,口碑急轉(zhuǎn)直下,被質(zhì)疑為刷榜作弊實際效果差、開源條件多部署門檻高是偽開源等。大模型評測平臺LMArena親自下場發(fā)文,打臉Meta提供給平臺的Llama4是“特供版”。Meta若繼續(xù)在商業(yè)控制與技術(shù)開放之間搖擺,恐將在AI競賽中進一步失去開發(fā)者支持。

    • Meta說他們的 Llama 4 偏見少了!但,“虛假對等”才是真偏見

      Meta公司稱,相比之前的版本,他們最新的人工智能模型Llama4的政治偏見更少了。其中一部分便是通過允許該模型回答更多帶有政治爭議性的問題來實現(xiàn)這一點的。下次當(dāng)你使用Meta的AI產(chǎn)品時,它可能會為“通過服用馬用鎮(zhèn)靜劑來治療新冠病毒”這種觀點說好話!

    • 實錘了,Llama 4重測排名掉至32名!遠不及DeepSeek和Qwen

      LMArena更新了Meta最新發(fā)布的開源大模型Llama-4-Maverick的排名,從此前的第2名,直線掉到了第32名!這也實錘了此前開發(fā)者對Meta為刷榜排名向LMArena提供了“特供版”的Llama4大模型的質(zhì)疑。開源版同款Llama-4-Maverick-17B-128E-Instruct在LMArena的排名為32名,遠低于Gemini2.5Pro、GPT4o、DeepSeek-V3-0324、DeepSeek-R1、Qwen2.5-Max,甚至連英偉達基于上一代Llama3.3改造的Llama-3.3-Nemotron-Super-49B-v1都不如。

    • 反擊DeepSeek失敗!Llama 4效果不好,Meta承認有問題

      今天凌晨1點半,Meta生成式AI領(lǐng)導(dǎo)者AhmadAl-Dahle在社交平臺發(fā)布了一篇長文,對前天剛開源的Llama4質(zhì)疑進行了官方回應(yīng)。Ahmad表示,Llama4一開發(fā)完就發(fā)布了,所以,不同服務(wù)中模型質(zhì)量難免會有一些差異。由于關(guān)稅大戰(zhàn)的原因,Meta的股票遭遇重創(chuàng),他們也需要一個利好消息來拉升股票,現(xiàn)在適得其反。

    • 剛剛,Llama 4深夜開源擊敗DeepSeek V3!2萬億多模態(tài)巨獸搶回王座

      Llama4重磅發(fā)布了!Meta官宣開源首個原生多模態(tài)Llama4,首次采用的MoE架構(gòu),支持12種語言,首批發(fā)布一共兩款:Llama4Scout:共有1090億參數(shù),17B活躍參數(shù),16個專家,1000萬上下Llama4Maverick:共有4000億參數(shù),17B活躍參數(shù),128個專家,100萬上下文另外,2萬億參數(shù)Llama4Behemoth將在未來幾個月面世,288B活躍參數(shù),16個專家。Llama4的橫空出世,成為迄今為止開源最強,多模態(tài)能力最好的模型之一。L

    • Llama 4五大疑點曝光,逐層扒皮,全球AI進步停滯,NYU教授稱Scaling徹底結(jié)束

      令人失望的Llama4,只是前奏已。接下來我們恐將看到——全球局勢的改變,將徹底阻止AI進步!最近,一位AICEO做出長視頻,逐級對Llama4身上的六大疑點進行了扒皮。GaryMarcus正在尋找對開發(fā)更可靠替代方法有興趣的投資者。

    • 騰訊最新股權(quán)曝光:馬化騰持股價值3534億港元

      近日,騰訊發(fā)布截至2024年的年報,年報顯示,截至2024年12月31日,AdvanceDataServices持有804,859,700股,持股比例為8.72%。AdvanceDataServices為騰訊CEO馬化騰全資持有公司,按照昨日收盤股價440元/股計算,這一持股價值3534億港元。騰訊2020年、2021年、2022年、2023年、2024年營收分別為4820.64億元、5601.18億元、5545.52億元、6090億、6602.57億;毛利分別為2215.32億元、2459.44億元、2387.46億元、2931.09億元、3492.46億元。

    • 奔馳新款CLA接入豆包大模型

      4月22日,奔馳與火山引擎合作的首款國產(chǎn)純電車型CLA全球首發(fā)亮相。該車搭載奔馳自研MB.OS架構(gòu),接入火山引擎大模型,支持個性化智能交互體驗。智能系統(tǒng)可識別4種情緒并給予反饋,交互效率提升50%,喚醒僅需0.2秒。虛擬助手能解答百科問題并協(xié)助車輛功能設(shè)置。這是雙方繼2024年8月達成AI戰(zhàn)略合作后落地的首款量產(chǎn)車型,結(jié)合生成式AI和大數(shù)據(jù)技術(shù),為中國用戶打造更智能的用車體驗。

    • Windows 11愈發(fā)受游戲玩家歡迎!Steam最新占比已達55.34%

      根據(jù)Valve最新發(fā)布的2025年3月Steam硬件和軟件調(diào)查結(jié)果,Windows11在Steam上的份額持續(xù)攀升,目前占據(jù)了所有參與調(diào)查的Windows設(shè)備的55.34%。Windows10在Steam上的市場份額為40.58%,較3月下降了12.76個百分點。其他硬件配置方面,16GB內(nèi)存、6核處理器、8GB顯存以及1080p顯示器是最常見的配置。