无码在线播放二区|久久亚洲精品国产精品|无码视频在线观看一区二区|在线观看国产日韩亚洲中

  • <menu id="yw4o4"></menu>
  • 
    <menu id="yw4o4"><em id="yw4o4"></em></menu>
  • 首頁 > 業(yè)界 > 關鍵詞  > Mistral最新資訊  > 正文

    Mistral、AI2 發(fā)布新的開源 LLMs:更小,更便宜

    2025-01-31 11:12 · 稿源:站長之家

    站長之家(ChinaZ.com) 1月31日消息:Mistral AI 和 Allen 人工智能研究所今天發(fā)布了新的大型語言模型(LLM),它們聲稱這些模型在各自類別中屬于最先進的。

    mistral

    Mistral 的模型被稱為 Mistral Small 3,而 Allen 人工智能研究所(通常簡稱 Ai2)發(fā)布的則是 Tülu 3 405B。這兩款模型都可以在開源許可下使用。

    Mistral Small 3 包含 240 億個參數(shù),遠少于市場上最先進的 LLM,這使得它在啟用量化后足夠小,可以在某些 MacBook 上運行。量化是一種調整模型的技術,旨在在降低硬件資源需求的同時,減少一些輸出質量的損失。

    在一次內部評估中,Mistral 將 Mistral Small 3 與 Meta Platforms Inc. 發(fā)布的開源 LLM Llama 3.3 70B Instruct 進行了對比,后者的參數(shù)量是前者的三倍多。Mistral Small 3 提供了與 Llama 3.3 70B 類似的輸出質量,但響應速度顯著更快。在另一項測試中,這款新模型比 OpenAI 的 GPT-4o mini 提供了更高的輸出質量和更低的延遲。

    開發(fā)人員通常通過創(chuàng)建一個基礎模型來構建 LLM,然后使用多種不同的訓練方法來細化其輸出質量。在構建 Mistral Small 3 時,該公司開發(fā)了基礎模型,但跳過了后續(xù)的細化過程。這使得用戶可以根據(jù)項目需求自行微調 Mistral Small 3。

    該公司預計開發(fā)人員將會把這款 LLM 應用于各種任務,特別是在需要低延遲執(zhí)行外部應用程序任務的 AI 自動化工具中。該公司表示,其一些客戶還在機器人技術、金融服務和制造業(yè)等行業(yè)特定用例中使用 Mistral Small 3。

    「Mistral Small 3 是一款預訓練和指令式模型,專為應對『80%』的生成式 AI 任務而設計——這些任務需要強大的語言能力和指令跟隨性能,并且延遲非常低,」Mistral 的研究人員在博客中寫道。

    今天 Mistral Small 3 的發(fā)布恰逢 Ai2(一個非營利的 AI 研究機構)發(fā)布新的 LLM。Tülu 3 405B 是 Meta 去年 6 月發(fā)布的開源 Llama 3.1 405B 模型的定制版。在 Ai2 的測試中,Tülu 3 405B 在多個基準測試中超過了原始的 Llama 模型。

    該研究小組使用一種它們在 11 月首次詳細說明的開發(fā)流程創(chuàng)建了這個 LLM。該工作流結合了多種 LLM 訓練方法,其中包括 Ai2 自家發(fā)明的一種方法。

    該工作流的第一步是監(jiān)督微調。這是一種訓練方法,通過向 LLM 提供示例提示和相應的答案,幫助它學習如何響應用戶查詢。接下來,Ai2 使用了另一種名為 DPO 的訓練技術,將 Tülu 3 405B 的輸出與一組用戶偏好進行對齊。

    Ai2 還使用一種名為 RLVR 的內部開發(fā)的訓練方法進一步優(yōu)化了模型的能力。RLVR 是強化學習的一種變體,強化學習是廣泛應用的 AI 訓練技術。Ai2 表示,RLVR 可以使 AI 模型在解決數(shù)學問題等任務中表現(xiàn)得更好。

    Tülu 3 405B 代表了「完全開放的后訓練方法首次應用于最大開放權重模型」,Ai2 的研究人員在博客中寫道?!竿ㄟ^這一發(fā)布,我們展示了我們在 405B 參數(shù)規(guī)模上應用后訓練方法的可擴展性和有效性?!?/p>

    舉報

    • 相關推薦
    • 蘋果兩款Vision Pro開發(fā)中!一款更輕更便宜、一款近乎零延遲

      快科技4月14日消息,據(jù)媒體報道,蘋果正在開發(fā)兩款新的Vision Pro設備,一款更輕、更便宜,另一款則主打近乎零延遲的體驗。Mark Gurman透露,蘋果正在開發(fā)一款比當前Vision Pro更輕、更便宜的設備。當前Vision Pro起售價高達3499美元,重量約600-650克,而新款設備將針對普通消費者,解決重量和價格兩大問題。具體價格尚未披露,但有消息稱其價格可能與高端iPhone相當,預計在1600美

    • Trae重磅升級:全面開放自定義AI能力,用戶可打造個人專屬“AI 工程師”

      Trae新版本通過整合AI技術,提供更智能、高效的開發(fā)體驗,支持多語言文件輸入與多種功能擴展。它突破傳統(tǒng)IDE模式,強調人機協(xié)作與個性化定制,實現(xiàn)需求快速轉化和技術方案優(yōu)化。同時,其開放的插件系統(tǒng)和自定義能力,滿足不同場景的專業(yè)開發(fā)需求,推動AI在編程領域的深度融合與創(chuàng)新應用。

    • vivo X200 Ultra發(fā)布會定檔:將于4月21日發(fā)布

      vivo正式對外宣布,其備受科技愛好者關注的X系列春季新品發(fā)布會已確定于4月21日19:00盛大啟幕,屆時將攜vivoX200s與vivoX200Ultra兩款旗艦機型震撼登場,為消費者帶來一場視覺與技術的雙重盛宴。作為vivo影像技術的集大成者,vivoX200Ultra憑借其卓越的影像配置,被譽為新一代“影像滅霸”。該機正面配備了一塊6.82英寸等深四曲屏,頂配版本還支持北斗三號短報文功能,電池容量約為6000mAh,支持90W快充技術,并具備IP68與IP69級別的防水性能,為用戶提供了更加全面與可靠的使用體驗。

    • V單來了!vivo X200 Ultra今晚發(fā)布:參數(shù)全匯總

      快科技4月21日消息,vivo X200 Ultra將于今晚發(fā)布,這次影像能力進一步提升,官方直接稱其為V單”。首先在外觀上就非常像一臺微單相機,后攝部分采用了類似餅干頭”的鏡頭風格,三款都是玻璃機身,搭配磨砂效果的直角中框。正面采用6.82英寸2K等深四曲屏,搭載圓偏振光護眼技術,支持3D單點超聲波指紋,覆蓋鎧甲玻璃,防劃抗摔性能提升。核心搭載驍龍8至尊版,內置6000mAh

    • Trae國內版怎么用?Trae IDE 內置 MCP 市場配置使用指南

      字節(jié)跳動旗下Trae+IDE發(fā)布新版本,通過MCP協(xié)議實現(xiàn)AI智能體與外部工具的深度集成。MCP作為標準化橋梁,讓開發(fā)者能靈活接入Supabase、FireCrawl等第三方服務,只需@符號即可調用智能體完成數(shù)據(jù)庫操作、文檔搜索等復雜任務。新版本內置MCP市場,支持Token快速配置,并演示了如何通過Figma+AI自動生成前端代碼。該技術可應用于Blender建模、K8s管理等多元場景,顯著提升開發(fā)效率。Trae+IDE將持續(xù)擴展工具生態(tài),推動AI協(xié)作開發(fā)新時代。

    • AI日報:Kimi音頻基礎模型Kimi-Audio;階躍星辰開源圖像編輯模型Step1X-Edit;?夸克AI超級框上線 “拍照問夸克”

      本期AI日報聚焦多項AI技術突破與應用:1)Moonshot AI推出開源音頻模型Kimi-Audio,基于13億小時訓練數(shù)據(jù),支持語音識別等任務;2)階躍星辰開源圖像編輯模型Step1X-Edit,展現(xiàn)強大生成能力;3)夸克AI上線"拍照問夸克"功能,實現(xiàn)視覺問答;4)蘋果iOS18.5將在中國推送,帶來智能功能;5)谷歌發(fā)布601個生成式AI應用案例,覆蓋多行業(yè);6)微軟推出深度整合Windows的UFO2自動化系統(tǒng);7)OpenAI升級ChatGPT至GPT-4o版本,提升STEM領域能力;8)Ema公司推出高性價比語言模型EmaFusion;9)Liquid AI發(fā)布面向邊緣設備的Hyena Edge模型;10)LemonAI推出實時音視頻數(shù)字人產(chǎn)品Slice Live。此外,國內方面,智譜與生數(shù)科技達成戰(zhàn)略合作推動大模型發(fā)展,寶馬中國宣布新車將接入DeepSeek技術。

    • 解鎖春日創(chuàng)作靈感 三星Galaxy S25 Ultra盡顯AI影像魅力

      春天是一年中非常適合影像創(chuàng)作的季節(jié)。明媚的陽光、多變的光影、豐富的色彩,成為人們按下快門、記錄生活的最佳理由。讓三星GalaxyS25Ultra成為你的春日旅伴,走進自然與城市,用AI影像記錄生活的每一個動人瞬間。

    • 苦等一年 Meta終于放大招 正式發(fā)布開源大模型Llama 4

      美國科技巨擘Meta重磅推出其迄今最為強大的開源AI模型Llama4,恰逢Llama3上市一周年之際。Llama4系列采用了先進的混合專家架構,這一架構在模型訓練及用戶查詢回答過程中展現(xiàn)出更高效率,通過將模型劃分為多個專注于特定任務的專家”子模型,實現(xiàn)精準高效的處理。Meta首席執(zhí)行官扎克伯格表示:他們的目標是建立世界領先的人工智能,將其開源,并使其普遍可用,以便世界上每個人都能受益。

    • AI日報:小米首個推理大模型開源Xiaomi MiMo;快手上線AI筆記工具“喵記多”;騰訊拆分AI團隊

      本文匯總了AI領域最新動態(tài):1)小米開源70億參數(shù)大模型Xiaomi MiMo,在數(shù)學推理和代碼競賽中超越OpenAI和阿里模型;2)快手推出AI筆記工具"喵記多",簡化筆記管理;3)Luma AI發(fā)布電影級鏡頭控制API,降低視頻生成門檻;4)騰訊重組AI團隊,加大語言模型研發(fā)投入;5)Anthropic為Claude引入新語音"Glassy";6)谷歌NotebookLM新增50+語言音頻概述功能;7)xAI將發(fā)布Grok3.5模型;8)Meta推出獨立AI助手應用挑戰(zhàn)ChatGPT;9)OpenAI緊急修復GPT-4o"諂媚"問題;10)Mac本地AI助手Simular升級隱私保護;11)CameraBench項目幫助AI理解鏡頭運動;12)谷歌推出個性化語言學習AI工具。

    熱文

    • 3 天
    • 7天