无码在线播放二区|久久亚洲精品国产精品|无码视频在线观看一区二区|在线观看国产日韩亚洲中

<menu id="yw4o4"></menu>

<menu id="yw4o4"><em id="yw4o4"></em></menu>

<label id="zcgm0"></label>

Mistral、AI2 發(fā)布新的開源 LLMs：更小，更便宜

2025-01-31 11:12 · 稿源：站長之家

站長之家(ChinaZ.com) 1月31日消息：Mistral AI 和 Allen 人工智能研究所今天發(fā)布了新的大型語言模型（LLM），它們聲稱這些模型在各自類別中屬于最先進的。

mistral

Mistral 的模型被稱為 Mistral Small 3，而 Allen 人工智能研究所（通常簡稱 Ai2）發(fā)布的則是 Tülu 3 405B。這兩款模型都可以在開源許可下使用。

Mistral Small 3 包含 240 億個參數(shù)，遠少于市場上最先進的 LLM，這使得它在啟用量化后足夠小，可以在某些 MacBook 上運行。量化是一種調整模型的技術，旨在在降低硬件資源需求的同時，減少一些輸出質量的損失。

在一次內部評估中，Mistral 將 Mistral Small 3 與 Meta Platforms Inc. 發(fā)布的開源 LLM Llama 3.3 70B Instruct 進行了對比，后者的參數(shù)量是前者的三倍多。Mistral Small 3 提供了與 Llama 3.3 70B 類似的輸出質量，但響應速度顯著更快。在另一項測試中，這款新模型比 OpenAI 的 GPT-4o mini 提供了更高的輸出質量和更低的延遲。

開發(fā)人員通常通過創(chuàng)建一個基礎模型來構建 LLM，然后使用多種不同的訓練方法來細化其輸出質量。在構建 Mistral Small 3 時，該公司開發(fā)了基礎模型，但跳過了后續(xù)的細化過程。這使得用戶可以根據(jù)項目需求自行微調 Mistral Small 3。

該公司預計開發(fā)人員將會把這款 LLM 應用于各種任務，特別是在需要低延遲執(zhí)行外部應用程序任務的 AI 自動化工具中。該公司表示，其一些客戶還在機器人技術、金融服務和制造業(yè)等行業(yè)特定用例中使用 Mistral Small 3。

「Mistral Small 3 是一款預訓練和指令式模型，專為應對『80%』的生成式 AI 任務而設計——這些任務需要強大的語言能力和指令跟隨性能，并且延遲非常低，」Mistral 的研究人員在博客中寫道。

今天 Mistral Small 3 的發(fā)布恰逢 Ai2（一個非營利的 AI 研究機構）發(fā)布新的 LLM。Tülu 3 405B 是 Meta 去年 6 月發(fā)布的開源 Llama 3.1 405B 模型的定制版。在 Ai2 的測試中，Tülu 3 405B 在多個基準測試中超過了原始的 Llama 模型。

該研究小組使用一種它們在 11 月首次詳細說明的開發(fā)流程創(chuàng)建了這個 LLM。該工作流結合了多種 LLM 訓練方法，其中包括 Ai2 自家發(fā)明的一種方法。

該工作流的第一步是監(jiān)督微調。這是一種訓練方法，通過向 LLM 提供示例提示和相應的答案，幫助它學習如何響應用戶查詢。接下來，Ai2 使用了另一種名為 DPO 的訓練技術，將 Tülu 3 405B 的輸出與一組用戶偏好進行對齊。

Ai2 還使用一種名為 RLVR 的內部開發(fā)的訓練方法進一步優(yōu)化了模型的能力。RLVR 是強化學習的一種變體，強化學習是廣泛應用的 AI 訓練技術。Ai2 表示，RLVR 可以使 AI 模型在解決數(shù)學問題等任務中表現(xiàn)得更好。

Tülu 3 405B 代表了「完全開放的后訓練方法首次應用于最大開放權重模型」，Ai2 的研究人員在博客中寫道?！竿ㄟ^這一發(fā)布，我們展示了我們在 405B 參數(shù)規(guī)模上應用后訓練方法的可擴展性和有效性?！?/p>

（舉報）

相關推薦

關鍵詞：

比 SpaceX 更便宜……亞馬遜發(fā)射“柯伊伯計劃”首批衛(wèi)星

為了追趕領先者，亞馬遜打出了低價這張牌……

?亞馬遜衛(wèi)星 ?柯伊伯計劃 ?SpaceX
蘋果兩款Vision Pro開發(fā)中！一款更輕更便宜、一款近乎零延遲

快科技4月14日消息，據(jù)媒體報道，蘋果正在開發(fā)兩款新的Vision Pro設備，一款更輕、更便宜，另一款則主打近乎零延遲的體驗。Mark Gurman透露，蘋果正在開發(fā)一款比當前Vision Pro更輕、更便宜的設備。當前Vision Pro起售價高達3499美元，重量約600-650克，而新款設備將針對普通消費者，解決重量和價格兩大問題。具體價格尚未披露，但有消息稱其價格可能與高端iPhone相當，預計在1600美

?蘋果 ?Vision ?Pro
Trae重磅升級：全面開放自定義AI能力，用戶可打造個人專屬“AI 工程師”

Trae新版本通過整合AI技術，提供更智能、高效的開發(fā)體驗，支持多語言文件輸入與多種功能擴展。它突破傳統(tǒng)IDE模式，強調人機協(xié)作與個性化定制，實現(xiàn)需求快速轉化和技術方案優(yōu)化。同時，其開放的插件系統(tǒng)和自定義能力，滿足不同場景的專業(yè)開發(fā)需求，推動AI在編程領域的深度融合與創(chuàng)新應用。

?AI技術發(fā)展 ?編程工具變革 ?個性化編程
vivo X200 Ultra發(fā)布會定檔：將于4月21日發(fā)布

vivo正式對外宣布，其備受科技愛好者關注的X系列春季新品發(fā)布會已確定于4月21日19:00盛大啟幕，屆時將攜vivoX200s與vivoX200Ultra兩款旗艦機型震撼登場，為消費者帶來一場視覺與技術的雙重盛宴。作為vivo影像技術的集大成者，vivoX200Ultra憑借其卓越的影像配置，被譽為新一代“影像滅霸”。該機正面配備了一塊6.82英寸等深四曲屏，頂配版本還支持北斗三號短報文功能，電池容量約為6000mAh，支持90W快充技術，并具備IP68與IP69級別的防水性能，為用戶提供了更加全面與可靠的使用體驗。

?vivo ?X系列 ?影像技術
V單來了！vivo X200 Ultra今晚發(fā)布：參數(shù)全匯總

快科技4月21日消息，vivo X200 Ultra將于今晚發(fā)布，這次影像能力進一步提升，官方直接稱其為V單”。首先在外觀上就非常像一臺微單相機，后攝部分采用了類似餅干頭”的鏡頭風格，三款都是玻璃機身，搭配磨砂效果的直角中框。正面采用6.82英寸2K等深四曲屏，搭載圓偏振光護眼技術，支持3D單點超聲波指紋，覆蓋鎧甲玻璃，防劃抗摔性能提升。核心搭載驍龍8至尊版，內置6000mAh

?vivo ?X200 ?Ultra
Trae國內版怎么用？Trae IDE 內置 MCP 市場配置使用指南

字節(jié)跳動旗下Trae+IDE發(fā)布新版本，通過MCP協(xié)議實現(xiàn)AI智能體與外部工具的深度集成。MCP作為標準化橋梁，讓開發(fā)者能靈活接入Supabase、FireCrawl等第三方服務，只需@符號即可調用智能體完成數(shù)據(jù)庫操作、文檔搜索等復雜任務。新版本內置MCP市場，支持Token快速配置，并演示了如何通過Figma+AI自動生成前端代碼。該技術可應用于Blender建模、K8s管理等多元場景，顯著提升開發(fā)效率。Trae+IDE將持續(xù)擴展工具生態(tài)，推動AI協(xié)作開發(fā)新時代。

?字節(jié)跳動 ?Trae ?IDE
薦AI日報：Kimi全新音頻基礎模型Kimi-Audio；階躍星辰開源圖像編輯模型Step1X-Edit；?夸克AI超級框上線 “拍照問夸克”

本期AI日報聚焦多項AI技術突破與應用：1)Moonshot AI推出開源音頻模型Kimi-Audio，基于13億小時訓練數(shù)據(jù)，支持語音識別等任務；2)階躍星辰開源圖像編輯模型Step1X-Edit，展現(xiàn)強大生成能力；3)夸克AI上線"拍照問夸克"功能，實現(xiàn)視覺問答；4)蘋果iOS18.5將在中國推送，帶來智能功能；5)谷歌發(fā)布601個生成式AI應用案例，覆蓋多行業(yè)；6)微軟推出深度整合Windows的UFO2自動化系統(tǒng)；7)OpenAI升級ChatGPT至GPT-4o版本，提升STEM領域能力；8)Ema公司推出高性價比語言模型EmaFusion；9)Liquid AI發(fā)布面向邊緣設備的Hyena Edge模型；10)LemonAI推出實時音視頻數(shù)字人產(chǎn)品Slice Live。此外，國內方面，智譜與生數(shù)科技達成戰(zhàn)略合作推動大模型發(fā)展，寶馬中國宣布新車將接入DeepSeek技術。

?AI日報 ?音頻技術 ?開源模型
解鎖春日創(chuàng)作靈感三星Galaxy S25 Ultra盡顯AI影像魅力

春天是一年中非常適合影像創(chuàng)作的季節(jié)。明媚的陽光、多變的光影、豐富的色彩，成為人們按下快門、記錄生活的最佳理由。讓三星GalaxyS25Ultra成為你的春日旅伴，走進自然與城市，用AI影像記錄生活的每一個動人瞬間。

?春天影像創(chuàng)作 ?手機攝影技巧 ?三星Galaxy
苦等一年 Meta終于放大招正式發(fā)布開源大模型Llama 4

美國科技巨擘Meta重磅推出其迄今最為強大的開源AI模型Llama4，恰逢Llama3上市一周年之際。Llama4系列采用了先進的混合專家架構，這一架構在模型訓練及用戶查詢回答過程中展現(xiàn)出更高效率，通過將模型劃分為多個專注于特定任務的專家”子模型，實現(xiàn)精準高效的處理。Meta首席執(zhí)行官扎克伯格表示：他們的目標是建立世界領先的人工智能，將其開源，并使其普遍可用，以便世界上每個人都能受益。

?Meta ?Llama ?4
薦AI日報：小米首個推理大模型開源Xiaomi MiMo；快手上線AI筆記工具“喵記多”；騰訊拆分AI團隊

本文匯總了AI領域最新動態(tài)：1)小米開源70億參數(shù)大模型Xiaomi MiMo，在數(shù)學推理和代碼競賽中超越OpenAI和阿里模型；2)快手推出AI筆記工具"喵記多"，簡化筆記管理；3)Luma AI發(fā)布電影級鏡頭控制API，降低視頻生成門檻；4)騰訊重組AI團隊，加大語言模型研發(fā)投入；5)Anthropic為Claude引入新語音"Glassy"；6)谷歌NotebookLM新增50+語言音頻概述功能；7)xAI將發(fā)布Grok3.5模型；8)Meta推出獨立AI助手應用挑戰(zhàn)ChatGPT；9)OpenAI緊急修復GPT-4o"諂媚"問題；10)Mac本地AI助手Simular升級隱私保護；11)CameraBench項目幫助AI理解鏡頭運動；12)谷歌推出個性化語言學習AI工具。

?人工智能 ?Xiaomi ?MiMo

熱文

3 天
7天

站長商機

廣告

商務合作侵權投訴廣告服務版權聲明招聘

?CopyRight 2002-2020 CHINAZ.COM