快科技4月29日消息,馬斯克剛剛在社交平臺(tái)X上稱,下周將向SuperGrok訂閱者推出Grok 3.5,并將該條信息頂置。
據(jù)馬斯克稱,Grok 3.5是第一個(gè)能夠準(zhǔn)確回答有關(guān)火箭發(fā)動(dòng)機(jī)或電化學(xué)技術(shù)問題的人工智能。同時(shí),Grok可以從第一原理推理并得出互聯(lián)網(wǎng)上根本不存在的答案。
Grok 3.5被馬斯克旗下的xAI宣傳為全球首個(gè)人工智能能從第一性原理推理,生成網(wǎng)絡(luò)上不存在的答案”。
而今年2月18日,xAI正式發(fā)布Grok 3,并在兩天后把Grok 3免費(fèi)向所有公眾開放,超越ChatGPT,登頂蘋果應(yīng)用商店免費(fèi)應(yīng)用下載排行榜第一名。
馬斯克曾稱Grok 3為地球上最聰明的人工智能”。
令人值得關(guān)注的是,馬斯克官宣下周推出Grok 3.5”的這一舉動(dòng)恰巧發(fā)生在阿里巴巴發(fā)布Qwen3(千問3)之后。
4月29日凌晨4點(diǎn),阿里巴巴開源新一代通義千問模型Qwen3,參數(shù)量?jī)H為DeepSeek-R1的1/3,成本大幅下降,性能全面超越R1、OpenAI-o1等全球頂尖模型,登頂全球最強(qiáng)開源模型。
據(jù)悉,Qwen3是國(guó)內(nèi)首個(gè)混合推理模型”,快思考”與慢思考”集成進(jìn)同一個(gè)模型,對(duì)簡(jiǎn)單需求可低算力秒回”答案,對(duì)復(fù)雜問題可多步驟深度思考”,大大節(jié)省算力消耗。
作為Qwen系列全新一代的混合推理模型,Qwen3在GPQA、AIME24/25、LiveCodeBench等多個(gè)權(quán)威評(píng)測(cè)中表現(xiàn)出極具競(jìng)爭(zhēng)力的結(jié)果。
在奧數(shù)水平的AIME25測(cè)評(píng)中,Qwen3斬獲81.5分,刷新開源紀(jì)錄。
在考察代碼能力的LiveCodeBench評(píng)測(cè)中,Qwen3突破70分大關(guān),表現(xiàn)甚至超過Grok3。
在評(píng)估模型人類偏好對(duì)齊的ArenaHard測(cè)評(píng)中,Qwen3以95.6分超越OpenAI-o1及DeepSeek-R1。
性能大幅提升的同時(shí),Qwen3的部署成本還大幅下降,僅需4張H20即可部署Qwen3滿血版,顯存占用僅為性能相近模型的三分之一。
(舉報(bào))