最近,英偉達(dá)團(tuán)隊(duì)推出了全新的模型Nemotron-4,150億參數(shù),在8T token上完成了訓(xùn)練。值得一提的是,Nemotron-4在英語(yǔ)、多語(yǔ)言和編碼任務(wù)方面令人印象深刻。論文地址:https://arxiv.org/abs/2402.16819在7個(gè)評(píng)估基準(zhǔn)上,與同等參數(shù)規(guī)模的模型相比,Nemotron-415B表現(xiàn)出色。甚至,其
......
本文由站長(zhǎng)之家合作伙伴自媒體作者“?新智元公眾號(hào)”授權(quán)發(fā)布于站長(zhǎng)之家平臺(tái),本平臺(tái)僅提供信息索引服務(wù)。由于內(nèi)容發(fā)布時(shí)間超過(guò)平臺(tái)更新維護(hù)時(shí)間,為了保證文章信息的及時(shí)性,內(nèi)容觀點(diǎn)的準(zhǔn)確性,平臺(tái)將不提供完全的內(nèi)容展現(xiàn),本頁(yè)面內(nèi)容僅為平臺(tái)搜索索引使用。需閱讀完整內(nèi)容的用戶,請(qǐng)查看原文,獲取內(nèi)容詳情。
(舉報(bào))