作為國內(nèi)較早布局人工智能大模型的企業(yè)之一,上海巖芯數(shù)智近日正式發(fā)布國內(nèi)首 個(gè)非Attention機(jī)制的通用自然語言大模型——Yan模型。這也是業(yè)內(nèi)少有的非Transformer架構(gòu)大模型,擁有相較于同等參數(shù)Transformer的 7 倍訓(xùn)練效率、 5 倍推理吞吐、 3 倍記憶能力,同時(shí)支持CPU無損運(yùn)行、
......
111本文由站長之家用戶投稿發(fā)布于站長之家平臺,本平臺僅提供信息索引服務(wù)。為了保證文章信息的及時(shí)性,內(nèi)容觀點(diǎn)的準(zhǔn)確性,平臺將不提供完全的內(nèi)容展現(xiàn),本頁面內(nèi)容僅為平臺搜索索引使用。需閱讀完整內(nèi)容的用戶,請查看原文,獲取內(nèi)容詳情。
(推廣)