【新智元導(dǎo)讀】Meta最近開(kāi)源了一個(gè)7B尺寸的Spirit LM的多模態(tài)語(yǔ)言模型,能夠理解和生成語(yǔ)音及文本,可以非常自然地在兩種模式間轉(zhuǎn)換,不僅能處理基本的語(yǔ)音轉(zhuǎn)文本和文本轉(zhuǎn)語(yǔ)音任務(wù),還能捕捉和再現(xiàn)語(yǔ)音中的情感和風(fēng)格。在純文本大模型取得進(jìn)展的同時(shí),其他模態(tài)數(shù)據(jù),如語(yǔ)音與文本結(jié)
......
本文由站長(zhǎng)之家合作伙伴自媒體作者“新智元公眾號(hào)”授權(quán)發(fā)布于站長(zhǎng)之家平臺(tái),本平臺(tái)僅提供信息索引服務(wù)。由于內(nèi)容發(fā)布時(shí)間超過(guò)平臺(tái)更新維護(hù)時(shí)間,為了保證文章信息的及時(shí)性,內(nèi)容觀點(diǎn)的準(zhǔn)確性,平臺(tái)將不提供完全的內(nèi)容展現(xiàn),本頁(yè)面內(nèi)容僅為平臺(tái)搜索索引使用。需閱讀完整內(nèi)容的用戶,請(qǐng)查看原文,獲取內(nèi)容詳情。
(舉報(bào))