站長(zhǎng)之家(ChinaZ.com)8月3日 消息:Meta發(fā)布了一款開(kāi)源人工智能工具AudioCraft,幫助用戶根據(jù)文本提示創(chuàng)作音樂(lè)和音頻。
該工具融合了AudioGen、EnCodec和MusicGen三種模型或技術(shù),可以通過(guò)文本內(nèi)容生成高質(zhì)量、逼真的音頻和音樂(lè)。
據(jù)Meta官方介紹,MusicGen接受了Meta擁有和授權(quán)的音樂(lè)訓(xùn)練,可以從文本提示生成音樂(lè);AudioGen接受了公共音效訓(xùn)練,可以從文本提示生成音頻,如模擬狗叫或腳步聲;再加上改進(jìn)版本的EnCodec編解碼器,用戶可以更高效地生成更高質(zhì)量的音樂(lè)。
AudioCraft是一種非常有趣和強(qiáng)大的人工智能工具,可以幫助用戶創(chuàng)作出高質(zhì)量的音樂(lè)和音頻。通過(guò)簡(jiǎn)單的文本提示,用戶可以快速生成自己想要的音頻內(nèi)容,這對(duì)于音樂(lè)制作、游戲開(kāi)發(fā)、影視制作等領(lǐng)域有很大的吸引力。同時(shí),AudioCraft的開(kāi)源性質(zhì)也有利于促進(jìn)人工智能技術(shù)的發(fā)展和普及。
git:https://github.com/facebookresearch/audiocraft
模型:huggingface.co/spaces/facebook/MusicGen
(舉報(bào))