AI視頻生成新突破:只需圖片和音頻,即可輕松制作生動(dòng)短片!
科技界傳來激動(dòng)人心的消息!近期,抖音旗下圖片視頻工具即夢AI宣布即將推出令人驚嘆的新功能。
這款全新功能采用了先進(jìn)的多模態(tài)視頻生成模型 OmniHuman,為創(chuàng)作者帶來了前所未有的便利。只需提供一張圖片和一段音頻,該模型就能生成一條栩栩如生的 AI 視頻,大幅提升視頻制作的效率和質(zhì)量。
OmniHuman 技術(shù)主頁透露,該模型由字節(jié)跳動(dòng)自主研發(fā),支持輸入各種尺寸的圖片,包括肖像、半身和全身。根據(jù)輸入的音頻,OmniHuman 可自動(dòng)生成人物與其匹配的動(dòng)作,包括演講、演唱、演奏樂器和移動(dòng)。
對于人物視頻生成中的常見問題,如手勢崩壞,OmniHuman 也做出了顯著的改進(jìn)。此外,該模型還支持輸入動(dòng)漫和 3D 卡通等非真人圖片,并能保持原有的風(fēng)格和動(dòng)作。
從展示的演示效果來看,OmniHuman 的生成效果令人印象深刻,具有較高的自然度。為了防止該技術(shù)被濫用,字節(jié)跳動(dòng)技術(shù)團(tuán)隊(duì)特別強(qiáng)調(diào),OmniHuman 將不會(huì)對外提供下載。
即夢 AI 相關(guān)負(fù)責(zé)人透露,OmniHuman 目前已具備不俗的表現(xiàn),但生成影視級別視頻仍有提升空間。搭載 OmniHuman 的多模態(tài)視頻生成功能將首先在即夢上進(jìn)行小范圍測試,并逐步開放。
該負(fù)責(zé)人還表示,即夢將對該功能實(shí)施嚴(yán)格的安全審核機(jī)制,并在輸出視頻上標(biāo)注水印以提醒用戶。此舉旨在確保 AI 技術(shù)發(fā)揮積極作用,幫助視頻創(chuàng)作者充分發(fā)揮想象力。
(舉報(bào))