无码在线播放二区|久久亚洲精品国产精品|无码视频在线观看一区二区|在线观看国产日韩亚洲中

  • <menu id="yw4o4"></menu>
  • 
    <menu id="yw4o4"><em id="yw4o4"></em></menu>
  • 首頁 > 業(yè)界 > 關(guān)鍵詞  > I2VEdit最新資訊  > 正文

    I2VEdit:修改單幀即可編輯整個視頻 搞定虛擬試妝、風(fēng)格轉(zhuǎn)換

    2024-05-29 15:07 · 稿源:站長之家

    劃重點:

    ?? 利用預(yù)訓(xùn)練的圖像到視頻模型,編輯單幀就能擴(kuò)散到整個視頻

    ?? 包括粗略運動提取和外觀細(xì)化兩個關(guān)鍵過程

    ??保持外觀和運動與原始視頻的一致性,減少質(zhì)量損失的跳躍間隔策略

    站長之家(ChinaZ.com)5月29日 消息:近年來,擴(kuò)散模型在圖像和視頻編輯方面的出色生成能力引發(fā)了廣泛研究。與圖像編輯相比,視頻編輯在時間維度上面臨額外挑戰(zhàn),而圖像編輯已經(jīng)見證了更多種類、高質(zhì)量方法以及像 Photoshop 這樣更強大的軟件的發(fā)展。

    針對這一差距,研究人員引入了一種新穎且通用的解決方案,通過使用預(yù)訓(xùn)練的圖像到視頻模型,將圖像編輯工具的適用范圍擴(kuò)展到視頻中,并將編輯從單幀傳播到整個視頻。他們的方法被稱為 I2VEdit,能夠根據(jù)編輯的程度自適應(yīng)地保留源視頻的視覺和運動完整性,有效處理全局編輯、局部編輯和適度形狀變化,而現(xiàn)有方法無法完全實現(xiàn)。

    image.png

    產(chǎn)品入口:https://top.aibase.com/tool/i2vedit

    該方法的核心包括兩個主要過程:粗略運動提取,用于將基本運動模式與原始視頻進(jìn)行對齊;外觀細(xì)化,用于使用細(xì)粒度的注意力匹配進(jìn)行精確調(diào)整。

    他們還結(jié)合了跳幀策略,以減輕跨多個視頻剪輯的自回歸生成帶來的質(zhì)量下降。實驗結(jié)果表明,他們的框架在細(xì)粒度視頻編輯方面表現(xiàn)出卓越性能,證明了其產(chǎn)生高質(zhì)量、時間上連貫的輸出的能力。

    在應(yīng)用上,I2VEdit可以實現(xiàn)視頻編輯多種牛逼的視覺效果,比如:

    虛擬試穿,使用 I2VEdit可以讓虛擬試穿上升到新的高度,編輯源視頻中的可穿戴對象。

    主題替換,可以替換源視頻的主題。

    風(fēng)格轉(zhuǎn)換,使用 I2VEdit,可以更改源視頻的風(fēng)格。

    舉報

    • 相關(guān)推薦
    • AI日報:Kimi全新音頻基礎(chǔ)模型Kimi-Audio;階躍星辰開源圖像編輯模型Step1X-Edit;?夸克AI超級框上線 “拍照問夸克”

      本期AI日報聚焦多項AI技術(shù)突破與應(yīng)用:1)Moonshot AI推出開源音頻模型Kimi-Audio,基于13億小時訓(xùn)練數(shù)據(jù),支持語音識別等任務(wù);2)階躍星辰開源圖像編輯模型Step1X-Edit,展現(xiàn)強大生成能力;3)夸克AI上線"拍照問夸克"功能,實現(xiàn)視覺問答;4)蘋果iOS18.5將在中國推送,帶來智能功能;5)谷歌發(fā)布601個生成式AI應(yīng)用案例,覆蓋多行業(yè);6)微軟推出深度整合Windows的UFO2自動化系統(tǒng);7)OpenAI升級ChatGPT至GPT-4o版本,提升STEM領(lǐng)域能力;8)Ema公司推出高性價比語言模型EmaFusion;9)Liquid AI發(fā)布面向邊緣設(shè)備的Hyena Edge模型;10)LemonAI推出實時音視頻數(shù)字人產(chǎn)品Slice Live。此外,國內(nèi)方面,智譜與生數(shù)科技達(dá)成戰(zhàn)略合作推動大模型發(fā)展,寶馬中國宣布新車將接入DeepSeek技術(shù)。

    • 騰訊回應(yīng)朋友圈是否上線編輯功能:目前無法修改

      4月20日,微博詞條 #為什么微信還不推出編輯功能# 引發(fā)了廣泛討論。據(jù)媒體報道,對于朋友圈是否上線編輯功能的問題,騰訊客服回應(yīng)稱,目前已經(jīng)發(fā)布的朋友圈無法再次編輯修改,并表示對此帶來的不便表示歉意,同時承諾后續(xù)會不斷優(yōu)化。2020年,微信曾上線朋友圈刪除后可重新編輯的功能。當(dāng)用戶刪除一條朋友圈時,系統(tǒng)會提醒“你刪除

    • AI 潛入Reddit,騙過99%人類!蘇黎世大學(xué)操縱實測“AI洗腦術(shù)”,網(wǎng)友怒炸:我們是實驗鼠?

      蘇黎世大學(xué)研究團(tuán)隊在Reddit的"ChangeMyView"論壇進(jìn)行未經(jīng)授權(quán)的AI操控實驗,引發(fā)爭議。研究人員偽裝成普通用戶發(fā)布1783條評論,成功改變137名用戶觀點,說服率達(dá)18%。實驗采用三類AI角色:通用AI、模仿社區(qū)風(fēng)格的AI和個性化AI(根據(jù)用戶歷史定制說服策略)。最受爭議的是AI會虛構(gòu)身份(如性侵幸存者、殘疾人士等)博取信任。盡管校方辯稱實驗旨在警示AI操控風(fēng)險且內(nèi)?

    • 可靈AI發(fā)布全新2.0模型:上線多模態(tài)視頻編輯功能

      快科技4月16日消息,據(jù)報道,可靈AI在北京舉行靈感成真”2.0模型發(fā)布會,正式發(fā)布可靈2.0視頻生成模型及可圖2.0圖像生成模型。據(jù)介紹,可靈2.0模型在動態(tài)質(zhì)量、語義響應(yīng)、畫面美學(xué)等維度保持領(lǐng)先;可圖2.0模型在指令遵循、電影質(zhì)感及藝術(shù)風(fēng)格表現(xiàn)等方面顯著提升。3月27日,全球AI基準(zhǔn)測試機(jī)構(gòu)Artificial Analysis發(fā)布了最新的全球視頻生成大模型榜單,快手可靈1.6pro(高品質(zhì)模

    • 可靈2.0大師版首發(fā)爆火!排隊半小時實測,視頻編輯能力再升級

      “可靈持續(xù)領(lǐng)先!”4月15日下午,快手宣布可靈AI全系模型進(jìn)入2.0時代。自從上一次可靈1.6更新已過去近3個月,這次基座模型升級,快手高級副總裁、社區(qū)科學(xué)線負(fù)責(zé)人蓋坤在發(fā)布會上自信表示:“可圖2.0現(xiàn)在是行業(yè)領(lǐng)先的圖像模型……可靈2.0,特別在圖生視頻上持續(xù)全球大幅領(lǐng)先!”現(xiàn)場響起了一陣陣歡呼聲和掌聲。“AI新榜”現(xiàn)場拍攝升級后,可靈2.0視頻生成模型(大師版)具

    • 谷歌Gemini整合Veo 2視頻生成模型,8秒720P視頻輕松搞定

      谷歌宣布又有一款 AI 模型將加入 Gemini,但這次它不僅僅是一個聊天機(jī)器人。

    • 馬斯克炫酷變身毒液!實測通義Wan2.1首尾視頻模型,還能“拼接”經(jīng)典梗圖

      在GitHub狂攬1w+星標(biāo)的通義萬相Wan2.1,又雙叒上新了!最新打開方式是醬嬸兒的:給出開始(首幀)和結(jié)束(尾幀)兩張圖片,Wan2.1便能分分鐘生成一段絲滑的5s、720p視頻。根據(jù)前后視角的不同,還能自動調(diào)整鏡頭角度,緩慢變成高空俯拍,并同時保證人物光影正確:原來這是阿里通義萬相Wan2.1最新開源的首尾幀視頻模型,基于Wan2.1文生視頻14B大模型,為創(chuàng)作者們提供更高效、更靈活的

    • 1至5元不等!有人開始售賣ChatGPT生成的“吉卜力風(fēng)格”圖片了

      SNS上出現(xiàn)了售賣吉卜力風(fēng)格圖片的“交易”,一些二手交易平臺上聲稱收到錢后就會幫忙制作吉卜力風(fēng)格圖片的帖子也層出不窮。吉卜力風(fēng)格的圖片轉(zhuǎn)化功能在全球備受歡迎,近一周時間,通過ChatGPT制作的相關(guān)圖片數(shù)量就超過了7億張。想想他們?yōu)榱舜蛟炷撤N獨特風(fēng)格所付出的努力,如今卻遭遇這種無法受到著作權(quán)法保護(hù)的情況,無疑會極大地打擊創(chuàng)作者們的積極性。

    • AI日報:阿里通義萬相首尾視頻模型;豆包開源Seed智能體模型UI-TARS-1.5;OpenAI首發(fā)“智能體實踐指南”

      歡迎來到【AI日報】欄目!這里是你每天探索人工智能世界的指南,每天我們?yōu)槟愠尸F(xiàn)AI領(lǐng)域的熱點內(nèi)容,聚焦開發(fā)者,助你洞悉技術(shù)趨勢、了解創(chuàng)新AI產(chǎn)品應(yīng)用。新鮮AI產(chǎn)品點擊了解:https://top.aibase.com/1、阿里通義萬相首尾幀生視頻模型Wan2.1-FLF2V-14B開源阿里巴巴的通義實驗室在Hugging Face和GitHub上開源了Wan2.1-FLF2V-14B模型,標(biāo)志著AI視頻生成技術(shù)的重大進(jìn)步。該模型支持高清視頻生成

    • V來了!vivo X200 Ultra今晚發(fā)布:參數(shù)全匯總

      快科技4月21日消息,vivo X200 Ultra將于今晚發(fā)布,這次影像能力進(jìn)一步提升,官方直接稱其為V單”。首先在外觀上就非常像一臺微單相機(jī),后攝部分采用了類似餅干頭”的鏡頭風(fēng)格,三款都是玻璃機(jī)身,搭配磨砂效果的直角中框。正面采用6.82英寸2K等深四曲屏,搭載圓偏振光護(hù)眼技術(shù),支持3D單點超聲波指紋,覆蓋鎧甲玻璃,防劃抗摔性能提升。核心搭載驍龍8至尊版,內(nèi)置6000mAh

    熱文

    • 3 天
    • 7天