无码在线播放二区|久久亚洲精品国产精品|无码视频在线观看一区二区|在线观看国产日韩亚洲中

<menu id="yw4o4"></menu>

<menu id="yw4o4"><em id="yw4o4"></em></menu>

I2VEdit：修改單幀即可編輯整個視頻搞定虛擬試妝、風(fēng)格轉(zhuǎn)換

2024-05-29 15:07 · 稿源：站長之家

劃重點:
?? 利用預(yù)訓(xùn)練的圖像到視頻模型，編輯單幀就能擴(kuò)散到整個視頻
?? 包括粗略運動提取和外觀細(xì)化兩個關(guān)鍵過程
??保持外觀和運動與原始視頻的一致性，減少質(zhì)量損失的跳躍間隔策略

站長之家（ChinaZ.com）5月29日消息:近年來，擴(kuò)散模型在圖像和視頻編輯方面的出色生成能力引發(fā)了廣泛研究。與圖像編輯相比，視頻編輯在時間維度上面臨額外挑戰(zhàn)，而圖像編輯已經(jīng)見證了更多種類、高質(zhì)量方法以及像 Photoshop 這樣更強大的軟件的發(fā)展。

針對這一差距，研究人員引入了一種新穎且通用的解決方案，通過使用預(yù)訓(xùn)練的圖像到視頻模型，將圖像編輯工具的適用范圍擴(kuò)展到視頻中，并將編輯從單幀傳播到整個視頻。他們的方法被稱為 I2VEdit，能夠根據(jù)編輯的程度自適應(yīng)地保留源視頻的視覺和運動完整性，有效處理全局編輯、局部編輯和適度形狀變化，而現(xiàn)有方法無法完全實現(xiàn)。

產(chǎn)品入口：https://top.aibase.com/tool/i2vedit

該方法的核心包括兩個主要過程:粗略運動提取，用于將基本運動模式與原始視頻進(jìn)行對齊;外觀細(xì)化，用于使用細(xì)粒度的注意力匹配進(jìn)行精確調(diào)整。

他們還結(jié)合了跳幀策略，以減輕跨多個視頻剪輯的自回歸生成帶來的質(zhì)量下降。實驗結(jié)果表明，他們的框架在細(xì)粒度視頻編輯方面表現(xiàn)出卓越性能，證明了其產(chǎn)生高質(zhì)量、時間上連貫的輸出的能力。

在應(yīng)用上，I2VEdit可以實現(xiàn)視頻編輯多種牛逼的視覺效果，比如:

虛擬試穿，使用 I2VEdit可以讓虛擬試穿上升到新的高度，編輯源視頻中的可穿戴對象。

主題替換，可以替換源視頻的主題。

風(fēng)格轉(zhuǎn)換，使用 I2VEdit，可以更改源視頻的風(fēng)格。

（舉報）

相關(guān)推薦

關(guān)鍵詞：

薦AI日報：Kimi全新音頻基礎(chǔ)模型Kimi-Audio；階躍星辰開源圖像編輯模型Step1X-Edit；?夸克AI超級框上線 “拍照問夸克”

本期AI日報聚焦多項AI技術(shù)突破與應(yīng)用：1)Moonshot AI推出開源音頻模型Kimi-Audio，基于13億小時訓(xùn)練數(shù)據(jù)，支持語音識別等任務(wù)；2)階躍星辰開源圖像編輯模型Step1X-Edit，展現(xiàn)強大生成能力；3)夸克AI上線"拍照問夸克"功能，實現(xiàn)視覺問答；4)蘋果iOS18.5將在中國推送，帶來智能功能；5)谷歌發(fā)布601個生成式AI應(yīng)用案例，覆蓋多行業(yè)；6)微軟推出深度整合Windows的UFO2自動化系統(tǒng)；7)OpenAI升級ChatGPT至GPT-4o版本，提升STEM領(lǐng)域能力；8)Ema公司推出高性價比語言模型EmaFusion；9)Liquid AI發(fā)布面向邊緣設(shè)備的Hyena Edge模型；10)LemonAI推出實時音視頻數(shù)字人產(chǎn)品Slice Live。此外，國內(nèi)方面，智譜與生數(shù)科技達(dá)成戰(zhàn)略合作推動大模型發(fā)展，寶馬中國宣布新車將接入DeepSeek技術(shù)。

?AI日報 ?音頻技術(shù) ?開源模型
騰訊回應(yīng)朋友圈是否上線編輯功能：目前無法修改

4月20日，微博詞條 #為什么微信還不推出編輯功能# 引發(fā)了廣泛討論。據(jù)媒體報道，對于朋友圈是否上線編輯功能的問題，騰訊客服回應(yīng)稱，目前已經(jīng)發(fā)布的朋友圈無法再次編輯修改，并表示對此帶來的不便表示歉意，同時承諾后續(xù)會不斷優(yōu)化。2020年，微信曾上線朋友圈刪除后可重新編輯的功能。當(dāng)用戶刪除一條朋友圈時，系統(tǒng)會提醒“你刪除

?微信 ?編輯功能 ?朋友圈
薦AI 潛入Reddit，騙過99%人類！蘇黎世大學(xué)操縱實測“AI洗腦術(shù)”，網(wǎng)友怒炸：我們是實驗鼠？

蘇黎世大學(xué)研究團(tuán)隊在Reddit的"ChangeMyView"論壇進(jìn)行未經(jīng)授權(quán)的AI操控實驗，引發(fā)爭議。研究人員偽裝成普通用戶發(fā)布1783條評論，成功改變137名用戶觀點，說服率達(dá)18%。實驗采用三類AI角色：通用AI、模仿社區(qū)風(fēng)格的AI和個性化AI（根據(jù)用戶歷史定制說服策略）。最受爭議的是AI會虛構(gòu)身份（如性侵幸存者、殘疾人士等）博取信任。盡管校方辯稱實驗旨在警示AI操控風(fēng)險且內(nèi)?

?AI實驗 ?社交媒體影響 ?觀點操控
可靈AI發(fā)布全新2.0模型：上線多模態(tài)視頻編輯功能

快科技4月16日消息，據(jù)報道，可靈AI在北京舉行靈感成真”2.0模型發(fā)布會，正式發(fā)布可靈2.0視頻生成模型及可圖2.0圖像生成模型。據(jù)介紹，可靈2.0模型在動態(tài)質(zhì)量、語義響應(yīng)、畫面美學(xué)等維度保持領(lǐng)先；可圖2.0模型在指令遵循、電影質(zhì)感及藝術(shù)風(fēng)格表現(xiàn)等方面顯著提升。3月27日，全球AI基準(zhǔn)測試機(jī)構(gòu)Artificial Analysis發(fā)布了最新的全球視頻生成大模型榜單，快手可靈1.6pro（高品質(zhì)模

?可靈AI ?視頻生成模型 ?圖像生成模型
薦可靈2.0大師版首發(fā)爆火！排隊半小時實測，視頻編輯能力再升級

“可靈持續(xù)領(lǐng)先!”4月15日下午，快手宣布可靈AI全系模型進(jìn)入2.0時代。自從上一次可靈1.6更新已過去近3個月，這次基座模型升級，快手高級副總裁、社區(qū)科學(xué)線負(fù)責(zé)人蓋坤在發(fā)布會上自信表示:“可圖2.0現(xiàn)在是行業(yè)領(lǐng)先的圖像模型……可靈2.0，特別在圖生視頻上持續(xù)全球大幅領(lǐng)先!”現(xiàn)場響起了一陣陣歡呼聲和掌聲。“AI新榜”現(xiàn)場拍攝升級后，可靈2.0視頻生成模型（大師版）具

?快手 ?可靈AI ?圖生視頻
谷歌Gemini整合Veo 2視頻生成模型，8秒720P視頻輕松搞定

谷歌宣布又有一款 AI 模型將加入 Gemini，但這次它不僅僅是一個聊天機(jī)器人。

?谷歌 ?谷歌gemini ?veo2
薦馬斯克炫酷變身毒液！實測通義Wan2.1首尾幀視頻模型，還能“拼接”經(jīng)典梗圖

在GitHub狂攬1w+星標(biāo)的通義萬相Wan2.1，又雙叒上新了!最新打開方式是醬嬸兒的:給出開始（首幀）和結(jié)束(尾幀)兩張圖片，Wan2.1便能分分鐘生成一段絲滑的5s、720p視頻。根據(jù)前后視角的不同，還能自動調(diào)整鏡頭角度，緩慢變成高空俯拍，并同時保證人物光影正確:原來這是阿里通義萬相Wan2.1最新開源的首尾幀視頻模型，基于Wan2.1文生視頻14B大模型，為創(chuàng)作者們提供更高效、更靈活的

?視頻生成 ?開源模型 ?阿里通義萬相
1至5元不等！有人開始售賣ChatGPT生成的“吉卜力風(fēng)格”圖片了

SNS上出現(xiàn)了售賣吉卜力風(fēng)格圖片的“交易”，一些二手交易平臺上聲稱收到錢后就會幫忙制作吉卜力風(fēng)格圖片的帖子也層出不窮。吉卜力風(fēng)格的圖片轉(zhuǎn)化功能在全球備受歡迎，近一周時間，通過ChatGPT制作的相關(guān)圖片數(shù)量就超過了7億張。想想他們?yōu)榱舜蛟炷撤N獨特風(fēng)格所付出的努力，如今卻遭遇這種無法受到著作權(quán)法保護(hù)的情況，無疑會極大地打擊創(chuàng)作者們的積極性。

?動畫風(fēng)格圖片 ?ChatGPT ?吉卜力風(fēng)格
薦AI日報：阿里通義萬相首尾幀生視頻模型；豆包開源Seed智能體模型UI-TARS-1.5；OpenAI首發(fā)“智能體實踐指南”

歡迎來到【AI日報】欄目!這里是你每天探索人工智能世界的指南，每天我們?yōu)槟愠尸F(xiàn)AI領(lǐng)域的熱點內(nèi)容，聚焦開發(fā)者，助你洞悉技術(shù)趨勢、了解創(chuàng)新AI產(chǎn)品應(yīng)用。新鮮AI產(chǎn)品點擊了解:https://top.aibase.com/1、阿里通義萬相首尾幀生視頻模型Wan2.1-FLF2V-14B開源阿里巴巴的通義實驗室在Hugging Face和GitHub上開源了Wan2.1-FLF2V-14B模型，標(biāo)志著AI視頻生成技術(shù)的重大進(jìn)步。該模型支持高清視頻生成

?AI視頻生成 ?開源模型 ?阿里巴巴
V單來了！vivo X200 Ultra今晚發(fā)布：參數(shù)全匯總

快科技4月21日消息，vivo X200 Ultra將于今晚發(fā)布，這次影像能力進(jìn)一步提升，官方直接稱其為V單”。首先在外觀上就非常像一臺微單相機(jī)，后攝部分采用了類似餅干頭”的鏡頭風(fēng)格，三款都是玻璃機(jī)身，搭配磨砂效果的直角中框。正面采用6.82英寸2K等深四曲屏，搭載圓偏振光護(hù)眼技術(shù)，支持3D單點超聲波指紋，覆蓋鎧甲玻璃，防劃抗摔性能提升。核心搭載驍龍8至尊版，內(nèi)置6000mAh

?vivo ?X200 ?Ultra

熱文

3 天
7天

站長商機(jī)

廣告

商務(wù)合作侵權(quán)投訴廣告服務(wù) 版權(quán)聲明招聘

?CopyRight 2002-2020 CHINAZ.COM