无码在线播放二区|久久亚洲精品国产精品|无码视频在线观看一区二区|在线观看国产日韩亚洲中

<menu id="yw4o4"></menu>

<menu id="yw4o4"><em id="yw4o4"></em></menu>

<mark id="l49kl"></mark>

<ol id="l49kl"><wbr id="l49kl"></wbr></ol>

谷歌提出生成式圖像動(dòng)力學(xué):讓靜態(tài)圖片動(dòng)起來

2023-09-18 10:12 · 稿源：站長之家

站長之家（ChinaZ.com）9月18日消息:谷歌團(tuán)隊(duì)最新提出「生成圖像動(dòng)力學(xué)」，這項(xiàng)研究提出了一種基于圖像空間的場景動(dòng)力學(xué)先驗(yàn)?zāi)Ｐ?。該模型可以將單張靜態(tài)圖片轉(zhuǎn)換成無縫循環(huán)視頻，或者用于與圖片中的對象進(jìn)行交互。

項(xiàng)目地址：https://generative-dynamics.github.io/#demo

研究人員首先從包含自然振蕩運(yùn)動(dòng)的真實(shí)視頻中，如樹葉搖曳、花朵飄動(dòng)、蠟燭跳動(dòng)和衣物飄揚(yáng)等，提取運(yùn)動(dòng)軌跡。然后利用這些軌跡數(shù)據(jù)訓(xùn)練模型學(xué)習(xí)圖像動(dòng)力學(xué)的先驗(yàn)知識。對于任意輸入圖片，模型可以預(yù)測每個(gè)像素的長期運(yùn)動(dòng)表示，作者稱之為神經(jīng)隨機(jī)運(yùn)動(dòng)紋理。這些表示隨后轉(zhuǎn)換為密集的運(yùn)動(dòng)軌跡，可生成整段視頻。配合圖像渲染模塊，這些軌跡可以用于各種下游應(yīng)用，如將靜態(tài)圖片轉(zhuǎn)換成無縫循環(huán)視頻，或者讓用戶可以與圖片中的對象進(jìn)行交互。

利用神經(jīng)隨機(jī)運(yùn)動(dòng)紋理，研究人員可以模擬對象對用戶交互的響應(yīng)。用戶可以在圖片中拖動(dòng)一個(gè)點(diǎn)，然后釋放手指，場景會根據(jù)點(diǎn)的位置和方向產(chǎn)生相應(yīng)運(yùn)動(dòng)。用戶還可以點(diǎn)擊選擇不同的圖片進(jìn)行交互。

通過調(diào)整運(yùn)動(dòng)紋理的振幅，研究人員可以放大或縮小物體的運(yùn)動(dòng)效果。他們還可以通過插值預(yù)測的運(yùn)動(dòng)紋理來生成慢動(dòng)作視頻。

該方法自動(dòng)將單張靜態(tài)圖片轉(zhuǎn)換成無縫循環(huán)視頻，具有廣闊的應(yīng)用前景。它為創(chuàng)作更加逼真的數(shù)字內(nèi)容提供了可能，如將電影片段的單幀轉(zhuǎn)換為可交互的動(dòng)態(tài)場景。該研究為基于單張圖片合成視頻開辟了新的思路。

特點(diǎn):

（1）從視頻中提取自然運(yùn)動(dòng)軌跡，訓(xùn)練獲得圖像動(dòng)力學(xué)先驗(yàn)?zāi)Ｐ?/p>

（2）對靜態(tài)圖片預(yù)測像素級長期運(yùn)動(dòng)表示，即神經(jīng)隨機(jī)運(yùn)動(dòng)紋理

（3）將運(yùn)動(dòng)紋理轉(zhuǎn)換為密集運(yùn)動(dòng)軌跡，合成動(dòng)態(tài)視頻

（4）支持用戶與圖片中的對象交互

（5）調(diào)整運(yùn)動(dòng)紋理振幅來控制運(yùn)動(dòng)效果

（6）通過插值產(chǎn)生慢動(dòng)作視頻

（舉報(bào)）

相關(guān)推薦

關(guān)鍵詞：

谷歌

阿里開源通義新模型：指定首尾圖片生成視頻

快科技4月18日消息，據(jù)報(bào)道，阿里巴巴旗下通義萬相宣布開源其創(chuàng)新視頻生成技術(shù)首尾幀生視頻14B模型。這項(xiàng)突破性AI技術(shù)能夠根據(jù)用戶提供的起始和結(jié)束畫面，智能生成720p高清過渡視頻，為視頻創(chuàng)作帶來全新可能。該模型通過先進(jìn)的深度學(xué)習(xí)算法，能夠精準(zhǔn)理解輸入畫面的內(nèi)容、風(fēng)格及主題特征。當(dāng)用戶提供首尾兩幀圖像后，模型會智能分析畫面中的視覺元素，包括物體形?

?阿里巴巴 ?通義萬相 ?視頻生成技術(shù)
ChatGPT上線圖庫功能：可管理AI生成圖片

快科技4月16日消息，據(jù)報(bào)道，OpenAI近日宣布將為ChatGPT推出全新的Image Library圖庫功能，該功能將幫助用戶更高效地管理和查看AI生成的圖像。這項(xiàng)創(chuàng)新功能將逐步向所有用戶開放，包括移動(dòng)端和網(wǎng)頁端的免費(fèi)版、Plus版及Pro版用戶。新功能的設(shè)計(jì)充分考慮了用戶體驗(yàn)的便捷性。用戶只需點(diǎn)擊ChatGPT側(cè)邊欄的Library入口，就能進(jìn)入一個(gè)直觀的圖像網(wǎng)格界面。在這個(gè)界面中，用戶可以輕?

?OpenAI ?ChatGPT ?Image
1至5元不等！有人開始售賣ChatGPT生成的“吉卜力風(fēng)格”圖片了

SNS上出現(xiàn)了售賣吉卜力風(fēng)格圖片的“交易”，一些二手交易平臺上聲稱收到錢后就會幫忙制作吉卜力風(fēng)格圖片的帖子也層出不窮。吉卜力風(fēng)格的圖片轉(zhuǎn)化功能在全球備受歡迎，近一周時(shí)間，通過ChatGPT制作的相關(guān)圖片數(shù)量就超過了7億張。想想他們?yōu)榱舜蛟炷撤N獨(dú)特風(fēng)格所付出的努力，如今卻遭遇這種無法受到著作權(quán)法保護(hù)的情況，無疑會極大地打擊創(chuàng)作者們的積極性。

?動(dòng)畫風(fēng)格圖片 ?ChatGPT ?吉卜力風(fēng)格
字節(jié)發(fā)布豆包1.5深度思考模型：“實(shí)拍級”圖像生成

快科技4月17日消息，據(jù)報(bào)道，今日，在火山引擎AI創(chuàng)新巡展杭州站的現(xiàn)場，字節(jié)跳動(dòng)旗下火山引擎總裁譚待正式發(fā)布了備受矚目的豆包1.5深度思考模型。譚待指出，豆包1.5深度思考模型在多個(gè)關(guān)鍵領(lǐng)域展現(xiàn)出卓越性能。在數(shù)學(xué)、編程、科學(xué)推理這類專業(yè)領(lǐng)域中，它能夠精準(zhǔn)高效地處理復(fù)雜問題；在創(chuàng)意寫作等通用任務(wù)方面，同樣表現(xiàn)出色。該模型采用MoE架構(gòu)，總參數(shù)為200B，激?

?豆包1.5深度思考模型 ?火山引擎AI創(chuàng)新 ?字節(jié)跳動(dòng)技術(shù)發(fā)布
薦UniToken：多模態(tài)AI的“全能選手”，一次編碼搞定圖文理解與圖像生成

復(fù)旦大學(xué)與美團(tuán)研究者提出UniToken框架，首次在統(tǒng)一模型中實(shí)現(xiàn)圖文理解與生成任務(wù)的"雙優(yōu)表現(xiàn)"。該方案融合連續(xù)和離散視覺編碼，有效解決了傳統(tǒng)多模態(tài)建模中的"任務(wù)干擾"和"表示割裂"問題。通過三階段訓(xùn)練策略（視覺語義對齊、多任務(wù)聯(lián)合訓(xùn)練、指令強(qiáng)化微調(diào)），UniToken在多個(gè)基準(zhǔn)測試中性能超越專用模型。其創(chuàng)新性體現(xiàn)在：1）統(tǒng)一的雙邊視覺編碼

?UniToken ?多模態(tài)建模 ?視覺編碼
Adobe 發(fā)布 Firefly 系列產(chǎn)品，涵蓋圖片、視頻、矢量等

Firefly 通過在單一空間內(nèi)提供圖像、視頻、音頻和矢量生成功能，將為基于人工智能的創(chuàng)意制作體驗(yàn)帶來革新……

?adobe ?firefly ?AI模型
微信加好友能加圖片備注了目前還在灰度測試中

微信近日測試"圖片備注"新功能，用戶添加好友后若對方發(fā)送圖片，可直接點(diǎn)擊圖片上方按鈕將圖片保存至該好友的備注信息中。該功能簡化了為好友添加個(gè)性化備注的流程，特別適合快速記錄初次見面的印象或特定場景照片標(biāo)識。目前該功能已進(jìn)入大規(guī)模測試階段，不少用戶反饋已在微信界面看到這一新增選項(xiàng)。這體現(xiàn)了微信持續(xù)優(yōu)化用戶體驗(yàn)、探索社交互動(dòng)新方式的努力。

?微信 ?圖片備注 ?用戶體驗(yàn)
微信首個(gè)AI助手元寶上線：支持分析公眾號文章、文件、圖片

快科技4月17日消息，日前，微信首個(gè)AI助手元寶上線，用戶可在微信搜索元寶”，添加好友后可進(jìn)行對話。與元寶AI助手對話無需下載或跳轉(zhuǎn)其他App、小程序，而是以好友的形式出現(xiàn)在通訊錄，聊天時(shí)甚至還會顯示對方正在輸入...”，就像與真實(shí)好友對話一樣。據(jù)介紹，元寶AI是騰訊元寶App入駐微信的AI助手，搭載混元和DeepSeek雙模引擎，無縫銜接微信生態(tài)。元寶AI可一鍵解析公?

?微信AI助手 ?騰訊元寶 ?聊天機(jī)器人
微美全息（WIMI.US）探索量子圖像壓縮算法，引領(lǐng)圖像處理領(lǐng)域顛覆性創(chuàng)新

量子計(jì)算作為信息技術(shù)領(lǐng)域的顛覆性力量，其在量子圖像處理和圖像壓縮領(lǐng)域也顯示出巨大的技術(shù)潛力。隨著數(shù)字圖像處理技術(shù)的不斷演進(jìn)，傳統(tǒng)圖像處理算法，本質(zhì)上依賴于并行計(jì)算，然，隨著圖像數(shù)量和分辨率的快速增長，這些經(jīng)典算法在計(jì)算資源和時(shí)間消耗上存在局限性。量子圖像壓縮技術(shù)的深入研究也將促進(jìn)量子算法和量子信息處理理論的進(jìn)一步發(fā)展，為量子信息技術(shù)的廣泛應(yīng)用奠定堅(jiān)實(shí)基礎(chǔ)，推動(dòng)數(shù)字圖像處理技術(shù)邁向新的高度，實(shí)現(xiàn)更高效、更智能的圖像處理和壓縮。

?量子計(jì)算 ?圖像處理 ?圖像壓縮
薦日銷破千元！AI生成的3D梗圖掛件，被我們賣爆了

先說結(jié)論:我們花15天做的AI3D掛件，在線下賣爆了，單日營收破千元!故事的開始，是因?yàn)槲覀儼l(fā)現(xiàn)把AI3D打印手辦做成一門小生意的可行性越來越高，這也激發(fā)了我們的“搞錢基因”。再加上前不久新榜在上海舉辦了「新榜內(nèi)容節(jié)」，一拍即合，我們于是做了一批模型去大會現(xiàn)場擺攤試水!最后結(jié)果還不錯(cuò)，單日最高收入突破1000元，是我們“創(chuàng)業(yè)史”上的一個(gè)高光表現(xiàn)。歡迎大家

?AI ?3D打印 ?創(chuàng)業(yè)經(jīng)驗(yàn)

熱文

3 天
7天

站長商機(jī)

廣告

商務(wù)合作侵權(quán)投訴廣告服務(wù) 版權(quán)聲明招聘

?CopyRight 2002-2020 CHINAZ.COM

<mark id="wfyyl"><wbr id="wfyyl"><code id="wfyyl"></code></wbr></mark>