无码在线播放二区|久久亚洲精品国产精品|无码视频在线观看一区二区|在线观看国产日韩亚洲中

  • <menu id="yw4o4"></menu>
  • 
    <menu id="yw4o4"><em id="yw4o4"></em></menu>
  • 首頁 > 業(yè)界 > 關(guān)鍵詞  > 抖音最新資訊  > 正文

    字節(jié)跳動(dòng)放大招!OmniHuman數(shù)字人模型即將上線:一張圖+一段音頻即可生成視頻

    2025-02-07 19:34 · 稿源: 快科技

    AI視頻生成新突破:只需圖片和音頻,即可輕松制作生動(dòng)短片!

    科技界傳來激動(dòng)人心的消息!近期,抖音旗下圖片視頻工具即夢AI宣布即將推出令人驚嘆的新功能。

    這款全新功能采用了先進(jìn)的多模態(tài)視頻生成模型 OmniHuman為創(chuàng)作者帶來了前所未有的便利。只需提供一張圖片和一段音頻,該模型就能生成一條栩栩如生的 AI 視頻,大幅提升視頻制作的效率和質(zhì)量。

    OmniHuman 技術(shù)主頁透露,該模型由字節(jié)跳動(dòng)自主研發(fā),支持輸入各種尺寸的圖片,包括肖像、半身和全身。根據(jù)輸入的音頻,OmniHuman 可自動(dòng)生成人物與其匹配的動(dòng)作,包括演講、演唱、演奏樂器和移動(dòng)。

    對于人物視頻生成中的常見問題,如手勢崩壞,OmniHuman 也做出了顯著的改進(jìn)。此外,該模型還支持輸入動(dòng)漫和 3D 卡通等非真人圖片,并能保持原有的風(fēng)格和動(dòng)作。

    從展示的演示效果來看,OmniHuman 的生成效果令人印象深刻,具有較高的自然度。為了防止該技術(shù)被濫用,字節(jié)跳動(dòng)技術(shù)團(tuán)隊(duì)特別強(qiáng)調(diào),OmniHuman 將不會(huì)對外提供下載。

    即夢 AI 相關(guān)負(fù)責(zé)人透露,OmniHuman 目前已具備不俗的表現(xiàn),但生成影視級別視頻仍有提升空間。搭載 OmniHuman 的多模態(tài)視頻生成功能將首先在即夢上進(jìn)行小范圍測試,并逐步開放。

    該負(fù)責(zé)人還表示,即夢將對該功能實(shí)施嚴(yán)格的安全審核機(jī)制,并在輸出視頻上標(biāo)注水印以提醒用戶。此舉旨在確保 AI 技術(shù)發(fā)揮積極作用,幫助視頻創(chuàng)作者充分發(fā)揮想象力。

    舉報(bào)

    • 相關(guān)推薦
    • 字節(jié)跳動(dòng)AI眼鏡有新動(dòng)作! 已和供應(yīng)商“搭上線

      有知情人士透露了字節(jié)跳動(dòng)在AI硬件領(lǐng)域的又一重大布局計(jì)劃推出自家的AI智能眼鏡。字節(jié)跳動(dòng)自去年起便已啟動(dòng)AI眼鏡項(xiàng)目。意在為豆包尋找更廣泛的C端應(yīng)用場景,提升用戶粘性和使用頻率;另一方面,通過打通軟硬件,構(gòu)建更加完整的生態(tài)系統(tǒng),為公司的長遠(yuǎn)發(fā)展奠定堅(jiān)實(shí)基礎(chǔ)。

    • 阿里開源通義新模型:指定首尾圖片生成視頻

      快科技4月18日消息,據(jù)報(bào)道,阿里巴巴旗下通義萬相宣布開源其創(chuàng)新視頻生成技術(shù)首尾幀生視頻14B模型。這項(xiàng)突破性AI技術(shù)能夠根據(jù)用戶提供的起始和結(jié)束畫面,智能生成720p高清過渡視頻,為視頻創(chuàng)作帶來全新可能。該模型通過先進(jìn)的深度學(xué)習(xí)算法,能夠精準(zhǔn)理解輸入畫面的內(nèi)容、風(fēng)格及主題特征。當(dāng)用戶提供首尾兩幀圖像后,模型會(huì)智能分析畫面中的視覺元素,包括物體形?

    • 寶馬×字節(jié)跳動(dòng):以AI賦能汽車營銷創(chuàng)新變革

      4月18日,華晨寶馬旗下領(lǐng)悅數(shù)字信息技術(shù)公司與字節(jié)跳動(dòng)旗下火山引擎達(dá)成合作,雙方將圍繞AI技術(shù)在汽車營銷服務(wù)的創(chuàng)新應(yīng)用展開深度合作。通過AI+場景的高效匹配,實(shí)現(xiàn)產(chǎn)品精準(zhǔn)推薦、內(nèi)容智能引導(dǎo),提升用戶購車體驗(yàn)與經(jīng)銷商運(yùn)營效率。寶馬集團(tuán)大中華區(qū)總裁高翔表示,此次合作是寶馬"360度全鏈AI戰(zhàn)略"在營銷領(lǐng)域的重要實(shí)踐。領(lǐng)悅公司將借助火山引擎的大模型技術(shù),打造專屬智能營銷工具,提供24小時(shí)在線客服、個(gè)性化推薦等服務(wù)。這是雙方自2019年以來的第三次合作,此前已在數(shù)字化運(yùn)營、直播營銷等領(lǐng)域取得成果。此次合作標(biāo)志著寶馬加速推進(jìn)AI技術(shù)在全業(yè)務(wù)鏈的應(yīng)用,持續(xù)深化中國市場數(shù)字化轉(zhuǎn)型。

    • 苦等一年 Meta終于放大招 正式發(fā)布開源大模型Llama 4

      美國科技巨擘Meta重磅推出其迄今最為強(qiáng)大的開源AI模型Llama4,恰逢Llama3上市一周年之際。Llama4系列采用了先進(jìn)的混合專家架構(gòu),這一架構(gòu)在模型訓(xùn)練及用戶查詢回答過程中展現(xiàn)出更高效率,通過將模型劃分為多個(gè)專注于特定任務(wù)的專家”子模型,實(shí)現(xiàn)精準(zhǔn)高效的處理。Meta首席執(zhí)行官扎克伯格表示:他們的目標(biāo)是建立世界領(lǐng)先的人工智能,將其開源,并使其普遍可用,以便世界上每個(gè)人都能受益。

    • 字節(jié)發(fā)布豆包1.5深度思考模型:“實(shí)拍級”圖像生成

      快科技4月17日消息,據(jù)報(bào)道,今日,在火山引擎AI創(chuàng)新巡展杭州站的現(xiàn)場,字節(jié)跳動(dòng)旗下火山引擎總裁譚待正式發(fā)布了備受矚目的豆包1.5深度思考模型。譚待指出,豆包1.5深度思考模型在多個(gè)關(guān)鍵領(lǐng)域展現(xiàn)出卓越性能。在數(shù)學(xué)、編程、科學(xué)推理這類專業(yè)領(lǐng)域中,它能夠精準(zhǔn)高效地處理復(fù)雜問題;在創(chuàng)意寫作等通用任務(wù)方面,同樣表現(xiàn)出色。該模型采用MoE架構(gòu),總參數(shù)為200B,激?

    • 滴滴放大招!20億助力穩(wěn)就業(yè)促消費(fèi) 積極應(yīng)對外部挑戰(zhàn)

      近日,滴滴宣布將追加投入20億元專項(xiàng)資金,聚焦穩(wěn)就業(yè)促消費(fèi)”,切實(shí)發(fā)揮平臺(tái)企業(yè)責(zé)任,積極應(yīng)對外部不確定性帶來的挑戰(zhàn)。2024年已有數(shù)百萬網(wǎng)約車司機(jī)通過滴滴獲得收入。為進(jìn)一步激發(fā)出行活力,滴滴將在2025年追加投入10億元用于乘客補(bǔ)貼,穩(wěn)定司機(jī)收入水平的同時(shí),提升用戶出行頻率,有效帶動(dòng)關(guān)聯(lián)消費(fèi)活力。

    • 接替Manus,字節(jié)的Agent王牌能打多久?

      字節(jié)跳動(dòng)旗下智能體平臺(tái)"扣子空間"推出首款由大廠發(fā)布的Agent爆款產(chǎn)品,自4月18日上線后引發(fā)用戶瘋搶邀請碼。該產(chǎn)品具備規(guī)劃、工具調(diào)用和記憶等關(guān)鍵能力,支持游戲攻略撰寫、市場調(diào)研等復(fù)雜需求,并首創(chuàng)"探索模式"和"規(guī)劃模式"雙交互設(shè)計(jì)。雖然底層模型能力較DeepResearch和Manus仍有差距,但憑借產(chǎn)品設(shè)計(jì)優(yōu)化和量大價(jià)優(yōu)的優(yōu)勢,成功填補(bǔ)了Manus留下的市場空白。字節(jié)同步推出企業(yè)版HiAgent解決私有化部署問題,半年內(nèi)智能體業(yè)務(wù)訂單量增長超330%。當(dāng)前行業(yè)正迎來Agent爆發(fā)期,但企業(yè)落地仍面臨系統(tǒng)接入、數(shù)據(jù)安全等挑戰(zhàn)。

    • AI日報(bào):昆侖萬維開源Skywork-OR1系列模型;訊飛星辰Agent開發(fā)平臺(tái)全面支持MCP;字節(jié)跳動(dòng)布局AI智能眼鏡

      歡迎來到【AI日報(bào)】欄目!這里是你每天探索人工智能世界的指南,每天我們?yōu)槟愠尸F(xiàn)AI領(lǐng)域的熱點(diǎn)內(nèi)容,聚焦開發(fā)者,助你洞悉技術(shù)趨勢、了解創(chuàng)新AI產(chǎn)品應(yīng)用。新鮮AI產(chǎn)品點(diǎn)擊了解:https://top.aibase.com/1、Kimi開源視覺語言模型 Kimi-VL 與 Kimi-VL-Thinking,多項(xiàng)基準(zhǔn)超越 GPT-4oMoonshot AI 最近開源了 Kimi-VL 和 Kimi-VL-Thinking 兩款視覺語言模型,展現(xiàn)出卓越的多模態(tài)理解與推理能力。這些模型采

    • 16樓住戶洗衣機(jī)中現(xiàn)活蛇 家人被嚇哭:跑后只剩一段蛇皮

      4月19日,山西運(yùn)城一居民樓內(nèi)發(fā)生了一起令人驚詫的事件。當(dāng)日,某單元16樓的一戶居民家中,在正常使用洗衣機(jī)時(shí),竟意外發(fā)現(xiàn)洗衣機(jī)內(nèi)盤踞著一條活蛇,這一幕讓在場家人驚恐萬分,甚至有人被嚇得當(dāng)場落淚。據(jù)該戶居民回憶,事發(fā)時(shí)家中并無異常聲響或跡象,直至打開洗衣機(jī)準(zhǔn)備清洗衣物時(shí),才突然發(fā)現(xiàn)這條不速之客。面對這突如其來的狀況,家人迅速在房間內(nèi)展開搜尋

    • 迅雷一鍵即可完成大模型下載

      近日,迅雷為提升用戶使用體驗(yàn),讓用戶能夠更快更好地批量下載大模型所有文件,已針對大模型下載場景進(jìn)行了優(yōu)化,并上線了新版本插件,下載迅雷客戶端且在瀏覽器安裝迅雷插件即可使用。值得一提的是,在使用迅雷該插件功能創(chuàng)建任務(wù)時(shí),將同時(shí)創(chuàng)建相對應(yīng)的文件夾,下載完成后,所有文件都將在一個(gè)文件夾中,相比傳統(tǒng)瀏覽器——需要用戶逐個(gè)手動(dòng)點(diǎn)擊下載圖標(biāo)并?