无码在线播放二区|久久亚洲精品国产精品|无码视频在线观看一区二区|在线观看国产日韩亚洲中

<menu id="yw4o4"></menu>

<menu id="yw4o4"><em id="yw4o4"></em></menu>

字節(jié)跳動(dòng)放大招！OmniHuman數(shù)字人模型即將上線：一張圖+一段音頻即可生成視頻

2025-02-07 19:34 · 稿源：快科技

AI視頻生成新突破：只需圖片和音頻，即可輕松制作生動(dòng)短片！

科技界傳來激動(dòng)人心的消息！近期，抖音旗下圖片視頻工具即夢AI宣布即將推出令人驚嘆的新功能。

這款全新功能采用了先進(jìn)的多模態(tài)視頻生成模型 OmniHuman，為創(chuàng)作者帶來了前所未有的便利。只需提供一張圖片和一段音頻，該模型就能生成一條栩栩如生的 AI 視頻，大幅提升視頻制作的效率和質(zhì)量。

OmniHuman 技術(shù)主頁透露，該模型由字節(jié)跳動(dòng)自主研發(fā)，支持輸入各種尺寸的圖片，包括肖像、半身和全身。根據(jù)輸入的音頻，OmniHuman 可自動(dòng)生成人物與其匹配的動(dòng)作，包括演講、演唱、演奏樂器和移動(dòng)。

對于人物視頻生成中的常見問題，如手勢崩壞，OmniHuman 也做出了顯著的改進(jìn)。此外，該模型還支持輸入動(dòng)漫和 3D 卡通等非真人圖片，并能保持原有的風(fēng)格和動(dòng)作。

從展示的演示效果來看，OmniHuman 的生成效果令人印象深刻，具有較高的自然度。為了防止該技術(shù)被濫用，字節(jié)跳動(dòng)技術(shù)團(tuán)隊(duì)特別強(qiáng)調(diào)，OmniHuman 將不會(huì)對外提供下載。

即夢 AI 相關(guān)負(fù)責(zé)人透露，OmniHuman 目前已具備不俗的表現(xiàn)，但生成影視級別視頻仍有提升空間。搭載 OmniHuman 的多模態(tài)視頻生成功能將首先在即夢上進(jìn)行小范圍測試，并逐步開放。

該負(fù)責(zé)人還表示，即夢將對該功能實(shí)施嚴(yán)格的安全審核機(jī)制，并在輸出視頻上標(biāo)注水印以提醒用戶。此舉旨在確保 AI 技術(shù)發(fā)揮積極作用，幫助視頻創(chuàng)作者充分發(fā)揮想象力。

（舉報(bào)）

相關(guān)推薦

關(guān)鍵詞：

傳字節(jié)跳動(dòng)AI眼鏡有新動(dòng)作！已和供應(yīng)商“搭上線”

有知情人士透露了字節(jié)跳動(dòng)在AI硬件領(lǐng)域的又一重大布局計(jì)劃推出自家的AI智能眼鏡。字節(jié)跳動(dòng)自去年起便已啟動(dòng)AI眼鏡項(xiàng)目。意在為豆包尋找更廣泛的C端應(yīng)用場景，提升用戶粘性和使用頻率；另一方面，通過打通軟硬件，構(gòu)建更加完整的生態(tài)系統(tǒng)，為公司的長遠(yuǎn)發(fā)展奠定堅(jiān)實(shí)基礎(chǔ)。

?字節(jié)跳動(dòng) ?AI硬件 ?智能眼鏡
阿里開源通義新模型：指定首尾圖片生成視頻

快科技4月18日消息，據(jù)報(bào)道，阿里巴巴旗下通義萬相宣布開源其創(chuàng)新視頻生成技術(shù)首尾幀生視頻14B模型。這項(xiàng)突破性AI技術(shù)能夠根據(jù)用戶提供的起始和結(jié)束畫面，智能生成720p高清過渡視頻，為視頻創(chuàng)作帶來全新可能。該模型通過先進(jìn)的深度學(xué)習(xí)算法，能夠精準(zhǔn)理解輸入畫面的內(nèi)容、風(fēng)格及主題特征。當(dāng)用戶提供首尾兩幀圖像后，模型會(huì)智能分析畫面中的視覺元素，包括物體形?

?阿里巴巴 ?通義萬相 ?視頻生成技術(shù)
寶馬×字節(jié)跳動(dòng)：以AI賦能汽車營銷創(chuàng)新變革

4月18日，華晨寶馬旗下領(lǐng)悅數(shù)字信息技術(shù)公司與字節(jié)跳動(dòng)旗下火山引擎達(dá)成合作，雙方將圍繞AI技術(shù)在汽車營銷服務(wù)的創(chuàng)新應(yīng)用展開深度合作。通過AI+場景的高效匹配，實(shí)現(xiàn)產(chǎn)品精準(zhǔn)推薦、內(nèi)容智能引導(dǎo)，提升用戶購車體驗(yàn)與經(jīng)銷商運(yùn)營效率。寶馬集團(tuán)大中華區(qū)總裁高翔表示，此次合作是寶馬"360度全鏈AI戰(zhàn)略"在營銷領(lǐng)域的重要實(shí)踐。領(lǐng)悅公司將借助火山引擎的大模型技術(shù)，打造專屬智能營銷工具，提供24小時(shí)在線客服、個(gè)性化推薦等服務(wù)。這是雙方自2019年以來的第三次合作，此前已在數(shù)字化運(yùn)營、直播營銷等領(lǐng)域取得成果。此次合作標(biāo)志著寶馬加速推進(jìn)AI技術(shù)在全業(yè)務(wù)鏈的應(yīng)用，持續(xù)深化中國市場數(shù)字化轉(zhuǎn)型。

?華晨寶馬 ?人工智能 ?營銷服務(wù)
苦等一年 Meta終于放大招正式發(fā)布開源大模型Llama 4

美國科技巨擘Meta重磅推出其迄今最為強(qiáng)大的開源AI模型Llama4，恰逢Llama3上市一周年之際。Llama4系列采用了先進(jìn)的混合專家架構(gòu)，這一架構(gòu)在模型訓(xùn)練及用戶查詢回答過程中展現(xiàn)出更高效率，通過將模型劃分為多個(gè)專注于特定任務(wù)的專家”子模型，實(shí)現(xiàn)精準(zhǔn)高效的處理。Meta首席執(zhí)行官扎克伯格表示：他們的目標(biāo)是建立世界領(lǐng)先的人工智能，將其開源，并使其普遍可用，以便世界上每個(gè)人都能受益。

?Meta ?Llama ?4
字節(jié)發(fā)布豆包1.5深度思考模型：“實(shí)拍級”圖像生成

快科技4月17日消息，據(jù)報(bào)道，今日，在火山引擎AI創(chuàng)新巡展杭州站的現(xiàn)場，字節(jié)跳動(dòng)旗下火山引擎總裁譚待正式發(fā)布了備受矚目的豆包1.5深度思考模型。譚待指出，豆包1.5深度思考模型在多個(gè)關(guān)鍵領(lǐng)域展現(xiàn)出卓越性能。在數(shù)學(xué)、編程、科學(xué)推理這類專業(yè)領(lǐng)域中，它能夠精準(zhǔn)高效地處理復(fù)雜問題；在創(chuàng)意寫作等通用任務(wù)方面，同樣表現(xiàn)出色。該模型采用MoE架構(gòu)，總參數(shù)為200B，激?

?豆包1.5深度思考模型 ?火山引擎AI創(chuàng)新 ?字節(jié)跳動(dòng)技術(shù)發(fā)布
滴滴放大招!20億助力穩(wěn)就業(yè)促消費(fèi) 積極應(yīng)對外部挑戰(zhàn)

近日，滴滴宣布將追加投入20億元專項(xiàng)資金，聚焦穩(wěn)就業(yè)促消費(fèi)”，切實(shí)發(fā)揮平臺(tái)企業(yè)責(zé)任，積極應(yīng)對外部不確定性帶來的挑戰(zhàn)。2024年已有數(shù)百萬網(wǎng)約車司機(jī)通過滴滴獲得收入。為進(jìn)一步激發(fā)出行活力，滴滴將在2025年追加投入10億元用于乘客補(bǔ)貼，穩(wěn)定司機(jī)收入水平的同時(shí)，提升用戶出行頻率，有效帶動(dòng)關(guān)聯(lián)消費(fèi)活力。

?滴滴出行 ?網(wǎng)約車 ?就業(yè)促進(jìn)
薦接替Manus，字節(jié)的Agent王牌能打多久？

字節(jié)跳動(dòng)旗下智能體平臺(tái)"扣子空間"推出首款由大廠發(fā)布的Agent爆款產(chǎn)品，自4月18日上線后引發(fā)用戶瘋搶邀請碼。該產(chǎn)品具備規(guī)劃、工具調(diào)用和記憶等關(guān)鍵能力，支持游戲攻略撰寫、市場調(diào)研等復(fù)雜需求，并首創(chuàng)"探索模式"和"規(guī)劃模式"雙交互設(shè)計(jì)。雖然底層模型能力較DeepResearch和Manus仍有差距，但憑借產(chǎn)品設(shè)計(jì)優(yōu)化和量大價(jià)優(yōu)的優(yōu)勢，成功填補(bǔ)了Manus留下的市場空白。字節(jié)同步推出企業(yè)版HiAgent解決私有化部署問題，半年內(nèi)智能體業(yè)務(wù)訂單量增長超330%。當(dāng)前行業(yè)正迎來Agent爆發(fā)期，但企業(yè)落地仍面臨系統(tǒng)接入、數(shù)據(jù)安全等挑戰(zhàn)。

?字節(jié) ?Agent ?AI
薦AI日報(bào)：昆侖萬維開源Skywork-OR1系列模型；訊飛星辰Agent開發(fā)平臺(tái)全面支持MCP；字節(jié)跳動(dòng)布局AI智能眼鏡

歡迎來到【AI日報(bào)】欄目!這里是你每天探索人工智能世界的指南，每天我們?yōu)槟愠尸F(xiàn)AI領(lǐng)域的熱點(diǎn)內(nèi)容，聚焦開發(fā)者，助你洞悉技術(shù)趨勢、了解創(chuàng)新AI產(chǎn)品應(yīng)用。新鮮AI產(chǎn)品點(diǎn)擊了解:https://top.aibase.com/1、Kimi開源視覺語言模型 Kimi-VL 與 Kimi-VL-Thinking，多項(xiàng)基準(zhǔn)超越 GPT-4oMoonshot AI 最近開源了 Kimi-VL 和 Kimi-VL-Thinking 兩款視覺語言模型，展現(xiàn)出卓越的多模態(tài)理解與推理能力。這些模型采

?人工智能 ?視覺語言模型 ?Kimi-VL
16樓住戶洗衣機(jī)中現(xiàn)活蛇家人被嚇哭：跑后只剩一段蛇皮

4月19日，山西運(yùn)城一居民樓內(nèi)發(fā)生了一起令人驚詫的事件。當(dāng)日，某單元16樓的一戶居民家中，在正常使用洗衣機(jī)時(shí)，竟意外發(fā)現(xiàn)洗衣機(jī)內(nèi)盤踞著一條活蛇，這一幕讓在場家人驚恐萬分，甚至有人被嚇得當(dāng)場落淚。據(jù)該戶居民回憶，事發(fā)時(shí)家中并無異常聲響或跡象，直至打開洗衣機(jī)準(zhǔn)備清洗衣物時(shí)，才突然發(fā)現(xiàn)這條不速之客。面對這突如其來的狀況，家人迅速在房間內(nèi)展開搜尋

?山西運(yùn)城 ?洗衣機(jī) ?蛇
迅雷一鍵即可完成大模型下載

近日，迅雷為提升用戶使用體驗(yàn)，讓用戶能夠更快更好地批量下載大模型所有文件，已針對大模型下載場景進(jìn)行了優(yōu)化，并上線了新版本插件，下載迅雷客戶端且在瀏覽器安裝迅雷插件即可使用。值得一提的是，在使用迅雷該插件功能創(chuàng)建任務(wù)時(shí)，將同時(shí)創(chuàng)建相對應(yīng)的文件夾，下載完成后，所有文件都將在一個(gè)文件夾中，相比傳統(tǒng)瀏覽器——需要用戶逐個(gè)手動(dòng)點(diǎn)擊下載圖標(biāo)并?

?迅雷 ?大模型下載 ?下載優(yōu)化

熱文

3 天
7天

1

累了倦了就找 ChatGPT……AI正在淪為“情緒垃圾桶”！

站長商機(jī)

廣告

商務(wù)合作侵權(quán)投訴廣告服務(wù) 版權(quán)聲明招聘

?CopyRight 2002-2020 CHINAZ.COM

<ul id="pqnqm"></ul>

<em id="pqnqm"></em>