歡迎來到【AI日報】欄目!這里是你每天探索人工智能世界的指南,每天我們?yōu)槟愠尸F(xiàn)AI領域的熱點內容,聚焦開發(fā)者,助你洞悉技術趨勢、了解創(chuàng)新AI產(chǎn)品應用。
新鮮AI產(chǎn)品點擊了解:https://top.aibase.com/
1、Luma 官方發(fā)視頻介紹Dream Machine模型特點
看了Luma官方發(fā)布的Dream Machine模型介紹視頻,感覺這款AI視頻生成工具非常強大。它不僅提供高質量的視頻輸出,而且能夠快速理解用戶的提示,生成符合美學風格的視頻內容。這對于創(chuàng)意迭代過程非常有幫助,讓視頻生成變得更加高效。
【AiBase提要:】
?? 生成的視頻質量高,分辨率可達1024像素。
?? 能理解提示生成符合美學風格的視頻。
? 推理速度快,有利于快速迭代創(chuàng)意。
詳情鏈接:https://top.aibase.com/tool/dream-machine
2、新對口型視頻項目Hallo發(fā)布 可對表情,嘴型進行精確控制
新對口型視頻項目Hallo發(fā)布,通過單張圖像和音頻輸入生成唱歌和說話的視頻,實現(xiàn)精確控制人物表情和姿態(tài),提升語音輸入與生成動畫之間的對齊精度。該技術不僅可用于虛擬角色動畫生成,還可應用于真實人物,支持多種運動控制,跨演員應用,以及歌唱動畫生成。技術先進,動畫逼真,具有廣泛的應用潛力。
【AiBase提要:】
?? 根據(jù)單張圖像和音頻輸入生成唱歌和說話視頻
?? 支持虛擬和真實角色動畫生成,項目已開源
?? 多種運動控制,實現(xiàn)精確表情和姿態(tài)控制,增強動畫的多樣性和真實性。
項目地址:https://top.aibase.com/tool/hallo
3、北大快手聯(lián)合推視頻生成框架VideoTetris 復雜視頻生成效果超越Pika
本文介紹了北京大學與快手AI團隊合作攻克復雜視頻生成難題,提出VideoTetris框架,成功超越商用模型Pika和Gen-2。該框架定義了組合視頻生成任務,支持復雜指令和長視頻生成,保留位置信息和細節(jié)特征。團隊采用時空組合擴散方法,優(yōu)化訓練數(shù)據(jù)預處理和引入?yún)⒖紟⒁饬C制,生成更具動感和自然的視頻。
【AiBase提要:】
? VideoTetris框架成功攻克復雜視頻生成難題,超越商用模型Pika和Gen-2。
? 定義了組合視頻生成任務,支持復雜指令和長視頻生成,保留位置信息和細節(jié)特征。
? 采用時空組合擴散方法,優(yōu)化訓練數(shù)據(jù)預處理和引入?yún)⒖紟⒁饬C制,生成更具動感和自然的視頻。
詳情鏈接:https://top.aibase.com/tool/videotetris
4、日本AI藝術家用Luma復活妻子 網(wǎng)友淚目
這篇文章講述了65歲的AI藝術家松尾公也用技術復活了他逝去11年的妻子Tori-chan,感動了無數(shù)人。通過AI技術,他重新編曲、錄制妻子的歌曲,制作動態(tài)視頻,并提取翻譯她的信件,表達對妻子的思念和愛意。這是一個普通人用技術造夢的故事,展現(xiàn)了愛在AI時代的力量和溫度。
【AiBase提要:】
?? 松尾公也用Luma的AI視頻Dream Machine復活逝去11年的妻子Tori-chan,感動眾人。
?? 他通過AI技術重新編曲、錄制妻子的歌曲,并制作動態(tài)視頻,展現(xiàn)出對妻子的深深思念。
?? 通過AI工具提取翻譯妻子寫給他的信,表達出濃濃的愛意和對妻子的永恒思念。
產(chǎn)品入口:https://top.aibase.com/tool/luma-ai
5、蘋果AI或計劃將延遲推出,開發(fā)者要等到夏末才能進行測試
據(jù)彭博社報道,蘋果的人工智能(AI)計劃將是一個漫長而緩慢的過程。蘋果公司上周宣布的蘋果 Intelligence 計劃預計將在夏末晚些時候才能供開發(fā)者測試。這意味著它不會成為蘋果新操作系統(tǒng)更新的首批測試版,并且僅會在今年秋季推出一個預覽版。
【AiBase提要:】
?? 蘋果的人工智能(AI)計劃將在夏末晚些時候供開發(fā)者測試
?? 蘋果計劃不會成為新操作系統(tǒng)更新的首批測試版
?? 蘋果Intelligence計劃將帶來改變消費者與設備互動方式,以及購物方式
6、KREA AI推出視頻增強功能 一鍵提升視頻畫質
這篇文章介紹了KREA AI推出的視頻增強功能“Enhancer”,可以提升圖片和視頻畫質,并支持更高的分辨率和幀速率。用戶可以簡單操作,上傳需要改善的目標圖片/視頻,KREA AI將進行在線處理,最終生成高質量視頻。
【AiBase提要:】
? Enhancer功能向所有人開放,可以提升圖片和視頻畫質
? 可配合AI視頻工具使用,處理完之后,可以在頁面直接查看增強效果前后對比
? 可生成最大2.5x像素的視頻和高達 120fps 的幀速率。
產(chǎn)品入口:https://top.aibase.com/tool/krea-ai
7、清華與北大合作發(fā)布長視頻理解基準測試:LVBench
本文介紹了智譜、清華大學和北京大學合作推出的長視頻理解基準測試項目LVBench,旨在彌補現(xiàn)有多模態(tài)大型語言模型在處理長視頻方面的挑戰(zhàn)。該項目包含多類別的數(shù)小時QA數(shù)據(jù),涵蓋不同類型的視頻內容,旨在推動長視頻領域的技術突破和創(chuàng)新。許多研究機構已在LVBench數(shù)據(jù)集上展開工作,為視頻理解和多模態(tài)學習領域注入新活力。
【AiBase提要:】
?? LVBench項目是長視頻理解基準測試項目,包含多類別的數(shù)小時QA數(shù)據(jù)。
?? LVBench數(shù)據(jù)集涵蓋視頻摘要、事件檢測、角色識別和場景理解等多種任務。
?? LVBench基準的推出將推動相關技術的突破和創(chuàng)新,為長視頻領域的發(fā)展注入新動力。
詳情鏈接:https://github.com/THUDM/LVBench
8、網(wǎng)格生成模型MeshAnything:將任何3D轉換為藝術家創(chuàng)建的網(wǎng)格
近期,由重建和生成創(chuàng)建的3D資產(chǎn)已經(jīng)達到了手工制作資產(chǎn)的質量水平,凸顯了它們在替代領域的潛力。MeshAnything是一種用于生成藝術家創(chuàng)建的3D網(wǎng)格的自動回歸模型,通過VQ-VAE和形狀條件的僅解碼器變壓器實現(xiàn)高質量的網(wǎng)格生成。該方法顯著提高了存儲、渲染和模擬效率,同時保持與以往方法相當?shù)木取?/p>
【AiBase提要:】
?? MeshAnything使用自回歸模型生成高質量的藝術家創(chuàng)作的3D網(wǎng)格。
?? MeshAnything的網(wǎng)格體提高了存儲、渲染和仿真效率,同時保持精度。
?? MeshAnything在各個領域都有廣泛的應用場景,滿足不同用戶的創(chuàng)作和需求。
詳情鏈接:https://top.aibase.com/tool/meshanythingMeshAnything
9、哈佛神經(jīng)科學家和谷歌DeepMind在虛擬老鼠中創(chuàng)建人工大腦
這篇文章介紹了哈佛大學研究人員與谷歌DeepMind團隊合作,利用人工智能技術為虛擬老鼠創(chuàng)建人工"大腦"的突破性研究。他們成功建立了生物力學逼真的3D老鼠模型,并利用DeepMind的深度強化學習算法訓練了一個人工神經(jīng)網(wǎng)絡大腦,實現(xiàn)了超越真實的模擬效果。這一創(chuàng)新有望為神經(jīng)科學和人工智能領域帶來革命性進展。
【AiBase提要:】
?? 虛擬老鼠擁有人工"大腦",能在復雜環(huán)境中精確控制運動
?? 利用DeepMind算法訓練的人工神經(jīng)網(wǎng)絡大腦能產(chǎn)生各種復雜運動軌跡和力量
?? 未來應用前景廣闊,可能開創(chuàng)"虛擬神經(jīng)科學"新領域,為神經(jīng)系統(tǒng)疾病治療帶來新策略
10、麥當勞宣布結束與 IBM 的 AI 得來速訂購合作
麥當勞宣布結束與 IBM 的 AI 得來速訂購合作,將在2024年7月26日前移除在100多家餐廳中測試的技術。盡管目前尚不清楚麥當勞為何結束與 IBM 的合作,但該公司表示正在測試語音接單聊天機器人是否能加快服務速度,并對測試結果表示自信。餐飲行業(yè)普遍渴望引入 AI 技術來提升效率。
【AiBase提要:】
?? 麥當勞將結束與 IBM 的 AI 得來速訂購合作,將移除在100多家餐廳中測試的技術
?? 麥當勞正在測試語音接單聊天機器人以加快服務速度
?? 餐飲行業(yè)普遍渴望引入 AI 技術來提升效率
11、研究:人們與ChatGPT對話五分鐘,很難區(qū)分是否為人類
大型語言模型(LLMs)如 GPT-4模型在聊天平臺ChatGPT展現(xiàn)出驚人能力,難以區(qū)分其生成的文本是否為人類所寫。加州大學圣迭戈分校研究發(fā)現(xiàn),人們與GPT-4對話時很難分辨其是否為人類,展示出機器展現(xiàn)人類智能的程度。
【AiBase提要:】
?? GPT-4模型在研究中展現(xiàn)出與人類難以區(qū)分的對話能力。
?? 研究結果顯示約50%的互動中人們誤認為GPT-4是人類。
?? 設計了名為"人還是不是人"的在線游戲,揭示人們難以可靠判斷與人類還是AI系統(tǒng)交談的區(qū)別。
12、多模態(tài)模型的畫布框架Sketchpad:提升多模態(tài)模型數(shù)學能力
這篇文章介紹了研究人員引入的“Sketchpad”概念,為多模態(tài)LM提供了視覺畫板和繪圖工具,使其能夠進行視覺推理。通過實驗結果顯示,Sketchpad顯著提高了LM在數(shù)學任務和復雜的視覺推理任務上的表現(xiàn),進一步接近人類的思維方式,為人工智能技術的發(fā)展開辟了新的可能性。
【AiBase提要:】
?? Sketchpad為多模態(tài)LM提供視覺畫板和繪圖工具,使其能進行視覺推理。
?? 實驗結果顯示,Sketchpad顯著提高了LM在數(shù)學任務和復雜的視覺推理任務上的表現(xiàn)。
?? Sketchpad使得GPT-4o在所有任務上創(chuàng)下了新的技術水平,包括V*Bench、BLINK空間推理和視覺對應。
詳情鏈接:https://top.aibase.com/tool/visual-sketchpad
(舉報)