无码在线播放二区|久久亚洲精品国产精品|无码视频在线观看一区二区|在线观看国产日韩亚洲中

<menu id="yw4o4"></menu>

<menu id="yw4o4"><em id="yw4o4"></em></menu>

AI日報：Luma官方親自下場夸自家“孩子”；日本藝術家用Luma復活妻子看哭網(wǎng)友；蘋果AI可能要放大家“鴿子”；北大快手聯(lián)合推視頻生成框架VideoTetris

2024-06-17 16:00 · 稿源：站長之家

歡迎來到【AI日報】欄目!這里是你每天探索人工智能世界的指南，每天我們?yōu)槟愠尸F(xiàn)AI領域的熱點內容，聚焦開發(fā)者，助你洞悉技術趨勢、了解創(chuàng)新AI產(chǎn)品應用。

新鮮AI產(chǎn)品點擊了解：https://top.aibase.com/

1、Luma 官方發(fā)視頻介紹Dream Machine模型特點

看了Luma官方發(fā)布的Dream Machine模型介紹視頻，感覺這款AI視頻生成工具非常強大。它不僅提供高質量的視頻輸出，而且能夠快速理解用戶的提示，生成符合美學風格的視頻內容。這對于創(chuàng)意迭代過程非常有幫助，讓視頻生成變得更加高效。

【AiBase提要:】
?? 生成的視頻質量高，分辨率可達1024像素。
?? 能理解提示生成符合美學風格的視頻。
? 推理速度快，有利于快速迭代創(chuàng)意。
詳情鏈接:https://top.aibase.com/tool/dream-machine

2、新對口型視頻項目Hallo發(fā)布可對表情，嘴型進行精確控制

新對口型視頻項目Hallo發(fā)布，通過單張圖像和音頻輸入生成唱歌和說話的視頻，實現(xiàn)精確控制人物表情和姿態(tài)，提升語音輸入與生成動畫之間的對齊精度。該技術不僅可用于虛擬角色動畫生成，還可應用于真實人物，支持多種運動控制，跨演員應用，以及歌唱動畫生成。技術先進，動畫逼真，具有廣泛的應用潛力。

【AiBase提要：】
?? 根據(jù)單張圖像和音頻輸入生成唱歌和說話視頻
?? 支持虛擬和真實角色動畫生成，項目已開源
?? 多種運動控制，實現(xiàn)精確表情和姿態(tài)控制，增強動畫的多樣性和真實性。
項目地址：https://top.aibase.com/tool/hallo

3、北大快手聯(lián)合推視頻生成框架VideoTetris 復雜視頻生成效果超越Pika

本文介紹了北京大學與快手AI團隊合作攻克復雜視頻生成難題，提出VideoTetris框架，成功超越商用模型Pika和Gen-2。該框架定義了組合視頻生成任務，支持復雜指令和長視頻生成，保留位置信息和細節(jié)特征。團隊采用時空組合擴散方法，優(yōu)化訓練數(shù)據(jù)預處理和引入?yún)⒖紟⒁饬C制，生成更具動感和自然的視頻。

【AiBase提要:】
? VideoTetris框架成功攻克復雜視頻生成難題，超越商用模型Pika和Gen-2。
? 定義了組合視頻生成任務，支持復雜指令和長視頻生成，保留位置信息和細節(jié)特征。
? 采用時空組合擴散方法，優(yōu)化訓練數(shù)據(jù)預處理和引入?yún)⒖紟⒁饬C制，生成更具動感和自然的視頻。
詳情鏈接:https://top.aibase.com/tool/videotetris

4、日本AI藝術家用Luma復活妻子網(wǎng)友淚目

這篇文章講述了65歲的AI藝術家松尾公也用技術復活了他逝去11年的妻子Tori-chan，感動了無數(shù)人。通過AI技術，他重新編曲、錄制妻子的歌曲，制作動態(tài)視頻，并提取翻譯她的信件，表達對妻子的思念和愛意。這是一個普通人用技術造夢的故事，展現(xiàn)了愛在AI時代的力量和溫度。

【AiBase提要:】
?? 松尾公也用Luma的AI視頻Dream Machine復活逝去11年的妻子Tori-chan，感動眾人。
?? 他通過AI技術重新編曲、錄制妻子的歌曲，并制作動態(tài)視頻，展現(xiàn)出對妻子的深深思念。
?? 通過AI工具提取翻譯妻子寫給他的信，表達出濃濃的愛意和對妻子的永恒思念。
產(chǎn)品入口:https://top.aibase.com/tool/luma-ai
詳細文章：http://www.vquan.org.cn/ainews/9623.shtml

5、蘋果AI或計劃將延遲推出，開發(fā)者要等到夏末才能進行測試

據(jù)彭博社報道，蘋果的人工智能（AI）計劃將是一個漫長而緩慢的過程。蘋果公司上周宣布的蘋果 Intelligence 計劃預計將在夏末晚些時候才能供開發(fā)者測試。這意味著它不會成為蘋果新操作系統(tǒng)更新的首批測試版，并且僅會在今年秋季推出一個預覽版。

【AiBase提要：】
?? 蘋果的人工智能（AI）計劃將在夏末晚些時候供開發(fā)者測試
?? 蘋果計劃不會成為新操作系統(tǒng)更新的首批測試版
?? 蘋果Intelligence計劃將帶來改變消費者與設備互動方式，以及購物方式

6、KREA AI推出視頻增強功能一鍵提升視頻畫質

這篇文章介紹了KREA AI推出的視頻增強功能“Enhancer”，可以提升圖片和視頻畫質，并支持更高的分辨率和幀速率。用戶可以簡單操作，上傳需要改善的目標圖片/視頻，KREA AI將進行在線處理，最終生成高質量視頻。

【AiBase提要：】
? Enhancer功能向所有人開放，可以提升圖片和視頻畫質
? 可配合AI視頻工具使用，處理完之后，可以在頁面直接查看增強效果前后對比
? 可生成最大2.5x像素的視頻和高達 120fps 的幀速率。
產(chǎn)品入口:https://top.aibase.com/tool/krea-ai

7、清華與北大合作發(fā)布長視頻理解基準測試：LVBench

本文介紹了智譜、清華大學和北京大學合作推出的長視頻理解基準測試項目LVBench，旨在彌補現(xiàn)有多模態(tài)大型語言模型在處理長視頻方面的挑戰(zhàn)。該項目包含多類別的數(shù)小時QA數(shù)據(jù)，涵蓋不同類型的視頻內容，旨在推動長視頻領域的技術突破和創(chuàng)新。許多研究機構已在LVBench數(shù)據(jù)集上展開工作，為視頻理解和多模態(tài)學習領域注入新活力。

【AiBase提要:】
?? LVBench項目是長視頻理解基準測試項目，包含多類別的數(shù)小時QA數(shù)據(jù)。
?? LVBench數(shù)據(jù)集涵蓋視頻摘要、事件檢測、角色識別和場景理解等多種任務。
?? LVBench基準的推出將推動相關技術的突破和創(chuàng)新，為長視頻領域的發(fā)展注入新動力。
詳情鏈接:https://github.com/THUDM/LVBench

8、網(wǎng)格生成模型MeshAnything：將任何3D轉換為藝術家創(chuàng)建的網(wǎng)格

近期，由重建和生成創(chuàng)建的3D資產(chǎn)已經(jīng)達到了手工制作資產(chǎn)的質量水平，凸顯了它們在替代領域的潛力。MeshAnything是一種用于生成藝術家創(chuàng)建的3D網(wǎng)格的自動回歸模型，通過VQ-VAE和形狀條件的僅解碼器變壓器實現(xiàn)高質量的網(wǎng)格生成。該方法顯著提高了存儲、渲染和模擬效率，同時保持與以往方法相當?shù)木取?/p>

【AiBase提要:】
?? MeshAnything使用自回歸模型生成高質量的藝術家創(chuàng)作的3D網(wǎng)格。
?? MeshAnything的網(wǎng)格體提高了存儲、渲染和仿真效率，同時保持精度。
?? MeshAnything在各個領域都有廣泛的應用場景，滿足不同用戶的創(chuàng)作和需求。
詳情鏈接:https://top.aibase.com/tool/meshanythingMeshAnything

9、哈佛神經(jīng)科學家和谷歌DeepMind在虛擬老鼠中創(chuàng)建人工大腦

這篇文章介紹了哈佛大學研究人員與谷歌DeepMind團隊合作，利用人工智能技術為虛擬老鼠創(chuàng)建人工"大腦"的突破性研究。他們成功建立了生物力學逼真的3D老鼠模型，并利用DeepMind的深度強化學習算法訓練了一個人工神經(jīng)網(wǎng)絡大腦，實現(xiàn)了超越真實的模擬效果。這一創(chuàng)新有望為神經(jīng)科學和人工智能領域帶來革命性進展。

【AiBase提要:】
?? 虛擬老鼠擁有人工"大腦"，能在復雜環(huán)境中精確控制運動
?? 利用DeepMind算法訓練的人工神經(jīng)網(wǎng)絡大腦能產(chǎn)生各種復雜運動軌跡和力量
?? 未來應用前景廣闊，可能開創(chuàng)"虛擬神經(jīng)科學"新領域，為神經(jīng)系統(tǒng)疾病治療帶來新策略

10、麥當勞宣布結束與 IBM 的 AI 得來速訂購合作

麥當勞宣布結束與 IBM 的 AI 得來速訂購合作，將在2024年7月26日前移除在100多家餐廳中測試的技術。盡管目前尚不清楚麥當勞為何結束與 IBM 的合作，但該公司表示正在測試語音接單聊天機器人是否能加快服務速度，并對測試結果表示自信。餐飲行業(yè)普遍渴望引入 AI 技術來提升效率。

【AiBase提要:】
?? 麥當勞將結束與 IBM 的 AI 得來速訂購合作，將移除在100多家餐廳中測試的技術
?? 麥當勞正在測試語音接單聊天機器人以加快服務速度
?? 餐飲行業(yè)普遍渴望引入 AI 技術來提升效率

11、研究：人們與ChatGPT對話五分鐘，很難區(qū)分是否為人類

大型語言模型（LLMs）如 GPT-4模型在聊天平臺ChatGPT展現(xiàn)出驚人能力，難以區(qū)分其生成的文本是否為人類所寫。加州大學圣迭戈分校研究發(fā)現(xiàn)，人們與GPT-4對話時很難分辨其是否為人類，展示出機器展現(xiàn)人類智能的程度。

【AiBase提要:】
?? GPT-4模型在研究中展現(xiàn)出與人類難以區(qū)分的對話能力。
?? 研究結果顯示約50%的互動中人們誤認為GPT-4是人類。
?? 設計了名為"人還是不是人"的在線游戲，揭示人們難以可靠判斷與人類還是AI系統(tǒng)交談的區(qū)別。

12、多模態(tài)模型的畫布框架Sketchpad：提升多模態(tài)模型數(shù)學能力

這篇文章介紹了研究人員引入的“Sketchpad”概念，為多模態(tài)LM提供了視覺畫板和繪圖工具，使其能夠進行視覺推理。通過實驗結果顯示，Sketchpad顯著提高了LM在數(shù)學任務和復雜的視覺推理任務上的表現(xiàn)，進一步接近人類的思維方式，為人工智能技術的發(fā)展開辟了新的可能性。

【AiBase提要:】
?? Sketchpad為多模態(tài)LM提供視覺畫板和繪圖工具，使其能進行視覺推理。
?? 實驗結果顯示，Sketchpad顯著提高了LM在數(shù)學任務和復雜的視覺推理任務上的表現(xiàn)。
?? Sketchpad使得GPT-4o在所有任務上創(chuàng)下了新的技術水平，包括V*Bench、BLINK空間推理和視覺對應。
詳情鏈接:https://top.aibase.com/tool/visual-sketchpad

（舉報）

相關推薦

關鍵詞：

視頻生成模型Vidu Q1怎么用？Vidu Q1官網(wǎng)是什么？

國產(chǎn)視頻生成大模型Vidu Q1在性能、價格和功能上實現(xiàn)重大突破。該模型由生數(shù)科技推出，在VBench評測中超越Sora等國內外頂尖模型，支持1080p高清視頻生成，每秒價格低至3毛錢。其首尾幀功能僅需兩張圖即可實現(xiàn)電影級運鏡效果，支持多元風格生成和48kHz高采樣率混音功能。Vidu Q1已深度賦能影視、廣告、動漫等行業(yè)，大幅降低創(chuàng)作門檻。

?國產(chǎn)視頻生成 ?Vidu ?Q1
最新AI資訊日報平臺推薦 AI日報周報合集去哪看？

AIbase基地是一個專注于人工智能領域的綜合性平臺，致力于為用戶提供豐富的AI資訊、工具和資源，幫助用戶更好地了解和探索人工智能的前沿動態(tài)和發(fā)展趨勢。無論是關注行業(yè)動態(tài)、學習AI技術是尋找AI產(chǎn)品和項目，AIbase基地都能滿足用戶的需求，是通往AGI之路上的一個重要助力。數(shù)據(jù)可視化:通過各種榜單的形式，將復雜的AI產(chǎn)品和項目數(shù)據(jù)進行可視化展示，使用戶能夠更加直觀地了解市場趨勢和行業(yè)動態(tài)，便于做出決策。

?人工智能 ?AI新聞 ?AI工具
AI日報： OpenAI推出gpt-image-1圖像生成API;納米AI發(fā)布MCP萬能工具箱;中國占全球AI專利60%

【AI日報】欄目聚焦人工智能領域最新動態(tài)：1) OpenAI推出ChatGPT圖像生成API，開發(fā)者可輕松集成AI繪圖功能，已生成超7億張圖片；2) 谷歌Gemini月活用戶突破3.5億，但仍落后于ChatGPT的6億用戶；3) OpenAI預測2029年收入將達1250億美元，AI代理業(yè)務成主要增長點；4) Ostris發(fā)布8B參數(shù)擴散模型Flex.2-preview，優(yōu)化ComfyUI工作流；5) 英偉達推出多模態(tài)LLM模型Describe Anything，支持指定區(qū)域生成詳細描?

?OpenAI ?ChatGPT ?圖像生成
最新AI新聞快訊去哪看？每日AI日報資訊獲取平臺推薦

在人工智能領域，獲取全面且高質量的資源對于開發(fā)者、研究人員和愛好者來說至關重要。AIbase正是這樣一個綜合性平臺，它致力于為用戶提供豐富的AI資源，幫助他們更好地探索和應用AI技術。通過AIbase，你可以更好地探索AI技術，發(fā)現(xiàn)新的應用機會，提升自己的AI能力。

?人工智能 ?AI資源平臺 ?機器學習
薦AI日報：Vidu Q1正式上線；MCP SDK 正式支持流式 HTTP；抖音一季度封禁AI黑產(chǎn)賬號260萬個

本文介紹了AI領域多項重要進展：1)MCP SDK支持流式HTTP協(xié)議，提升開發(fā)效率；2)Vidu Q1視頻生成模型上線，提供專業(yè)級視覺體驗；3)馬斯克計劃籌資250億美元開發(fā)Colossus 2超級計算機；4)Sand AI開源MAGI-1視頻生成模型；5)電商AI助手Add To Cart AI優(yōu)化購物體驗；6)Anthropic發(fā)布Claude Code編程指南；7)真我推出支持32種語言的AI翻譯耳機；8)2025年AI視頻企業(yè)TOP20榜單發(fā)布；9)清華GLM大模型免費開放；10)AI面試作弊工具引爭議；11)抖音AI治理封禁260萬違規(guī)賬號；12)全球首款具備嗅覺的機器人問世。這些創(chuàng)新展示了AI技術在視頻生成、編程輔助、電商、翻譯等領域的快速發(fā)展與應用潛力。

?人工智能 ?開發(fā)者工具 ?技術趨勢
薦AI日報：小米首個推理大模型開源Xiaomi MiMo；快手上線AI筆記工具“喵記多”；騰訊拆分AI團隊

本文匯總了AI領域最新動態(tài)：1)小米開源70億參數(shù)大模型Xiaomi MiMo，在數(shù)學推理和代碼競賽中超越OpenAI和阿里模型；2)快手推出AI筆記工具"喵記多"，簡化筆記管理；3)Luma AI發(fā)布電影級鏡頭控制API，降低視頻生成門檻；4)騰訊重組AI團隊，加大語言模型研發(fā)投入；5)Anthropic為Claude引入新語音"Glassy"；6)谷歌NotebookLM新增50+語言音頻概述功能；7)xAI將發(fā)布Grok3.5模型；8)Meta推出獨立AI助手應用挑戰(zhàn)ChatGPT；9)OpenAI緊急修復GPT-4o"諂媚"問題；10)Mac本地AI助手Simular升級隱私保護；11)CameraBench項目幫助AI理解鏡頭運動；12)谷歌推出個性化語言學習AI工具。

?人工智能 ?Xiaomi ?MiMo
可靈AI開啟視頻生成2.0時代！全球用戶數(shù)已突破2200萬

4 月 15 日，快手可靈AI在北京中關村國際創(chuàng)新中心舉行“靈感成真”2. 0 模型發(fā)布會，宣布基座模型再次升級，面向全球正式發(fā)布可靈2. 0 視頻生成模型及可圖2. 0 圖像生成模型。

?可靈2.0 ?可靈AI ?快手
薦AI日報：ChatGPT重磅上線圖像庫功能；白嫖！Veo2登陸谷歌AI Studio；螞蟻百寶箱推“MCP專區(qū)”

歡迎來到【AI日報】欄目!這里是你每天探索人工智能世界的指南，每天我們?yōu)槟愠尸F(xiàn)AI領域的熱點內容，聚焦開發(fā)者，助你洞悉技術趨勢、了解創(chuàng)新AI產(chǎn)品應用。新鮮AI產(chǎn)品點擊了解:https://top.aibase.com/1、報道稱字節(jié)跳動整合 AI 研發(fā)團隊，AI Lab 即將并入 Seed字節(jié)跳動正在進行AI研發(fā)團隊的整合，將獨立的字節(jié)AI Lab并入Seed團隊。這一舉措體現(xiàn)了字節(jié)在AI領域戰(zhàn)略布局的調整，旨在進?

?字節(jié)跳動 ?AI研發(fā) ?AI
薦AI日報：OpenAI下周或發(fā)布GPT-4.1系列；Pika全新AI視頻功能Twists；商湯科技日日新V6震撼發(fā)布

歡迎來到【AI日報】欄目!這里是你每天探索人工智能世界的指南，每天我們?yōu)槟愠尸F(xiàn)AI領域的熱點內容，聚焦開發(fā)者，助你洞悉技術趨勢、了解創(chuàng)新AI產(chǎn)品應用。新鮮AI產(chǎn)品點擊了解:https://top.aibase.com/1、報道稱OpenAI下周重磅發(fā)布GPT-4.1系列，包含Mini版和Nano版OpenAI即將發(fā)布GPT-4.1系列及o3系列，標志著其在多模態(tài)和推理能力上的重大進展。新加坡在AI技能學習上投入的時間顯著高于其他亞太國家，顯示出其在AI人才培養(yǎng)方面的競爭力。

?OpenAI ?GPT-4.1 ?多模態(tài)AI
薦AI日報：國內首個多模態(tài)AI程序員上崗；字節(jié)啟動Top Seed計劃招募AI人才；DeepSeek R1T Chimera上線OpenRouter

【AI日報】今日AI領域重要動態(tài)：1.百度發(fā)布文心快碼3.5及多模態(tài)AI程序員"文心快碼Comate Zulu"，提升開發(fā)效率；2.字節(jié)跳動啟動"Top Seed"計劃，招募30名AI博士人才；3.DeepSeek開源R1T Chimera模型上線OpenRouter平臺；4.阿里AI工程師余亮獲"全國勞動模范"稱號；5.開源圖像編輯工具Step1X-Edit登陸Hugging Face，性能媲美GPT-4o；6.谷歌被曝每月向三星支付巨額資金預裝Gemini應用

?人工智能 ?AI編程工具 ?多模態(tài)交互

熱文

3 天
7天

站長商機

廣告

商務合作侵權投訴廣告服務版權聲明招聘

?CopyRight 2002-2020 CHINAZ.COM