歡迎來到【AI日報】欄目!這里是你每天探索人工智能世界的指南,每天我們?yōu)槟愠尸F(xiàn)AI領(lǐng)域的熱點內(nèi)容,聚焦開發(fā)者,助你洞悉技術(shù)趨勢、了解創(chuàng)新AI產(chǎn)品應(yīng)用。
新鮮AI產(chǎn)品點擊了解:https://top.aibase.com/
1、Luma AI 推出Ray2視頻生成模型,實現(xiàn)更快更自然的運動效果
Luma AI最近推出了Ray2視頻生成模型,標(biāo)志著在AI視頻創(chuàng)作領(lǐng)域的重要進展。Ray2經(jīng)過大量計算訓(xùn)練,提升了視頻生成的速度和自然度,用戶可以通過簡單的文本描述生成短視頻。盡管在復(fù)雜提示下可能出現(xiàn)失真,整體反饋積極。為了慶祝這一發(fā)布,Luma Labs還舉辦了大獎賽,鼓勵創(chuàng)作者參與并有機會贏得獎金。
【AiBase提要:】
?? Ray2生成視頻模型發(fā)布,提升視頻創(chuàng)作效率和自然度。
?? 支持文本到視頻的快速生成,用戶可輕松制作短視頻。
?? 舉辦 Ray2大獎賽,創(chuàng)作者有機會贏得高達(dá)7000美元的獎金。
詳情鏈接:https://lumalabs.ai/ray
2、馬斯克旗下xAI上線Grok網(wǎng)頁版 無需X賬號即可體驗
近日,埃隆·馬斯克旗下的xAI公司推出了網(wǎng)頁版Grok AI聊天機器人,用戶無需訪問X.com或擁有X賬戶即可體驗其強大功能。只需在瀏覽器中訪問grok.com并提供出生年份,用戶便可立即使用這款智能聊天機器人。Grok AI不僅能實時收集信息和解答問題,還具備生成圖像的能力,帶來便捷的用戶體驗。
【AiBase提要:】
?? Grok AI網(wǎng)頁版上線,用戶無需X賬戶即可使用。
?? 只需提供出生年份,便可體驗智能聊天功能。
?? 臨時模式保護用戶隱私,聊天內(nèi)容不被記錄。
3、智譜AI成首家被美國列入實體清單的中國大模型公司,回應(yīng)稱不受影響
智譜AI被美國商務(wù)部列入出口管制實體清單,成為首家被制裁的中國大模型公司。盡管面臨制裁,智譜AI強調(diào)其技術(shù)源自清華大學(xué),并表示制裁不會對其運營造成實質(zhì)性影響。智譜AI在大模型技術(shù)領(lǐng)域持續(xù)創(chuàng)新,展現(xiàn)出強大的市場前景和技術(shù)實力。
【AiBase提要:】
?? 智譜AI成為首家被美國列入實體清單的中國大模型公司,標(biāo)志著對中國AI產(chǎn)業(yè)的新一輪打壓。
?? 公司強調(diào)其技術(shù)源自清華大學(xué),擁有全鏈路大模型核心技術(shù),制裁不會影響正常運營。
?? 智譜AI正在與蘋果洽談合作,顯示出其技術(shù)實力和市場前景。
4、階躍星辰自研推理模型Step Reasoner mini上線
上海階躍星辰智能科技有限公司推出了其自研的推理模型Step Reasoner mini(Step R-mini),該模型以其超長推理能力在邏輯推理、代碼和數(shù)學(xué)等領(lǐng)域表現(xiàn)出色。Step R-mini通過大規(guī)模強化學(xué)習(xí)訓(xùn)練,能夠兼顧文理科雙向能力,展現(xiàn)了在復(fù)雜問題解決和內(nèi)容創(chuàng)作上的卓越性能。
【AiBase提要:】
?? Step R-mini是首個推理模型,擅長主動規(guī)劃和反思,提供準(zhǔn)確可靠的回復(fù)。
?? 在數(shù)學(xué)和邏輯推理任務(wù)中,Step R-mini展現(xiàn)出色的解題能力,能夠處理復(fù)雜問題并提供多種解法。
?? 該模型在內(nèi)容創(chuàng)作中深入理解用戶需求,具備創(chuàng)新表達(dá)風(fēng)格,能夠生成富有情感的文學(xué)作品。
詳情鏈接:https://yuewen.cn
5、阿里巴巴Qwen 團隊發(fā)布新型過程獎勵模型,數(shù)學(xué)推理再進化
阿里巴巴 Qwen 團隊最新發(fā)布的論文介紹了新型過程獎勵模型(PRM)在數(shù)學(xué)推理中的應(yīng)用,推出了 Qwen2.5-Math-PRM 系列模型,顯著提升了推理的準(zhǔn)確性和泛化能力。這些模型通過創(chuàng)新的共識過濾機制和蒙特卡洛估計,解決了傳統(tǒng)方法在推理過程中的不足,尤其是在教育和科學(xué)計算等領(lǐng)域的應(yīng)用前景廣闊。
【AiBase提要:】
?? 新模型突破了現(xiàn)有 PRM 框架的限制,顯著提高了數(shù)學(xué)推理的準(zhǔn)確性和泛化能力。
?? 采用共識過濾機制,有效降低了數(shù)據(jù)噪聲約60%,提升了訓(xùn)練數(shù)據(jù)質(zhì)量。
?? Qwen2.5-Math-PRM 系列在多個評估指標(biāo)上表現(xiàn)優(yōu)異,尤其在逐步識別錯誤的任務(wù)中超越了許多專有模型。
6、Kinetix 推出全新AI視頻技術(shù) 可精準(zhǔn)控制角色動作
Kinetix最近推出了一項創(chuàng)新的AI視頻技術(shù),能夠通過結(jié)合真人表演和文本指令,實現(xiàn)對數(shù)字角色動作的精準(zhǔn)控制。這項技術(shù)的操作流程簡單易懂,用戶無需專業(yè)的動畫制作經(jīng)驗也能快速創(chuàng)作出高質(zhì)量的動畫內(nèi)容。憑借強大的3D動畫數(shù)據(jù)庫支持和合成數(shù)據(jù)生成管道,Kinetix不僅大幅縮短了制作時間,還降低了成本。
【AiBase提要:】
?? 通過結(jié)合真人表演視頻和文本指令,Kinetix的AI技術(shù)實現(xiàn)了對數(shù)字角色動作的精確操控。
?? 系統(tǒng)支持多種動作和表情的精準(zhǔn)捕捉,用戶可調(diào)節(jié)動作的速度、幅度和節(jié)奏,提升角色表現(xiàn)效果。
?? 制作時間從傳統(tǒng)的數(shù)周縮短至數(shù)小時,降低制作成本,使中小型團隊和個人創(chuàng)作者也能輕松實現(xiàn)專業(yè)動畫。
詳情鏈接:https://www.kinetix.tech/character-motion-control-for-video-generation-models
7、線稿上色的新技術(shù)MangaNinja:輸入線稿和參考圖,精準(zhǔn)給線稿上色
MangaNinja是一種創(chuàng)新的線稿上色技術(shù),通過輸入線稿和參考圖像,能夠?qū)崿F(xiàn)高精度的上色效果。該技術(shù)基于擴散模型,采用補丁重排模塊和點驅(qū)動控制方案,顯著提升了上色的準(zhǔn)確性和圖像質(zhì)量。MangaNinja在處理復(fù)雜場景時表現(xiàn)出色,能夠有效解決角色姿勢變化和顏色混淆等問題,為用戶提供了更大的創(chuàng)作靈感和可能性。
【AiBase提要:】
?? MangaNinja 是一種基于參考圖像的線稿上色方法,具備精準(zhǔn)匹配和細(xì)致控制的能力。
?? 通過創(chuàng)新的補丁重排模塊和點驅(qū)動控制方案,MangaNinja 顯著提升了上色的準(zhǔn)確性與圖像質(zhì)量。
??? 該技術(shù)能夠應(yīng)對多樣化的上色挑戰(zhàn),包括極端姿勢和多參考圖像的協(xié)調(diào),實現(xiàn)高質(zhì)量的互動上色體驗。
詳情鏈接:https://johanan528.github.io/MangaNinjia/
8、微軟AutoGen v0.4發(fā)布:AI 智能體靈活性和跨語言能力大提升
微軟最新發(fā)布的AutoGen v0.4版本顯著提升了AI代理的靈活性和可控性,解決了用戶在使用過程中遇到的架構(gòu)限制和效率低下的問題。新版本引入的異步消息傳遞機制和跨語言互操作性,使得開發(fā)者可以更方便地構(gòu)建復(fù)雜的代理網(wǎng)絡(luò)。
【AiBase提要:】
?? AutoGen v0.4版本增強了 AI 代理的靈活性,解決了用戶反饋的問題。
?? 新版支持異步消息傳遞和跨語言互操作性,提升了代理之間的協(xié)作能力。
?? AutoGen Studio 低代碼界面的升級,使得用戶可以更方便地設(shè)計和管理代理。
詳情鏈接:https://www.microsoft.com/en-us/research/blog/autogen-v0-4-reimagining-the-foundation-of-agentic-ai-for-scale-extensibility-and-robustness/
9、騰訊會議全新升級 上線AI小助手Pro
騰訊會議近期推出了AI小助手Pro,基于騰訊混元千億級參數(shù)大模型,具備深度理解和快速響應(yīng)的能力,能夠為用戶提供精準(zhǔn)的會議支持。此次升級還優(yōu)化了組織協(xié)同功能,提升了會議效率,用戶可以更方便地管理會議通知和錄制分享。同時,新增的個人身份認(rèn)證和企業(yè)認(rèn)證功能也增強了會議的專業(yè)性與安全性。
【AiBase提要:】
?? AI小助手Pro支持聯(lián)網(wǎng)搜索和多種任務(wù)處理,能深度理解會議內(nèi)容,提供精準(zhǔn)回答。
?? 用戶可在會議中直接創(chuàng)建組織,快速添加參會者,提升會議效率。
?? 新增身份認(rèn)證功能,增強會議安全性和專業(yè)性,提升用戶體驗。
10、一家初創(chuàng)公司用AI智能體在Reddit大肆刷推廣帖 還讓人毫無察覺
最近,Astral創(chuàng)業(yè)公司因利用AI技術(shù)在Reddit上發(fā)布廣告而備受關(guān)注。創(chuàng)始人薩瓦娜·費德展示了這項技術(shù)的快速應(yīng)用能力,能夠生成與用戶討論相似的內(nèi)容,從而推銷客戶的產(chǎn)品。這種手法不僅高效,還能在不被察覺的情況下插入廣告信息,引發(fā)了人們對網(wǎng)絡(luò)空間未來的擔(dān)憂,傳統(tǒng)互聯(lián)網(wǎng)可能被無休止的商業(yè)化和垃圾信息所侵蝕。
【AiBase提要:】
?? Astral利用AI技術(shù)在Reddit上迅速生成用戶相似的廣告帖子。
?? 創(chuàng)始人設(shè)計AI代理繞過Reddit限制,專注于商業(yè)推廣而非用戶服務(wù)。
?? 此舉引發(fā)對網(wǎng)絡(luò)內(nèi)容未來的擔(dān)憂,社交媒體可能充斥廣告與垃圾信息。
11.智譜發(fā)布 GLM-4-Air、GLM-4V-Plus 模型,設(shè)立 Flash 全模態(tài)免費模型
智譜華章科技公司發(fā)布新模型 GLM-4-Air 和 GLM-4V-Plus,并推出全新端到端模型 GLM-Realtime,實現(xiàn)低延遲的視頻理解和語音交互。該公司致力于提供高性價比的語言模型解決方案,并設(shè)立 Flash 全模態(tài)免費模型,支持多種應(yīng)用場景,助力開發(fā)者創(chuàng)新。
【AiBase 提要:】
?? 推出 GLM-Realtime,具備清唱功能和 2 分鐘記憶能力。
?? GLM-4-Air-0111 全面升級,降低應(yīng)用門檻至原來 50%。
?? Flash 全模態(tài)免費模型系列,支持多模態(tài)理解和生成。
項目入口:bigmodel.cn
12.Vidu2. 0 正式上線10 秒生成短片,主體一致性效果更佳
Vidu 視頻大模型正式發(fā)布 2.0 版本,生成短片的速度從 30 秒縮短至 10 秒,效率提升三倍。新版本優(yōu)化了視頻質(zhì)量,保證了風(fēng)格和主體的一致性,首尾過渡自然流暢。Vidu2.0 還推出超值套餐,降低了創(chuàng)作成本,并支持批量生成和本地支付,進一步便利用戶。
【AiBase 提要:】
?? Vidu2.0 將短視頻生成時間從 30 秒縮短至 10 秒。
?? 新版本在視頻質(zhì)量和一致性上進行了全面優(yōu)化。
?? 超值套餐和本地支付提升了用戶創(chuàng)作體驗。
(舉報)