歡迎來到【今日AI】欄目!這里是你每天探索人工智能世界的指南,每天我們?yōu)槟愠尸F(xiàn)AI領(lǐng)域的熱點內(nèi)容,聚焦開發(fā)者,助你洞悉技術(shù)趨勢、了解創(chuàng)新AI產(chǎn)品應(yīng)用。
新鮮AI產(chǎn)品點擊了解:https://top.aibase.com/
??????AI應(yīng)用
Gemini Pro1.5及其百萬上下文功能現(xiàn)已向所有人開放
【AiBase提要:】
? Gemini Pro1.5加入視頻模態(tài)的長上下文功能,AI可以處理更復(fù)雜的視頻內(nèi)容。
? 博主體驗Gemini Pro1.5后表示,描述準(zhǔn)確且清晰,展示強大處理能力。
? Gemini Pro1.5百萬上下文功能的開放將推動AI領(lǐng)域發(fā)展,為用戶帶來更豐富體驗。
Suno正式發(fā)布V3音樂生成模型 所有人都可用
【AiBase提要:】
? 音質(zhì)得到顯著提升,帶來更清晰動聽音頻體驗。
? V3提供更豐富音樂風(fēng)格選擇,滿足不同需求。
? 用戶指令響應(yīng)顯著改進(jìn),確保音樂結(jié)尾流暢自然。
官網(wǎng)地址:https://top.aibase.com/tool/suno-ai
剪映內(nèi)測視頻翻譯功能僅限移動端體驗
【AiBase提要:】
??剪映推出全新視頻翻譯功能,進(jìn)一步鞏固其領(lǐng)先地位。
??內(nèi)測僅限移動端體驗,審批速度較快,可在短時間獲得資格
??視頻翻譯功能僅支持用戶本人視頻,需聲音認(rèn)證。
內(nèi)測申請地址:https://bytedance.larkoffice.com/share/base/form/shrcnq7rM9EEJytIW5LKyUpVaee
HeyGen發(fā)布5.0版本上線實時數(shù)字人聊天和視頻翻譯功能
【AiBase提要:】
?全新用戶界面設(shè)計,更容易找到想要使用的功能
?引入全新視頻編輯工作室,編輯更加靈活
?上線實時數(shù)字人聊天功能,視頻翻譯等功能
產(chǎn)品入口:https://top.aibase.com/tool/heygen-5-0
零一萬物API開放 多模態(tài)中文圖表體驗超越GPT-4V
【AiBase提要:】
?? 零一萬物API正式開放,包含三款強大模型,支持通用聊天、多文檔閱讀理解等功能。
?? 多模態(tài)模型Yi-VL-Plus中文圖表體驗超越GPT-4V,支持圖表識別、信息提取、問答和推理。
?? Yi-34B-Chat-200K模型開放,準(zhǔn)確率高達(dá)99.8%,用于長文本理解、小說內(nèi)容總結(jié)和論文要點提取。
視頻轉(zhuǎn)視頻框架AnyV2V 可修改源視頻主題、風(fēng)格等
【AiBase提要:】
?? 支持對源視頻進(jìn)行深度修改,加入文本提示、主題或風(fēng)格
?? 核心目標(biāo)是簡化視頻編輯為兩個步驟
?? 整合各種圖像編輯工具,實現(xiàn)新視頻生成外觀和動作與原視頻保持一致
論文地址:https://arxiv.org/html/2403.14468v1#S6
MIT研究員推新AI圖片生成框架DMD:AI 單步生成高質(zhì)量圖像 速度快30倍
【AiBase提要:】
?? MIT研究人員開發(fā)了比傳統(tǒng)擴散模型快30倍的單步AI圖像生成器,質(zhì)量仍高。
?? 新方法結(jié)合了教師 - 學(xué)生模型,通過匹配蒸餾實現(xiàn)單步圖像生成。
?? 框架加速了圖像生成,潛在益處涉及設(shè)計工具、藥物發(fā)現(xiàn)和3D建模等領(lǐng)域。
論文網(wǎng)址:https://arxiv.org/abs/2311.18828
微軟NaturalSpeech語音合成推出第三代 生成語音更自然了
【AiBase提要:】
?? NaturalSpeech3采用屬性分解擴散模型和數(shù)據(jù)/模型擴展,提高語音合成質(zhì)量和自然度
?? FACodec和屬性分解擴散模型是NaturalSpeech3的關(guān)鍵技術(shù)
?? NaturalSpeech3在語音質(zhì)量、相似性、韻律和可懂度方面超越了現(xiàn)有TTS系統(tǒng)
論文:https://arxiv.org/abs/2403.03100
Demo 演示: https://speechresearch.github.io/naturalspeech3
??????AI新鮮事
開源AI掌機01Light爆火,讓遠(yuǎn)程操控電腦變得觸手可及
【AiBase提要:】
?01Light能夠識別屏幕內(nèi)容學(xué)習(xí)用戶習(xí)慣,提供個性化需求滿足。
? 用戶按下按鈕講話,01Light思考回應(yīng)需求,實現(xiàn)遠(yuǎn)程語音控制電腦操作。
? 完全開源的01Light能提高工作效率,節(jié)省時間,隨時隨地操控電腦。
官網(wǎng):https://top.aibase.com/tool/01-light
項目地址:https://github.com/OpenInterpreter/01
Stable Diffusion核心團(tuán)隊集體離職 AI巨頭Stability AI面臨財務(wù)危機
【AiBase提要:】
?? Stable Diffusion核心團(tuán)隊集體離職,引發(fā)科技界廣泛關(guān)注。
?? Stability AI可能因財務(wù)困境挑戰(zhàn),團(tuán)隊領(lǐng)導(dǎo)離職名單中。
?? Stable Diffusion項目開源成功,但給公司商業(yè)模式帶來挑戰(zhàn)。
百度5款大模型上新,更小更便宜!還可1分鐘零代碼打造Agent應(yīng)用
【AiBase提要】
? 做一個“英語作文批改小幫手”應(yīng)用,只需在AppBuilder中輸入應(yīng)用名稱或功能,平臺即可生成應(yīng)用。
? 百度推出5款大模型,輕量化、性價比更高,適用于各種場景下的Agent應(yīng)用。
? 千帆AppBuilder升級,支持一鍵分發(fā)到多個主流渠道,加入新的基礎(chǔ)組件如向量數(shù)據(jù)庫VDB1.0。
產(chǎn)品入口:https://top.aibase.com/tool/baiduzhinengyunqianfanappbuilder
微軟將以6.5億美元收購Inflection AI 獲得后者大模型的使用權(quán)
【AiBase提要:】
? 微軟同意支付6.5億美元收購Inflection AI,獲取大模型使用權(quán)。
? 微軟將雇傭Inflection AI大部分員工,包括聯(lián)合創(chuàng)始人。
? Inflection-2.5是Inflection最新人工智能模型,性能接近GPT-4。
中國首部AI全流程微短劇《中國神話》啟播 央視頻AI頻道上線
【AiBase提要:】
?? 央視頻推出全流程AI微短劇《中國神話》,六集展現(xiàn)經(jīng)典神話故事。
?? 央視頻AI頻道正式上線,推動視聽產(chǎn)業(yè)創(chuàng)新升級。
?? AI技術(shù)應(yīng)用助力央視頻推動中國傳媒業(yè)發(fā)展。
月入25萬,批量AI美女,收割中年男人的錢包
【AiBase提要:】
? 中年男人愿意花錢,AI美女們抓住了這一商機。
? AI美女主播以低單價產(chǎn)品吸引中老年男性用戶,通過帶貨視頻獲利豐厚,受歡迎程度高。
? AI帶貨產(chǎn)業(yè)鏈龐大,但也存在虛假宣傳和維權(quán)問題。
————
今日Midjourney提示詞:淘寶服裝模特
圖源備注:圖片由AI生成,圖片授權(quán)服務(wù)商Midjourney
A beautiful Chinese female model wearing round framed glasses, with a delicate Asian face, wearing a light gray linen short sleeved shirt and Short pants, Japanese style shirt ,hands in pockets, front view, and a beige background,full bodyshot, Studio lighting, soho, shot on Canon EOS5D Mark IV ,8k --ar3:4--v6.0
(舉報)