歡迎來到【AI日報】欄目!這里是你每天探索人工智能世界的指南,每天我們?yōu)槟愠尸F(xiàn)AI領(lǐng)域的熱點內(nèi)容,聚焦開發(fā)者,助你洞悉技術(shù)趨勢、了解創(chuàng)新AI產(chǎn)品應(yīng)用。
新鮮AI產(chǎn)品點擊了解:https://top.aibase.com/
1、騰訊SaaS產(chǎn)品智能化升級 全面接入混元模型
騰訊宣布旗下協(xié)作SaaS產(chǎn)品全面接入混元模型,實現(xiàn)軟件服務(wù)智能化。騰訊樂享、騰訊電子簽、騰訊問卷等產(chǎn)品已實現(xiàn)智能化升級,為用戶提供更智能、高效的服務(wù)?;煸竽P鸵褦U展至萬億級參數(shù)規(guī)模,在國內(nèi)率先采用混合專家模型結(jié)構(gòu),性能表現(xiàn)優(yōu)異。外部開發(fā)者和企業(yè)可以通過騰訊云上API直接調(diào)用騰訊混元能力,解決用戶痛點。
【AiBase提要:】
?? 騰訊SaaS產(chǎn)品實現(xiàn)智能化升級,提供更智能、高效的服務(wù)。
?? 混元大模型擴展至萬億級參數(shù)規(guī)模,性能在多方面表現(xiàn)優(yōu)異。
?? 外部開發(fā)者和企業(yè)可通過騰訊云API調(diào)用混元能力,解決不同場景下的痛點。
2、微軟發(fā)布iPhone可運行的ChatGPT級AI模型Phi-3系列 挑戰(zhàn)OpenAI地位
微軟最新推出的Phi-3系列小型AI模型在AI領(lǐng)域引起轟動,尤其是Phi-3-mini模型在多項基準(zhǔn)測試中超越了參數(shù)更大的Llama3模型。該系列模型能在iPhone14Pro和iPhone15上實現(xiàn)每秒12token的運行速度,達到了ChatGPT水平。微軟強調(diào)訓(xùn)練數(shù)據(jù)的重要性,通過精心設(shè)計數(shù)據(jù)和訓(xùn)練方法提升模型性能。
【AiBase提要:】
?? Phi-3-mini模型參數(shù)僅3.8B,性能超越8B參數(shù)的Llama3模型。
?? Phi-3系列包括Phi-3-small和Phi-3-medium版本,性能優(yōu)越。
?? 微軟團隊通過精心設(shè)計訓(xùn)練數(shù)據(jù)和獨特訓(xùn)練方法提升了Phi-3系列模型的性能。
詳情鏈接:https://arxiv.org/pdf/2404.14219.pdf
3、全國首例AI聲音侵權(quán)案一審宣判 自己聲音被AI化出售獲賠25萬元
這篇文章報道了全國首例AI聲音侵權(quán)案的一審判決結(jié)果,涉及配音師聲音被AI技術(shù)濫用的案件引起社會廣泛關(guān)注。法院裁定被告未經(jīng)授權(quán)擅自使用配音師聲音開發(fā)AI產(chǎn)品構(gòu)成侵權(quán),需賠償25萬元。判決強調(diào)聲音作為人格權(quán)益應(yīng)受法律保護,為聲音創(chuàng)作者提供了重要法律保障。
【AiBase提要:】
?? 首例AI聲音侵權(quán)案一審判決結(jié)果:被告未經(jīng)授權(quán)使用配音師聲音開發(fā)AI產(chǎn)品,需賠償25萬元。
?? 法院強調(diào)聲音作為獨特人格權(quán)益應(yīng)受法律保護,未經(jīng)授權(quán)擅自使用聲音構(gòu)成侵權(quán)行為。
????? 判決為聲音創(chuàng)作者提供了重要法律保障,將堅決維護聲音權(quán)益并打擊侵權(quán)行為。
4、中文聊天模型Llama3-8B-Chinese-Chat發(fā)布
這篇文章介紹了基于Meta-Llama-3-8B-Instruct模型經(jīng)過ORPO方法微調(diào)的中文聊天模型Llama3-8B-Chinese-Chat。該模型減少了中英混合回答和表情符號的使用,使得回答更正式和專業(yè)。它在理解中文問題意圖、提供恰當(dāng)回答、拒絕不當(dāng)請求等方面表現(xiàn)出色。
【AiBase提要:】
?? Llama3-8B-Chinese-Chat是基于Meta-Llama-3-8B-Instruct模型通過ORPO方法微調(diào)的中文聊天模型,減少了中英混合回答和表情符號的使用。
?? ORPO方法利用賠率比概念調(diào)整模型偏好設(shè)置,優(yōu)化模型在特定任務(wù)中的表現(xiàn),Llama3-8B-Chinese-Chat模型使用ORPO優(yōu)化中英文生成偏好。
?? Llama3-8B-Chinese-Chat模型在安全、道德、數(shù)學(xué)問題解答、寫作和編程示例等方面表現(xiàn)出色,提供更準(zhǔn)確、專業(yè)的回答和示例代碼。
詳情鏈接:https://top.aibase.com/tool/llama3-8b-chinese-chat
5、Adobe發(fā)布視頻超分辨率項目VideoGigaGAN
Adobe最近推出了視頻超分辨率項目VideoGigaGAN,該項目在視頻放大技術(shù)方面取得了顯著進展,能將視頻放大至原始分辨率的8倍,保持時間連貫性和高頻細節(jié)清晰度。這一技術(shù)將視頻處理帶入新階段,極大擴展了視頻內(nèi)容的應(yīng)用范圍和質(zhì)量。
【AiBase提要:】
? VideoGigaGAN實現(xiàn)視頻放大至8倍原始分辨率,保持時間連貫性和高頻細節(jié)清晰度。
?? Adobe優(yōu)化GigaGAN模型,增強視頻穩(wěn)定性,展示卓越性能。
?? VideoGigaGAN提升視頻視覺質(zhì)量,適應(yīng)不同風(fēng)格視頻內(nèi)容,具有廣泛的應(yīng)用潛力。
詳情鏈接:https://top.aibase.com/tool/videogigagan
6、Midjourney發(fā)布random功能 可基于提示詞生成完全隨機的圖像風(fēng)格
Midjourney發(fā)布了一個有趣的功能,可以基于提示詞生成完全隨機的圖像風(fēng)格。用戶可以通過隨機生成的圖像風(fēng)格來探索不同的創(chuàng)作方向,同時還可以與其他用戶進行實時交流和分享,共同探討創(chuàng)作過程中的靈感和想法。這一功能的推出將進一步豐富用戶的圖像生成體驗,為他們提供更多的創(chuàng)作選擇和交流平臺。
【AiBase提要:】
?? 可基于提示詞生成完全隨機的圖像風(fēng)格
?? 用戶可以通過Room功能進行實時交流和分享
?? 探索不同的創(chuàng)作方向,豐富用戶的圖像生成體驗
7、AI獨角獸月之暗面創(chuàng)始人楊植麟套現(xiàn)數(shù)千萬美金 官方回應(yīng)
楊植麟作為月之暗面創(chuàng)始人,通過個人股份銷售套現(xiàn)數(shù)千萬美元,引起廣泛關(guān)注。公司成立僅一年便獲得巨額融資,估值超過25億美元。月之暗面的成功不僅在估值上體現(xiàn),旗艦產(chǎn)品Kimi Chat的成功也備受矚目。
【AiBase提要:】
?? 月之暗面創(chuàng)始人楊植麟通過個人股份銷售套現(xiàn)數(shù)千萬美元,公司估值超過25億美元。
?? 月之暗面創(chuàng)立僅一年便迅速崛起,成為中國大模型領(lǐng)域獨角獸之一。
?? 月之暗面旗艦產(chǎn)品Kimi Chat憑借“長文本”功能在AI大模型領(lǐng)域脫穎而出,引發(fā)資本市場熱潮。
8、毫不猶豫!小扎自曝愿開源100億美元模型 直言2025年之前AGI不可能實現(xiàn)
在最新的播客訪談中,小扎展現(xiàn)了開源英雄形象,表示愿意開源價值100億美元模型,強調(diào)開源降低成本促進創(chuàng)新,但也需綜合考慮經(jīng)濟利弊。他對2025年之前AGI實現(xiàn)持悲觀態(tài)度,認(rèn)為能源短缺是瓶頸,解決可能需數(shù)十年。批評蘋果和谷歌獨占移動生態(tài),希望通過開源改變局面,防范競爭對手威脅。對于人工智能發(fā)展瓶頸,擔(dān)憂能源限制和數(shù)據(jù)中心挑戰(zhàn),持保留態(tài)度未來AI模型能力提升。
【AiBase提要:】
?? 小扎愿意開源價值100億美元模型,認(rèn)為開源降低成本促進創(chuàng)新,但需綜合考慮經(jīng)濟利弊。
?? 對2025年之前AGI實現(xiàn)持悲觀態(tài)度,認(rèn)為能源短缺是瓶頸,解決可能需數(shù)十年。
?? 批評蘋果和谷歌獨占移動生態(tài),希望通過開源改變局面,防范競爭對手威脅。
9、字節(jié)跳動發(fā)布圖像模型蒸餾算法Hyper-SD
這篇文章介紹了字節(jié)跳動的Lightning團隊發(fā)布的新圖像模型蒸餾算法Hyper-SD,該算法在圖像處理和機器學(xué)習(xí)領(lǐng)域取得重要進展。通過創(chuàng)新的方法提升了模型性能,在保持模型精簡的同時提高了推理速度和效率。
【AiBase提要:】
?? 分段軌跡一致性蒸餾:Hyper-SD技術(shù)確保了原始ODE軌跡的完整性。
?? 人類反饋學(xué)習(xí)機制:引入人類反饋學(xué)習(xí),提升模型表現(xiàn),減少性能損失。
?? 分?jǐn)?shù)蒸餾技術(shù):增強了模型在低步推理下的生成能力,進一步提升性能。
詳情鏈接:https://top.aibase.com/tool/hyper-sd
10、AI音樂生成工具AI Jukebox 輸入提示詞選擇曲風(fēng)即可創(chuàng)作音樂
AI Jukebox是一款利用人工智能技術(shù)的音樂生成工具,通過Hugging Face平臺提供服務(wù)。它簡化音樂創(chuàng)作過程,智能化且用戶友好。用戶可以通過輸入提示詞指導(dǎo)AI生成特定風(fēng)格音樂,實現(xiàn)智能化音樂創(chuàng)作。AI Jukebox鼓勵人機合作模式,為音樂人和音樂愛好者提供靈感和創(chuàng)作工具,探索無限可能性。
【AiBase提要:】
?? 本地化模型加載: 用戶打開AI Jukebox的網(wǎng)頁后,系統(tǒng)自動加載生成模型,無需復(fù)雜設(shè)置。
?? 基于提示詞的音樂生成: 用戶通過輸入特定提示詞指導(dǎo)AI生成特定風(fēng)格音樂,包括音樂類型、情感、樂器等描述。
?? 人機合作模式: AI Jukebox鼓勵用戶與AI合作,探索新的音樂創(chuàng)作方式,提供靈感和創(chuàng)作工具。
詳情鏈接:https://top.aibase.com/tool/ai-jukebox
11、虛擬人聊天系統(tǒng)Live2D
這篇文章介紹了基于Unity開發(fā)的Live2D虛擬人聊天系統(tǒng)項目,利用Live2D技術(shù)展現(xiàn)動態(tài)虛擬人形象,提供流暢的動畫效果,增強用戶交互體驗。項目集成了Azure、OpenAI和APISpace等API支持自然語言處理和生成,實現(xiàn)實時文本交流。同時支持圖像處理和人臉檢測,高清分辨率顯示,以及自定義擴展功能。
【AiBase提要:】
????? Live2D虛擬人形象集成,提供流暢的動畫效果,增強用戶體驗。
?? 實時聊天功能,虛擬人能理解并回應(yīng)用戶文本輸入,實現(xiàn)實時交流。
?? 圖像處理和人臉檢測,讓虛擬人更好地響應(yīng)用戶視覺輸入。
詳情鏈接:https://top.aibase.com/tool/live2d-virtual-human-for-chatting-based-on-unity
12、港大與浙大聯(lián)合研發(fā)SC-GS模型
本文介紹了香港大學(xué)CVMI實驗室與3D大模型公司VAST以及浙江大學(xué)聯(lián)合研究團隊提出的SC-GS模型,該模型在數(shù)字資產(chǎn)創(chuàng)造和3D重建領(lǐng)域取得突破性成果。通過稀疏控制點實時交互編輯,實現(xiàn)了對動態(tài)場景的高效編輯和合成,展現(xiàn)了巨大潛力。
【AiBase提要:】
?? SC-GS模型在新視角合成領(lǐng)域掀起革命性浪潮,展現(xiàn)出對動態(tài)高斯的稀疏控制點進行實時交互編輯的能力。
?? 用戶可以通過簡單的鼠標(biāo)拖拽和鍵盤組合按鍵操作,輕松實現(xiàn)對重建動態(tài)場景的編輯。
?? SC-GS模型通過神經(jīng)網(wǎng)絡(luò)預(yù)測控制點運動狀態(tài),驅(qū)動整個場景中的動態(tài)高斯進行變形,提升了動態(tài)新視角合成的性能。
詳情鏈接:https://top.aibase.com/tool/sc-gs
13、新視頻分割技術(shù)SAM 可高效識別移動物體
本文介紹了在視頻分割領(lǐng)域,研究團隊探索新的視頻對象分割技術(shù),通過結(jié)合SAM模型和光流技術(shù),提高了視頻分割性能。兩種模型展示了潛力,實現(xiàn)了顯著性能提升,并將分割技術(shù)擴展到整個視頻序列,實現(xiàn)物體追蹤。這些技術(shù)提升了視頻分割精度和效率,降低了計算復(fù)雜度,對多個應(yīng)用場景具有重要意義。
【AiBase提要:】
?? SAM與光流結(jié)合的模型展示了提高視頻分割性能的潛力。
?? SAM與RGB圖像結(jié)合的模型增強了模型對視頻中物體運動的識別和分割能力。
?? 將基于幀的分割方法擴展到整個視頻序列,實現(xiàn)了物體在視頻連續(xù)幀中的身份追蹤。
詳情鏈接:https://www.robots.ox.ac.uk/~vgg/research/flowsam/
(舉報)