歡迎來到【AI日?qǐng)?bào)】欄目!這里是你每天探索人工智能世界的指南,每天我們?yōu)槟愠尸F(xiàn)AI領(lǐng)域的熱點(diǎn)內(nèi)容,聚焦開發(fā)者,助你洞悉技術(shù)趨勢、了解創(chuàng)新AI產(chǎn)品應(yīng)用。
新鮮AI產(chǎn)品點(diǎn)擊了解:https://top.aibase.com/
1、昆侖萬維天工大模型4.0o1版和4o版正式上線
2025年1月6日,昆侖萬維集團(tuán)推出了其最新的「天工大模型4.0」o1版和4o版,標(biāo)志著在人工智能領(lǐng)域的一次重大進(jìn)展。o1版是國內(nèi)首款具備中文邏輯推理能力的模型,經(jīng)過技術(shù)升級(jí),能夠處理多種推理挑戰(zhàn)。而4o版則是一款多模態(tài)模型,擁有情感表達(dá)和多語言能力,為用戶提供了更自然的對(duì)話體驗(yàn)。。
【AiBase提要:】
?? o1版具備中文邏輯推理能力,經(jīng)過技術(shù)升級(jí),能處理數(shù)學(xué)、代碼等多種推理挑戰(zhàn)。
??4o版是一款多模態(tài)模型,提供情感表達(dá)和快速響應(yīng)的實(shí)時(shí)語音對(duì)話助手Skyo。
?? 兩款模型的發(fā)布推動(dòng)了昆侖萬維在AI領(lǐng)域的技術(shù)進(jìn)步和應(yīng)用拓展。
詳情鏈接:https://www.tiangong.cn/
2、羅永浩新 AI 助理 “J1Assistant” 正式上線,語音交互引領(lǐng)智能新時(shí)代
羅永浩的人工智能項(xiàng)目Jarvis推出了名為“J1Assistant”的AI助理軟件,現(xiàn)僅在海外提供安卓版本。該軟件的亮點(diǎn)在于其音頻輸入功能,用戶可以通過語音輕松發(fā)送消息、搜索信息或與AI模型互動(dòng)。J1Assistant集成了Jarvis自家AI模型,具備備忘錄功能,幫助用戶管理日常事務(wù)。
【AiBase提要:】
?? J1Assistant推出音頻輸入功能,用戶可通過語音進(jìn)行操作,提升交互體驗(yàn)。
?? 集成Jarvis自家AI模型,提供實(shí)用答案及備忘錄功能,幫助用戶管理事務(wù)。
?? 目前僅支持安卓版本,未來有望推出更多功能和平臺(tái),滿足用戶需求。
3、愛奇藝起訴MiniMax:AI模型涉嫌侵犯版權(quán),要求賠償10萬元
有媒體報(bào)道稱愛奇藝向法院提起訴訟,指控AI初創(chuàng)企業(yè)MiniMax在模型訓(xùn)練中侵犯其版權(quán)。MiniMax被指未經(jīng)授權(quán)使用愛奇藝的素材,生成侵權(quán)內(nèi)容。愛奇藝要求MiniMax立即停止侵權(quán)并索賠10萬元。MiniMax可能會(huì)以素材為公開資源或用戶輸入為由進(jìn)行抗辯,爭取法律免責(zé)。此事件尚未有雙方公開回應(yīng),法律爭議仍在發(fā)展中。
【AiBase提要:】
?? 愛奇藝已向法院起訴MiniMax,指控其侵犯版權(quán)。
?? MiniMax被指未經(jīng)授權(quán)使用愛奇藝的版權(quán)素材進(jìn)行模型訓(xùn)練。
?? 愛奇藝要求MiniMax停止侵權(quán)并索賠約10萬元人民幣。
4、阿里團(tuán)隊(duì)出品!妝容遷移技術(shù)SHMT:提供化妝參考圖就能給你上妝
阿里巴巴達(dá)摩院最近推出的SHMT模型,利用潛在擴(kuò)散模型實(shí)現(xiàn)化妝效果的精準(zhǔn)轉(zhuǎn)移,已被國際頂級(jí)學(xué)術(shù)會(huì)議NeurIPS2024接收。該技術(shù)通過簡單的化妝參考圖和目標(biāo)角色照片,能夠快速生成妝容效果,極大地推動(dòng)了化妝應(yīng)用和圖像處理領(lǐng)域的發(fā)展。
【AiBase提要:】
?? SHMT模型利用潛在擴(kuò)散模型實(shí)現(xiàn)化妝效果轉(zhuǎn)移,已被NeurIPS2024接收。
?? 團(tuán)隊(duì)提供完整的開源代碼和預(yù)訓(xùn)練模型,便于研究人員進(jìn)行應(yīng)用與改進(jìn)。
?? 數(shù)據(jù)準(zhǔn)備和參數(shù)調(diào)整至關(guān)重要,研究中詳細(xì)指導(dǎo)了操作流程和目錄結(jié)構(gòu)。
詳情鏈接:https://github.com/Snowfallingplum/SHMT
5、字節(jié)跳動(dòng)開源全新AI模型LatentSync 精準(zhǔn)控制唇形同步
字節(jié)跳動(dòng)推出的LatentSync是一項(xiàng)先進(jìn)的端到端唇同步技術(shù),利用音頻條件的潛在擴(kuò)散模型,實(shí)現(xiàn)了視頻中人物唇部動(dòng)作與音頻的精確匹配。該技術(shù)通過引入TREPA技術(shù),增強(qiáng)了時(shí)間一致性,同時(shí)優(yōu)化了SyncNet的收斂性,顯著提升了唇同步的準(zhǔn)確性。
【AiBase提要:】
?? 端到端框架:LatentSync無需中間運(yùn)動(dòng)表示,直接從音頻生成唇部動(dòng)作。
?? 高質(zhì)量生成:利用Stable Diffusion生成動(dòng)態(tài)逼真的說話視頻,提升視覺效果。
?? 時(shí)間一致性:通過TREPA技術(shù)增強(qiáng)視頻幀之間的時(shí)間一致性,確保唇同步的準(zhǔn)確性。
詳情鏈接:https://github.com/bytedance/LatentSync
6、Meta 發(fā)布新型記憶層技術(shù):突破參數(shù)限制,大幅提升 AI 事實(shí)準(zhǔn)確性
Meta 公司近日推出了一項(xiàng)創(chuàng)新的記憶層技術(shù),旨在提升大型語言模型的事實(shí)準(zhǔn)確性并擴(kuò)展參數(shù)規(guī)模。這項(xiàng)技術(shù)通過可訓(xùn)練的鍵值查找機(jī)制,顯著提高了模型的信息存儲(chǔ)和檢索能力。實(shí)驗(yàn)結(jié)果表明,配備記憶層的模型在多個(gè)任務(wù)中表現(xiàn)優(yōu)異,尤其在事實(shí)性任務(wù)上,性能提升顯著。
【AiBase提要:】
?? 記憶層技術(shù)通過稀疏激活機(jī)制提升事實(shí)準(zhǔn)確性,達(dá)到1280億參數(shù)的規(guī)模。
?? 實(shí)驗(yàn)顯示,配備記憶層的模型在事實(shí)性問答等任務(wù)中表現(xiàn)優(yōu)于傳統(tǒng)稠密模型。
?? 研究人員對(duì)記憶層進(jìn)行了多項(xiàng)優(yōu)化,提升了性能和穩(wěn)定性,展示出強(qiáng)大的可擴(kuò)展性。
詳情鏈接:https://arxiv.org/pdf/2412.09764
7、Yukai推出陪伴型機(jī)器人“Mirumi”:毛茸茸的帶給你嬰兒般的情感體驗(yàn)
Yukai Engineering以其創(chuàng)新的機(jī)器人產(chǎn)品而聞名,最新推出的Mirumi是一款裝在錢包上的毛茸茸小球,能夠自發(fā)轉(zhuǎn)頭觀察周圍的人。這款機(jī)器人旨在模仿嬰兒的天真與愉快,帶給人們愉悅的互動(dòng)體驗(yàn)。Mirumi的設(shè)計(jì)靈感源自日本妖怪,結(jié)合運(yùn)動(dòng)感應(yīng)技術(shù),展現(xiàn)多種情感,如好奇、害羞等,進(jìn)一步彰顯了Yukai在奇特機(jī)器人領(lǐng)域的獨(dú)特地位。
【AiBase提要:】
?? Mirumi是一款毛茸茸的小球,能自發(fā)轉(zhuǎn)頭觀察周圍,帶來愉悅感。
?? 該機(jī)器人通過運(yùn)動(dòng)感應(yīng)表達(dá)情感,模仿嬰兒的天真與互動(dòng)。
?? Mirumi的設(shè)計(jì)靈感源自日本妖怪,旨在重現(xiàn)與嬰兒互動(dòng)的快樂體驗(yàn)。
8、OpenAI 開始將目標(biāo)轉(zhuǎn)向“超級(jí)智能”
OpenAI CEO 山姆?奧特曼在其博客中宣布,公司已掌握構(gòu)建人工智能(AGI)的核心技術(shù),并將目標(biāo)轉(zhuǎn)向超智能。他認(rèn)為,超智能將顯著提升科學(xué)發(fā)現(xiàn)和創(chuàng)新速度,推動(dòng)社會(huì)繁榮。盡管當(dāng)前技術(shù)存在限制,如“幻覺”現(xiàn)象和高運(yùn)行成本,奧特曼對(duì)未來充滿信心,認(rèn)為技術(shù)進(jìn)步將改變時(shí)間線。
【AiBase提要:】
?? OpenAI CEO 山姆?奧特曼表示,公司已經(jīng)掌握了構(gòu)建 AGI 的技術(shù),并將目標(biāo)轉(zhuǎn)向超智能。
?? AGI 被定義為在經(jīng)濟(jì)上超越人類的高度自主系統(tǒng),OpenAI 與微軟的協(xié)議對(duì)其有明確約定。
?? 盡管當(dāng)前技術(shù)仍有限制,奧特曼對(duì)未來發(fā)展充滿信心,認(rèn)為時(shí)間線會(huì)隨著技術(shù)進(jìn)步而變化。
9、哈佛大學(xué)華人研究員Jeffrey Wang加盟OpenAI 專注模型預(yù)訓(xùn)練和推理工作
Jeffrey Wang,哈佛大學(xué)的華人研究員,最近加入OpenAI,專注于模型預(yù)訓(xùn)練和推理工作。他的學(xué)術(shù)成就和研究背景引起了廣泛關(guān)注,尤其是在機(jī)器學(xué)習(xí)和隱私性領(lǐng)域的貢獻(xiàn)。Jeffrey的加入不僅是他個(gè)人職業(yè)生涯的重要一步,也展示了OpenAI對(duì)頂尖人才的吸引力,預(yù)示著未來AI研究的蓬勃發(fā)展。
【AiBase提要:】
?? Jeffrey Wang在哈佛大學(xué)期間積極參與機(jī)器學(xué)習(xí)和統(tǒng)計(jì)學(xué)的研究,并教授相關(guān)課程。
?? 他的研究成果在多個(gè)國際會(huì)議上發(fā)表,探討了語言模型隱私和擴(kuò)散模型的公平性問題。
?? Jeffrey Wang的加入標(biāo)志著OpenAI吸引頂尖人才的能力,推動(dòng)AI領(lǐng)域的發(fā)展。
10、微軟計(jì)劃在2025財(cái)年投入800億美元建設(shè)人工智能數(shù)據(jù)中心
微軟公司在2025財(cái)年計(jì)劃投入800億美元用于建設(shè)專門處理人工智能工作負(fù)載的數(shù)據(jù)中心。這一投資旨在加速AI模型的訓(xùn)練和云應(yīng)用的全球部署,展現(xiàn)了美國在新技術(shù)浪潮中的重要地位。隨著AI技術(shù)的迅速發(fā)展,微軟的投資不僅是對(duì)自身業(yè)務(wù)的擴(kuò)展,也反映了對(duì)基礎(chǔ)設(shè)施的迫切需求,未來將為更多行業(yè)的數(shù)字化轉(zhuǎn)型提供強(qiáng)大支持。
【AiBase提要:】
?? 超過一半的資金將用于美國建設(shè),彰顯其在AI技術(shù)中的重要地位。
?? 微軟與OpenAI的競爭關(guān)系日益緊張,未來可能影響行業(yè)格局。
? 隨著AI技術(shù)需求增加,電力需求也在急劇上升,數(shù)據(jù)中心面臨電力短缺風(fēng)險(xiǎn)。
11、這能力絕了!AI 可以“聽出”鋰電池即將起火的信號(hào)
鋰離子電池在我們的日常生活中無處不在,但其過熱或損壞可能引發(fā)嚴(yán)重火災(zāi)。2023年,紐約市因電動(dòng)自行車電池引發(fā)的火災(zāi)事件頻發(fā),造成多起傷亡。為應(yīng)對(duì)這一風(fēng)險(xiǎn),NIST研究團(tuán)隊(duì)開發(fā)了一種基于聲音的火災(zāi)預(yù)警技術(shù),能夠通過AI算法識(shí)別電池安全閥破裂聲,提前約兩分鐘發(fā)出警告。
【AiBase提要:】
?? NIST研究團(tuán)隊(duì)開發(fā)基于聲音的鋰電池火災(zāi)預(yù)警技術(shù),利用AI識(shí)別安全閥破裂聲。
?? 經(jīng)過訓(xùn)練的算法識(shí)別率高達(dá)94%,在多種噪音干擾下仍能保持高效檢測。
? 新型火災(zāi)警報(bào)器預(yù)計(jì)提供約兩分鐘的提前預(yù)警,幫助人們及時(shí)逃生。
12、馬斯克宣布 Grok3即將上線,實(shí)力提升十倍!
在人工智能領(lǐng)域,埃隆·馬斯克再次成為焦點(diǎn),他在社交媒體上透露,備受期待的Grok3模型即將推出,計(jì)算能力較Grok2提升十倍。Grok系列自發(fā)布以來備受關(guān)注,盡管Grok3的推出經(jīng)歷了一些延遲,但馬斯克的最新消息無疑令期待已久的用戶振奮。
【AiBase提要:】
?? Grok3模型即將推出,計(jì)算能力提升十倍,使用了10萬塊英偉達(dá)H100芯片。
?? 盡管Grok3原定去年底發(fā)布,但由于多種原因推遲,馬斯克確認(rèn)預(yù)訓(xùn)練工作已完成。
?? 全球?qū)I技術(shù)的需求增長,Grok3的發(fā)布將為開發(fā)者和企業(yè)帶來新的機(jī)遇和挑戰(zhàn)。
(舉報(bào))