歡迎來到【AI日報】欄目!這里是你每天探索人工智能世界的指南,每天我們?yōu)槟愠尸F(xiàn)AI領(lǐng)域的熱點內(nèi)容,聚焦開發(fā)者,助你洞悉技術(shù)趨勢、了解創(chuàng)新AI產(chǎn)品應(yīng)用。
新鮮AI產(chǎn)品點擊了解:https://top.aibase.com/
1、谷歌Gemini即將發(fā)布五個新功能:Imagen3、定制GPT等
谷歌即將推出Gemini產(chǎn)品系列的新功能,包括Imagen3、Gemini定制GPT等,備受期待。這些新功能將為用戶帶來更加個性化和便捷的體驗,展示了谷歌在人工智能領(lǐng)域的持續(xù)創(chuàng)新和發(fā)展。
【AiBase提要:】
?? 谷歌Gemini即將發(fā)布新功能,包括Imagen3、Gemini定制GPT等,為用戶帶來更加個性化和便捷的體驗。
?? 預(yù)計Gemini還將推出個性化回應(yīng)、預(yù)定提示、錄音和Google Photos集成等功能,進(jìn)一步豐富用戶體驗。
?? 谷歌正在加緊招募iOS版Gemini的Beta測試人員,iOS更新或?qū)⒑芸烀媸溃故玖薌emini持續(xù)發(fā)展的勢頭。
2、百度推出文小言AI數(shù)字人社交APP
百度最近推出了名為"文小言"的AI數(shù)字人社交APP,利用先進(jìn)的文心大模型技術(shù),用戶可以與仿真的數(shù)字人進(jìn)行實時溝通、互動,建立情感聯(lián)系,帶來更真實、自然的交互體驗。用戶可以在應(yīng)用中找到喜歡的數(shù)字人聊天對象,了解其信息并進(jìn)行多種方式的互動。
【AiBase提要:】
?? 用戶可以與AI虛擬角色實時溝通、互動,建立情感聯(lián)系,提升交互體驗。
?? 每個AI數(shù)字人提供獨特的聊天服務(wù),可成為用戶的百科全書、生活小助手,甚至心靈導(dǎo)師。
?? 數(shù)字人在回復(fù)時展示語音、文字,并通過肢體語言增強(qiáng)真實感。
3、OpenAI草莓計劃揭秘:Q*推理能力大爆發(fā),未來觸手可及!
我對OpenAI草莓計劃感到興奮和好奇。這個項目以草莓的身份重新登場,據(jù)說能讓AI提前規(guī)劃任務(wù)、自主上網(wǎng)搜集信息,甚至進(jìn)行深入研究。草莓模型的設(shè)計理念頗具創(chuàng)新,讓AI具備前所未有的推理能力。OpenAI的秘密研發(fā)過程和高度保密讓人更加期待未來的成果。
【AiBase提要:】
?? 草莓計劃能讓AI提前規(guī)劃任務(wù)、自主上網(wǎng)搜集信息,進(jìn)行深入研究。
?? STaR技術(shù)通過迭代使用少量推理示例和大量無推理數(shù)據(jù),讓AI自我提升。
?? OpenAI希望草莓能夠執(zhí)行長時間任務(wù),提升AI模型的推理能力。
論文地址:https://arxiv.org/pdf/2203.14465
4、Magic Insert:一鍵拖放即可讓人物完美融入新背景
在數(shù)字創(chuàng)作的神奇世界里,Magic Insert技術(shù)的魅力在于可以輕松將主題從一張圖片拖放到另一張風(fēng)格迥異的背景圖中,實現(xiàn)完美融合。這項技術(shù)結(jié)合了風(fēng)格感知個性化和對象插入,展現(xiàn)出靈活性和多樣性,為圖像生成領(lǐng)域帶來新挑戰(zhàn)。
【AiBase提要:】
?? Magic Insert技術(shù)結(jié)合了風(fēng)格感知個性化和對象插入,實現(xiàn)主題在不同背景中的完美融合。
?? 技術(shù)亮點包括使用LoRA和文本標(biāo)記微調(diào)模型、Bootstrapped Domain Adaptation技術(shù)實現(xiàn)真實對象插入,以及靈活性選擇風(fēng)格化程度和主題細(xì)節(jié)忠實度。
?? 研究人員展示了Magic Insert在多種風(fēng)格主題和背景上的實驗結(jié)果,證明其有效性和用戶偏好。
詳情鏈接:https://magicinsert.github.io/demo.html
5、快看漫畫:正在訓(xùn)練二次元領(lǐng)域垂直大模型
快看漫畫正致力于探索基于開源大模型進(jìn)行微調(diào),訓(xùn)練二次元領(lǐng)域的垂直大模型,以提升作品搜索轉(zhuǎn)化率和活力,推動漫畫行業(yè)的創(chuàng)新發(fā)展。通過應(yīng)用大語言模型(LLM)和檢索增強(qiáng)生成技術(shù)(RAG),快看漫畫構(gòu)建了內(nèi)部知識庫,采用微調(diào)大模型+RAG增強(qiáng)策略,提高了搜索回答響應(yīng)速度和排序指標(biāo)。
【AiBase提要:】
?? 利用大模型進(jìn)行微調(diào),提升作品搜索轉(zhuǎn)化率和活力
?? 應(yīng)用大語言模型(LLM)和檢索增強(qiáng)生成技術(shù)(RAG),構(gòu)建內(nèi)部知識庫
?? 推動漫畫行業(yè)創(chuàng)新發(fā)展,提升用戶體驗和內(nèi)容產(chǎn)能
6、個性化服務(wù)升級!亞馬遜悄悄上線Rufus AI購物助手
亞馬遜最新推出的Rufus AI購物助手為用戶帶來個性化購物體驗,通過智能問答服務(wù)幫助用戶節(jié)省時間、做出明智選擇,展現(xiàn)出色的購物問題解決能力。
【AiBase提要:】
?? Rufus AI購物助手上線,提供個性化購物體驗,節(jié)省用戶時間。
?? 智能問答服務(wù),詳盡回答用戶關(guān)于產(chǎn)品的各種問題,包括推薦、比較、訂單追蹤。
?? Rufus展現(xiàn)潛力,有望成為亞馬遜智能購物領(lǐng)域的王牌,引領(lǐng)零售創(chuàng)新。
7、谷歌 Eureka AI模型提前曝光 卓越的文本寫作能力引關(guān)注
谷歌即將推出名為“Eureka”的新型AI模型,備受關(guān)注。Eureka在自然語言生成方面表現(xiàn)出色,被認(rèn)為是谷歌在AI領(lǐng)域的重大突破。預(yù)計在7月15日將發(fā)布初步公告,7月18日有望正式發(fā)布。除了Eureka,谷歌還在開發(fā)其他新工具,如Google Gemini,引起行業(yè)極大興趣。
【AiBase提要:】
? Eureka模型在自然語言生成方面表現(xiàn)出色,超越其他模型。
?? Eureka展示了改進(jìn)的指令遵循能力,對用戶定義參數(shù)遵守異常。
?? Eureka在廣泛的AI驅(qū)動任務(wù)中具有提高性能的潛力。
8、3D視覺重建技術(shù)DUSt3R:輕松基于2D圖片生成3D模型
DUSt3R是一項創(chuàng)新技術(shù),能在沒有相機(jī)信息的情況下創(chuàng)建3D模型,極大地簡化了從2D圖片到3D模型的轉(zhuǎn)換過程。它采用智能的處理方式,提供高效的重建任務(wù)處理,表現(xiàn)卓越,在多種視覺任務(wù)中取得最佳成績。
【AiBase提要:】
?? 創(chuàng)新技術(shù): DUSt3R能在沒有相機(jī)信息的情況下創(chuàng)建3D模型,簡化了復(fù)雜的相機(jī)參數(shù)需求。
?? 高效處理: DUSt3R統(tǒng)一處理多張圖片的重建任務(wù),智能高效。
?? 卓越表現(xiàn): DUSt3R在多種視覺任務(wù)中表現(xiàn)出色,取得最佳成績。
詳情鏈接:https://top.aibase.com/tool/dust3r
9、OpenDiLoCo:分布式AI訓(xùn)練的開源解決方案,低通信成本,全球覆蓋!
在AI大爆炸時代,OpenDiLoCo開源框架實現(xiàn)了DiLoCo訓(xùn)練方法,通過低通信成本實現(xiàn)全球分布式訓(xùn)練,保持高計算利用率。
【AiBase提要:】
?? 全球分布式訓(xùn)練: OpenDiLoCo實現(xiàn)了全球范圍內(nèi)的模型訓(xùn)練,跨越兩大洲、三個國家,保持高計算利用率。
?? 動態(tài)資源管理: 訓(xùn)練過程中可動態(tài)調(diào)整計算資源,新設(shè)備可隨時加入或退出訓(xùn)練。
?? 容錯與點對點通信: 使用Hivemind庫實現(xiàn)容錯訓(xùn)練,點對點通信方式進(jìn)行訓(xùn)練,提高效率和穩(wěn)定性。
詳情鏈接:https://arxiv.org/pdf/2407.07852
10、微軟MIT開創(chuàng)推理新紀(jì)元:6700萬參數(shù)模型,與GPT-4一較高下
在這篇論文中,研究人員介紹了一種突破性的機(jī)器學(xué)習(xí)訓(xùn)練策略,通過改進(jìn)邏輯推理能力和利用因果關(guān)系構(gòu)建訓(xùn)練集,成功訓(xùn)練出了一個小型Transformer模型,與GPT-4相媲美。這項研究為AI學(xué)習(xí)因果推理打開了新的可能性,讓AI能夠更好地理解和解釋世界。
【AiBase提要:】
?? 獨特的訓(xùn)練方法: 采用新穎訓(xùn)練方法,提升大型模型的邏輯推理能力。
?? 邏輯推理的改進(jìn): 顯著提升模型的邏輯推理能力,解決了先前挑戰(zhàn)。
?? 利用因果關(guān)系構(gòu)建訓(xùn)練集: 利用因果關(guān)系模型構(gòu)建訓(xùn)練數(shù)據(jù)集,幫助模型理解數(shù)據(jù)背后的因果邏輯。
詳情鏈接:https://arxiv.org/pdf/2407.07612v1
11、美國金融監(jiān)管機(jī)構(gòu)敦促調(diào)查OpenAI的保密協(xié)議問題
本文報道了一群舉報人揭露OpenAI公司的保密協(xié)議存在問題,要求美國金融監(jiān)管機(jī)構(gòu)展開調(diào)查。舉報人指稱OpenAI可能限制員工的舉報權(quán)利,引發(fā)公眾擔(dān)憂。格拉斯利表示OpenAI的政策限制了舉報人的權(quán)利,呼吁SEC對其不當(dāng)行為進(jìn)行調(diào)查。
【AiBase提要:】
?? 舉報人揭露OpenAI公司保密協(xié)議問題,要求SEC展開調(diào)查
?? OpenAI被指違反SEC規(guī)定,剝奪員工舉報權(quán)利
?? 根據(jù)舉報信,OpenAI被要求生產(chǎn)所有保密協(xié)議,避免侵犯員工權(quán)利,舉報人要求SEC對OpenAI的不當(dāng)行為進(jìn)行調(diào)查
(舉報)