歡迎來到【AI日報】欄目!這里是你每天探索人工智能世界的指南,每天我們?yōu)槟愠尸F(xiàn)AI領(lǐng)域的熱點內(nèi)容,聚焦開發(fā)者,助你洞悉技術(shù)趨勢、了解創(chuàng)新AI產(chǎn)品應用。
新鮮AI產(chǎn)品點擊了解:https://top.aibase.com/
1、快手可靈AI全面接入DeepSeek-R1,DeepSeek靈感版已上線
快手旗下的可靈AI近期全面接入DeepSeek-R1,為用戶在視頻和圖片生成方面帶來了顯著便利。通過DeepSeek-R1,用戶能夠輕松將靈感轉(zhuǎn)化為專業(yè)提示詞,從而降低創(chuàng)作門檻并提升效率。此外,DeepSeek靈感版與可靈AI的靈感詞庫功能聯(lián)動,幫助用戶更好地掌控視頻細節(jié),使得即使是普通用戶也能創(chuàng)作出高質(zhì)量的內(nèi)容。這一系列創(chuàng)新舉措使得可靈AI在行業(yè)中繼續(xù)保持領(lǐng)先地位。
【AiBase提要:】
??快手可靈AI全面接入DeepSeek-R1,助力用戶將靈感轉(zhuǎn)化為專業(yè)提示詞。
??可靈AI持續(xù)迭代升級,接入DeepSeek-R1后進一步降低創(chuàng)作門檻。
??DeepSeek靈感版與“靈感詞庫”聯(lián)動,提升用戶掌控視頻細節(jié)的能力。
2、百度發(fā)布文心4.5與X1大模型,價格大幅降低引關(guān)注
百度最新推出的文心大模型4.5和X1,標志著其在多模態(tài)理解和邏輯推理領(lǐng)域的重大進展。文心4.5以其顯著的價格優(yōu)勢和卓越的性能超越了GPT-4.5,吸引了眾多開發(fā)者的關(guān)注。而X1則專注于中文知識問答和文學創(chuàng)作,具備強大的推理能力和多模態(tài)功能。
【AiBase提要:】
?? 文心4.5是百度首個原生多模態(tài)大模型,性能超越GPT-4.5,API調(diào)用價格僅為后者的1%。
?? 文心大模型X1專注于中文知識問答和邏輯推理,具備長思維鏈和多模態(tài)能力,能理解和生成圖片。
?? 文心4.5和X1的輸入輸出價格極具競爭力,標志著百度在大模型領(lǐng)域的強勁布局。
3、小米大模型團隊登頂音頻推理 MMAU 榜,受到DeepSeek-R1啟發(fā)
小米大模型團隊在音頻推理領(lǐng)域取得了顯著進展,利用強化學習算法成功提升了模型的準確率至64.5%,在國際權(quán)威的MMAU評測榜上名列前茅。該團隊的研究表明,強化學習的實時反饋機制在模型訓練中更為有效,并且開源了相關(guān)技術(shù),推動了學術(shù)界和產(chǎn)業(yè)界的進一步研究。
【AiBase提要:】
?? 小米大模型團隊通過強化學習算法在音頻推理領(lǐng)域取得突破,準確率達到64.5%。
?? MMAU 評測集是音頻推理能力的重要標準,當前人類專家準確率為82.23%。
?? 研究結(jié)果表明,強化學習的實時反饋機制對模型訓練更為有效,未來研究仍需深入探索。
詳情鏈接:https://github.com/xiaomi-research/r1-aqa
4、釘釘推出AI客服助理 可自動接入企業(yè)官網(wǎng)、公眾號等平臺
釘釘于2025年3月17日推出了AI客服助理,旨在提升企業(yè)客戶服務效率。該功能能夠自動接入企業(yè)官網(wǎng)及公眾號,支持多輪對話,精準理解用戶需求并提供專業(yè)回復。自推出以來,已有700多家企業(yè)接入,具備7×24小時在線服務,響應速度快,且可通過多平臺部署,極大便利了企業(yè)與用戶的溝通。
【AiBase提要:】
?? AI客服助理可自動接入官網(wǎng)和公眾號,提升企業(yè)服務能力。
??? 只需三步配置,企業(yè)可快速上線AI助理,簡化知識體系構(gòu)建。
?? 支持多平臺部署,企業(yè)可通過多渠道為用戶提供服務。
5、圖像效果轉(zhuǎn)換技術(shù)LBM:一鍵移除路人甲,還可調(diào)整光照
LBM(潛在橋梁匹配)是一款由gojasper團隊開發(fā)的圖像處理工具,能夠高效地實現(xiàn)圖像效果轉(zhuǎn)換。它不僅具備強大的對象移除能力,使得用戶能夠輕松去除照片中的不必要元素,還能靈活調(diào)整光線,營造出理想的氛圍。LBM的創(chuàng)新理念在于潛在空間的操作,使得圖像編輯變得更加簡單和高效,適合攝影愛好者和專業(yè)人士使用。
【AiBase提要:】
??? LBM具備強大的對象移除能力,用戶只需輕點即可去除照片中的干擾元素,簡化了圖像編輯流程。
?? 該工具支持光照調(diào)整,用戶可以在陰天拍攝的照片中創(chuàng)造出陽光明媚的效果,提升照片的視覺吸引力。
?? LBM在法線和深度估計等多種圖像轉(zhuǎn)換任務中表現(xiàn)卓越,展現(xiàn)出其廣泛的應用潛力和可擴展性。
詳情鏈接:https://top.aibase.com/tool/lbm
6、Anthropic將發(fā)布 Harmony 功能:讓 AI 助手無縫接入本地文件
Anthropic正在開發(fā)名為Harmony的新功能,旨在將本地文件目錄集成到Claude的工作環(huán)境中。這一創(chuàng)新將使用戶能夠與文件進行更流暢的互動,AI助手可以直接讀取、索引和分析目錄中的內(nèi)容。Harmony不僅支持文件的分析和修改,還提供基于關(guān)鍵詞的搜索功能,展現(xiàn)了強大的AI編碼助手潛力。
【AiBase提要:】
? Harmony功能將使用戶能夠無縫接入本地文件,提升AI的交互能力。
?? Claude在測試中成功識別了多個代碼安全漏洞,顯示出其強大的分析能力。
?? Anthropic還在開發(fā)Compass功能,可能會支持深度研究和信息整合。
7、開源圖片超分模型Thera:可以提升圖片清晰度,讓模糊從此“下崗”
Thera是一款由蘇黎世聯(lián)邦理工學院和蘇黎世大學開發(fā)的開源超分辨率模型,能夠以任意倍數(shù)提升圖片清晰度。它不僅能讓模糊照片恢復生機,還通過內(nèi)置的物理觀測模型,減少圖像失真,呈現(xiàn)更自然的細節(jié)。
【AiBase提要:】
? Thera支持任意尺度的超分辨率放大,用戶可以自定義放大倍數(shù),靈活應對各種需求。
?? 內(nèi)置物理觀測模型,模擬真實圖像形成過程,減少失真,呈現(xiàn)更真實細節(jié)。
?? 作為開源項目,Thera以Apache-2.0許可證提供,促進技術(shù)共享與發(fā)展,提供預訓練模型便于用戶使用。
詳情鏈接:https://top.aibase.com/tool/thera
8、谷歌Gemini2.0Flash去除圖片水印功能引版權(quán)擔憂
谷歌新推出的Gemini2.0Flash模型引發(fā)了關(guān)于去除圖片水印的爭議,尤其是涉及到Getty Images等知名圖片庫的內(nèi)容。盡管該模型在圖像生成和編輯方面表現(xiàn)出色,但其缺乏使用限制引發(fā)了版權(quán)方面的擔憂。Gemini2.0Flash的功能似乎更為強大,但在美國版權(quán)法下,未經(jīng)同意去除水印的行為仍然可能被視為違法。
【AiBase提要:】
??Gemini2.0Flash可去除圖片水印,功能強大但引發(fā)版權(quán)爭議。
??其他AI模型如Claude3.7Sonnet和GPT-4o拒絕去除水印,認為此舉不道德且可能違法。
??美國版權(quán)法下,未經(jīng)原所有者同意去除水印通常被視為違法,谷歌未對質(zhì)疑作出及時回應。
9、Cohere 發(fā)布AI模型Command A,兩塊GPU就能高效運轉(zhuǎn),企業(yè)部署成本降50%
Cohere推出的Command A模型以其僅需兩塊GPU的低硬件需求和高達50%的成本節(jié)省,打破了高性能AI的傳統(tǒng)門檻。其1110億參數(shù)的設(shè)計結(jié)合優(yōu)化的Transformer架構(gòu),使得企業(yè)能夠在處理復雜任務時,享受超長的上下文窗口和多語種支持。
【AiBase提要:】
?? Command A模型僅需兩塊GPU即可高效運轉(zhuǎn),顯著降低了企業(yè)的硬件需求。
?? 支持多達23種語言及地區(qū)方言,助力企業(yè)拓展全球市場。
?? 私有部署成本降低高達50%,為企業(yè)帶來顯著的財務優(yōu)勢。
詳情鏈接:https://huggingface.co/CohereForAI/c4ai-command-a-03-2025
10、首個國產(chǎn)Agent開發(fā)框架!倉頡社區(qū)發(fā)布Cangjie Magic,原生支持鴻蒙等全平臺!
Cangjie Magic是一個創(chuàng)新的智能體開發(fā)框架,基于華為自研的倉頡編程語言,旨在重塑智能體開發(fā)的方式。該框架通過獨特的Agent DSL架構(gòu)、原生支持MCP通信協(xié)議和智能調(diào)度引擎,提供了全面的智能體生命周期管理。
【AiBase提要:】
??? 獨創(chuàng)的Agent DSL架構(gòu),實現(xiàn)智能體建模的聲明式編程,提升開發(fā)效率。
?? 原生支持MCP通信協(xié)議,確保智能體之間的高效通信與協(xié)作。
?? 計劃在第三季度實現(xiàn)對Android和iOS的智能體調(diào)用能力,拓展移動端應用場景。
詳情鏈接:https://gitcode.com/Cangjie-TPC/CangjieMagic
11、OpenAI 高管預測:AI 將于2025年底超越人類程序員
在最近的播客中,OpenAI 的首席產(chǎn)品官凱文?維爾表示,人工智能預計將在2025年底之前超越人類程序員,尤其是在編碼基準測試中。他強調(diào)了AI編碼模型的快速進步,并提到Anthropic及OpenAI的先進模型正在推動編碼的自動化。隨著推理能力的提升,AI在編程領(lǐng)域的表現(xiàn)也在不斷改善,未來幾乎所有代碼可能由AI生成。
【AiBase提要:】
?? AI預計將在2025年底超越人類程序員,成為更優(yōu)秀的編碼者。
?? Anthropic和OpenAI的先進模型正在推動編碼自動化,未來幾乎所有代碼可能由AI生成。
?? OpenAI即將推出的新模型在競爭性編碼排名中不斷上升,標志著AI在編程領(lǐng)域的持續(xù)進步。
(舉報)