歡迎來(lái)到【AI日?qǐng)?bào)】欄目!這里是你每天探索人工智能世界的指南,每天我們?yōu)槟愠尸F(xiàn)AI領(lǐng)域的熱點(diǎn)內(nèi)容,聚焦開(kāi)發(fā)者,助你洞悉技術(shù)趨勢(shì)、了解創(chuàng)新AI產(chǎn)品應(yīng)用。
新鮮AI產(chǎn)品點(diǎn)擊了解:https://top.aibase.com/
1、OpenAI推ChatGPT新圖像生成功能API:開(kāi)發(fā)者可輕松集成 AI 繪圖功能
OpenAI最近推出了gpt-image-1圖像生成API,開(kāi)發(fā)者可以將這一先進(jìn)技術(shù)輕松集成到各種應(yīng)用中。這一功能自上線以來(lái),吸引了大量用戶(hù),生成了超過(guò)7億張圖像。gpt-image-1不僅支持多種圖像風(fēng)格,還內(nèi)置安全護(hù)欄,確保生成內(nèi)容符合公司政策。此外,其合理的收費(fèi)結(jié)構(gòu)使得開(kāi)發(fā)者能夠以低成本生成高質(zhì)量圖像,標(biāo)志著AI圖像生成領(lǐng)域的重要進(jìn)步。
【AiBase提要:】
?? OpenAI推出gpt-image-1圖像生成API,開(kāi)發(fā)者可輕松集成到應(yīng)用中。
??? 用戶(hù)在新功能上線第一周便生成超過(guò)7億張圖像,吸引了數(shù)百萬(wàn)新用戶(hù)。
?? gpt-image-1的圖像生成成本合理,低至每張圖像2美分。
2、谷歌 Gemini 月活躍用戶(hù)突破3.5億,仍與 ChatGPT 存在差距
谷歌的人工智能聊天機(jī)器人Gemini在過(guò)去一年中實(shí)現(xiàn)了顯著的用戶(hù)增長(zhǎng),月活躍用戶(hù)數(shù)達(dá)到了3.5億,日活躍用戶(hù)數(shù)也從900萬(wàn)增至3500萬(wàn)。然而,與市場(chǎng)領(lǐng)先者ChatGPT的6億月活躍用戶(hù)相比,Gemini仍有差距。谷歌通過(guò)與三星的合作和產(chǎn)品整合,推動(dòng)了Gemini的快速增長(zhǎng),顯示出用戶(hù)對(duì)AI聊天工具的需求正在上升。未來(lái),谷歌如何進(jìn)一步提升Gemini的用戶(hù)體驗(yàn)和功能,將是其能否縮小與競(jìng)爭(zhēng)對(duì)手差距的關(guān)鍵。
【AiBase提要:】
?? Gemini的月活躍用戶(hù)數(shù)已達(dá)3.5億,日活躍用戶(hù)增至3500萬(wàn)。
?? ChatGPT的月活躍用戶(hù)為6億,仍領(lǐng)先Gemini。
?? 谷歌通過(guò)與三星的合作及產(chǎn)品整合,推動(dòng)Gemini快速增長(zhǎng)。
3、OpenAI預(yù)測(cè)2029年收入激增至1250億美元
OpenAI近期發(fā)布的收入預(yù)測(cè)顯示,到2029年,其總收入預(yù)計(jì)將達(dá)到1250億美元,其中AI代理業(yè)務(wù)和渠道收入將成為主要驅(qū)動(dòng)力。2023年,OpenAI的收入達(dá)到37億美元,周活躍用戶(hù)超過(guò)5億,顯示出顯著增長(zhǎng)。公司預(yù)計(jì)未來(lái)四年將實(shí)現(xiàn)現(xiàn)金流轉(zhuǎn)正,毛利潤(rùn)占比將提升至近70%。這一系列預(yù)測(cè)吸引了投資者的關(guān)注,預(yù)計(jì)將推動(dòng)OpenAI的快速發(fā)展。
【AiBase提要:】
?? 預(yù)計(jì)到2029年,OpenAI收入將達(dá)1250億美元,AI代理業(yè)務(wù)成為主要增長(zhǎng)點(diǎn)。
??2023年收入達(dá)37億美元,周活躍用戶(hù)超過(guò)5億,顯示出顯著增長(zhǎng)。
?? 預(yù)計(jì)未來(lái)四年將實(shí)現(xiàn)現(xiàn)金流轉(zhuǎn)正,毛利潤(rùn)占比將提升至近70%。
4、Ostris發(fā)布Flex.2-preview,8B參數(shù)擴(kuò)散模型革新ComfyUI工作流
Ostris團(tuán)隊(duì)推出了Flex.2-preview,這是一款基于8億參數(shù)的文本到圖像擴(kuò)散模型,旨在優(yōu)化ComfyUI工作流。該模型在圖像生成的控制能力上表現(xiàn)卓越,支持多種功能如圖像修補(bǔ)和深度控制,已在Hugging Face開(kāi)源,迅速吸引了AI藝術(shù)創(chuàng)作社區(qū)的關(guān)注。Flex.2-preview的輕量化設(shè)計(jì)與高效推理能力,使其成為創(chuàng)意設(shè)計(jì)和商業(yè)應(yīng)用中的理想工具,展現(xiàn)了未來(lái)AI藝術(shù)創(chuàng)作的無(wú)限可能。
【AiBase提要:】
?? 通用控制支持:內(nèi)置線條、姿態(tài)和深度控制,精確引導(dǎo)生成結(jié)果,適合多種創(chuàng)作需求。
??? 圖像修補(bǔ)能力:支持高級(jí)圖像修補(bǔ),用戶(hù)可通過(guò)掩碼進(jìn)行內(nèi)容替換或修復(fù),提升創(chuàng)作靈活性。
?? ComfyUI集成:模型專(zhuān)為ComfyUI優(yōu)化,提供節(jié)點(diǎn)化工作流支持,簡(jiǎn)化復(fù)雜任務(wù)配置。
詳情鏈接:https://huggingface.co/ostris/Flex.2-preview
5、英偉達(dá)推多模態(tài)LLM Describe Anything:指定特定區(qū)域生成詳細(xì)的描述
NVIDIA AI團(tuán)隊(duì)推出的Describe Anything3B(DAM-3B)模型在多模態(tài)學(xué)習(xí)領(lǐng)域引起了廣泛關(guān)注。該模型能夠根據(jù)用戶(hù)指定的圖像或視頻區(qū)域生成詳細(xì)描述,超越了傳統(tǒng)圖像標(biāo)注的局限性。通過(guò)開(kāi)源代碼和數(shù)據(jù)集,DAM-3B為開(kāi)發(fā)者提供了豐富資源,促進(jìn)了多模態(tài)AI的研究與應(yīng)用,尤其在教育、醫(yī)療和內(nèi)容創(chuàng)作等領(lǐng)域展現(xiàn)出廣闊的前景。
【AiBase提要:】
??? DAM-3B具備區(qū)域化描述能力,能夠根據(jù)用戶(hù)指定區(qū)域生成詳細(xì)描述,提升描述的精準(zhǔn)性和豐富性。
?? NVIDIA開(kāi)源了DAM-3B的代碼、模型權(quán)重和數(shù)據(jù)集,推動(dòng)了多模態(tài)AI研究的透明性和社區(qū)協(xié)作。
?? 模型在內(nèi)容創(chuàng)作、智能交互和無(wú)障礙技術(shù)等多個(gè)領(lǐng)域展現(xiàn)出廣泛的應(yīng)用前景,推動(dòng)社會(huì)包容性進(jìn)步。
詳情鏈接:https://github.com/NVlabs/describe-anything
6、納米AI發(fā)布MCP萬(wàn)能工具箱,簡(jiǎn)化AI工具集成與調(diào)用
納米AI推出的MCP萬(wàn)能工具箱旨在簡(jiǎn)化Model Context Protocol的配置復(fù)雜性,提供一站式解決方案。該工具箱預(yù)配置了100多個(gè)MCP服務(wù)和18個(gè)常用API密鑰,支持多種功能如圖像、音頻和視頻生成。它的發(fā)布引發(fā)了AI開(kāi)發(fā)者社區(qū)的廣泛關(guān)注,社區(qū)反饋積極,認(rèn)為其高效性與易用性顯著提升了開(kāi)發(fā)者的工作效率。
【AiBase提要:】
?? 預(yù)配置100多個(gè)MCP服務(wù),開(kāi)發(fā)者無(wú)需手動(dòng)配置即可直接調(diào)用,降低接入門(mén)檻。
?? 內(nèi)置18個(gè)常用API密鑰,用戶(hù)可省去自行獲取密鑰的繁瑣步驟,簡(jiǎn)化初始配置。
?? 支持多模態(tài)生成,通過(guò)自然語(yǔ)言指令生成圖像、音頻和視頻,提升創(chuàng)作效率。
詳情鏈接:https://bot.n.cn/download?src=AIBotCode
7、騰訊云代碼助手CodeBuddy推出Craft軟件開(kāi)發(fā)智能體
騰訊云于4月24日發(fā)布了全新升級(jí)的代碼助手CodeBuddy,推出Craft軟件開(kāi)發(fā)智能體。此工具將AI編程從簡(jiǎn)單的代碼補(bǔ)全提升至項(xiàng)目交付,顯著提高了開(kāi)發(fā)效率。開(kāi)發(fā)者只需用自然語(yǔ)言輸入需求,Craft便能自動(dòng)生成完整的項(xiàng)目代碼,并支持主流IDE。Craft還支持MCP協(xié)議,實(shí)現(xiàn)代碼的無(wú)縫接入測(cè)試、構(gòu)建和部署,兼容騰訊生態(tài)系統(tǒng),助力團(tuán)隊(duì)高效協(xié)作。
【AiBase提要:】
?? Craft智能體能將開(kāi)發(fā)者的自然語(yǔ)言需求轉(zhuǎn)化為完整的項(xiàng)目代碼,極大簡(jiǎn)化開(kāi)發(fā)流程。
?? 支持MCP協(xié)議,使得AI生成的代碼能夠無(wú)縫接入測(cè)試和部署環(huán)節(jié),提高了開(kāi)發(fā)的連貫性。
?? CodeBuddy已在騰訊內(nèi)部廣泛應(yīng)用,85%的開(kāi)發(fā)者使用該工具,顯著提升了整體開(kāi)發(fā)效率。
詳情鏈接:https://cnb.cool
8、昆侖萬(wàn)維開(kāi)源Skywork-R1V2.0版本
昆侖萬(wàn)維于4月24日發(fā)布了其多模態(tài)推理模型Skywork-R1V2.0,顯著提升了視覺(jué)與文本推理能力,尤其在高考理科難題和通用任務(wù)場(chǎng)景中表現(xiàn)優(yōu)異。該模型在多個(gè)權(quán)威基準(zhǔn)測(cè)試中刷新了開(kāi)源SOTA紀(jì)錄,展現(xiàn)出與商業(yè)閉源模型相媲美的能力。R1V2.0的開(kāi)源不僅體現(xiàn)了昆侖萬(wàn)維在多模態(tài)領(lǐng)域的技術(shù)實(shí)力,也為全球開(kāi)發(fā)者和研究者提供了強(qiáng)大的工具,推動(dòng)了多模態(tài)生態(tài)的建設(shè)。
【AiBase提要:】
?? R1V2.0在中文理科題目推理方面表現(xiàn)突出,成為免費(fèi)AI解題助手,刷新多個(gè)開(kāi)源SOTA紀(jì)錄。
?? 采用多模態(tài)獎(jiǎng)勵(lì)模型Skywork-VL Reward和混合偏好優(yōu)化機(jī)制,提升模型在多任務(wù)、多領(lǐng)域下的適應(yīng)能力。
?? 昆侖萬(wàn)維致力于推動(dòng)開(kāi)源和創(chuàng)新,R1V2.0的開(kāi)源為AGI的發(fā)展提供了新的基座模型,未來(lái)將繼續(xù)推出領(lǐng)先的大模型與數(shù)據(jù)集。
詳情鏈接:https://github.com/SkyworkAI/Skywork-R1V
9、智譜宣布旗下多款大模型產(chǎn)品降價(jià) 其中GLM-4-Plus降價(jià)90%
智譜BigModel開(kāi)放平臺(tái)于4月24日宣布其多款大模型產(chǎn)品價(jià)格大幅調(diào)整,進(jìn)入了“億時(shí)代”,使企業(yè)能夠以低成本接觸到先進(jìn)的AI技術(shù)。此次調(diào)整包括GLM-4-FlashX、GLM-Z1系列和GLM-4-Plus等多個(gè)產(chǎn)品,特別是GLM-4-Plus的降價(jià)幅度高達(dá)90%。這一舉措旨在降低使用門(mén)檻,滿足金融、互聯(lián)網(wǎng)、教育等多個(gè)行業(yè)的需求,推動(dòng)市場(chǎng)對(duì)大模型技術(shù)的廣泛應(yīng)用。
【AiBase提要:】
?? GLM-4-FlashX模型每?jī)|tokens價(jià)格僅為10元,推理速度與GPT-4相當(dāng),表現(xiàn)優(yōu)異。
?? GLM-Z1-AirX推理速度是DeepSeek-R1的8倍,性?xún)r(jià)比高,GLM-Z1-Air價(jià)格僅為DeepSeek-R1的1/30。
?? GLM-4-Plus價(jià)格降至5元/百萬(wàn)tokens,行業(yè)領(lǐng)先,滿足多行業(yè)場(chǎng)景需求。
10、JSON Visuals for ChatGPT發(fā)布,解鎖無(wú)限圖像風(fēng)格創(chuàng)作
JSON Visuals for ChatGPT的發(fā)布為圖像生成帶來(lái)了全新的創(chuàng)意維度,用戶(hù)可以利用超過(guò)50種美學(xué)代碼和隨機(jī)化器,輕松生成個(gè)性化的視覺(jué)內(nèi)容。該工具不僅提升了生成的靈活性,還支持高分辨率輸出,適用于數(shù)字藝術(shù)、品牌營(yíng)銷(xiāo)、游戲設(shè)計(jì)等多個(gè)領(lǐng)域。社區(qū)反饋積極,期待未來(lái)的功能優(yōu)化和擴(kuò)展。
【AiBase提要:】
?50+美學(xué)代碼,支持多樣化風(fēng)格生成,滿足創(chuàng)作需求。
?? 屬性隨機(jī)化器,自動(dòng)調(diào)整風(fēng)格屬性,探索創(chuàng)意無(wú)限可能。
?? 高兼容性,快速生成高分辨率圖像,提升用戶(hù)體驗(yàn)。
詳情鏈接:https://json.visuals.zip/
11、國(guó)家知識(shí)產(chǎn)權(quán)局:中國(guó)成為全球AI專(zhuān)利最大擁有國(guó),占比達(dá)60%
在國(guó)務(wù)院新聞辦公室的發(fā)布會(huì)上,國(guó)家知識(shí)產(chǎn)權(quán)局局長(zhǎng)申長(zhǎng)雨宣布,中國(guó)在人工智能領(lǐng)域展現(xiàn)出強(qiáng)勁的發(fā)展勢(shì)頭,已成為全球AI專(zhuān)利的最大擁有國(guó),專(zhuān)利數(shù)量占全球總量的60%。這一成就不僅反映了科技創(chuàng)新的突破,也彰顯了中國(guó)在新興產(chǎn)業(yè)中的領(lǐng)導(dǎo)地位。國(guó)家知識(shí)產(chǎn)權(quán)局積極推動(dòng)相關(guān)知識(shí)產(chǎn)權(quán)制度的創(chuàng)新,以支持人工智能技術(shù)的發(fā)展,并致力于完善知識(shí)產(chǎn)權(quán)保護(hù)規(guī)則,提升保護(hù)和運(yùn)用水平。
【AiBase提要:】
?? 中國(guó)在全球人工智能專(zhuān)利中占據(jù)60%份額,成為最大擁有國(guó)。
?? 國(guó)家知識(shí)產(chǎn)權(quán)局推出多項(xiàng)政策,支持人工智能技術(shù)的快速發(fā)展與應(yīng)用。
??2024年知識(shí)產(chǎn)權(quán)授權(quán)數(shù)據(jù)喜人,社會(huì)滿意度提升至82.36分。
12、199元!小米新款智能音箱發(fā)布:AI大模型加持,智能對(duì)話再升級(jí)
小米新款智能音箱以199元的親民價(jià)格正式發(fā)布,雖然在硬件配置上相比Pro版有所精簡(jiǎn),但其AI大模型的引入使得智能交互體驗(yàn)得到了顯著提升。新音箱支持連續(xù)對(duì)話與指令語(yǔ)控,用戶(hù)能夠更高效地操控智能家居。同時(shí),新增的遠(yuǎn)程備車(chē)功能也為用戶(hù)提供了更為便捷的出行體驗(yàn)。整體來(lái)看,這款音箱在性?xún)r(jià)比和智能化方面都表現(xiàn)出色,適合追求便捷生活的用戶(hù)。
【AiBase提要:】
?? 外觀設(shè)計(jì)延續(xù)Pro版簡(jiǎn)約風(fēng)格,采用清爽淺灰色外殼,尺寸更小巧。
?? 功能上有所取舍,取消紅外遙控和Type-C音頻連接,但聲學(xué)配置依然出色。
?? AI大模型加持,支持連續(xù)對(duì)話和遠(yuǎn)程備車(chē)功能,智能交互體驗(yàn)顯著提升。
(舉報(bào))