无码在线播放二区|久久亚洲精品国产精品|无码视频在线观看一区二区|在线观看国产日韩亚洲中

  • <menu id="yw4o4"></menu>
  • 
    <menu id="yw4o4"><em id="yw4o4"></em></menu>
  • 首頁 > 原創(chuàng) > 關(guān)鍵詞  > 人工智能最新資訊  > 正文

    AI日報:阿里通義千問登頂全球開源模型榜首;MiniMax推Speech-02語音模型;?ChatGPT付費(fèi)用戶激增至2000萬

    2025-04-02 15:27 · 稿源:站長之家

    歡迎來到【AI日報】欄目!這里是你每天探索人工智能世界的指南,每天我們?yōu)槟愠尸F(xiàn)AI領(lǐng)域的熱點(diǎn)內(nèi)容,聚焦開發(fā)者,助你洞悉技術(shù)趨勢、了解創(chuàng)新AI產(chǎn)品應(yīng)用。

    新鮮AI產(chǎn)品點(diǎn)擊了解:https://top.aibase.com/

    1、阿里通義千問 Qwen2.5-Omni 登頂全球開源模型榜單

    Hugging Face發(fā)布了最新的大模型榜單,阿里巴巴的Qwen2.5-Omni憑借其卓越的性能和多模態(tài)能力,成功登頂,成為全球開源模型的領(lǐng)軍者。此成就不僅展示了阿里在技術(shù)研發(fā)上的實(shí)力,也為AI技術(shù)的普及和應(yīng)用創(chuàng)造了條件。

    image.png

    【AiBase提要:】

    ?? Qwen2.5-Omni成為全球開源模型榜單第一,展現(xiàn)強(qiáng)大性能和多模態(tài)能力。

    ?? DeepSeek-V3-0324和SpatialLM-Llama-1B緊隨其后,為開發(fā)者提供更多選擇。

    ?? 阿里通義千問已開源200款模型,推動AI技術(shù)的普及和應(yīng)用。

    2、MiniMax Audio推Speech-02語音模型,一次性可以輸入20萬字符

    MiniMax Audio最近推出了全新的Speech-02系列語音模型,支持超過30種語言,且一次性可輸入多達(dá)20萬字符。新模型不僅在語音合成的自然度上達(dá)到了99%的人聲相似度,還解決了音頻播放中的節(jié)奏故障問題,確保了流暢的聽感。此外,新的“Read Anything”功能和“Long-Text Mode”使得用戶可以更方便地獲取和處理長文本內(nèi)容,極大地提升了用戶體驗(yàn)。

    image.png

    【AiBase提要:】

    ?? Speech-02系列支持30多種語言,語音相似度高達(dá)99%,提供自然流暢的音頻體驗(yàn)。

    ?? 新增的“Read Anything”功能允許用戶上傳文件或粘貼URL,隨時收聽各類內(nèi)容。

    ?? “Long-Text Mode”支持一次性輸入20萬字符,便捷處理長文本,適合音頻書籍和播客制作。

    詳情鏈接:https://www.minimax.io/audio

    3、賺麻了!ChatGPT付費(fèi)用戶激增至2000萬,年化營收增長30%

    OpenAI的ChatGPT在短短三個月內(nèi)付費(fèi)用戶數(shù)量突破2000萬,年化營收增長近30%,顯示出用戶對這一人工智能工具的強(qiáng)烈需求。盡管付費(fèi)用戶比例略有下降,但每周活躍用戶已達(dá)到5億。為了支持日益增長的用戶群體,OpenAI計劃融資400億美元,盡管公司仍處于虧損狀態(tài),預(yù)計距離盈利還有五年。【AiBase提要:】

    ?? ChatGPT的付費(fèi)用戶已突破2000萬,年化營收增長30%。

    ?? OpenAI計劃融資400億美元,仍在追求盈利之路。

    ?? 競爭對手Gemini、Claude和Grok正在迅速增長,市場競爭日益加劇。

    4、ElevenLabs發(fā)布全球首款犬類AI文本轉(zhuǎn)語音模型“Text To Bark”

    ElevenLabs推出了全球首款專為犬類設(shè)計的AI文本轉(zhuǎn)語音模型“Text To Bark”,該技術(shù)能夠?qū)⑷祟愝斎氲奈淖洲D(zhuǎn)化為高度逼真的狗吠聲,聲稱95%的狗無法分辨聲音的來源。這一創(chuàng)新為人類與寵物之間的溝通提供了新的可能性,盡管狗可能仍無法理解具體意圖。

    【AiBase提要:】

    ?????“Text To Bark”模型可將文字轉(zhuǎn)化為狗吠聲,聲稱95%的狗無法分辨其真實(shí)性。

    ?? 用戶可選擇犬種并調(diào)整吠聲的語氣和節(jié)奏,適應(yīng)不同場景需求。

    ?? ElevenLabs計劃將該技術(shù)擴(kuò)展至其他動物,探索多模態(tài)交互系統(tǒng)。

    詳情鏈接:https://top.aibase.com/tool/text-to-bark

    5、還在為處理多圖發(fā)愁?騰訊元寶更新,多圖上傳+智能處理一鍵搞定

    騰訊元寶最近進(jìn)行了重大的功能升級,特別是在圖像識別方面的能力得到了顯著增強(qiáng)。用戶現(xiàn)在可以一次性上傳多達(dá)10張圖片,無論是使用混元還是DeepSeek模型,均可實(shí)現(xiàn)連貫的識圖與理解。這一功能在實(shí)際應(yīng)用中展現(xiàn)出極高的實(shí)用性,能夠幫助用戶快速提煉信息、生成文案,甚至將草圖轉(zhuǎn)化為網(wǎng)頁demo。

    image.png

    【AiBase提要:】

    ?? 支持一次性上傳10張圖片,提升圖像識別效率。

    ?? 結(jié)合混元多模態(tài)理解能力,提供連貫的內(nèi)容分析與文案生成。

    ?? 多平臺全面支持,包括手機(jī)版、電腦版和網(wǎng)頁版,操作便捷。

    6、EasyControl_Ghibli模型上線:免費(fèi)解鎖吉卜力風(fēng)格圖像生成

    EasyControl_Ghibli模型的上線為用戶提供了一個免費(fèi)的工具,可以輕松生成吉卜力風(fēng)格的圖像。它突破了傳統(tǒng)AI圖像生成的限制,讓普通用戶也能參與到藝術(shù)創(chuàng)作中,體驗(yàn)到科技帶來的樂趣與溫暖。盡管模型仍有成長空間,但其開源特性和易用性為教育、娛樂和個人表達(dá)開辟了新的可能性,展現(xiàn)了AI技術(shù)的潛力與魅力。

    【AiBase提要:】

    ?? EasyControl_Ghibli模型在Hugging Face平臺上線,用戶可免費(fèi)生成吉卜力風(fēng)格圖像。

    ??? 該模型基于100張真實(shí)亞洲面孔的照片訓(xùn)練,能夠捕捉吉卜力作品的光影與情感。

    ?? 模型的開源特性和易用性使得普通用戶能夠輕松參與藝術(shù)創(chuàng)作,拉近人與人之間的距離。

    詳情鏈接:https://top.aibase.com/tool/easycontrol-ghibli

    7、飛槳3.0正式發(fā)布,支持文心4.5等大模型,跨芯片適配成本降80

    百度旗下的深度學(xué)習(xí)平臺飛槳最近推出了其新一代框架3.0,標(biāo)志著深度學(xué)習(xí)領(lǐng)域的一次重要技術(shù)革新。該框架通過引入五大核心技術(shù)創(chuàng)新,如動靜統(tǒng)一自動并行,顯著降低了大模型的開發(fā)和訓(xùn)練成本,并提升了性能和適配性。飛槳3.0支持多款主流大模型,并實(shí)現(xiàn)了跨芯片的無縫遷移,硬件適配成本降低了80%。

    【AiBase提要:】

    ?? 飛槳框架3.0引入五大核心技術(shù)創(chuàng)新,降低大模型開發(fā)和訓(xùn)練成本。

    ?? 通過優(yōu)化的DeepSeek-R1單機(jī)部署,吞吐量提升高達(dá)一倍。

    ?? 支持60余款主流芯片,實(shí)現(xiàn)跨芯片無縫遷移,適配成本降80%。

    8、Krea整合Gemini文字生圖與圖像編輯功能:Chat界面迎來實(shí)用性飛躍

    Krea最近與Google Gemini的深度整合,成功引入文字生成圖像和圖像編輯功能,極大提升了平臺的生成能力和用戶體驗(yàn)。這一更新使Krea Chat界面從簡單的對話工具轉(zhuǎn)變?yōu)橐粋€綜合創(chuàng)作平臺,能夠快速生成和編輯視覺內(nèi)容,降低了創(chuàng)作門檻。

    【AiBase提要:】

    ??? Krea與Google Gemini整合,推出文字生成圖像及圖像編輯功能,提升用戶體驗(yàn)。

    ?? 用戶可通過自然語言描述快速生成和編輯圖像,降低創(chuàng)作門檻。

    ?? 此次更新有望縮短創(chuàng)意產(chǎn)業(yè)從概念到成品的周期,推動團(tuán)隊(duì)創(chuàng)作效率。

    9、騰訊發(fā)布GeometryCrafter:用AI解鎖開放世界視頻的幾何一致性之美

    騰訊近期推出的GeometryCrafter模型在開放世界視頻的幾何估計方面取得了重大突破,利用擴(kuò)散先驗(yàn)技術(shù),成功實(shí)現(xiàn)了動態(tài)視頻內(nèi)容的深度理解和處理。該模型能夠在無需額外信息的情況下,提取并生成一致的幾何信息,填補(bǔ)了該領(lǐng)域的空白。

    image.png

    【AiBase提要:】

    ?? GeometryCrafter通過擴(kuò)散先驗(yàn)技術(shù)實(shí)現(xiàn)開放世界視頻的一致性幾何估計,提升了視頻內(nèi)容的深度理解能力。

    ?? 該模型能夠在無需相機(jī)位姿或光流數(shù)據(jù)的情況下,生成細(xì)膩且連貫的深度序列和幾何結(jié)構(gòu),填補(bǔ)了行業(yè)空白。

    ?? 騰訊選擇在Hugging Face上開源模型代碼,推動AI技術(shù)的普惠化,讓更多創(chuàng)作者參與到技術(shù)探索中。

    詳情鏈接:https://huggingface.co/papers/2504.01016

    10、Meta推AI系統(tǒng)MoCha:文字秒變生動動畫角色,口型動作自然流暢

    Meta與滑鐵盧大學(xué)的研究團(tuán)隊(duì)聯(lián)合推出的MoCha AI系統(tǒng),通過文本描述生成全身動畫角色,具有同步語音和自然動作的能力。這一技術(shù)的推出標(biāo)志著內(nèi)容創(chuàng)作的效率和表現(xiàn)力將得到顯著提升,尤其是在數(shù)字助理、虛擬化身等領(lǐng)域展現(xiàn)出廣泛的應(yīng)用潛力。

    【AiBase提要:】

    ?? MoCha系統(tǒng)能夠根據(jù)文本生成全身動畫角色,具備自然動作和同步語音的能力。

    ??? 通過創(chuàng)新的“語音-視頻窗口注意力”機(jī)制,MoCha實(shí)現(xiàn)了更精確的唇部同步,解決了音頻與視頻生成中的挑戰(zhàn)。

    ?? 多角色管理系統(tǒng)簡潔高效,用戶只需定義一次角色信息,即可在不同場景中引用,提升了創(chuàng)作便捷性。

    詳情鏈接:https://top.aibase.com/tool/mocha

    11、GPT-4.5首度以“人格扮演”通過圖靈測試:AI對話能力邁向新高度

    加州大學(xué)圣地亞哥分校的研究顯示,OpenAI的GPT-4.5在圖靈測試中首次以“人格扮演”方式超越人類表現(xiàn),成為最具類人對話能力的AI系統(tǒng)。該模型在語言自然度和情感表達(dá)上表現(xiàn)出色,能夠靈活應(yīng)對裁判的情感變化,展現(xiàn)出類人社交智能。這一突破不僅推動了AI技術(shù)的發(fā)展,也引發(fā)了對AI智能標(biāo)準(zhǔn)的深刻討論。

    【AiBase提要:】

    ?? GPT-4.5在標(biāo)準(zhǔn)圖靈測試中以73%的通過率超越人類表現(xiàn),成為首個真正“通過”的AI模型。

    ?? 該模型展現(xiàn)出驚人的語言自然度和情感豐富性,能夠根據(jù)裁判的語氣靈活調(diào)整回答。

    ?? GPT-4.5的成功源于其復(fù)雜的人格扮演機(jī)制和對話策略,推動了AI技術(shù)的應(yīng)用潛力。

    詳情鏈接:https://arxiv.org/pdf/2503.23674

    12、OpenAI 悄悄上線 OpenAI 學(xué)院,免費(fèi)提供 AI 教育資源

    OpenAI 最近推出了全新的教育平臺——OpenAI 學(xué)院,旨在為全球用戶提供免費(fèi)且高質(zhì)量的人工智能學(xué)習(xí)資源。該平臺涵蓋從基礎(chǔ)知識到高級技能的多種課程,適合自學(xué)者、教育工作者和開發(fā)人員。盡管沒有進(jìn)行大規(guī)模宣傳,這一舉措被認(rèn)為是OpenAI在推動AI教育普及方面的重要一步,受到業(yè)內(nèi)人士的廣泛歡迎。

    image.png

    【AiBase提要:】

    ?? OpenAI 學(xué)院提供數(shù)十小時的免費(fèi)學(xué)習(xí)材料,涵蓋人工智能的基礎(chǔ)知識與高級技能。

    ?? 該平臺面向自學(xué)者、教育工作者和開發(fā)人員開放,課程形式靈活多樣,包括線上和線下活動。

    ?? OpenAI 學(xué)院的推出標(biāo)志著公司在教育和知識傳播領(lǐng)域的積極角色,旨在降低AI學(xué)習(xí)的門檻。

    詳情鏈接:https://academy.openai.com/?continueFlag=bc9fbeae4c35e24ba47bde4cf390e735

    舉報

    • 相關(guān)推薦
    • GPTBots 集成阿里通義千問 3.0,持續(xù)為企業(yè)提供頂尖 AI 服務(wù)

      GPTBots.ai平臺宣布完成與阿里通義千問3.0系列模型的技術(shù)集成,成為企業(yè)級AI智能體構(gòu)建領(lǐng)域的標(biāo)桿平臺。該平臺通過混合推理架構(gòu)和多語言交互技術(shù),支持119種語言服務(wù),覆蓋全球主要市場。平臺提供雙模式智能任務(wù)處理:針對復(fù)雜業(yè)務(wù)場景的"深度思考"模式,以及高頻咨詢的"即時響應(yīng)"模式。搭載Qwen-3-235B旗艦?zāi)P秃蚎wen-3-30B輕量版,在代碼生成、數(shù)學(xué)推理等核心能力上達(dá)到行業(yè)頂尖水平。平臺實(shí)現(xiàn)與企業(yè)ERP、CRM等系統(tǒng)的無縫對接,推動數(shù)據(jù)價值變現(xiàn)。通過標(biāo)準(zhǔn)化流程自動化、全球化服務(wù)等核心價值,幫助企業(yè)提升運(yùn)營效率70%、降低客服成本70%,并實(shí)現(xiàn)數(shù)據(jù)驅(qū)動的決策升級。

    • 阿里千問3登頂全球最強(qiáng)開源模型 已在通義App上線

      阿里集團(tuán)推出新一代開源AI模型"通義千問3"(Qwen3),包含8款不同規(guī)格的混合推理模型。旗艦型號Qwen3-235B采用混合專家架構(gòu),創(chuàng)下國產(chǎn)模型性能新紀(jì)錄;Qwen3-32B則以部署成本低、運(yùn)行穩(wěn)定見長。該系列在邏輯推理、編程、翻譯等專業(yè)領(lǐng)域表現(xiàn)卓越,用戶可通過通義App和網(wǎng)頁版體驗(yàn)。升級后的通義App整合問答對話、圖像理解與生成等多項(xiàng)功能,持續(xù)強(qiáng)化代碼生成、數(shù)學(xué)解題等專業(yè)場景應(yīng)用能力,致力于打造實(shí)用性強(qiáng)的個人AI助手。

    • AI日報通義千問Qwen3重磅發(fā)布;抖音AI搜索能力開放;ChatGPT 搜索新增網(wǎng)購功能;Suno V4.5版本將發(fā)布

      本期AI日報重點(diǎn)內(nèi)容: 1. 通義千問發(fā)布Qwen3大模型,在代碼、數(shù)學(xué)和通用能力方面表現(xiàn)突出,支持兩種思考模式并開源多個模型權(quán)重 2. 抖音開放AI搜索能力接口,為第三方應(yīng)用提供豐富內(nèi)容資源 3. ChatGPT新增網(wǎng)購功能,通過對話獲取個性化商品推薦 4. Suno AI即將推出V4.5版本,提升音樂生成真實(shí)度 5. Simular AI登陸macOS,打造本地化智能助手 6. 暗月之面開源Kimi-VL模型,可處理文本、圖像和視頻 7. UCLA與Meta推出d1框架,提升大語言模型推理速度 8. 通義靈碼上線Qwen3編程智能體 9. Gen-4References圖像生成技術(shù)驚艷亮相 10. Hugging Face推出可編程機(jī)械臂SO-101 11. Windsurf推出全新品牌標(biāo)志 12. Ollama全面支持Qwen3模型本地部署

    • 奧特曼:ChatGPT不是AGI!OpenAI最強(qiáng)開源模型直擊DeepSeek

      【新智元導(dǎo)讀】代碼截圖泄露,滿血版o3、o4-mini鎖定下周!更勁爆的是,一款據(jù)稱是OpenAI的神秘模型一夜爆紅,每日處理高達(dá)260億token,是Claude用量4倍。奧特曼在TED放話:將推超強(qiáng)開源模型,直面DeepSeek挑戰(zhàn)。持續(xù)的創(chuàng)新、豐富的資源和智能AI將會無縫融入日常生活,未來一代人將會覺得當(dāng)前人們又辛苦又落后。

    • 超過ChatGPT、Deepseek?谷歌發(fā)布 Gemini 2.5 Flash AI 模型

      新版AI模型縮短了響應(yīng)時間,節(jié)約了運(yùn)算成本;還推出了新的AI芯片“Ironwood”。谷歌發(fā)布了新的AI模型“Gemini2.5Flash”,據(jù)稱,這款A(yù)I模型的性能比OpenAI和DeepSeek的AI產(chǎn)品“更高效”。谷歌計劃在三星今年上半年推出的AI伴侶機(jī)器人Ballie上搭載生成式AI模型。

    • AI日報阿里通義萬相首尾幀生視頻模型;豆包開源Seed智能體模型UI-TARS-1.5;OpenAI首發(fā)“智能體實(shí)踐指南”

      歡迎來到【AI日報】欄目!這里是你每天探索人工智能世界的指南,每天我們?yōu)槟愠尸F(xiàn)AI領(lǐng)域的熱點(diǎn)內(nèi)容,聚焦開發(fā)者,助你洞悉技術(shù)趨勢、了解創(chuàng)新AI產(chǎn)品應(yīng)用。新鮮AI產(chǎn)品點(diǎn)擊了解:https://top.aibase.com/1、阿里通義萬相首尾幀生視頻模型Wan2.1-FLF2V-14B開源阿里巴巴的通義實(shí)驗(yàn)室在Hugging Face和GitHub上開源了Wan2.1-FLF2V-14B模型,標(biāo)志著AI視頻生成技術(shù)的重大進(jìn)步。該模型支持高清視頻生成

    • 外媒:ChatGPT模型 o4 mini 的“AI幻覺率”高達(dá)48%

      性能是提升了些,但,“胡說八道”的能力提升得更快,直接登頂……

    • 超125萬人用過的ChatGPT“吉卜力化”功能被禁了?付費(fèi)用戶可用

      得益于“吉卜力風(fēng)格”的熱潮,ChatGPT的人氣不斷攀升,但現(xiàn)在好像沒那么簡單了?!拔颐吭轮Ц?00美金訂閱Pro服務(wù),但當(dāng)我要求它幫我轉(zhuǎn)換宮崎駿導(dǎo)演的吉卜力風(fēng)格圖片時,卻被判定違反了內(nèi)容政策。OpenAI在推出GPT-4o圖片生成功能時,已經(jīng)大幅放寬了與圖片生成相關(guān)的內(nèi)容限制政策。

    • IQ 過百的 AI 模型名單發(fā)布:ChatGPT、Deepseek等上榜

      人工智能IQ哪家強(qiáng)?o3 智商高達(dá) 132、Gemini 2.5 Pro Exp. 拿下 128 分、Claude 憑借 3.7 Sonnet Extended 位列第四、Deepsee R 1……

    • AI日報ChatGPT重磅上線圖像庫功能;白嫖!Veo2登陸谷歌AI Studio;螞蟻百寶箱“MCP專區(qū)”

      歡迎來到【AI日報】欄目!這里是你每天探索人工智能世界的指南,每天我們?yōu)槟愠尸F(xiàn)AI領(lǐng)域的熱點(diǎn)內(nèi)容,聚焦開發(fā)者,助你洞悉技術(shù)趨勢、了解創(chuàng)新AI產(chǎn)品應(yīng)用。新鮮AI產(chǎn)品點(diǎn)擊了解:https://top.aibase.com/1、報道稱字節(jié)跳動整合 AI 研發(fā)團(tuán)隊(duì),AI Lab 即將并入 Seed字節(jié)跳動正在進(jìn)行AI研發(fā)團(tuán)隊(duì)的整合,將獨(dú)立的字節(jié)AI Lab并入Seed團(tuán)隊(duì)。這一舉措體現(xiàn)了字節(jié)在AI領(lǐng)域戰(zhàn)略布局的調(diào)整,旨在進(jìn)?