11.11云上盛惠!海量產(chǎn)品 · 輕松上云!云服務(wù)器首年1.8折起,買1年送3個(gè)月!超值優(yōu)惠,性能穩(wěn)定,讓您的云端之旅更加暢享??靵眚v訊云選購吧!
本期AI日?qǐng)?bào)聚焦多項(xiàng)AI技術(shù)突破與應(yīng)用:1)Moonshot AI推出開源音頻模型Kimi-Audio,基于13億小時(shí)訓(xùn)練數(shù)據(jù),支持語音識(shí)別等任務(wù);2)階躍星辰開源圖像編輯模型Step1X-Edit,展現(xiàn)強(qiáng)大生成能力;3)夸克AI上線"拍照問夸克"功能,實(shí)現(xiàn)視覺問答;4)蘋果iOS18.5將在中國推送,帶來智能功能;5)谷歌發(fā)布601個(gè)生成式AI應(yīng)用案例,覆蓋多行業(yè);6)微軟推出深度整合Windows的UFO2自動(dòng)化系統(tǒng);7)OpenAI升級(jí)ChatGPT至GPT-4o版本,提升STEM領(lǐng)域能力;8)Ema公司推出高性價(jià)比語言模型EmaFusion;9)Liquid AI發(fā)布面向邊緣設(shè)備的Hyena Edge模型;10)LemonAI推出實(shí)時(shí)音視頻數(shù)字人產(chǎn)品Slice Live。此外,國內(nèi)方面,智譜與生數(shù)科技達(dá)成戰(zhàn)略合作推動(dòng)大模型發(fā)展,寶馬中國宣布新車將接入DeepSeek技術(shù)。
Kimi-Audio是一款開源的通用音頻基礎(chǔ)模型,在語音識(shí)別、音頻理解、音頻轉(zhuǎn)文本、語音對(duì)話等任務(wù)中表現(xiàn)優(yōu)異。該模型采用集成式架構(gòu)設(shè)計(jì),包含音頻分詞器、音頻大模型和音頻去分詞器三大核心組件,支持多模態(tài)輸入處理。在十余項(xiàng)音頻基準(zhǔn)測(cè)試中,Kimi-Audio均取得領(lǐng)先性能,如LibriSpeech ASR測(cè)試WER僅1.28%,VocalSound測(cè)試達(dá)94.85%。模型使用1300萬小時(shí)多語言音頻數(shù)據(jù)進(jìn)行預(yù)訓(xùn)練,并構(gòu)建了自動(dòng)處理流水線生成高質(zhì)量訓(xùn)練數(shù)據(jù)。評(píng)估結(jié)果顯示,Kimi-Audio在語音識(shí)別、音樂理解、語音情感分析等任務(wù)上全面超越同類模型,在OpenAudioBench和VoiceBench對(duì)話測(cè)試中也表現(xiàn)最佳。目前模型代碼、檢查點(diǎn)和評(píng)估工具包已在GitHub開源。
歡迎來到【AI日?qǐng)?bào)】欄目!這里是你每天探索人工智能世界的指南,每天我們?yōu)槟愠尸F(xiàn)AI領(lǐng)域的熱點(diǎn)內(nèi)容,聚焦開發(fā)者,助你洞悉技術(shù)趨勢(shì)、了解創(chuàng)新AI產(chǎn)品應(yīng)用。新鮮AI產(chǎn)品點(diǎn)擊了解:https://top.aibase.com/1、零一萬物否認(rèn)被阿里收購:相關(guān)傳聞不實(shí)北京零一萬物科技有限公司針對(duì)近期網(wǎng)上關(guān)于“阿里收購零一萬物”的傳聞進(jìn)行了辟謠。通過技術(shù)創(chuàng)新,提升了AI性能,未來將繼續(xù)探索更多AI應(yīng)用。
在日前舉行的第一屆空天信息技術(shù)大會(huì)上,我國自主研制的百億級(jí)遙感解譯基礎(chǔ)模型空天靈眸”3.0版正式發(fā)布。這是迄今全球首個(gè)百億參數(shù)級(jí)空天一體遙感解譯基礎(chǔ)模型。并且已在應(yīng)急、國土、海洋、住建等多個(gè)行業(yè)部署試運(yùn)行,在最具挑戰(zhàn)性的復(fù)雜要素精細(xì)分類、運(yùn)動(dòng)小目標(biāo)連續(xù)跟蹤等任務(wù)上性能卓越。
“這可能是本屆WAIC上歡呼聲最多的一場發(fā)布”在剛剛閉幕的世界人工智能大會(huì)上,快手曬出了可靈發(fā)布一個(gè)月以來的成績單:“超50萬人申請(qǐng),已開放給超30萬用戶使用,生成超700萬條短視頻。”作為全球首個(gè)用戶可用的真實(shí)影像級(jí)視頻生成大模型,可靈一經(jīng)問世便引發(fā)了強(qiáng)烈反響,連外國網(wǎng)友都紛紛投來了羨慕的目光……甚至StabilityAI的前CEOEmadMostaque看了也表示,中國這次已經(jīng)
近日,IBM憑借其旗艦Granite系列模型,在2024年第二季度的《ForresterWave:語言AI基礎(chǔ)模型》報(bào)告中,被評(píng)為“強(qiáng)勁表現(xiàn)者”。隨著企業(yè)從生成式AI的試驗(yàn)階段轉(zhuǎn)向生產(chǎn)階段,他們正在尋找基礎(chǔ)模型的最佳選擇,他們希望這些模型能夠提供可信、性能優(yōu)越且成本效益高的生成式AI。對(duì)企業(yè)誠信、透明治理、社會(huì)責(zé)任、包容文化和服務(wù)精神的長期承諾是IBM業(yè)務(wù)發(fā)展的基石。
微軟近日發(fā)布了首個(gè)大規(guī)模大氣基礎(chǔ)模型Aurora,這一模型利用人工智能技術(shù),能夠預(yù)測(cè)全球范圍內(nèi)的極端天氣事件。與當(dāng)前數(shù)值預(yù)報(bào)系統(tǒng)相比,Aurora的計(jì)算速度提高了約5000倍,擁有超高的準(zhǔn)確率和效率。微軟發(fā)布的Aurora模型的問世標(biāo)志著AI在天氣預(yù)測(cè)領(lǐng)域的巨大進(jìn)展,也讓人們對(duì)未來天氣預(yù)測(cè)的發(fā)展充滿了期待。
一款名為ambientGPT的開源項(xiàng)目備受關(guān)注。這款工具是一款多模態(tài)MacOS基礎(chǔ)模型操作界面,可以調(diào)用GPT-4oAPI或者本地開源模型進(jìn)行問答,并能直接訪問屏幕內(nèi)容不需要截圖。該技術(shù)的推出,預(yù)示著未來在智能模型應(yīng)用領(lǐng)域?qū)?huì)迎來更多創(chuàng)新和便利。
百度創(chuàng)始人、董事長兼首席執(zhí)行官李彥宏在法國巴黎舉辦的“歐洲科技創(chuàng)新展覽會(huì)”上表示,中國在人工智能領(lǐng)域與西方的最大區(qū)別是應(yīng)用。中國擁有數(shù)百個(gè)基礎(chǔ)模型,但人們更多關(guān)注AI時(shí)代的超級(jí)應(yīng)用。盡管技術(shù)進(jìn)步速度并不算快,他仍堅(jiān)信要抵達(dá)理想的AGI時(shí)代還需要十年以上。
視覺語言模型屢屢出現(xiàn)新突破,但ViT仍是圖像編碼器的首選網(wǎng)絡(luò)結(jié)構(gòu)。字節(jié)提出新基礎(chǔ)模型——ViTamin,專為視覺語言時(shí)代設(shè)計(jì)。更多大模型算法相關(guān)崗位開放中。