站長之家(ChinaZ.com) 2月28日 消息:近日,螞蟻集團推出20億參數(shù)多模態(tài)遙感基礎模型SkySense,這是螞蟻百靈大模型在多模態(tài)領域最新的研發(fā)成果,其論文已被世界計算機視覺頂會CVPR2024接收。數(shù)據(jù)顯示,SkySense在17項測試場景中指標均超過國際同類產(chǎn)品,這也是迄今為止國際上參數(shù)規(guī)模最大、覆蓋任務最全、識別精度最高的多模態(tài)遙感基礎模型。SkySense可用于地貌、農(nóng)作物觀測和解譯等,有效輔助農(nóng)業(yè)生產(chǎn)和經(jīng)營。
(圖片說明:SkySense在17項評測中均超過國際上最新的遙感模型)
隨著人工智能的發(fā)展,大模型技術與衛(wèi)星遙感技術相結合產(chǎn)生了新突破。SkySense是螞蟻集團基于螞蟻百靈大模型平臺能力開發(fā)的多模態(tài)遙感模型。
SkySense在總計17項國際權威公開數(shù)據(jù)集進行了測評,其測試任務類型包括了土地利用監(jiān)測、高分辨率目標識別、地物變化檢測等7種常見遙感感知任務,并與國際上已發(fā)布的包括IBM和NASA聯(lián)合研發(fā)的Prithvi等共18個全球主流同類模型做了測試結果比較。數(shù)據(jù)顯示,17項測評中SkySense均名列第一。譬如,在國際高清遙感地物檢測榜單FAIR1M2.0中,SkySense平均精度(mAP)領先第二名超3%。
在剛剛公布的CVPR2024論文入選結果上,SkySense的研究成果亦被收錄。CVPR是由IEEE舉辦的計算機視覺和模式識別領域的頂級會議,是國際計算機視覺三大頂會之一。
傳統(tǒng)的遙感影像理解技術,往往側重于針對單一模態(tài)單一任務建模,缺乏對多模態(tài)數(shù)據(jù)、時間序列、地理先驗知識的綜合建模和利用,限制了其在海量數(shù)據(jù)和多種任務中的泛化能力。SkySense突破以上技術瓶頸,實現(xiàn)了文本、紅外光、可見光、SAR雷達多種模態(tài)、多分辨率的時序遙感影像建模,在多樣化的任務中展現(xiàn)出優(yōu)異性能。在螞蟻百靈大模型多模態(tài)能力支持下,研發(fā)人員基于內(nèi)部構建的19億遙感影像數(shù)據(jù)集進行預訓練,得到了20.6億參數(shù)量的模型SkySense,這也是迄今為止國際上參數(shù)規(guī)模最大、覆蓋任務最全、識別精度最高的多模態(tài)遙感大模型。SkySense可廣泛應用于城市規(guī)劃、森林保護、應急救災、綠色金融、農(nóng)業(yè)監(jiān)測等重要領域,目前通過螞蟻內(nèi)部MEarth平臺提供數(shù)據(jù)與識別服務。
據(jù)了解,螞蟻集團正在計劃開放Skysense模型參數(shù),與行業(yè)共建,促進智能遙感技術與應用發(fā)展。
SkySense由螞蟻AI創(chuàng)新研發(fā)部門NextEvo與武漢大學聯(lián)合研發(fā)。NextEvo是螞蟻AI核心技術研發(fā)團隊,主導了螞蟻百靈大模型的研發(fā)工作,其研發(fā)方向涉及CV、NLP、多模態(tài)、AIGC、數(shù)字人、AI工程化等核心技術。去年,該部門升級了多模態(tài)團隊,由楊銘帶隊全面布局多模態(tài)技術。楊銘美國西北大學博士,F(xiàn)acebookAIResearch(FAIR)創(chuàng)始成員,去年加入螞蟻集團,先后就職于NEC美國實驗室、FAIR、地平線機器人公司,是世界知名計算機視覺研究專家。
目前,螞蟻集團多模態(tài)研究成果已應用于支付寶五福節(jié)AI大規(guī)?;印⑽浵佱t(yī)療數(shù)字人等場景。
(舉報)