11.11云上盛惠!海量產(chǎn)品 · 輕松上云!云服務(wù)器首年1.8折起,買1年送3個月!超值優(yōu)惠,性能穩(wěn)定,讓您的云端之旅更加暢享??靵眚v訊云選購吧!
谷歌研究最新發(fā)布的ScreenAI標(biāo)志著語言和語音控制計算機界面的又一重要進(jìn)展。這一AI模型不僅能理解用戶界面和信息圖表在回答基于信息圖表的問題、總結(jié)內(nèi)容以及導(dǎo)航用戶界面等多項任務(wù)上,創(chuàng)下了新的性能標(biāo)桿。為鼓勵更多的發(fā)展,谷歌研究計劃發(fā)布ScreenAI的評估數(shù)據(jù)集,其中ScreenQA已經(jīng)提供了包含36,000張截圖的86,000個問答對;更復(fù)雜的變體和包含截圖及其文本描述的集合將會推出。
劃重點:??GoogleAI團隊提出了ScreenAI,這是一個視覺語言模型,可以全面理解UI和信息圖。??ScreenAI在多個任務(wù)上表現(xiàn)出色,包括圖形問答,元素注釋,摘要生成等。通過利用這些組件的共同視覺語言和復(fù)雜設(shè)計,ScreenAI為理解數(shù)字內(nèi)容提供了全面的方法。