11.11云上盛惠!海量產(chǎn)品 · 輕松上云!云服務(wù)器首年1.8折起,買1年送3個月!超值優(yōu)惠,性能穩(wěn)定,讓您的云端之旅更加暢享??靵眚v訊云選購吧!
最近的研究表明,GPT-4在圖形推理任務(wù)上表現(xiàn)不佳,僅有33%的準(zhǔn)確率,引發(fā)了對大型語言模型圖形處理能力的關(guān)注。通過使用ConceptARC數(shù)據(jù)集,研究者對451名人類受試者進(jìn)行了圖形推理任務(wù)測試,結(jié)果顯示人類在這方面表現(xiàn)卓越,平均準(zhǔn)確率達(dá)到91%。這項(xiàng)研究突顯了目前大型語言模型在某些特定任務(wù)上的局限性,并提出了對研究方法的進(jìn)一步審視的需求。