11.11云上盛惠!海量產(chǎn)品 · 輕松上云!云服務(wù)器首年1.8折起,買1年送3個月!超值優(yōu)惠,性能穩(wěn)定,讓您的云端之旅更加暢享??靵眚v訊云選購吧!
多圖像場景也能用DPO方法來對齊了!由上海交大、上海AI實驗室、港中文等帶來最新成果MIA-DPO。這是一個面向大型視覺語言模型的多圖像增強(qiáng)的偏好對齊方法。MIA-DPO的成功證明了通過偏好優(yōu)化對齊模型與人類反饋,在提升模型多圖像感知與推理能力的同時,也可以保持原有的單圖任務(wù)性能,為未來的研究奠定了堅實基礎(chǔ)。