在2024世界人工智能大會(WAIC)上,上海巖芯數(shù)智攜Yan1.2多模態(tài)大模型亮相,不僅可以讓大模型在手機、電腦、甚至樹莓派端無損運行,還可以讓機器人準(zhǔn)確理解用戶的模糊指令和意圖。
現(xiàn)場,研發(fā)團隊展示了一款部署Yan1.2多模態(tài)大模型的智能機器人“小智”,它能夠基于Yan1.2的語音和視覺處理能力,實時識別環(huán)境、準(zhǔn)確理解用戶的模糊指令和意圖,并據(jù)此控制其機械軀體有效完成各類復(fù)雜任務(wù)。值得一提的是,“小智”機器人搭載的核心硬件是以低算力著稱的樹莓派第五代芯片。在極低算力的設(shè)備上實現(xiàn)了強大的多模態(tài)能力。
智能機器人“小智”
比如,“小智”可以根據(jù)“讓一讓,我要放東西”的模糊指令,識別其意圖和行動方向,從而做出相應(yīng)的避讓動作。當(dāng)有人問“小智,你現(xiàn)在看到了什么”或手捧書籍邀請“小智”一同看書時,它能夠基于多模態(tài)能力進行學(xué)習(xí)和創(chuàng)作,比較準(zhǔn)確描述環(huán)境和人物特征、學(xué)習(xí)書籍信息。
(推廣)