站長之家(ChinaZ.com) 5月19日 消息:Project Ring 是一款腕戴式小型計算機,它使用 AI 實時分析環(huán)境,并進行文本描述,再通過 ChatGPT 對環(huán)境進行評估。
這款可穿戴設備結(jié)合了語言和圖像模型,以提供人與 AI 之間更流暢的交互體驗。
根據(jù)開發(fā)人員 Mina Fahmi 的說法,該項目旨在“展示低摩擦交互,將人類與人工智能之間的物理和數(shù)字信息融合在一起。”
為此,F(xiàn)ahmi 構(gòu)建了一個帶攝像頭和操縱桿的腕戴式小型計算機,可以使用Replicate image-to-text 模型對環(huán)境進行實時可視化分析,用文本進行描述,并通過ChatGPT對其進行評論。
整個過程中,使用 Eleven Labs 的文本轉(zhuǎn)語音服務將文本轉(zhuǎn)換為語音,然后通過 安卓智能手機傳輸?shù)焦莻鲗Ф鷻C。耳機有一個內(nèi)置麥克風,允許用戶對可穿戴設備說話,例如,詢問有關(guān)環(huán)境的問題。使用OpenAI 的 Whisper將用戶的語音轉(zhuǎn)換為文本,以便 ChatGPT 參與智能評論。所有數(shù)據(jù)都在谷歌云中處理。
Fahmi 稱他使用GPT-4完成了 Project Ring 的所有代碼生成。語言模型總共生成了大約750行代碼。其中包括用于 Raspberry Pi 的 Python 腳本、云應用程序、網(wǎng)站和 Android 應用程序。
需要注意的是,F(xiàn)ahmi 有編碼背景,但他已經(jīng)很多年沒有寫過任何代碼了。他相信項目表明使用 GPT-4來編寫完整的軟件原型是可能的,雖然不是一件容易的事情。
該項目還強調(diào)了人工智能通過提供對環(huán)境的實時描述和評論來改善有視覺或聽覺障礙的人的無障礙環(huán)境的潛力。
項目展示了人工智能自動化編碼任務和創(chuàng)建完整軟件原型的潛力。它還強調(diào)了人工智能增強人機交互和提供體驗世界的新方式的可能性。
(舉報)