无码在线播放二区|久久亚洲精品国产精品|无码视频在线观看一区二区|在线观看国产日韩亚洲中

  • <menu id="yw4o4"></menu>
  • 
    <menu id="yw4o4"><em id="yw4o4"></em></menu>
  • 首頁 > 傳媒 > 關鍵詞  > Figure最新資訊  > 正文

    端到端VLA是具身智能的曙光嗎?這項被Figure AI帶火的關鍵技術有中國團隊更早提出并應用

    2025-03-03 15:25 · 稿源: 站長之家用戶

    Figure AI 在與 OpenAI 終止合作后,果然發(fā)布了大新聞,這家人形機器人公司從外接大模型的方式,轉入本地具身大模型來完成機器人的感知、交互與操作,充分展現(xiàn)了本體具身大模型與外接互聯(lián)網(wǎng)大模型的優(yōu)勢。

    根據(jù) Figure AI 有限的技術分享,他比較新推出的 Helix 系統(tǒng)是基于視覺-語言-行動(VLA)端到端整體架構演進的一套快慢系統(tǒng)。

    借助 Helix,F(xiàn)igure AI 將端到端 VLA 模型運行到自家的雙足人形機器人 Figure 02 上,實現(xiàn)了面向場景任務的泛化性。

    在 Figure AI 官方展示視頻中,機器人一邊用頭部追蹤手部,一邊調整軀干姿勢,同時能夠比較準確抓取物體。

    這種多自由度協(xié)調在高維動作空間中相當挑戰(zhàn)性,而 Helix 可以做到美好平衡。

    究其本質,Helix 是一個能夠對整個人形上身(包括手腕、軀干、頭部和各個手指)進行高速率連續(xù)控制的 VLA 模型,作為 Figure AI 的比較優(yōu)秀大腦,它完成了所有事情:

    像人類一樣用眼睛觀察、用耳朵聽、用手操作,并在沒有特別訓練的情況下完成全新的任務,有準確的控制能力。

    這在視頻中得到了充分展現(xiàn):Helix 驅動的機器人成功抓取數(shù)千種新物體,僅需一句「拿起 [X]」,當指令為「拿起沙漠物品」時,它能識別玩具仙人掌并完成抓取。

    「Helix 表現(xiàn)出了強大的物體泛化能力,只需用自然語言詢問,就能撿起數(shù)千種形狀、大小、顏色與材料特性各異的新奇家居用品,而這些物品在此前的訓練中從未見過?!笷igure AI 的創(chuàng)始人兼 CEO 布雷特·艾德考克認為。

    Figure AI 此番高舉高打的端到端 VLA 架構,實際在硅谷也是非常新的技術。

    伯克利機器人行業(yè)的優(yōu)質團隊創(chuàng)辦的 PI,在 2024 年 6 月、10 月分別發(fā)表了 OpenVLA、PI-0,奠定了端到端 VLA 的圣杯標準,當時獲得極大反響。

    但這個技術不只是硅谷優(yōu)質團隊的專利,中國科研力量也在端到端 VLA 舞臺上展露過實力。

    2024 年 6 月,比 PI 早發(fā)表的,針對操作機器人的 RoboMamba 端到端具身大模型,由北大,智平方等合力推出。

    這一模型不僅比 PI 的 OpenVLA 更早公開應用,還在未見任務(Unseen Task)的泛化能力上顯著超越 Google 的 RT 系列模型,進一步鞏固了中國在大模型原創(chuàng)力上的國際聲譽。

    這是業(yè)界能看到的,僅有初創(chuàng)公司參與的端到端 VLA 工作被國際專家認可。

    圖注:圖源 RoboMamba 論文

    圖注:論文介紹了一個名為 RoboMamba 的多模態(tài)狀態(tài)空間模型,旨在提高機器人的推理和操作能力,同時保持有效的微調和推理

    論文創(chuàng)新性地將視覺編碼器與有效的 Mamba 語言模型集成,構建了全新的端到端機器人多模態(tài)大模型。

    端到端的背后,是對量產(chǎn)的深入理解。在場景多變的情況下,如何用數(shù)據(jù)驅動的方式完成系統(tǒng)升級迭代,如何對數(shù)據(jù),模型結構,訓練方法實現(xiàn)系統(tǒng)級別 AI 突破。這些關鍵問題困住了大量具身智能領域的入局者。

    小鵬、OPPO前首席科學家,微軟總部研究員,創(chuàng)新領軍人才郭彥東,是初次提出端到端 VLA 架構的人,這來自于他在產(chǎn)業(yè)、行業(yè)多年的深耕積累,以及他在 AI 原創(chuàng)領域的硬核研發(fā)能力。依托技術的先發(fā)布局,和大量人工智能軟硬一體化結合的量產(chǎn)經(jīng)驗,幫助智平方率先做到了這一點,成為國內(nèi)最早進行真正商業(yè)落地的通用智能機器人公司。

    本質上,能做好 VLA 端到端的公司具備對大模型前沿技術的硬核創(chuàng)新能力,其間的點滴積累如能應用到整個 AI+硬件行業(yè),會成為相當價值的存在。

    推廣

    特別聲明:以上內(nèi)容(如有圖片或視頻亦包括在內(nèi))均為站長傳媒平臺用戶上傳并發(fā)布,本平臺僅提供信息存儲服務,對本頁面內(nèi)容所引致的錯誤、不確或遺漏,概不負任何法律責任,相關信息僅供參考。站長之家將盡力確保所提供信息的準確性及可靠性,但不保證有關資料的準確性及可靠性,讀者在使用前請進一步核實,并對任何自主決定的行為負責。任何單位或個人認為本頁面內(nèi)容可能涉嫌侵犯其知識產(chǎn)權或存在不實內(nèi)容時,可及時向站長之家提出書面權利通知或不實情況說明,并提供身份證明、權屬證明及詳細侵權或不實情況證明(點擊查看反饋聯(lián)系地址)。本網(wǎng)站在收到上述法律文件后,將會依法依規(guī)核實信息,溝通刪除相關內(nèi)容或斷開相關鏈接。

    • 相關推薦
    • AI火花集|從技術競速到用共生,阿里云和AI火花先鋒“解鎖”中國AI應用的破局之路

      以阿里云為代表的大廠與中小企業(yè)進入一種全新的共生協(xié)作模式。

    • 紫東太初多模態(tài)RAG全新發(fā)布:端到端問答準確率提升33%

      在產(chǎn)業(yè)智能化進程中,如何高效融合企業(yè)專有知識資產(chǎn),構建領域專屬認知引擎,是企業(yè)邁向智能決策與高效運營的關鍵。然而,傳統(tǒng)檢索增強生成(RAG)技術受限于語言單模態(tài)處理能力,僅能實現(xiàn)文本知識庫與文本查詢之間的淺層理解,難以滿足復雜業(yè)務場景的需求,在實際應用中暴露出兩大缺陷:信息表征缺失:忽略知識庫中多模態(tài)富文檔的視覺語義信息,如版面結構、圖表關?

    • 專訪中國時空AI領域技術創(chuàng)新專家路新江

      當數(shù)字浪潮席卷產(chǎn)業(yè)變革,時空AI便成為了指引方向的關鍵力量。 2024 年某公司智能云在"中國MaaS市場"與"中國AI大模型解決方案市場"成績突出,分別以32.4%和17%的市場份額劃展現(xiàn)出在AI領域的顯著優(yōu)勢?;诔鞘写髷?shù)據(jù)的時空AI技術建成的AI原生地圖,用戶規(guī)模已突破一億大關,日均對話量超千萬次,成功躋身國內(nèi)破億大模型產(chǎn)品行列;與山東省港口攜手打造的“智慧運營助手”

    • 一“馬”當先!人形機器人“天工”大賽奪金 百度智能云助力具身智能產(chǎn)業(yè)加速跑

      4 月 19 日, 2025 北京亦莊半程馬拉松暨人形機器人半程馬拉松鳴槍開跑。作為全球首個人形機器人半程馬拉松比賽,吸引了 20 余家頂尖企業(yè)及高校團隊參與。北京人形機器人創(chuàng)新中心(以下簡稱“北京創(chuàng)新中心”)旗下的純電驅全尺寸人形機器人“天工”以卓越性能和續(xù)航表現(xiàn)完成21. 0975 公里賽程,并率先沖線獲得冠軍。百度智能云作為背后的重要技術支撐,通過百度百舸AI異構

    • 錨定AI技術,艾力斯特深度布局人工智能康復醫(yī)療領域

      2025年3月21日,iRest艾力斯特在溫州召開"AI+康復與產(chǎn)學研融合創(chuàng)新高峰論壇暨經(jīng)銷商大會"。大會匯聚全球頂尖學者、行業(yè)專家及千余名經(jīng)銷商代表,圍繞智能康復、人工智能與醫(yī)療健康的融合展開深入探討。公司宣布將重點布局腦機接口技術在康復設備中的應用,并接入DeepSeek AI系統(tǒng)實現(xiàn)個性化健康管理。iRest總裁周玲衛(wèi)提出三大目標:建立全球無感信息感知優(yōu)勢、打造國際化研發(fā)高地、推動科技成果產(chǎn)業(yè)化。企業(yè)還與浙江省殘疾人福利基金會達成戰(zhàn)略合作,推動智能康復設備進社區(qū)、進家庭。作為中國按摩器具行業(yè)領軍企業(yè),iRest持續(xù)深耕智能康復領域,通過技術創(chuàng)新實現(xiàn)從實驗室到家庭醫(yī)療場景的全面普及。

    • AI眼鏡大戰(zhàn)升級:巨頭進場,小團隊懸了?

      競爭激烈,前景不明。百鏡大戰(zhàn)再次升級,近期,小米、華為、阿里、字節(jié)等大廠紛紛加速布局。3月24日,小米通過旗下品牌米家發(fā)布了一款AI音頻眼鏡——MIJIA智能音頻眼鏡2,售價1199元。它背后還藏著一個大招。有科技博主透露,MIJIA智能音頻眼鏡2只是預熱,真正的「小米眼鏡」可能在今年下半年露面,具備雙芯片和攝像頭,集成AR導航、實時翻譯、智能識物、一鍵變色等功

    • 標桿效!比音勒芬AI 戰(zhàn)略重塑高運動服飾行業(yè)新格局

      在人工智能加速重構全球產(chǎn)業(yè)格局的背景下,中國高端運動服飾領軍品牌比音勒芬邁出了數(shù)字化轉型的關鍵一步。近日,集團在總部隆重舉行比音勒芬AI戰(zhàn)略發(fā)布會——暨比音勒芬、麗晶、清華大學技術合作啟動會。三方將圍繞以人為中心的AI技術在時尚產(chǎn)業(yè)的全鏈路應用展開深度合作,共同打造“科技+時尚+文化”融合創(chuàng)新的行業(yè)標桿,開啟中國高端運動服飾智能化升級的新?

    • 初探“數(shù)龍杯”明星團隊:《萌爪派對》以AI重構情感陪伴

      在“數(shù)龍杯”全球AI游戲及應用創(chuàng)新大賽的火熱報名季,眾多明星AI團隊紛紛嶄露頭角。其中,由前字節(jié)跳動游戲部門高管李馳創(chuàng)辦的上海喵吉托工作室備受關注,他們攜自研項目《萌爪派對》強勢參賽,團隊也與我們分享了對“AI+情感”賽道的獨特理解。《萌爪派對》《萌爪派對》是一款以養(yǎng)寵為核心的輕治愈社交游戲,玩家扮演萌爪島上的居民,通過與寵物一起釣魚、種田?

    • 首支報名團隊探秘:《武俠世界AI》加入“數(shù)龍杯”

      “數(shù)龍杯”的第一個參賽者來了!在4月2日“數(shù)龍杯”全球AI游戲及應用創(chuàng)新大賽正式啟動后,來自中國廣州的“四方格團隊”即投遞了作品,成為首支報名成功的開發(fā)團隊。大賽主辦方也將繼續(xù)跟蹤報道各類創(chuàng)新團隊,為他們創(chuàng)造更多的亮相機會,以此推動更多的創(chuàng)新項目與廣大用戶見面。

    • 智能測試崛起!軟件測試工程師如何抓住 AI 機遇對挑戰(zhàn)?

      《AI4SE行業(yè)現(xiàn)狀調查報告(2024年度)》顯示,AI正深度滲透軟件工程各環(huán)節(jié),成為行業(yè)變革核心引擎。報告指出:1)65.75%企業(yè)已實現(xiàn)AI技術規(guī)?;瘧?,需求分析和運維領域應用增幅達10%;2)智能測試工具顯著提升效率,60%企業(yè)缺陷率降低20%-39%,但僅7.13%企業(yè)降幅超50%;3)Testin云測推出XAgent智能測試系統(tǒng),實現(xiàn)全流程自動化,推動測試模式從"人工預設"向"自主規(guī)劃"升級。報告預測到2025年,65%企業(yè)應用將由AI生成,但面臨數(shù)據(jù)安全、算法可靠性等挑戰(zhàn)。當前中國信通院將企業(yè)智能化水平劃分為L2-L4級,僅8.98%企業(yè)達到高度智能化水平,產(chǎn)業(yè)升級任重道遠。