无码在线播放二区|久久亚洲精品国产精品|无码视频在线观看一区二区|在线观看国产日韩亚洲中

<menu id="yw4o4"></menu>

<menu id="yw4o4"><em id="yw4o4"></em></menu>

<p id="olsph"><kbd id="olsph"><dfn id="olsph"></dfn></kbd></p>

<track id="olsph"></track>

端到端VLA是具身智能的曙光嗎？這項被Figure AI帶火的關鍵技術有中國團隊更早提出并應用

2025-03-03 15:25 · 稿源：站長之家用戶

Figure AI 在與 OpenAI 終止合作后，果然發(fā)布了大新聞，這家人形機器人公司從外接大模型的方式，轉入本地具身大模型來完成機器人的感知、交互與操作，充分展現(xiàn)了本體具身大模型與外接互聯(lián)網(wǎng)大模型的優(yōu)勢。

根據(jù) Figure AI 有限的技術分享，他比較新推出的 Helix 系統(tǒng)是基于視覺-語言-行動(VLA)端到端整體架構演進的一套快慢系統(tǒng)。

借助 Helix，F(xiàn)igure AI 將端到端 VLA 模型運行到自家的雙足人形機器人 Figure 02 上，實現(xiàn)了面向場景任務的泛化性。

在 Figure AI 官方展示視頻中，機器人一邊用頭部追蹤手部，一邊調整軀干姿勢，同時能夠比較準確抓取物體。

這種多自由度協(xié)調在高維動作空間中相當挑戰(zhàn)性，而 Helix 可以做到美好平衡。

究其本質，Helix 是一個能夠對整個人形上身(包括手腕、軀干、頭部和各個手指)進行高速率連續(xù)控制的 VLA 模型，作為 Figure AI 的比較優(yōu)秀大腦，它完成了所有事情:

像人類一樣用眼睛觀察、用耳朵聽、用手操作，并在沒有特別訓練的情況下完成全新的任務，有準確的控制能力。

這在視頻中得到了充分展現(xiàn):Helix 驅動的機器人成功抓取數(shù)千種新物體，僅需一句「拿起 [X]」，當指令為「拿起沙漠物品」時，它能識別玩具仙人掌并完成抓取。

「Helix 表現(xiàn)出了強大的物體泛化能力，只需用自然語言詢問，就能撿起數(shù)千種形狀、大小、顏色與材料特性各異的新奇家居用品，而這些物品在此前的訓練中從未見過?！笷igure AI 的創(chuàng)始人兼 CEO 布雷特·艾德考克認為。

Figure AI 此番高舉高打的端到端 VLA 架構，實際在硅谷也是非常新的技術。

伯克利機器人行業(yè)的優(yōu)質團隊創(chuàng)辦的 PI，在 2024 年 6 月、10 月分別發(fā)表了 OpenVLA、PI-0，奠定了端到端 VLA 的圣杯標準，當時獲得極大反響。

但這個技術不只是硅谷優(yōu)質團隊的專利，中國科研力量也在端到端 VLA 舞臺上展露過實力。

2024 年 6 月，比 PI 早發(fā)表的，針對操作機器人的 RoboMamba 端到端具身大模型，由北大，智平方等合力推出。

這一模型不僅比 PI 的 OpenVLA 更早公開應用，還在未見任務(Unseen Task)的泛化能力上顯著超越 Google 的 RT 系列模型，進一步鞏固了中國在大模型原創(chuàng)力上的國際聲譽。

這是業(yè)界能看到的，僅有初創(chuàng)公司參與的端到端 VLA 工作被國際專家認可。

圖注:圖源 RoboMamba 論文

圖注:論文介紹了一個名為 RoboMamba 的多模態(tài)狀態(tài)空間模型，旨在提高機器人的推理和操作能力，同時保持有效的微調和推理

論文創(chuàng)新性地將視覺編碼器與有效的 Mamba 語言模型集成，構建了全新的端到端機器人多模態(tài)大模型。

端到端的背后，是對量產(chǎn)的深入理解。在場景多變的情況下，如何用數(shù)據(jù)驅動的方式完成系統(tǒng)升級迭代，如何對數(shù)據(jù)，模型結構，訓練方法實現(xiàn)系統(tǒng)級別 AI 突破。這些關鍵問題困住了大量具身智能領域的入局者。

小鵬、OPPO前首席科學家，微軟總部研究員，創(chuàng)新領軍人才郭彥東，是初次提出端到端 VLA 架構的人，這來自于他在產(chǎn)業(yè)、行業(yè)多年的深耕積累，以及他在 AI 原創(chuàng)領域的硬核研發(fā)能力。依托技術的先發(fā)布局，和大量人工智能軟硬一體化結合的量產(chǎn)經(jīng)驗，幫助智平方率先做到了這一點，成為國內(nèi)最早進行真正商業(yè)落地的通用智能機器人公司。

本質上，能做好 VLA 端到端的公司具備對大模型前沿技術的硬核創(chuàng)新能力，其間的點滴積累如能應用到整個 AI+硬件行業(yè)，會成為相當價值的存在。

（推廣）

特別聲明：以上內(nèi)容(如有圖片或視頻亦包括在內(nèi))均為站長傳媒平臺用戶上傳并發(fā)布，本平臺僅提供信息存儲服務，對本頁面內(nèi)容所引致的錯誤、不確或遺漏，概不負任何法律責任，相關信息僅供參考。站長之家將盡力確保所提供信息的準確性及可靠性，但不保證有關資料的準確性及可靠性，讀者在使用前請進一步核實，并對任何自主決定的行為負責。任何單位或個人認為本頁面內(nèi)容可能涉嫌侵犯其知識產(chǎn)權或存在不實內(nèi)容時，可及時向站長之家提出書面權利通知或不實情況說明，并提供身份證明、權屬證明及詳細侵權或不實情況證明（點擊查看反饋聯(lián)系地址）。本網(wǎng)站在收到上述法律文件后，將會依法依規(guī)核實信息，溝通刪除相關內(nèi)容或斷開相關鏈接。

相關推薦

關鍵詞：

AI火花集｜從技術競速到應用共生，阿里云和AI火花先鋒“解鎖”中國AI應用的破局之路

以阿里云為代表的大廠與中小企業(yè)進入一種全新的共生協(xié)作模式。

?阿里 ?人工智能 ?AI火花集
紫東太初多模態(tài)RAG全新發(fā)布：端到端問答準確率提升33%

在產(chǎn)業(yè)智能化進程中，如何高效融合企業(yè)專有知識資產(chǎn)，構建領域專屬認知引擎，是企業(yè)邁向智能決策與高效運營的關鍵。然而，傳統(tǒng)檢索增強生成(RAG)技術受限于語言單模態(tài)處理能力，僅能實現(xiàn)文本知識庫與文本查詢之間的淺層理解，難以滿足復雜業(yè)務場景的需求，在實際應用中暴露出兩大缺陷:信息表征缺失:忽略知識庫中多模態(tài)富文檔的視覺語義信息，如版面結構、圖表關?

?產(chǎn)業(yè)智能化 ?企業(yè)知識資產(chǎn) ?多模態(tài)檢索
專訪中國時空AI領域技術創(chuàng)新專家路新江

當數(shù)字浪潮席卷產(chǎn)業(yè)變革，時空AI便成為了指引方向的關鍵力量。 2024 年某公司智能云在"中國MaaS市場"與"中國AI大模型解決方案市場"成績突出，分別以32.4%和17%的市場份額劃展現(xiàn)出在AI領域的顯著優(yōu)勢?；诔鞘写髷?shù)據(jù)的時空AI技術建成的AI原生地圖，用戶規(guī)模已突破一億大關，日均對話量超千萬次，成功躋身國內(nèi)破億大模型產(chǎn)品行列；與山東省港口攜手打造的“智慧運營助手”
一“馬”當先！人形機器人“天工”大賽奪金百度智能云助力具身智能產(chǎn)業(yè)加速跑

4 月 19 日， 2025 北京亦莊半程馬拉松暨人形機器人半程馬拉松鳴槍開跑。作為全球首個人形機器人半程馬拉松比賽，吸引了 20 余家頂尖企業(yè)及高校團隊參與。北京人形機器人創(chuàng)新中心(以下簡稱“北京創(chuàng)新中心”)旗下的純電驅全尺寸人形機器人“天工”以卓越性能和續(xù)航表現(xiàn)完成21. 0975 公里賽程，并率先沖線獲得冠軍。百度智能云作為背后的重要技術支撐，通過百度百舸AI異構

?人形機器人 ?北京半程馬拉松 ?智能技術
錨定AI技術，艾力斯特深度布局人工智能康復醫(yī)療領域

2025年3月21日，iRest艾力斯特在溫州召開"AI+康復與產(chǎn)學研融合創(chuàng)新高峰論壇暨經(jīng)銷商大會"。大會匯聚全球頂尖學者、行業(yè)專家及千余名經(jīng)銷商代表，圍繞智能康復、人工智能與醫(yī)療健康的融合展開深入探討。公司宣布將重點布局腦機接口技術在康復設備中的應用，并接入DeepSeek AI系統(tǒng)實現(xiàn)個性化健康管理。iRest總裁周玲衛(wèi)提出三大目標：建立全球無感信息感知優(yōu)勢、打造國際化研發(fā)高地、推動科技成果產(chǎn)業(yè)化。企業(yè)還與浙江省殘疾人福利基金會達成戰(zhàn)略合作，推動智能康復設備進社區(qū)、進家庭。作為中國按摩器具行業(yè)領軍企業(yè)，iRest持續(xù)深耕智能康復領域，通過技術創(chuàng)新實現(xiàn)從實驗室到家庭醫(yī)療場景的全面普及。

?AI+康復 ?產(chǎn)學研融合 ?智能康復
薦AI眼鏡大戰(zhàn)升級：巨頭進場，小團隊懸了？

競爭激烈，前景不明。百鏡大戰(zhàn)再次升級，近期，小米、華為、阿里、字節(jié)等大廠紛紛加速布局。3月24日，小米通過旗下品牌米家發(fā)布了一款AI音頻眼鏡——MIJIA智能音頻眼鏡2，售價1199元。它背后還藏著一個大招。有科技博主透露，MIJIA智能音頻眼鏡2只是預熱，真正的「小米眼鏡」可能在今年下半年露面，具備雙芯片和攝像頭，集成AR導航、實時翻譯、智能識物、一鍵變色等功

?AI音頻眼鏡 ?小米眼鏡 ?華為智能眼鏡
標桿效應！比音勒芬AI 戰(zhàn)略重塑高端運動服飾行業(yè)新格局

在人工智能加速重構全球產(chǎn)業(yè)格局的背景下，中國高端運動服飾領軍品牌比音勒芬邁出了數(shù)字化轉型的關鍵一步。近日，集團在總部隆重舉行比音勒芬AI戰(zhàn)略發(fā)布會——暨比音勒芬、麗晶、清華大學技術合作啟動會。三方將圍繞以人為中心的AI技術在時尚產(chǎn)業(yè)的全鏈路應用展開深度合作，共同打造“科技+時尚+文化”融合創(chuàng)新的行業(yè)標桿，開啟中國高端運動服飾智能化升級的新?

?數(shù)字化轉型 ?高端運動服飾 ?AI戰(zhàn)略發(fā)布
初探“數(shù)龍杯”明星團隊:《萌爪派對》以AI重構情感陪伴

在“數(shù)龍杯”全球AI游戲及應用創(chuàng)新大賽的火熱報名季，眾多明星AI團隊紛紛嶄露頭角。其中，由前字節(jié)跳動游戲部門高管李馳創(chuàng)辦的上海喵吉托工作室備受關注，他們攜自研項目《萌爪派對》強勢參賽，團隊也與我們分享了對“AI+情感”賽道的獨特理解。《萌爪派對》《萌爪派對》是一款以養(yǎng)寵為核心的輕治愈社交游戲，玩家扮演萌爪島上的居民，通過與寵物一起釣魚、種田?

?AI游戲 ?萌爪派對 ?情感共鳴
首支報名團隊探秘：《武俠世界AI》加入“數(shù)龍杯”

“數(shù)龍杯”的第一個參賽者來了！在4月2日“數(shù)龍杯”全球AI游戲及應用創(chuàng)新大賽正式啟動后，來自中國廣州的“四方格團隊”即投遞了作品，成為首支報名成功的開發(fā)團隊。大賽主辦方也將繼續(xù)跟蹤報道各類創(chuàng)新團隊，為他們創(chuàng)造更多的亮相機會，以此推動更多的創(chuàng)新項目與廣大用戶見面。

?數(shù)龍杯 ?AI游戲 ?全球大賽
智能測試崛起！軟件測試工程師如何抓住 AI 機遇應對挑戰(zhàn)？

《AI4SE行業(yè)現(xiàn)狀調查報告(2024年度)》顯示，AI正深度滲透軟件工程各環(huán)節(jié)，成為行業(yè)變革核心引擎。報告指出：1）65.75%企業(yè)已實現(xiàn)AI技術規(guī)?；瘧?，需求分析和運維領域應用增幅達10%；2）智能測試工具顯著提升效率，60%企業(yè)缺陷率降低20%-39%，但僅7.13%企業(yè)降幅超50%；3）Testin云測推出XAgent智能測試系統(tǒng)，實現(xiàn)全流程自動化，推動測試模式從"人工預設"向"自主規(guī)劃"升級。報告預測到2025年，65%企業(yè)應用將由AI生成，但面臨數(shù)據(jù)安全、算法可靠性等挑戰(zhàn)。當前中國信通院將企業(yè)智能化水平劃分為L2-L4級，僅8.98%企業(yè)達到高度智能化水平，產(chǎn)業(yè)升級任重道遠。

?人工智能 ?軟件工程 ?行業(yè)變革

熱文

3 天
7天

站長商機

廣告

商務合作侵權投訴廣告服務版權聲明招聘

?CopyRight 2002-2020 CHINAZ.COM

<p id="xx2f3"><mark id="xx2f3"></mark></p>

<input id="xx2f3"><th id="xx2f3"><small id="xx2f3"></small></th></input>