无码在线播放二区|久久亚洲精品国产精品|无码视频在线观看一区二区|在线观看国产日韩亚洲中

  • <menu id="yw4o4"></menu>
  • 
    <menu id="yw4o4"><em id="yw4o4"></em></menu>
  • 首頁 > 業(yè)界 > 關鍵詞  > Wayve最新資訊  > 正文

    Wayve推出GAIA-1 9B,通過生成合成視頻訓練自動駕駛

    2023-10-07 10:33 · 稿源:站長之家

    文章概要:

    - Wayve是一家英國初創(chuàng)公司,于2023年6月發(fā)布GAIA-1,一款用于自動駕駛車輛訓練數(shù)據(jù)的生成式人工智能模型。

    - GAIA-1使用文本、圖像、視頻和行動數(shù)據(jù)創(chuàng)建各種交通情景的合成視頻,填補了道路交通復雜性所產(chǎn)生的數(shù)據(jù)空白。

    - 這一世界模型可以預測未來事件,幫助自動駕駛車輛提前規(guī)劃行動,增加道路安全和效率。

    站長之家(ChinaZ.com)10月7日 消息:英國初創(chuàng)公司W(wǎng)ayve在2023年6月發(fā)布了GAIA-1(Generative Artificial Intelligence for Autonomy),這是一款為自動駕駛車輛培訓數(shù)據(jù)而設計的生成式模型。GAIA-1的最新版本,GAIA-19B,已經(jīng)取得了令人矚目的進展。

    GAIA-1的獨特之處在于它的能力,它能夠使用文本、圖像、視頻和行動數(shù)據(jù)來生成各種交通情景的合成視頻。這一能力填補了自動駕駛車輛訓練中的數(shù)據(jù)缺口。

    image.png

    試想一下,在霧中,有一個行人從卡車后面跳出來,同時一名摩托車手即將超越你,一名自行車手從前方靠近。這是一個真實的情景,但要捕捉到這個精確的場景,你需要開多少英里的車并進行拍攝呢?GAIA-1回答了這個問題,它可以生成各種交通情景的合成視頻,用于自動駕駛車輛的培訓。

    與傳統(tǒng)的生成式視頻模型不同,Wayve表示,GAIA-1是一種生成式“世界模型”,它學會了理解和解讀駕駛的最重要概念。它能夠識別和分離不同的車輛及其特征、道路、建筑物或交通信號燈等概念。GAIA-1還學會了代表環(huán)境及其未來動態(tài),為駕駛提供了結構化的環(huán)境理解,可用于做出明智的駕駛決策。

    自GAIA-1首次發(fā)布以來,Wayve團隊對其進行了優(yōu)化,以高效生成高分辨率視頻,并通過大規(guī)模培訓提高了世界模型的質量。該模型現(xiàn)在擁有90億個參數(shù)(相對于六月版本的10億個參數(shù)),還能夠精確控制視頻中的車輛行為和場景特征。這使其成為培訓和驗證自動駕駛系統(tǒng)的強大工具。

    GAIA-1的模型基于在2019年至2023年間在英國倫敦收集的4700小時專有駕駛數(shù)據(jù)。模型的架構包括每個輸入模態(tài)(視頻、文本和行動)的專用編碼器、世界模型、自回歸變換器和視頻解碼器,以及將預測的圖像元素轉換回像素空間的視頻擴散模型。

    值得注意的是,GAIA-1的世界建模任務與大型語言模型(LLMs)常用的方法非常相似,其中任務被簡化為預測下一個標記。在GAIA-1中,這一方法應用于視頻建模,而不是語言。這表明隨著模型大小和培訓數(shù)據(jù)集的增加,GAIA-1在視頻生成方面的性能和效率將繼續(xù)提高,類似于大型語言模型在其各自領域內觀察到的縮放模式。開發(fā)人員表示,隨著更多的數(shù)據(jù)和處理能力,仍然存在“顯著的改進空間”。

    此外,GAIA-1還可以預測過去的上下文視頻圖像的不同未來情景,包括行人、自行車手、摩托車手和對向交通的行為,從而使模型能夠考慮與其他道路使用者的互動并對情況做出反應。GAIA-1還可以通過純文本輸入進行控制,例如,通過文本命令“天氣是晴朗的”、“多雨的”、“有霧的”或“多雪的”來生成不同的駕駛情景。此外,它還可以使用文本命令,如“現(xiàn)在是白天,我們處于直射陽光下”、“天空是灰色的”、“現(xiàn)在是黃昏”和“現(xiàn)在是夜晚”,來創(chuàng)建不同的照明情景。

    然而,Wayve也指出了GAIA-1的一些局限性。雖然自回歸生成過程非常有效,但需要大量計算,因此生成長時間的視頻會非常計算密集。此外,當前模型主要集中于預測單一攝像機輸出,而自動駕駛需要來自所有周圍視點的全面視圖,這是關鍵問題之一。

    未來的工作將擴展該模型的能力,以捕捉更廣泛的視角,并優(yōu)化其生成效率,使該技術更具適用性和效率。此外,Wayve還在開發(fā)Lingo-1,這是一種自動駕駛系統(tǒng),將機器視覺與基于文本的邏輯相結合,以解釋道路上的決策和情況。這種基于文本的邏輯可以增加車輛的安全感,使人工智能的決策不再像一個“黑盒子”。

    GAIA-1項目網(wǎng)址:https://wayve.ai/thinking/scaling-gaia-1/

    舉報

    • 相關推薦
    • L4級自動駕駛!埃安滴滴作新車亮相

      快科技4月13日消息,最近,廣汽埃安與滴滴自動駕駛合作開發(fā)的首款L4級自動駕駛車型正式亮相。這款合作車型將滴滴自動駕駛全新一代硬件平臺與廣汽埃安的安全冗余平臺相結合,具備全球化適配能力,計劃于2025年底量產(chǎn)交付。據(jù)悉,滴滴自動駕駛的硬件平臺配備了33個傳感器,包括激光雷達、攝像頭、4D毫米波雷達、紅外相機和聲音傳感器等。通過多傳感器異構探測與前融合的方式,能夠實現(xiàn)360全場景、全工況感知識別,這種多維度的感知能力,使得車輛在復雜路況下也能精準識別周圍環(huán)境。此外,滴滴自動駕駛還全棧自研了行業(yè)首個可量產(chǎn)的、三域融

    • 從阿布扎比到迪拜,文遠知行的自動駕駛中東拓展之路

      文遠知行是全球自動駕駛領軍企業(yè),已在10國30城開展研發(fā)測試運營,擁有中美等五國自動駕駛牌照。2024年4月宣布與Uber、迪拜交管局合作,在迪拜推出Robotaxi服務。這是Uber首次在美國以外上線自動駕駛車輛,也是中東規(guī)模最大的商業(yè)化Robotaxi車隊。此前文遠知行已在阿聯(lián)酋深耕四年,2023年7月獲該國首個全域自動駕駛牌照。此次合作將整合文遠的技術積累與Uber的出行平臺優(yōu)勢,推動迪拜智能交通轉型,打造全球自動駕駛示范城市。

    • 馬斯克稱明年特斯拉可完全自動駕駛

      特斯拉CEO馬斯克宣布,公司計劃年底前推出面向個人用戶的全自動駕駛功能,并預計明年下半年實現(xiàn)數(shù)百萬輛汽車完全自動駕駛。特斯拉已實現(xiàn)從生產(chǎn)線到停車場的全程自主駕駛,展示其自動駕駛技術積累。同時,特斯拉正擴展業(yè)務模式,包括為客戶和工廠提供基于AI技術的自主機器人Optimus。預計年底前數(shù)千臺Optimus將投入工廠工作,助力生產(chǎn)自動化。公司計劃到2029或2030年實現(xiàn)Optimus年產(chǎn)量達100萬臺,開啟機器人技術新紀元。

    • 周鴻祎直言:機器人研發(fā)難度遠超自動駕駛

      文章主要講述了AI技術在醫(yī)療領域的應用與影響。AI被用于診斷、治療、研究和預測,提高了醫(yī)療系統(tǒng)的效率和準確性。AI能夠快速分析大量數(shù)據(jù),輔助醫(yī)生做出更精準的診斷,同時在藥物開發(fā)、病理分析和個性化治療方面展現(xiàn)出巨大潛力。文章指出,AI技術在醫(yī)療領域的發(fā)展雖然面臨隱私和倫理挑戰(zhàn),但也為患者帶來了更個性化的服務和治療方案。整體而言,AI在醫(yī)療領域的應用仍然受到傳統(tǒng)醫(yī)療體系的制約,但其優(yōu)勢在于能夠處理大量復雜信息,促進醫(yī)學研究的深入發(fā)展。

    • 馬斯克談自動駕駛底層邏輯:無論路上發(fā)生什么都不碰撞

      特斯拉副總裁陶琳分享馬斯克對自動駕駛底層邏輯的觀點:首要指令是"不能撞車",這一原則絕對優(yōu)先于其他考量。馬斯克強調,無論道路標線如何錯誤,甚至出現(xiàn)UFO擋路,車輛都必須確保安全。特斯拉堅持視覺架構+端到端神經(jīng)網(wǎng)絡技術路線,正是為了在任何情況下都能避免碰撞。自動駕駛的核心追求只有一個:無論發(fā)生什么情況,特斯拉都不會發(fā)生碰撞。保障每個人的安全始終是技術路徑選擇中的最優(yōu)先考量。

    • 文遠知行推 “文遠出行” App,自動駕駛出行便捷再升級

      近日,“全球Robotaxi第一股”文遠知行宣布,正式將旗下移動出行 App「WeRide Go」更名為「文遠出行」。此次更名不僅簡化了 App 的名稱,還上線了備受期待的 “預約專車接送” 功能,為用戶帶來更便捷、高效的自動駕駛出行體驗。用戶可在各大軟件商店輕松搜索并下載「文遠出行」App。通過這款 App,用戶能夠一鍵呼叫文遠知行的 robotaxi 無人出行服務,還能實時查看文遠知行?

    • 馬斯克:將出現(xiàn)新方案實現(xiàn)自動駕駛 僅需攝像頭和AI芯片

      站長之家(ChinaZ.com) 4月15日 消息:當?shù)貢r間4月14日,特斯拉首席執(zhí)行官埃隆·馬斯克在社交媒體透露,公司即將推出基于純AI技術的全自動駕駛(FSD)解決方案。該方案完全依賴攝像頭與特斯拉自主研發(fā)的AI芯片,并由其AI軟件驅動,與特斯拉長期堅持的“純視覺自動駕駛”技術路線一致。特斯拉近期通過官方X賬號發(fā)布視頻,展示其德克薩斯工廠內FSD無監(jiān)督技術的應用場景。視頻?

    • 文遠知行 App 煥新升級,解鎖全球便捷自動駕駛出行

      文遠知行宣布旗下出行App"文遠出行"正式上線,原WeRide Go更名升級。新App簡化了操作流程,用戶只需4步即可呼叫Robotaxi無人駕駛服務:選擇上下車點、選擇車型、解鎖車門、完成支付。該平臺還提供Robobus實時運營信息,滿足多樣化出行需求。目前服務網(wǎng)絡已覆蓋南京、鄂爾多斯、蘇州、阿布扎比等全球多地,用戶可通過微信公眾號或官網(wǎng)查詢各地運營動態(tài)。此次App升級標志著文遠知行在自動駕駛商業(yè)化應用的重要布局,未來將持續(xù)優(yōu)化服務體驗。

    • 從法網(wǎng)接駁到高鐵站服務,文遠知行自動駕駛車輛駛入法國市場

      文遠知行與歐洲自動駕駛運營商Beti合作,獲得法國純無人駕駛公開道路測試和運營牌照。這是該公司繼2024年5月與雷諾集團合作開通法網(wǎng)公開賽場館接駁服務后,在歐洲市場的又一突破。7月31日,法國駐廣州總領事福希煒體驗了文遠Robotaxi和Robobus,對其技術進步印象深刻。2月27日,文遠知行與雷諾集團、Beti及Macif保險集團在法國德龍省推出L4級自動駕駛出行服務,這是其在歐洲首個公開道路Robobus商業(yè)化部署。目前已在10國30城開展自動駕駛研發(fā)測試運營,產(chǎn)品落地法國、西班牙等多國。

    • 讓AI替你打工:AI數(shù)字人直播系統(tǒng)-支持實時驅動+無限貼牌/形象克隆+短視頻合成

      數(shù)字人直播領域持續(xù)升溫,尤其在AI技術快速迭代的當下,越來越多企業(yè)希望搭建專屬虛擬主播系統(tǒng),以期用數(shù)字化方案降低人力成本、替代傳統(tǒng)真人直播。然而市場產(chǎn)品良莠不齊,如何精準匹配需求成為關鍵難題。今天要推薦的這款AI數(shù)字人直播系統(tǒng),正是針對這一痛點設計的解決方案。用戶可自主上傳品牌虛擬形象,通過智能算法快速生成高精度視頻內容,并支持實時直播?