欧美性猛交xxxx免费看_牛牛在线视频国产免费_天堂草原电视剧在线观看免费_国产粉嫩高清在线观看_国产欧美日本亚洲精品一5区

0
  • 聊天消息
  • 系統(tǒng)消息
  • 評論與回復(fù)
登錄后你可以
  • 下載海量資料
  • 學(xué)習(xí)在線課程
  • 觀看技術(shù)視頻
  • 寫文章/發(fā)帖/加入社區(qū)
會員中心
創(chuàng)作中心

完善資料讓更多小伙伴認(rèn)識你,還能領(lǐng)取20積分哦,立即完善>

3天內(nèi)不再提示

一種包含全棧自動駕駛算法的統(tǒng)一架構(gòu)設(shè)計UniAD介紹

3D視覺工坊 ? 來源:自動駕駛之心 ? 2023-01-09 11:18 ? 次閱讀

一、研究背景:

現(xiàn)代自動駕駛系統(tǒng)包含多個順序執(zhí)行的任務(wù),即感知、預(yù)測及規(guī)劃。隨著傳感器和硬件的進(jìn)步,設(shè)計一種可以執(zhí)行各種任務(wù)的智能系統(tǒng)成為一種趨勢。之前的設(shè)計方案可概括為兩類:1)為每個任務(wù)部署獨(dú)立的模型;2)組建包含多個獨(dú)立任務(wù)頭的多任務(wù)學(xué)習(xí)模型。然而,這些方法都可能會受到累積誤差以及在下游規(guī)劃上較差的遷移效果的影響。

近期,arXiv 中收錄了上海人工智能實驗室OpenDriveLab團(tuán)隊聯(lián)合武漢大學(xué)、商湯科技的一篇文章——Goal-oriented Autonomous Driving,其提出良好的自動駕駛系統(tǒng)應(yīng)該以最終任務(wù)——安全的路線規(guī)劃為導(dǎo)向。該研究對感知與預(yù)測中的關(guān)鍵組成部分進(jìn)行分析與研究,并按照一定優(yōu)先級進(jìn)行組建,以便所有的子任務(wù)都有助于規(guī)劃,并提出了統(tǒng)一自動駕駛框架 (UniAD) ,這是第一個將全棧駕駛?cè)蝿?wù)整合到一個深度神經(jīng)網(wǎng)絡(luò)中的框架,并可以發(fā)揮每個子任務(wù)以及各個模塊的優(yōu)勢,以執(zhí)行安全的規(guī)劃。

隨著深度學(xué)習(xí)的成功發(fā)展,自動駕駛算法由一系列子任務(wù)組成,包括感知中的物體檢測、多目標(biāo)跟蹤、地圖分割;預(yù)測任務(wù)中的軌跡預(yù)測和占用柵格預(yù)測。如圖1(a)所示,大多數(shù)工業(yè)解決方案是為每個任務(wù)部署獨(dú)立模型。盡管簡化了多任務(wù)模型的設(shè)計,但由于不同子任務(wù)優(yōu)化方向的不同,這樣的設(shè)計面臨著信息丟失、錯誤累積和特征未對齊的風(fēng)險。

poYBAGO7h6KAISN1AACYwkxKw8c489.jpg

圖1:自動駕駛算法框架的各種設(shè)計比較。(a)大多數(shù)工業(yè)解決方案是對不同的任務(wù)部署不同的模型。(b)多任務(wù)學(xué)習(xí)架構(gòu),多個任務(wù)頭共享一個主干網(wǎng)絡(luò)(特征提取器)。(c)端到端學(xué)習(xí)范式,其聯(lián)合了感知與規(guī)劃模塊?,F(xiàn)有工作或如(c.1)采用直接從感知結(jié)果進(jìn)行規(guī)劃,或如(c.2)中采用多模塊級聯(lián)的系統(tǒng)。

除了上述工業(yè)方案,更為先進(jìn)的設(shè)計是將不同的任務(wù)整合到多任務(wù)學(xué)習(xí)(MTL)范式中,如圖1(b)所示,例如BEVerse,以及部分工業(yè)化架構(gòu),例如Mobileye、Tesla、Nvidia等。在MTL中,多任務(wù)的協(xié)同訓(xùn)練利用同一個特征提取器,可以方便地拓展至多個子任務(wù)并節(jié)省芯片的計算。然而,這樣的方法仍未解決不同任務(wù)優(yōu)化方向不一致的問題,同時不同任務(wù)的監(jiān)督信息也未得到充分的交互,以更好作用于規(guī)劃。相比之下,端到端自動駕駛架構(gòu)(如圖1(c)所示)將感知、決策和規(guī)劃結(jié)合為一個整體。前序任務(wù)(模塊)的組合應(yīng)當(dāng)有利于最終的規(guī)劃,同時應(yīng)該盡量避免誤差累計的問題。(c.1)中采用直接從感知結(jié)果進(jìn)行規(guī)劃,(c.2)中采用模塊級聯(lián)的方式。在(c.3)中,UniAD以良好的規(guī)劃為導(dǎo)向,通過層級結(jié)構(gòu)對不同任務(wù)進(jìn)行組建以達(dá)到更好的規(guī)劃結(jié)果。

pYYBAGO7h7SAdcYjAADCWbEKmW0662.jpg

表1:UniAD 與之前方案的對比,包含了更多的任務(wù)以輔助下游規(guī)劃,包含檢測 (Detection),跟蹤 (Tracking),地圖生成 (Mapping),軌跡預(yù)測 (Motion Forecasting),占用柵格預(yù)測 (Occupancy prediction) 與規(guī)劃 (Planning)。

二、研究內(nèi)容

如圖2所示,UniAD是由四個基于Transformer解碼器的感知預(yù)測模塊以及一個規(guī)劃模塊組成。多組查詢向量 (query) 用于連接整個架構(gòu)以及學(xué)習(xí)多個智能體與周圍環(huán)境的交互。具體而言,多個環(huán)視攝像頭采集的圖像將首先通過特征提取器轉(zhuǎn)化為圖像特征,再通過 BEV(Bird’s-Eye-View,鳥瞰圖視角)編碼器將圖像特征轉(zhuǎn)化為 BEV 特征。在 TrackFormer 中,用一組跟蹤查詢向量 (Track query) 從 BEV 特征中檢測新出現(xiàn)的物體(智能體)并持續(xù)跟蹤已經(jīng)檢測到的物體。MapFormer 是通過地圖查詢向量 (Map query) 對不同類別的地圖元素進(jìn)行分割,比如車道線與人行道。MotionFormer 通過建模物體與環(huán)境之間的交互關(guān)系對每個物體的未來軌跡進(jìn)行預(yù)測。同時引入自車查詢向量 (Sdc query) 對自車的運(yùn)動進(jìn)行建模,自車查詢向量將用于后續(xù)的自車規(guī)劃中。OccFormer 用于進(jìn)行占用柵格預(yù)測,以 BEV 特征為查詢向量,物體特征為鍵 (key) 與值 (value),對未來的 BEV 特征進(jìn)行不斷地更新,進(jìn)而解碼為占用柵格。規(guī)劃模塊 (Planner) 將自車查詢向量解碼,生成規(guī)劃路徑,并利用占用柵格預(yù)測對路徑進(jìn)行優(yōu)化,使其避免障礙物。

pYYBAGO7h8aAMYjWAABcuE_92Co400.jpg

圖2. 統(tǒng)一的自動駕駛(UniAD)的整體框架。UniAD通過多個 Transformer 模塊將各個任務(wù)進(jìn)行層級式的結(jié)合,并對不同任務(wù)間的信息進(jìn)行了充分的交互。UniAD使用多組查詢向量對物體與地圖進(jìn)行建模,并將預(yù)測結(jié)果傳遞至規(guī)劃模塊,用于進(jìn)行安全的路徑規(guī)劃。

(1)感知:跟蹤與地圖分割

TrackFormer 可以同時進(jìn)行檢測與多目標(biāo)跟蹤,通過引入一組 Track query 去建模追蹤物體在場景中的整個生命周期(即從出現(xiàn)到完全消失)。Track query 通過與 BEV 特征進(jìn)行注意力機(jī)制運(yùn)算并通過多層感知機(jī) (MLP) 進(jìn)行解碼,最終得到跟蹤物體的邊界框與速度等屬性。MapFormer 是將 2D 全景分割的經(jīng)典方案 Panoptic Segformer 遷移至 3D 場景,并用于在線地圖分割。具體而言,用一組 Map query 表示地圖中的不同元素,比如車道線、人行道等,這些地圖元素將有利于下游任務(wù)對周圍環(huán)境信息的學(xué)習(xí)。Map query 經(jīng)過 MapFormer 的更新后,將被傳送至 MotionFormer 進(jìn)行物體與地圖元素的交互。

(2)預(yù)測:軌跡預(yù)測

MotionFormer 以信息豐富的物體特征和地圖特征為輸入,輸出場景中所有智能體在多種模態(tài)下的未來軌跡。這種范式只需要進(jìn)行一次網(wǎng)絡(luò)的前向傳播便能輸出所有智能體的未來軌跡,相較于之前以智能體為中心(agent-centric)的方法,節(jié)省了每步對坐標(biāo)空間進(jìn)行對齊的計算消耗。同時為了持續(xù)建模自車運(yùn)動信息,利用 TrackFormer 中的自車查詢向量 (Sdc query) 學(xué)習(xí)自車的未來軌跡。MotionFormer 由多層交叉注意力 (cross-attention) 模塊組成,以達(dá)到不斷精細(xì)化的目的。每層模塊包含三次不同的注意力計算以建模不同類型的交互,分別是智能體-智能體,智能體-地圖,智能體-軌跡目標(biāo),具體交互表示如下:

pYYBAGO7h9iAanCCAAAc5x29Xvw255.jpg

其中 MHCA、MHSA 與 DeformAttn 分別表示多頭交叉注意力,多頭自注意力與可變形注意力。交互結(jié)束后得到的軌跡查詢向量 (Motion query) 將繼續(xù)傳遞給占用柵格預(yù)測與規(guī)劃模塊。

poYBAGO7h-6ADdBaAAD8MeW2tYI261.jpg

圖3. MotionFormer。它由N個堆疊的交互模塊組成,每個模塊內(nèi)會進(jìn)行agent-agent,agent-map 和 agent-goal point(軌跡終點(diǎn))的關(guān)系建模。agent-agent 和 agent-map 交互模塊使用標(biāo)準(zhǔn)的Transformer解碼器層,agent-goal交互模塊構(gòu)是建在可變形的交叉注意力模塊上。

(3)預(yù)測:占用柵格預(yù)測

占用柵格圖是一種離散化的BEV 表示形式,其中每個格子代表的值代表當(dāng)前位置是否被物體占用。占用柵格預(yù)測任務(wù)是指預(yù)測未來多步的占用柵格圖,即未來 BEV 的占用情況。之前的方法通常會利用卷積神經(jīng)網(wǎng)絡(luò) (CNN) 與遞歸神經(jīng)網(wǎng)絡(luò) (RNN) 逐步預(yù)測未來多步 BEV 特征圖并解碼,但是卻忽略了場景中物體的運(yùn)動信息,這些信息與未來場景的占用柵格有很強(qiáng)的關(guān)聯(lián)。為了引入稀疏的物體運(yùn)動信息,本文在 OccFormer 中利用注意力機(jī)制,將場景中密集的各柵格表示為查詢向量 (query),將物體特征表示為鍵 (key) 與值 (value)。通過多層 Transformer 的解碼器,查詢向量將多次更新,用于表示未來時序的 BEV 特征圖。為了更好地對齊物體與各柵格的位置關(guān)系,本文引入了一個基于占用柵格的注意力掩碼,該掩碼使得注意力計算只在位置對應(yīng)的柵格-物體特征之間進(jìn)行。查詢向量的更新過程如下:

poYBAGO7iAuAWOSfAAAQ10LomU4408.jpg
poYBAGO7iBKAAeNbAADJaMqS2tg246.jpg

poYBAGO7iCeARzxHAACv3u6Qu94212.jpg

(4)自車規(guī)劃

為了規(guī)劃自車未來的運(yùn)動軌跡,將 MotionFormer 更新后的自車查詢向量 (Sdc query) 與 BEV 特征進(jìn)行注意力機(jī)制交互,讓 Sdc query 感知整個 BEV 環(huán)境,隱式地學(xué)習(xí)周圍環(huán)境與其他智能體。為了更顯式地避免與周圍車的碰撞,作者利用占用柵格預(yù)測模塊的輸出對自車路徑進(jìn)行優(yōu)化,避免未來可能有物體占用的區(qū)域。

pYYBAGO7iECAT91jAAE4uWIg9CI078.jpg

三、實驗結(jié)果

1. 各模塊實驗結(jié)果

感知結(jié)果

poYBAGO7iFyAFBDiAAFBoRQ8jKI179.jpg

預(yù)測結(jié)果

pYYBAGO7iG-AKDGeAAFCQumlZHI433.jpg

規(guī)劃結(jié)果

與 ST-P3 相比,UniAD 將規(guī)劃L2誤差和碰撞率分別降低了51.2%和56.3%,并優(yōu)于其它基于 LiDAR 輸入的方案。
poYBAGO7iImAbHR0AADLJurJn_w847.jpg

2. 消融研究

為了驗證以目標(biāo)為導(dǎo)向的設(shè)計理念是否真正發(fā)揮作用,本文對感知及預(yù)測中的各個模塊進(jìn)行了廣泛的消融研究,如表7所示,以證明前序模塊的有效性和必要性。 0e057914-8fcc-11ed-bfe3-dac502259ad0.jpg表7:感知及預(yù)測中的各個模塊對下游任務(wù)的幫助。

poYBAGO7iLKAQ-ZkAACTO-NGZ5Q578.jpg

3. 可視化

poYBAGO7iMiAcWslAAHGnh4NzIw779.jpg

圖7:在市區(qū)駕駛的可視化表示。UniAD 可以生成高質(zhì)量的感知和預(yù)測結(jié)果,并進(jìn)行安全的路徑規(guī)劃。前三列顯示六個攝像機(jī)的視角,最后兩列分別是 BEV 預(yù)測結(jié)果和來自規(guī)劃模塊的注意力掩碼。每個智能體都用單獨(dú)的顏色表示。

poYBAGO7iNqAK0ccAADXkzewGaU974.jpg

圖8:關(guān)鍵案例可視化。第一個場景(上圖)顯示自車正在讓兩個過馬路的行人,第二個場景(下圖)顯示自車正在讓側(cè)方一輛快速行駛的汽車。從最右圖可以觀察到規(guī)劃模塊對最關(guān)鍵的智能體給予更多的關(guān)注度。

pYYBAGO7iOqASMGcAADSjwfcnpM557.jpg

圖9:避障可視化。在這兩種情況下,自車正在進(jìn)行變道以避開障礙物車輛。從最右注意力掩碼中,可以觀察到UniAD可以關(guān)注障礙物以及前后的道路

四、總結(jié)

UniAD 設(shè)計是以安全的路徑規(guī)劃為導(dǎo)向,對多個必需的自動駕駛?cè)蝿?wù)進(jìn)行層級化設(shè)計,以多組查詢向量 (query) 對物體與環(huán)境之間的多種交互進(jìn)行建模。通過大量實驗驗證了模型設(shè)計的有效性,并相對之前的方案取得了更好的性能。UniAD 是一種統(tǒng)一的自動駕駛算法框架,可以以高精度執(zhí)行包含跟蹤、地圖生成、軌跡預(yù)測、占用預(yù)測與規(guī)劃任務(wù),是首個全面探索自動駕駛系統(tǒng)各模塊必要性的工作,作者通過進(jìn)行廣泛的消融和實驗,驗證了 UniAD 在各感知預(yù)測任務(wù)對最終規(guī)劃的幫助。







審核編輯:劉清

聲明:本文內(nèi)容及配圖由入駐作者撰寫或者入駐合作網(wǎng)站授權(quán)轉(zhuǎn)載。文章觀點(diǎn)僅代表作者本人,不代表電子發(fā)燒友網(wǎng)立場。文章及其配圖僅供工程師學(xué)習(xí)之用,如有內(nèi)容侵權(quán)或者其他違規(guī)問題,請聯(lián)系本站處理。 舉報投訴
  • 解碼器
    +關(guān)注

    關(guān)注

    9

    文章

    1152

    瀏覽量

    40955
  • 自動駕駛系統(tǒng)
    +關(guān)注

    關(guān)注

    0

    文章

    66

    瀏覽量

    6844
  • MLP
    MLP
    +關(guān)注

    關(guān)注

    0

    文章

    57

    瀏覽量

    4299

原文標(biāo)題:All in One | UniAD:一種包含全棧自動駕駛算法的統(tǒng)一架構(gòu)設(shè)計

文章出處:【微信號:3D視覺工坊,微信公眾號:3D視覺工坊】歡迎添加關(guān)注!文章轉(zhuǎn)載請注明出處。

收藏 人收藏

    評論

    相關(guān)推薦

    自動駕駛自研可行嗎?

    隨著自動駕駛加速落地,自研模式在高階智能駕駛技術(shù)領(lǐng)域逐漸成為共識,這種模式指的是整車廠從底層硬件、軟件算法到系統(tǒng)集成全面自主開發(fā),而非依
    的頭像 發(fā)表于 01-27 10:24 ?2598次閱讀

    基于改進(jìn)ResNet50網(wǎng)絡(luò)的自動駕駛場景天氣識別算法

    摘要:為了充分利用自動駕駛汽車路測圖像數(shù)據(jù),增加行駛過程中對天氣情況識別的準(zhǔn)確性,提出了一種基于改進(jìn)ResNet50網(wǎng)絡(luò)的自動駕駛場景天氣識別算法。該
    的頭像 發(fā)表于 11-09 11:14 ?996次閱讀
    基于改進(jìn)ResNet50網(wǎng)絡(luò)的<b class='flag-5'>自動駕駛</b>場景天氣識別<b class='flag-5'>算法</b>

    智能駕駛自動駕駛的關(guān)系

    智能駕駛自動駕駛在概念上存在定的聯(lián)系和區(qū)別,以下是對兩者關(guān)系的介紹、概念定義 智能駕駛
    的頭像 發(fā)表于 10-23 16:02 ?839次閱讀

    自動駕駛HiL測試方案介紹#ADAS #自動駕駛 #VTHiL

    自動駕駛
    北匯信息POLELINK
    發(fā)布于 :2024年10月12日 18:02:07

    FPGA在自動駕駛領(lǐng)域有哪些優(yōu)勢?

    FPGA(Field-Programmable Gate Array,現(xiàn)場可編程門陣列)在自動駕駛領(lǐng)域具有顯著的優(yōu)勢,這些優(yōu)勢使得FPGA成為自動駕駛技術(shù)中不可或缺的部分。以下是FPGA在
    發(fā)表于 07-29 17:11

    FPGA在自動駕駛領(lǐng)域有哪些應(yīng)用?

    是FPGA在自動駕駛領(lǐng)域的主要應(yīng)用: 、感知算法加速 圖像處理:自動駕駛中需要通過攝像頭獲取并識別道路信息和行駛環(huán)境,這涉及到大量的圖像處理任務(wù)。FPGA在處理圖像上的運(yùn)算速度快,可
    發(fā)表于 07-29 17:09

    自動駕駛的傳感器技術(shù)介紹

    自動駕駛的傳感器技術(shù)是自動駕駛系統(tǒng)的核心組成部分,它使車輛能夠感知并理解周圍環(huán)境,從而做出智能決策。以下是對自動駕駛傳感器技術(shù)的詳細(xì)介紹,內(nèi)容涵蓋常見類型、工作原理、在
    的頭像 發(fā)表于 07-23 16:08 ?2475次閱讀

    中級自動駕駛架構(gòu)師應(yīng)該學(xué)習(xí)哪些知識

    師是個新興且不斷發(fā)展的職業(yè)。隨著技術(shù)的進(jìn)步,這領(lǐng)域?qū)⒗^續(xù)吸引更多人才,推動自動駕駛技術(shù)的發(fā)展。 自動駕駛架構(gòu)師在設(shè)計和開發(fā)
    的頭像 發(fā)表于 06-20 21:47 ?349次閱讀

    初級自動駕駛架構(gòu)師應(yīng)該學(xué)習(xí)哪些知識

    師是個新興且不斷發(fā)展的職業(yè)。隨著技術(shù)的進(jìn)步,這領(lǐng)域?qū)⒗^續(xù)吸引更多人才,推動自動駕駛技術(shù)的發(fā)展。 自動駕駛架構(gòu)師在設(shè)計和開發(fā)
    的頭像 發(fā)表于 06-20 21:45 ?383次閱讀

    自動駕駛:揭秘高精度時間同步技術(shù)(

    本文重點(diǎn)探討了高精度時間同步技術(shù)在多傳感器融合中的重要性。通過選擇統(tǒng)一的時鐘源和基于以太網(wǎng)的協(xié)議,確保多傳感器數(shù)據(jù)在統(tǒng)一時間框架內(nèi)準(zhǔn)確處理,為自動駕駛系統(tǒng)提供了可靠的時間基準(zhǔn)。
    的頭像 發(fā)表于 05-29 10:40 ?5251次閱讀
    <b class='flag-5'>自動駕駛</b>:揭秘高精度時間同步技術(shù)(<b class='flag-5'>一</b>)

    移動端芯片性能提升,Armv9架構(gòu)新升級引發(fā)關(guān)注

    “數(shù)碼博主”5月17日的最新爆料指出,聯(lián)發(fā)科積極推進(jìn)Armv9新代IP BLACKHAWK“黑鷹”的架構(gòu)設(shè)計,預(yù)計天璣9400芯片將采用這一架構(gòu),有望以“大核”設(shè)計再度領(lǐng)跑移動So
    的頭像 發(fā)表于 05-17 16:51 ?1132次閱讀

    智行者聯(lián)合清華完成國內(nèi)首套式端到端自動駕駛系統(tǒng)的開放道路測試

    近日,智行者與清華大學(xué)車輛學(xué)院李克強(qiáng)院士、李升波教授領(lǐng)導(dǎo)的研究團(tuán)隊,完成了國內(nèi)首套式端到端自動駕駛系統(tǒng)的開放道路測試。
    的頭像 發(fā)表于 04-22 09:24 ?847次閱讀
    智行者聯(lián)合清華完成國內(nèi)首套<b class='flag-5'>全</b><b class='flag-5'>棧</b>式端到端<b class='flag-5'>自動駕駛</b>系統(tǒng)的開放道路測試

    未來已來,多傳感器融合感知是自動駕駛破局的關(guān)鍵

    /L4級自動駕駛賽跑的元年。 馬斯克評論FSD 12.3版本的左轉(zhuǎn)彎操作就像人類司機(jī)樣。如果FSD 12.3版本成功,將基本顛覆目前市場上的智能駕駛技術(shù)路線?;凇皵?shù)據(jù)/算法/算力”
    發(fā)表于 04-11 10:26

    一種靈活可擴(kuò)展的自動駕駛解決方案

    每個自動駕駛應(yīng)用都結(jié)合了組特定的功能和定程度的駕駛員脫離,即在定程度上由駕駛員負(fù)責(zé)的前提下
    發(fā)表于 03-27 10:23 ?400次閱讀
    <b class='flag-5'>一種</b>靈活可擴(kuò)展的<b class='flag-5'>自動駕駛</b>解決方案

    自動駕駛發(fā)展問題及解決方案淺析

    汽車的發(fā)展提供有益的參考。 ? 自動駕駛汽車發(fā)展的現(xiàn)狀與挑戰(zhàn) ()技術(shù)難題 自動駕駛汽車的核心在于通過先進(jìn)的傳感器、算法和控制系統(tǒng)實現(xiàn)車輛的自主
    的頭像 發(fā)表于 03-14 08:38 ?1244次閱讀