欧美性猛交xxxx免费看_牛牛在线视频国产免费_天堂草原电视剧在线观看免费_国产粉嫩高清在线观看_国产欧美日本亚洲精品一5区

0
  • 聊天消息
  • 系統(tǒng)消息
  • 評(píng)論與回復(fù)
登錄后你可以
  • 下載海量資料
  • 學(xué)習(xí)在線課程
  • 觀看技術(shù)視頻
  • 寫(xiě)文章/發(fā)帖/加入社區(qū)
會(huì)員中心
創(chuàng)作中心

完善資料讓更多小伙伴認(rèn)識(shí)你,還能領(lǐng)取20積分哦,立即完善>

3天內(nèi)不再提示

利用TRansformer進(jìn)行端到端的目標(biāo)檢測(cè)及跟蹤

3D視覺(jué)工坊 ? 來(lái)源:計(jì)算機(jī)視覺(jué)研究院 ? 2023-04-18 09:12 ? 次閱讀

現(xiàn)存的用檢測(cè)跟蹤的方法采用簡(jiǎn)單的heuristics,如空間或外觀相似性。這些方法,盡管其共性,但過(guò)于簡(jiǎn)單,不足以建模復(fù)雜的變化,如通過(guò)遮擋跟蹤。

1

簡(jiǎn)要

多目標(biāo)跟蹤(MOT)任務(wù)的關(guān)鍵挑戰(zhàn)是跟蹤目標(biāo)下的時(shí)間建?!,F(xiàn)存的用檢測(cè)跟蹤的方法采用簡(jiǎn)單的heuristics,如空間或外觀相似性。這些方法,盡管其共性,但過(guò)于簡(jiǎn)單,不足以建模復(fù)雜的變化,如通過(guò)遮擋跟蹤。所以現(xiàn)有的方法缺乏從數(shù)據(jù)中學(xué)習(xí)時(shí)間變化的能力。

ddad6866-dd74-11ed-bfe3-dac502259ad0.png

在今天分享中,研究者提出了第一個(gè)完全端到端多目標(biāo)跟蹤框架MOTR。它學(xué)習(xí)了模擬目標(biāo)的長(zhǎng)距離時(shí)間變化。它隱式地執(zhí)行時(shí)間關(guān)聯(lián),并避免了以前的顯式啟發(fā)式方法。MOTR建立在TRansformer和DETR之上,引入了“跟蹤查詢”的概念。每個(gè)跟蹤查詢都會(huì)模擬一個(gè)目標(biāo)的整個(gè)跟蹤。逐幀傳輸和更新,以無(wú)縫地執(zhí)行目標(biāo)檢測(cè)和跟蹤。提出了時(shí)間聚合網(wǎng)絡(luò)Temporal aggregation network)結(jié)合多框架訓(xùn)練來(lái)建模長(zhǎng)期時(shí)間關(guān)系。實(shí)驗(yàn)結(jié)果表明,MOTR達(dá)到了最先進(jìn)的性能。

2

簡(jiǎn)單背景

多目標(biāo)跟蹤(MOT)是一種視覺(jué)目標(biāo)檢測(cè),其任務(wù)不僅是定位每一幀中的所有目標(biāo),而且還可以預(yù)測(cè)這些目標(biāo)在整個(gè)視頻序列中的運(yùn)動(dòng)軌跡。這個(gè)問(wèn)題具有挑戰(zhàn)性,因?yàn)槊恳粠械哪繕?biāo)可能會(huì)在pool environment中被遮擋,而開(kāi)發(fā)的跟蹤器可能會(huì)受到長(zhǎng)期和低速率跟蹤的影響。這些復(fù)雜而多樣的跟蹤方案在設(shè)計(jì)MOT解決方案時(shí)帶來(lái)了重大挑戰(zhàn)。

ddb96274-dd74-11ed-bfe3-dac502259ad0.png

對(duì)于基于IoU的方法,計(jì)算從兩個(gè)相鄰幀檢測(cè)到的檢測(cè)框的IoU矩陣,重疊高于給定閾值的邊界框與相同的身份相關(guān)聯(lián)(見(jiàn)上圖(a))。類似地,基于Re-ID的方法計(jì)算相鄰幀的特征相似性,并將目標(biāo)對(duì)與高相似性相關(guān)起來(lái)。此外,最近的一些工作還嘗試了目標(biāo)檢測(cè)和重識(shí)別特征學(xué)習(xí)的聯(lián)合訓(xùn)練(見(jiàn)上圖(b))。

由于DETR的巨大成功,這項(xiàng)工作將“目標(biāo)查詢”的概念擴(kuò)展到目標(biāo)跟蹤模型,在新框架中被稱為跟蹤查詢。每個(gè)跟蹤查詢都負(fù)責(zé)預(yù)測(cè)一個(gè)目標(biāo)的整個(gè)跟蹤。如上圖(c),與分類和框回歸分支并行,MOTR預(yù)測(cè)每一幀的跟蹤查詢集。

3

新框架分析

最近,DETR通過(guò)采用TRansformer成功地進(jìn)行了目標(biāo)檢測(cè)。在DETR中,目標(biāo)查詢,一個(gè)固定數(shù)量的學(xué)習(xí)位置嵌入,表示一些可能的實(shí)例的建議。一個(gè)目標(biāo)查詢只對(duì)應(yīng)于一個(gè)使用bipartite matching的對(duì)象??紤]到DETR中存在的高復(fù)雜性和慢收斂問(wèn)題,Deformable DETR用多尺度deformable attention取代了self-attention。為了展示目標(biāo)查詢?nèi)绾瓮ㄟ^(guò)解碼器與特征交互,研究者重新制定了Deformable DETR的解碼器。

ddbfda64-dd74-11ed-bfe3-dac502259ad0.png

MOTR

在MOTR中,研究者引入了跟蹤查詢和連續(xù)查詢傳遞,以完全端到端的方式執(zhí)行跟蹤預(yù)測(cè)。進(jìn)一步提出了時(shí)間聚合網(wǎng)絡(luò)來(lái)增強(qiáng)多幀的時(shí)間信息。

ddc6430e-dd74-11ed-bfe3-dac502259ad0.png

DETR中引入的目標(biāo)(檢測(cè))查詢不負(fù)責(zé)對(duì)特定目標(biāo)的預(yù)測(cè)。因此,一個(gè)目標(biāo)查詢可以隨著輸入圖像的變化而預(yù)測(cè)不同的目標(biāo)。當(dāng)在MOT數(shù)據(jù)集的示例上使用DETR檢測(cè)器時(shí),如上圖(a),相同檢測(cè)查詢(綠色目標(biāo)查詢)預(yù)測(cè)兩個(gè)不同幀預(yù)測(cè)兩個(gè)不同的目標(biāo)。因此,很難通過(guò)目標(biāo)查詢的身份來(lái)將檢測(cè)預(yù)測(cè)作為跟蹤值聯(lián)系起來(lái)。作為一種補(bǔ)救措施,研究者將目標(biāo)查詢擴(kuò)展到目標(biāo)跟蹤模型,即跟蹤查詢。在新的設(shè)計(jì)中,每個(gè)軌跡查詢都負(fù)責(zé)預(yù)測(cè)一個(gè)目標(biāo)的整個(gè)軌跡。一旦跟蹤查詢與幀中的一個(gè)目標(biāo)匹配,它總是預(yù)測(cè)目標(biāo),直到目標(biāo)消失(見(jiàn)上圖(b))。

ddd03396-dd74-11ed-bfe3-dac502259ad0.png

Overall architecture of the proposed MOTR

Query Interaction Module

在訓(xùn)練階段,可以基于對(duì)bipartite matching的GTs的監(jiān)督來(lái)實(shí)現(xiàn)跟蹤查詢的學(xué)習(xí)。而對(duì)于推斷,研究者使用預(yù)測(cè)的軌跡分?jǐn)?shù)來(lái)確定軌道何時(shí)出現(xiàn)和消失。

dddc4938-dd74-11ed-bfe3-dac502259ad0.png

Overall Optimization

我們?cè)敿?xì)描述下MOTR的訓(xùn)練過(guò)程。給定一個(gè)視頻序列作為輸入,訓(xùn)練損失,即track loss,是逐幀計(jì)算和逐幀生成的預(yù)測(cè)??倀rack loss是由訓(xùn)練樣本上的所有GT的數(shù)量歸一化的所有幀的track loss的總和:

dde3c58c-dd74-11ed-bfe3-dac502259ad0.png

單幀圖像Lt的track loss可表示為:

dde90a24-dd74-11ed-bfe3-dac502259ad0.png

4

實(shí)驗(yàn)

ddf1574c-dd74-11ed-bfe3-dac502259ad0.png

Implementation Details

All the experiments are conducted on PyTorch with 8Tesla V100 GPUs. We use the Deformable-DETR withResNet50 as our basic network. The basic network ispretrained on the COCO detection dataset.We trainour model with the AdamW optimizer for total 200 epochswith the initial learning rate of 2.0 · 10?4. The learning ratedecays to 2.0 · 10?5 at 150 epochs. The batch size is set to1 and each batch contains 5 frames.

ddfda3a8-dd74-11ed-bfe3-dac502259ad0.png

The effect of multi-frame continuous query passing on solving ID switch problem. When the length of video sequence is setto two (top), the objects that are occluded will miss and switch the identity. When improving the video sequence length from two to five(bottom), the track will not occur the ID switch problem with the help of enhanced temporal relation.

de2b7882-dd74-11ed-bfe3-dac502259ad0.png






審核編輯:劉清

聲明:本文內(nèi)容及配圖由入駐作者撰寫(xiě)或者入駐合作網(wǎng)站授權(quán)轉(zhuǎn)載。文章觀點(diǎn)僅代表作者本人,不代表電子發(fā)燒友網(wǎng)立場(chǎng)。文章及其配圖僅供工程師學(xué)習(xí)之用,如有內(nèi)容侵權(quán)或者其他違規(guī)問(wèn)題,請(qǐng)聯(lián)系本站處理。 舉報(bào)投訴
  • 解碼器
    +關(guān)注

    關(guān)注

    9

    文章

    1152

    瀏覽量

    40956
  • 檢測(cè)器
    +關(guān)注

    關(guān)注

    1

    文章

    870

    瀏覽量

    47796
  • MOT
    MOT
    +關(guān)注

    關(guān)注

    0

    文章

    18

    瀏覽量

    6981

原文標(biāo)題:利用TRansformer進(jìn)行端到端的目標(biāo)檢測(cè)及跟蹤(附源代碼)

文章出處:【微信號(hào):3D視覺(jué)工坊,微信公眾號(hào):3D視覺(jué)工坊】歡迎添加關(guān)注!文章轉(zhuǎn)載請(qǐng)注明出處。

收藏 人收藏

    評(píng)論

    相關(guān)推薦

    自動(dòng)駕駛技術(shù)研究與分析

    編者語(yǔ):「智駕最前沿」微信公眾號(hào)后臺(tái)回復(fù):C-0450,獲取本文參考報(bào)告:《自動(dòng)駕駛行業(yè)研究報(bào)告》pdf下載方式。 自動(dòng)駕駛進(jìn)入2024年,
    的頭像 發(fā)表于 12-19 13:07 ?331次閱讀

    在自動(dòng)泊車的應(yīng)用

    與城市環(huán)境的復(fù)雜性和高速公路駕駛的風(fēng)險(xiǎn)相比,停車場(chǎng)景的特點(diǎn)是低速、空間有限和高可控性。這些特點(diǎn)為在車輛中逐步部署自動(dòng)駕駛能力提供了可行的途徑。最重要的是自動(dòng)泊車對(duì)時(shí)間不敏感,而自動(dòng)駕駛幀率至少
    的頭像 發(fā)表于 12-18 11:38 ?460次閱讀
    <b class='flag-5'>端</b><b class='flag-5'>到</b><b class='flag-5'>端</b>在自動(dòng)泊車的應(yīng)用

    已來(lái),智駕仿真測(cè)試該怎么做?

    智駕方案因強(qiáng)泛化能力、可持續(xù)學(xué)習(xí)與升級(jí)等優(yōu)勢(shì)備受矚目,但這對(duì)仿真測(cè)試帶來(lái)了巨大挑戰(zhàn)。康謀探索了一種有效的
    的頭像 發(fā)表于 12-04 09:59 ?2782次閱讀
    <b class='flag-5'>端</b><b class='flag-5'>到</b><b class='flag-5'>端</b>已來(lái),智駕仿真測(cè)試該怎么做?

    爆火的如何加速智駕落地?

    編者語(yǔ):「智駕最前沿」微信公眾號(hào)后臺(tái)回復(fù):C-0551,獲取本文參考報(bào)告:《智能汽車技術(shù)研究報(bào)告》pdf下載方式。 “
    的頭像 發(fā)表于 11-26 13:17 ?398次閱讀
    爆火的<b class='flag-5'>端</b><b class='flag-5'>到</b><b class='flag-5'>端</b>如何加速智駕落地?

    連接視覺(jué)語(yǔ)言大模型與自動(dòng)駕駛

    自動(dòng)駕駛在大規(guī)模駕駛數(shù)據(jù)上訓(xùn)練,展現(xiàn)出很強(qiáng)的決策規(guī)劃能力,但是面對(duì)復(fù)雜罕見(jiàn)的駕駛場(chǎng)景,依然存在局限性,這是因?yàn)?b class='flag-5'>端
    的頭像 發(fā)表于 11-07 15:15 ?348次閱讀
    連接視覺(jué)語(yǔ)言大模型與<b class='flag-5'>端</b><b class='flag-5'>到</b><b class='flag-5'>端</b>自動(dòng)駕駛

    智己汽車“”智駕方案推出,老司機(jī)真的會(huì)被取代嗎?

    與Momenta聯(lián)合打造的IM AD 3.0端直覺(jué)智能駕駛系統(tǒng),在結(jié)構(gòu)設(shè)計(jì)和決策邏輯上,進(jìn)行了大膽的創(chuàng)新,試圖用“直覺(jué)化”思維模式替代傳統(tǒng)的模塊化系統(tǒng)。 ? IM AD 3.0的技術(shù)架構(gòu):
    的頭像 發(fā)表于 10-30 09:47 ?367次閱讀
    智己汽車“<b class='flag-5'>端</b><b class='flag-5'>到</b><b class='flag-5'>端</b>”智駕方案推出,老司機(jī)真的會(huì)被取代嗎?

    InfiniBand網(wǎng)絡(luò)解決LLM訓(xùn)練瓶頸

    的,這需要大量的計(jì)算資源和高速數(shù)據(jù)傳輸網(wǎng)絡(luò)。InfiniBand(IB)網(wǎng)絡(luò)作為高性能計(jì)算和AI模型訓(xùn)練的理想選擇,發(fā)揮著重要作用。在本文中,我們將深入探討大型語(yǔ)言模型(LLM)訓(xùn)練的概念,并探索
    的頭像 發(fā)表于 10-23 11:26 ?565次閱讀
    <b class='flag-5'>端</b><b class='flag-5'>到</b><b class='flag-5'>端</b>InfiniBand網(wǎng)絡(luò)解決LLM訓(xùn)練瓶頸

    測(cè)試用例怎么寫(xiě)

    編寫(xiě)測(cè)試用例是確保軟件系統(tǒng)從頭到尾能夠正常工作的關(guān)鍵步驟。以下是一個(gè)詳細(xì)的指南,介紹如何編寫(xiě)
    的頭像 發(fā)表于 09-20 10:29 ?585次閱讀

    恩智浦完整的Matter解決方案

    恩智浦為打造Matter設(shè)備,提供了完整的解決方案,從連接和安全解決方案到處理器和軟件,應(yīng)有盡有,為Matter標(biāo)準(zhǔn)的規(guī)?;逃锰峁┯辛χ?。
    的頭像 發(fā)表于 08-26 18:04 ?2652次閱讀
    恩智浦完整的Matter<b class='flag-5'>端</b><b class='flag-5'>到</b><b class='flag-5'>端</b>解決方案

    實(shí)現(xiàn)自動(dòng)駕駛,唯有?

    ,去年行業(yè)主流方案還是輕高精地圖城區(qū)智駕,今年大家的目標(biāo)都瞄到了(End-to-End, E2E)。
    的頭像 發(fā)表于 08-12 09:14 ?869次閱讀
    實(shí)現(xiàn)自動(dòng)駕駛,唯有<b class='flag-5'>端</b><b class='flag-5'>到</b><b class='flag-5'>端</b>?

    周光:不是真“無(wú)圖”,談何

    “如果智能駕駛系統(tǒng)不能徹底擺脫高精度地圖,談何?!?? 6月1日,元戎啟行CEO周光在粵港澳大灣區(qū)車展暨2024(第二屆)未來(lái)汽車先行者大會(huì)上表示。 ? 這并非周光第一次強(qiáng)調(diào)“無(wú)圖”方案與
    發(fā)表于 06-03 11:06 ?3140次閱讀
    周光:不是真“無(wú)圖”,談何<b class='flag-5'>端</b><b class='flag-5'>到</b><b class='flag-5'>端</b>

    小鵬汽車發(fā)布國(guó)內(nèi)首個(gè)量產(chǎn)上車的大模型

    小鵬汽車近日宣布,國(guó)內(nèi)首個(gè)大模型量產(chǎn)上車,這一革命性的技術(shù)將大幅提升智能駕駛的能力。據(jù)小鵬汽車介紹,這一大模型將使智駕能力提升二倍,感知距離同樣翻倍,同時(shí)能夠識(shí)別超過(guò)50種目標(biāo)
    的頭像 發(fā)表于 05-28 11:47 ?791次閱讀

    小鵬汽車發(fā)布大模型

    小鵬汽車近日宣布,其成功研發(fā)并發(fā)布了“國(guó)內(nèi)首個(gè)量產(chǎn)上車”的大模型,該模型可直接通過(guò)傳感器輸入內(nèi)容來(lái)控制車輛,標(biāo)志著智能駕駛技術(shù)的新突破。
    的頭像 發(fā)表于 05-21 15:09 ?749次閱讀

    理想汽車自動(dòng)駕駛模型實(shí)現(xiàn)

    理想汽車在感知、跟蹤、預(yù)測(cè)、決策和規(guī)劃等方面都進(jìn)行了模型化,最終實(shí)現(xiàn)了的模型。這種模型不僅完全模型化,還能夠虛擬化,即在模擬環(huán)境中
    發(fā)表于 04-12 12:17 ?514次閱讀
    理想汽車自動(dòng)駕駛<b class='flag-5'>端</b><b class='flag-5'>到</b><b class='flag-5'>端</b>模型實(shí)現(xiàn)

    百度開(kāi)源DETRs在實(shí)時(shí)目標(biāo)檢測(cè)中勝過(guò)YOLOs

    這篇論文介紹了一種名為RT-DETR的實(shí)時(shí)檢測(cè)Transformer,是第一個(gè)實(shí)時(shí)目標(biāo)
    的頭像 發(fā)表于 03-06 09:24 ?1810次閱讀
    百度開(kāi)源DETRs在實(shí)時(shí)<b class='flag-5'>目標(biāo)</b><b class='flag-5'>檢測(cè)</b>中勝過(guò)YOLOs