計(jì)算機(jī)視覺(jué)的三維重建是什么常見(jiàn)的三維重建表達(dá)方式有哪些

作者?| 張俊怡

三維重建意義

三維重建作為環(huán)境感知的關(guān)鍵技術(shù)之一，可用于自動(dòng)駕駛、虛擬現(xiàn)實(shí)、運(yùn)動(dòng)目標(biāo)監(jiān)測(cè)、行為分析、安防監(jiān)控和重點(diǎn)人群監(jiān)護(hù)等?，F(xiàn)在每個(gè)人都在研究識(shí)別，但識(shí)別只是計(jì)算機(jī)視覺(jué)的一部分。真正意義上的計(jì)算機(jī)視覺(jué)要超越識(shí)別，感知三維環(huán)境。我們活在三維空間里，要做到交互和感知，就必須將世界恢復(fù)到三維。所以，在識(shí)別的基礎(chǔ)上，計(jì)算機(jī)視覺(jué)下一步必須走向三維重建。本文筆者將帶大家初步了解三維重建的相關(guān)內(nèi)容以及算法。

三維重建定義

在計(jì)算機(jī)視覺(jué)中, 三維重建是指根據(jù)單視圖或者多視圖的圖像重建三維信息的過(guò)程. 由于單視頻的信息不完全,因此三維重建需要利用經(jīng)驗(yàn)知識(shí). 而多視圖的三維重建(類似人的雙目定位)相對(duì)比較容易, 其方法是先對(duì)攝像機(jī)進(jìn)行標(biāo)定, 即計(jì)算出攝像機(jī)的圖象坐標(biāo)系與世界坐標(biāo)系的關(guān)系.然后利用多個(gè)二維圖象中的信息重建出三維信息。

常見(jiàn)的三維重建表達(dá)方式

常規(guī)的3D shape representation有以下四種：深度圖（depth）、點(diǎn)云（point cloud）、體素（voxel）、網(wǎng)格（mesh）。

深度圖其每個(gè)像素值代表的是物體到相機(jī)xy平面的距離，單位為 mm。

體素是三維空間中的一個(gè)有大小的點(diǎn)，一個(gè)小方塊，相當(dāng)于是三維空間種的像素。

點(diǎn)云是某個(gè)坐標(biāo)系下的點(diǎn)的數(shù)據(jù)集。點(diǎn)包含了豐富的信息，包括三維坐標(biāo)X，Y，Z、顏色、分類值、強(qiáng)度值、時(shí)間等等。在我看來(lái)點(diǎn)云可以將現(xiàn)實(shí)世界原子化，通過(guò)高精度的點(diǎn)云數(shù)據(jù)可以還原現(xiàn)實(shí)世界。萬(wàn)物皆點(diǎn)云，獲取方式可通過(guò)三維激光掃描等。

△三角網(wǎng)格、用三角網(wǎng)格重建

三角網(wǎng)格就是全部由三角形組成的多邊形網(wǎng)格。多邊形和三角網(wǎng)格在圖形學(xué)和建模中廣泛使用，用來(lái)模擬復(fù)雜物體的表面，如建筑、車輛、人體，當(dāng)然還有茶壺等。任意多邊形網(wǎng)格都能轉(zhuǎn)換成三角網(wǎng)格。

三角網(wǎng)格需要存儲(chǔ)三類信息：

頂點(diǎn)：每個(gè)三角形都有三個(gè)頂點(diǎn)，各頂點(diǎn)都有可能和其他三角形共享。.

邊：連接兩個(gè)頂點(diǎn)的邊，每個(gè)三角形有三條邊。

面：每個(gè)三角形對(duì)應(yīng)一個(gè)面，我們可以用頂點(diǎn)或邊列表表示面。

三維重建的分類

根據(jù)采集設(shè)備是否主動(dòng)發(fā)射測(cè)量信號(hào)，分為兩類：基于主動(dòng)視覺(jué)理論和基于被動(dòng)視覺(jué)的三維重建方法。

主動(dòng)視覺(jué)三維重建方法：主要包括結(jié)構(gòu)光法和激光掃描法。

被動(dòng)視覺(jué)三維重建方法：被動(dòng)視覺(jué)只使用攝像機(jī)采集三維場(chǎng)景得到其投影的二維圖像，根據(jù)圖像的紋理分布等信息恢復(fù)深度信息，進(jìn)而實(shí)現(xiàn)三維重建。

其中，雙目視覺(jué)和多目視覺(jué)理論上可精確恢復(fù)深度信息，但實(shí)際中，受拍攝條件的影響，精度無(wú)法得到保證。單目視覺(jué)只使用單一攝像機(jī)作為采集設(shè)備，具有低成本、易部署等優(yōu)點(diǎn)，但其存在固有的問(wèn)題：?jiǎn)螐垐D像可能對(duì)應(yīng)無(wú)數(shù)真實(shí)物理世界場(chǎng)景（病態(tài)），故使用單目視覺(jué)方法從圖像中估計(jì)深度進(jìn)而實(shí)現(xiàn)三維重建的難度較大。

近幾年代表性論文回顧

-從單張圖像恢復(fù)深度圖

△Depth, NIPS 2014, Cited by 1011

這篇論文思路很簡(jiǎn)單，算是用深度學(xué)習(xí)做深度圖估計(jì)的開(kāi)山之作，網(wǎng)絡(luò)分為全局粗估計(jì)和局部精估計(jì)，對(duì)深度由粗到精的估計(jì)，并且提出了一個(gè)尺度不變的損失函數(shù)。

△主體網(wǎng)絡(luò)

△Scale-invariant Mean Squared Error

本文總結(jié)

（1）提出了一個(gè)包含分為全局粗估計(jì)和局部精估計(jì)，可以由粗到精估計(jì)的網(wǎng)絡(luò)。

（2）提出了一個(gè)尺度不變的損失函數(shù)。

-用體素來(lái)做單視圖或多視圖的三維重建

△Voxel, ECCV 2016, Cited by 342

這篇文章挺有意思，結(jié)合了LSTM來(lái)做，如果輸入只有一張圖像，則輸入一張，輸出也一個(gè)結(jié)果。如果是多視圖的，則將多視圖看作一個(gè)序列，輸入到LSTM當(dāng)中，輸出多個(gè)結(jié)果。

△Framework

如主框架所示，這篇文章采用深度學(xué)習(xí)從2D圖像到其對(duì)應(yīng)的3D voxel模型的映射:?

首先利用一個(gè)標(biāo)準(zhǔn)的CNN結(jié)構(gòu)對(duì)原始input image 進(jìn)行編碼；再利用一個(gè)標(biāo)準(zhǔn) Deconvolution network 對(duì)其解碼。中間用LSTM進(jìn)行過(guò)渡連接, LSTM 單元排列成3D網(wǎng)格結(jié)構(gòu), 每個(gè)單元接收一個(gè)feature vector from Encoder and Hidden states of neighbors by convolution，并將他們輸送到Decoder中. 這樣每個(gè)LSTM單元重構(gòu)output voxel的一部分。?

總之，通過(guò)這樣的Encoder-3DLSTM-Decoder?的網(wǎng)絡(luò)結(jié)構(gòu)就建立了2D images -to -3D voxel model?的映射。

△3D LSTM 和 3D GRU

損失函數(shù)采用的是二分類的交叉熵?fù)p失，類似于在三維空間做分割，類別是兩類，分別是占有或者不占有。

△損失函數(shù)

除了交叉熵loss可以用作評(píng)價(jià)指標(biāo)，還可以把預(yù)測(cè)結(jié)果跟標(biāo)簽的IoU作為評(píng)價(jià)指標(biāo)，如下圖所示：

△IoU可作為評(píng)價(jià)指標(biāo)

△Single Real-World Image Reconstruction

△Reconstructing From Different Views.

本文總結(jié)

（1）采用深度學(xué)習(xí)從2D圖像到其對(duì)應(yīng)的3D voxel模型的映射，模型設(shè)計(jì)為Encoder+3D LSTM + Decoder。

（2）既適用單視圖，也適用多視圖。

（3）以體素的表現(xiàn)形式做的三維重建。

（4）缺點(diǎn)是需要權(quán)衡體素分辨率大?。ㄓ?jì)算耗時(shí)）和精度大小。

-用點(diǎn)云來(lái)做單張RGB圖像的三維重建

△Point Cloud, CVPR 2017, Cited by 274

大多數(shù)現(xiàn)存的工作都在使用深度網(wǎng)絡(luò)進(jìn)行3D 數(shù)據(jù)采用體積網(wǎng)格或圖像集合（幾何體的2D視圖）。然而，這種表示導(dǎo)致采樣分辨率和凈效率之間的折衷。在這篇論文中，作者利用深度網(wǎng)絡(luò)通過(guò)單張圖像直接生成點(diǎn)云，解決了基于單個(gè)圖片對(duì)象生成3D幾何的問(wèn)題。

點(diǎn)云是一種簡(jiǎn)單，統(tǒng)一的結(jié)構(gòu)，更容易學(xué)習(xí)，點(diǎn)云可以在幾何變換和變形時(shí)更容易操作，因?yàn)檫B接性不需要更新。該網(wǎng)絡(luò)可以由輸入圖像確定的視角推斷的3D物體中實(shí)際包含點(diǎn)的位置。

模型最終的目標(biāo)是：給定一張單個(gè)的圖片（RGB或RGB-D），重構(gòu)出完整的3D形狀，并將這個(gè)輸出通過(guò)一種無(wú)序的表示——點(diǎn)云（Point cloud）來(lái)實(shí)現(xiàn)。點(diǎn)云中點(diǎn)的個(gè)數(shù)，文中設(shè)置為1024，作者認(rèn)為這個(gè)個(gè)數(shù)已經(jīng)足夠表現(xiàn)大部分的幾何形狀。

△主框架

鑒于這種非正統(tǒng)的網(wǎng)絡(luò)輸出，作者面臨的挑戰(zhàn)之一是如何在訓(xùn)練期間構(gòu)造損失函數(shù)。因?yàn)橄嗤膸缀涡螤羁赡茉谙嗤慕瞥潭壬峡梢杂貌煌狞c(diǎn)云來(lái)表示，因此與通常的L2型損失不同。

本文使用的 loss

△倒角距離

△搬土距離

對(duì)于解決2D圖片重構(gòu)后可能的形狀有很多種這個(gè)問(wèn)題，作者構(gòu)造了一個(gè) Min-of-N loss (MoN) 損失函數(shù)。

Min-of-N loss 的意思是，網(wǎng)絡(luò)G通過(guò)n個(gè)不同的r擾動(dòng)項(xiàng)進(jìn)行n次預(yù)測(cè)，作者認(rèn)為從直覺(jué)上來(lái)看，我們會(huì)相信n次中會(huì)至少有一次預(yù)測(cè)會(huì)非常接近真正的答案，因此可以認(rèn)為這n次預(yù)測(cè)與真正的答案的距離的最小值應(yīng)該要最小。

△實(shí)驗(yàn)可視化結(jié)果

△實(shí)驗(yàn)數(shù)值結(jié)果

本文總結(jié)

該文章的貢獻(xiàn)可歸納如下：

（1）開(kāi)創(chuàng)了點(diǎn)云生成的先例（單圖像3D重建）。

（2）系統(tǒng)地探討了體系結(jié)構(gòu)中的問(wèn)題點(diǎn)生成網(wǎng)絡(luò)的損失函數(shù)設(shè)計(jì)。

（3）提出了一種基于單圖像任務(wù)的三維重建的原理及公式和解決方案。

總體來(lái)說(shuō)，該篇文章開(kāi)創(chuàng)了單個(gè)2D視角用點(diǎn)云重構(gòu)3D物體的先河，是一篇值得一看的文章。

-先中場(chǎng)休息一下，簡(jiǎn)單先分析一下：

根據(jù)各種不同的表示方法我們可以知道volume受到分辨率和表達(dá)能力的限制，會(huì)缺乏很多細(xì)節(jié)；point cloud 的點(diǎn)之間沒(méi)有連接關(guān)系，會(huì)缺乏物體的表面信息。相比較而言mesh的表示方法具有輕量、形狀細(xì)節(jié)豐富的特點(diǎn)。

△不同表現(xiàn)形式的對(duì)比

Mesh:?我不是針對(duì)誰(shuí)，我是想說(shuō)在座的各位都是垃圾（depth、volume、point cloud）

由于后邊的內(nèi)容使用了圖卷積神經(jīng)網(wǎng)絡(luò)（GCN），這里簡(jiǎn)要介紹一下：

f(p,l), f(p,l+1)分別表示頂點(diǎn)p在卷積操作前后的特征向量；

N(p)指頂點(diǎn)p的鄰居節(jié)點(diǎn)；

W1,W2表示待學(xué)習(xí)的參數(shù)；

-用三角網(wǎng)格來(lái)做單張RGB圖像的三維重建

△Mesh, ECCV 2018, cited by 58

這篇文章提出的方法不需要借助點(diǎn)云、深度或者其他更加信息豐富的數(shù)據(jù)，而是直接從單張彩色圖片直接得到 3D mesh。

△主框架

1、給定一張輸入圖像：Input image

2、為任意的輸入圖像都初始化一個(gè)橢球體作為其初始三維形狀：Ellipsoid Mesh

整個(gè)網(wǎng)絡(luò)可以大概分成上下兩個(gè)部分：

（1）上面部分負(fù)責(zé)用全卷積神經(jīng)網(wǎng)絡(luò)提取輸入圖像的特征；

（2）下面部分負(fù)責(zé)用圖卷積神經(jīng)網(wǎng)絡(luò)來(lái)表示三維mesh，并對(duì)三維mesh不斷進(jìn)行形變，目標(biāo)是得到最終的輸出（最后邊的飛機(jī)）。

△主框架中的部分內(nèi)容詳細(xì)的解釋

1、C表示三維頂點(diǎn)坐標(biāo)，P表示圖像特征，F(xiàn)表示三維頂點(diǎn)特征；

2、perceptual feature pooling層負(fù)責(zé)根據(jù)三維頂點(diǎn)坐標(biāo)C(i-1)去圖像特征P中提取對(duì)應(yīng)的信息；

3、以上提取到的各個(gè)頂點(diǎn)特征再與上一時(shí)刻的頂點(diǎn)特征F(i-1)做融合，作為G-ResNet的輸入；

4、G-ResNet(graph-based ResNet)產(chǎn)生的輸出又做為mesh deformable block的輸出，得到新的三維坐標(biāo)C(i)和三維頂點(diǎn)特征F(i)。

除了剛剛提到的mesh deformation，下面這部分還有一個(gè)很關(guān)鍵的組成是graph uppooling。文章提出這個(gè)圖上采樣層是為了讓圖節(jié)點(diǎn)依次增加，從圖中可以直接看到節(jié)點(diǎn)數(shù)是由156-->628-->2466變換的，這其實(shí)就是coarse-to-fine的體現(xiàn)，如下圖：

這篇文章定義了四種loss來(lái)約束網(wǎng)格更好的形變：

△loss

本文的實(shí)驗(yàn)結(jié)果

本文總結(jié)

該文章的貢獻(xiàn)可歸納如下：

（1）文章實(shí)現(xiàn)用端到端的神經(jīng)網(wǎng)絡(luò)實(shí)現(xiàn)了從單張彩色圖直接生成用mesh表示的物體三維信息；

（2）文章采用圖卷積神經(jīng)網(wǎng)絡(luò)來(lái)表示3D mesh信息，利用從輸入圖像提到的特征逐漸對(duì)橢圓盡心變形從而產(chǎn)生正確的幾何形狀；

（3）為了讓整個(gè)形變的過(guò)程更加穩(wěn)定，文章還采用coarse-to-fine從粗粒度到細(xì)粒度的方式；

（4）文章為生成的mesh設(shè)計(jì)了幾種不同的損失函數(shù)來(lái)讓整個(gè)模型生成的效果更加好；

文章的核心思路就是給用一個(gè)橢球作為任意物體的初始形狀，然后逐漸將這個(gè)形狀變成目標(biāo)物體。

接下來(lái)介紹2019年的相關(guān)研究

由于相關(guān)內(nèi)容涉及到mask-rcnn，先回顧一下：

mask-rcnn是對(duì) faster rcnn 的擴(kuò)展或者說(shuō)是改進(jìn)，其增加了一個(gè)用于分割的分支，并且將RoIpooling 改成了 RoIAlign。

△mask rcnn

Mask RCNN可以看做是一個(gè)通用實(shí)例分割架構(gòu);。

Mask RCNN以Faster RCNN原型，增加了一個(gè)分支用于分割任務(wù)。

Mask RCNN比Faster RCNN速度慢一些，達(dá)到了5fps。

可用于人的姿態(tài)估計(jì)等其他任務(wù)；

-首先介紹一篇2019年做三維重建的文章

——Mesh R-CNN

這篇文章使用的正是mask rcnn 的框架，本篇文章提出了一種基于現(xiàn)實(shí)圖片的物體檢測(cè)系統(tǒng)，同時(shí)為每個(gè)檢測(cè)物體生成三角網(wǎng)格給出完整三維形狀。文中的系統(tǒng)mesh-rcnn是基于mask-rcnn的增強(qiáng)網(wǎng)絡(luò)，添加了一個(gè)網(wǎng)格預(yù)測(cè)分支，通過(guò)先預(yù)測(cè)轉(zhuǎn)化為物體的粗體素分布并轉(zhuǎn)化為三角形網(wǎng)格表示，然后通過(guò)一系列的圖卷積神經(jīng)網(wǎng)絡(luò)改進(jìn)網(wǎng)格的邊角輸出具有不同拓?fù)浣Y(jié)構(gòu)的網(wǎng)格。

△基本的pipeline

模型目標(biāo)：輸入一個(gè)圖像，檢測(cè)圖像中的所有對(duì)象，并輸出所有對(duì)象的類別標(biāo)簽，邊界框、分割掩碼以及三維三角形網(wǎng)格。

模型主框架基于mask-rcnn，使用一個(gè)額外的網(wǎng)格預(yù)測(cè)器來(lái)獲得三維形狀，其中包括體素預(yù)測(cè)分支和網(wǎng)格細(xì)化分支。先由體素預(yù)測(cè)分支通過(guò)預(yù)選框?qū)?yīng)的RoIAlign預(yù)測(cè)物體的粗體素分布，并將粗體素轉(zhuǎn)化為初始的三角形網(wǎng)格，然后網(wǎng)格細(xì)化分支使用作用在網(wǎng)格頂點(diǎn)上的圖卷積層調(diào)整這個(gè)初始網(wǎng)格的定點(diǎn)位置。總框架圖如下所示：

△總框架圖

△分支細(xì)節(jié)

1、Box/Mask 分支：?和mask-rcnn中的兩個(gè)分支一樣。

2、體素預(yù)測(cè)分支：類似于mask-rcnn中的mask分支，輸入是RoIAlign，將預(yù)選框假設(shè)位于一個(gè)分割成 G*G*G個(gè)粗體素的空間，然后預(yù)測(cè)分割出來(lái)的粗體素占用率。使用一個(gè)小的全卷積網(wǎng)絡(luò)來(lái)保持輸入特征和體素占用預(yù)測(cè)概率之間的對(duì)應(yīng)關(guān)系。最后輸出用G個(gè)通道生成G*G的特征圖，為每個(gè)位置提供一列體素占用率分?jǐn)?shù)。

3、體素占用轉(zhuǎn)化為網(wǎng)格表示：將體素占用概率轉(zhuǎn)化為二值化體素占用之后，將每個(gè)被占用的體素被替換為具有8個(gè)頂點(diǎn)、18個(gè)邊和12個(gè)面的立方體三角形網(wǎng)格（如上圖Cubify所示），然后合并相鄰占用體元之間的共享頂點(diǎn)和邊，消除共享內(nèi)面就可以形成了一個(gè)拓?fù)浣Y(jié)構(gòu)依賴于體素預(yù)測(cè)的密集網(wǎng)格了。

網(wǎng)格細(xì)化分支

網(wǎng)格細(xì)化分支將初始的網(wǎng)格結(jié)構(gòu)經(jīng)過(guò)一系列精化階段（在文中作者使用了三個(gè)階段）來(lái)細(xì)化里面的頂點(diǎn)位置。每個(gè)精化階段都是輸入一個(gè)三角形網(wǎng)格)，然后經(jīng)過(guò)三個(gè)步驟獲得更精細(xì)的網(wǎng)格結(jié)構(gòu)：頂點(diǎn)對(duì)齊（獲得頂點(diǎn)位置對(duì)應(yīng)的圖像特征）；圖卷積（沿著網(wǎng)格邊緣傳播信息）；頂點(diǎn)細(xì)化（更新頂點(diǎn)位置）。網(wǎng)絡(luò)的每一層都為網(wǎng)格的每個(gè)頂點(diǎn)維護(hù)一個(gè)三維坐標(biāo)以及特征向量。

△網(wǎng)格細(xì)化分支

1、頂點(diǎn)對(duì)齊：利用攝像機(jī)的內(nèi)在矩陣將每個(gè)頂點(diǎn)的三維坐標(biāo)投影到圖像平面上。

根據(jù)獲取的RoIAlign，在每個(gè)投影的頂點(diǎn)位置上計(jì)算一個(gè)雙線性插值圖像特征來(lái)作為對(duì)應(yīng)頂點(diǎn)的圖像特征。

2、圖卷積：圖卷積用于沿著網(wǎng)格邊緣傳播頂點(diǎn)信息，公式定義如下：

其中N(i)表示頂點(diǎn)i的鄰點(diǎn)集合，使用多個(gè)圖卷積層在局部網(wǎng)格區(qū)域上聚合信息。

3、頂點(diǎn)精化：使用2中更新后的頂點(diǎn)特征使用下面公式來(lái)更新頂點(diǎn)位置：

只更改頂點(diǎn)位置，不更改三角形平面。

模型損失函數(shù)

網(wǎng)格細(xì)化損失（從三個(gè)方面定義了三個(gè)損失函數(shù)）

論文實(shí)驗(yàn)

論文在兩個(gè)數(shù)據(jù)集上驗(yàn)證模型：在ShapeNet數(shù)據(jù)集上對(duì)網(wǎng)格預(yù)測(cè)器進(jìn)行了基準(zhǔn)測(cè)試與最先進(jìn)的方法進(jìn)行比較并且對(duì)模型中的各個(gè)模塊進(jìn)行單獨(dú)分析；在Pix3D數(shù)據(jù)集上測(cè)試完整Mesh R-Cnn模型在復(fù)雜背景下的物體三維網(wǎng)格預(yù)測(cè)結(jié)果。

在ShapeNet數(shù)據(jù)集：Mesh R-Cnn與其他的模型比較結(jié)果如圖下：

其中Ours(Best)表示去掉形狀正則化損失后的結(jié)果，在后面的實(shí)驗(yàn)中可以發(fā)現(xiàn)，去掉形狀正則化損失后盡管在標(biāo)準(zhǔn)度量上有好的表現(xiàn)，但是在視覺(jué)層面上生成的網(wǎng)格并不如加上后的結(jié)果（Ours(Pretty)）。

表格中比較了模型的完整版本以及不同去除模塊版本的表現(xiàn)：

其中Full Test Set表示在完整測(cè)試集上的表現(xiàn)；

Holes Test Set表示在打孔對(duì)象測(cè)試集中的表現(xiàn)；

Voxel-Only表示不適用網(wǎng)格細(xì)化分支；

Best和Perry分別表示不使用形狀正則化損失和使用形狀正則化損失；

Ours(light)表示在網(wǎng)格細(xì)化分支中使用較輕量的非殘差架構(gòu)。

盡管不使用邊長(zhǎng)正則化器的訓(xùn)練結(jié)果在標(biāo)準(zhǔn)度量中有更好的表現(xiàn)，但是會(huì)產(chǎn)生退化的預(yù)測(cè)網(wǎng)格，會(huì)導(dǎo)致輸出的網(wǎng)格出現(xiàn)許多重疊的面。

對(duì)比Pixel2Mesh模型，Pixel2Mesh模型的輸出結(jié)果是從一個(gè)標(biāo)準(zhǔn)橢圓變形得到的，不能正確地建模有孔的物體。相反，Mesh R-Cnn可以對(duì)任意拓?fù)浣Y(jié)構(gòu)的物體進(jìn)行建模。

Pix3D數(shù)據(jù)集

可視化結(jié)果

本文總結(jié)

該文章的貢獻(xiàn)可歸納如下：

（1）借鑒mask rcnn 框架；

（2）由粗到細(xì)調(diào)整的思想；

（3）使用圖卷積神經(jīng)網(wǎng)絡(luò)；

（4）使用多種損失來(lái)約束訓(xùn)練；

-最后介紹一篇論文，也是CVPR 2019的文章

△CVPR 2019, cited by 0

這篇文章同樣是既可以對(duì)單視圖，也可以對(duì)多視圖進(jìn)行重建，只不過(guò)這篇文章的重點(diǎn)不在這，而在于它可以對(duì)不可見(jiàn)部分（不確定性）進(jìn)行建模。

基本思想就是，每個(gè)輸入圖像都可以預(yù)測(cè)出多個(gè)重建結(jié)果，然后取交集就是最終結(jié)果。

下圖是主框架，左邊是訓(xùn)練階段，右邊是測(cè)試階段。

△主框架

左邊訓(xùn)練階段的意思是，輸入一張圖像 I，對(duì)其加入多個(gè)噪聲(r)，生成多個(gè)重建結(jié)果(S)（類似于條件生成模型）。對(duì)改模型的訓(xùn)練要加約束，這里提出了front constraint和diversity constraint。

右邊是測(cè)試階段，提出了一個(gè)一致性損失（consistency loss）來(lái)進(jìn)行在線優(yōu)化。

Distance Metric:

△度量距離（這篇文章是基于點(diǎn)云做的，所以需要用度量距離衡量?jī)蓚€(gè)點(diǎn)云集的距離）

Diversity Constraint: 目的是讓條件生成器生成的重建結(jié)果更具有多樣性。

△Diversity Constraint:

Front Constraint:?對(duì)圖像前邊部分（部分點(diǎn)）有監(jiān)督訓(xùn)練，所以這里有一個(gè)采樣過(guò)程，具體內(nèi)容如

下圖所示：

△Front Constraint、對(duì)Front Constraint采樣部分解釋

對(duì)于條件生成器生成的結(jié)果，用一個(gè)判別器去判斷這個(gè)形狀是否合理，公式如下：

Latent Space Discriminator（判別器是直接從WGAN-GP中拿來(lái)的）

△判別器

訓(xùn)練總的損失：

Inference (consistency constraint):

公式中Si 和 Sj 代表兩個(gè)點(diǎn)云集合。

△consistency constraint

條件生成器的結(jié)構(gòu)：

△簡(jiǎn)約版本

△詳細(xì)版本

實(shí)驗(yàn)結(jié)果：

本文總結(jié)

該文章的貢獻(xiàn)可歸納如下：

（1）提出對(duì)不可見(jiàn)部分的不確定性進(jìn)行建模；

（2）使用了條件生成模型；

（3）提出了三種約束；

編輯：黃飛

閱讀全文

計(jì)算機(jī)視覺(jué)(45543) 計(jì)算機(jī)視覺(jué)(45543)
三維重建(9832) 三維重建(9832)
雙目視覺(jué)(14110) 雙目視覺(jué)(14110)

評(píng)論

相關(guān)推薦

三維產(chǎn)品動(dòng)畫設(shè)計(jì)價(jià)值

【Evan藝源動(dòng)畫】三維產(chǎn)品動(dòng)畫設(shè)計(jì)是較為常見(jiàn)的一種類型，憑借自身的特點(diǎn)和優(yōu)勢(shì)，在領(lǐng)域中展現(xiàn)出許多的價(jià)值。三維產(chǎn)品動(dòng)畫不僅可以更詳細(xì)的展示產(chǎn)品的外觀、特點(diǎn)、結(jié)構(gòu)、功能等，還可以讓人們?nèi)轿粍?dòng)態(tài)

2019-08-24 14:12:00

三維內(nèi)存的概念

智能芯片之三維內(nèi)存介紹

2021-01-29 07:39:22

三維加速度

求哪位大神幫忙編一個(gè)三維加速度采集的LabVIEW8.5程序，采集卡NI9233，三個(gè)三維KISTLER加速度傳感器。QQ2984833847

2013-11-01 22:46:14

三維動(dòng)畫制作過(guò)程之間的聯(lián)系

了三維動(dòng)畫與二維動(dòng)畫之間的界線，而且這種手法正在被大多數(shù)人所接收，正在緩緩取代傳統(tǒng)二維動(dòng)畫的制作方式。(4)通過(guò)傳統(tǒng)的手法和計(jì)算機(jī)結(jié)合的方法制作三維動(dòng)畫，例如采取手繪的方法和計(jì)算機(jī)制作的辦法制作，或者采取傳統(tǒng)

2011-11-15 14:28:02

三維參數(shù)圖輸入矩陣的含義

用三維參數(shù)圖畫一個(gè)三維圖時(shí)，輸入矩陣X,Y,Z都表示啥？

2017-10-07 17:39:48

三維可視化的應(yīng)用和優(yōu)勢(shì)

、三維動(dòng)畫、以及計(jì)算機(jī)程控技術(shù)與實(shí)體模型進(jìn)行融合，實(shí)現(xiàn)對(duì)設(shè)備運(yùn)行的檢測(cè)與模擬，使得管理者對(duì)于其所管理設(shè)備的外觀形象、所處位置、運(yùn)行參數(shù)一目了然，可以很大程度上減少管理者的勞動(dòng)強(qiáng)度，進(jìn)而提高管理效率和水平

2020-12-02 11:52:33

三維快速建模技術(shù)與三維掃描建模的應(yīng)用

`三維快速建模技術(shù)與三維掃描建模的應(yīng)用隨著數(shù)字化測(cè)量的發(fā)展，三維激光掃描儀能夠快速地以多角度、高效、高精度方式獲取物體的表面三維數(shù)據(jù)，可以用于物體的三維建模。首先采用中科院廣州電子

2018-08-07 11:14:41

三維曲線加速度

想搞一個(gè)三維曲線圖，顯示加速度。將加速度傳感器的數(shù)據(jù)通過(guò)單片機(jī)串口發(fā)給計(jì)算機(jī)，再用labview將數(shù)據(jù)顯示在三維曲線圖上。哪位有好的建議，就發(fā)一下啊。有過(guò)相同經(jīng)驗(yàn)的更好，可以提供一些程序給我。謝謝了啊。

2013-10-23 17:12:57

三維曲線導(dǎo)入到三維圖形控件中

用三維線條圖做了一個(gè)同心圓曲線，怎么才能把它導(dǎo)入到三維圖形控件中呢？如圖

2014-10-27 13:49:36

三維移動(dòng)

德國(guó)pi公司的三維移動(dòng)平臺(tái)如何用labview控制呢？

2012-03-05 13:00:06

三維立體成像X射線顯微鏡在元器件失效分析中的應(yīng)用

°，完成一次圓周掃描，獲取系列視圖像。三維成像過(guò)程為：首先利用一次圓周掃描獲取系列透視圖像，然后采用相應(yīng)的重建算法，重建樣品區(qū)域內(nèi)被測(cè)區(qū)域的吸收系數(shù)的三維分布。根據(jù)吸收系數(shù)的三維重建，進(jìn)一步通過(guò)軟件

2019-08-31 10:07:21

三維立體數(shù)字沙盤是是什么？

`　　那什么是三維立體數(shù)字沙盤呢？三維立體數(shù)字沙盤又叫三維數(shù)字沙盤、立體數(shù)字沙盤，是利用三維技術(shù)、地理遙控技術(shù)、虛擬現(xiàn)實(shí)技術(shù)、觸控技術(shù)等實(shí)現(xiàn)的。在計(jì)算機(jī)中建立一個(gè)虛擬環(huán)境，把需要展現(xiàn)的內(nèi)容利用

2020-08-28 14:40:10

三維角度傳感器

想問(wèn)一下電賽關(guān)于三維角傳感器得用法有人知道嗎/?

2015-08-10 13:00:16

三維觸控技術(shù)突破“二向箔”的束縛

， AR）三維觸摸屏很有潛力成為AR應(yīng)用中人機(jī)交互的基礎(chǔ)技術(shù)。在AR技術(shù)中，用戶佩戴的專用眼鏡作為顯示屏，通過(guò)計(jì)算機(jī)視覺(jué)技術(shù)將AR的圖像界面與現(xiàn)實(shí)世界有機(jī)地結(jié)合在一起并投射到用戶眼睛的視網(wǎng)膜上。當(dāng)用戶的手

2016-12-19 15:53:17

三維設(shè)計(jì)應(yīng)用案例

。三維CAD的使用，不僅能提高設(shè)計(jì)質(zhì)量，還能縮短設(shè)計(jì)周期，創(chuàng)作良好的經(jīng)濟(jì)效益和社會(huì)效益。所以，越來(lái)越多的企業(yè)將三維CAD作為企業(yè)進(jìn)行產(chǎn)品設(shè)計(jì)和創(chuàng)新最通用的手段和工具。而隨著我國(guó)計(jì)算機(jī)技術(shù)的迅速發(fā)展

2019-07-03 07:06:31

三維逆向工程的成果及應(yīng)用案例

`三維逆向工程的成果及應(yīng)用案例何為逆向工程？為適應(yīng)現(xiàn)代先進(jìn)制造技術(shù)的發(fā)展，需將實(shí)物樣件或手工模型轉(zhuǎn)化為Sence數(shù)據(jù)，以便利用快速成形系統(tǒng)、計(jì)算機(jī)輔助系統(tǒng)等對(duì)其進(jìn)行處理，并進(jìn)行修改和優(yōu)化。逆向工程

2016-03-02 15:12:00

三維重建

畢業(yè)設(shè)計(jì)激光三角法測(cè)鋼管直徑圖像怎么處理？？謝謝

2012-05-05 12:17:29

Ansoft HFSS 13三維電磁仿真軟件

的電子設(shè)計(jì)工業(yè)標(biāo)準(zhǔn)。HFSS提供了一簡(jiǎn)潔直觀的用戶設(shè)計(jì)界面、精確自適應(yīng)的場(chǎng)解器、擁有空前電性能分析能力的功能強(qiáng)大后處理器，能計(jì)算任意形狀三維無(wú)源結(jié)構(gòu)的S參數(shù)和全波電磁場(chǎng)。HFSS軟件擁有強(qiáng)大的天線

2012-09-09 22:11:05

Handyscan三維掃描儀對(duì)戶外大型燈箱三維掃描解決方案

`近期我們接到一個(gè)與廣告行業(yè)相關(guān)的客戶，他們是一家專業(yè)設(shè)計(jì)、改裝戶外廣告燈箱的公司，目前是有一個(gè)大型戶外廣告燈箱，想要通過(guò)三維掃描，獲取其精準(zhǔn)的三維數(shù)據(jù)，并據(jù)此逆向建模設(shè)計(jì)，最終得出滿足自己需求

2020-07-15 10:52:54

LabVIEW三維仿真

有哪位大俠會(huì)使用LabVIEW做三維仿真，請(qǐng)多多指教，非常感謝！

2012-02-10 16:23:18

SMARTSCAN三維掃描儀電子產(chǎn)品配件三維掃描服務(wù)

`SMARTSCAN三維掃描儀電子產(chǎn)品配件三維掃描服務(wù)自從我司今年6月份發(fā)布了smartscan-這款新型桌面型工業(yè)用激光三維掃描儀后，受到了新老客戶的極大關(guān)注，該款設(shè)備設(shè)計(jì)精巧，采用藍(lán)色激光，掃描

2020-09-17 16:16:57

VR與三維可視化在電廠中的作用

VR技術(shù)也稱靈境技術(shù)或人工環(huán)境，其定義是集合仿真技術(shù)、計(jì)算機(jī)圖形學(xué)、人機(jī)接口技術(shù)、多媒體技術(shù)傳感技術(shù)以及網(wǎng)絡(luò)技術(shù)等多種領(lǐng)域技術(shù)而開(kāi)發(fā)出來(lái)的一種計(jì)算機(jī)仿真系統(tǒng)，能夠創(chuàng)建并讓用戶感受到原本只有在真實(shí)世界

2020-12-03 15:03:33

labview三維曲面，三維成像的切片圖怎樣弄，效果效果如下。

三維數(shù)據(jù)的切片圖

2014-12-05 09:54:56

labview怎樣畫三維曲面圖？

用labview三維曲面圖畫一個(gè)曲面，橫截面表達(dá)式為f=2.4*y*y*y*y-1.6*y*y+0.1*y+2.2

2017-12-15 18:42:34

上海黃浦三維媒體動(dòng)畫技術(shù)

表現(xiàn)手法的穿插和應(yīng)用。三維動(dòng)畫的表達(dá)方式直觀,成像效果真實(shí)性高，幾乎可以達(dá)到拍攝出來(lái)的照片的那種幾以假亂真的真實(shí)感，除了具有和照片不相上下的真實(shí)感外，較之照片更直觀，主次分明，可以根據(jù)制作者的意向選擇

2021-06-30 09:26:37

亮度最高的DLP可編程投影儀是哪一款

和TIDA-01226嗎，還是有更高亮度的產(chǎn)品。設(shè)備放在水下投影光會(huì)不會(huì)有明顯衰減？能否滿足在水下類似于晴天和陰天室內(nèi)的亮度環(huán)境下的 2m左右的投影圖案進(jìn)行三維重建需求？能否在不連接計(jì)算機(jī)的前提下投影一幅預(yù)設(shè)的圖案？

2018-06-23 07:04:07

什么讓三維掃描數(shù)據(jù)栩栩如生

`什么讓三維掃描數(shù)據(jù)栩栩如生1.應(yīng)用需求描述利用三維掃描儀掃描三維數(shù)據(jù)，并貼上色彩，可以用將產(chǎn)品三維信息完全展示，可以通過(guò)網(wǎng)站或者APP等方式進(jìn)行展示，是讓消費(fèi)者能夠快速全面了解產(chǎn)品外觀的一項(xiàng)新技術(shù)

2017-08-02 10:18:24

初學(xué)者請(qǐng)教高手，如何將一組齒輪輪廓數(shù)據(jù)重建成三維齒...

我有一組齒輪的輪廓數(shù)據(jù)，每條輪由800個(gè)數(shù)據(jù)組成，我想把這一組輪廓重建成三維齒面圖形，請(qǐng)高手指教，萬(wàn)分感謝！

2014-12-08 11:08:59

圖像處理

各位壇友，問(wèn)一下，Labview可以根據(jù)幾幅二維圖實(shí)現(xiàn)物體的三維重建嗎？還是只能用MATLAB stcrip節(jié)點(diǎn)實(shí)現(xiàn)？

2017-07-13 16:55:53

基于FPGA+DSP的三維圖像信息處理系統(tǒng)設(shè)計(jì)

　　三維圖像信息處理一直是圖像視頻處理領(lǐng)域的熱點(diǎn)和難點(diǎn)，目前國(guó)內(nèi)外成熟的三維信息處理系統(tǒng)不多，已有的系統(tǒng)主要依賴高性能通用PC完成圖像采集、預(yù)處理、重建、構(gòu)型等囊括底層和高層的處理工作。三維圖像處理

2019-06-24 06:11:03

基于RGB-D相機(jī)的機(jī)械臂無(wú)序抓取系統(tǒng) 相關(guān)資料推薦

引導(dǎo)語(yǔ)：本文為“3D視覺(jué)創(chuàng)新應(yīng)用（三維重建）競(jìng)賽”作品集系列之一，該作品由來(lái)自深圳大學(xué)團(tuán)隊(duì)完成，團(tuán)隊(duì)成員：趙晨昊、張曼英、周制黔、郭...

2021-07-02 06:56:13

基于嵌入式的室內(nèi)靜態(tài)場(chǎng)景實(shí)時(shí)重建系統(tǒng)的相關(guān)資料分享

點(diǎn)擊上方“3D視覺(jué)工坊”，選擇“星標(biāo)”干貨第一時(shí)間送達(dá)引導(dǎo)語(yǔ)：本文為“3D視覺(jué)創(chuàng)新應(yīng)用（三維重建）競(jìng)賽”作品集系列之一，該作品由來(lái)自杭州電子科技大學(xué)團(tuán)隊(duì)完成，團(tuán)隊(duì)成員：路榮豐、許成浩、呂坤...

2021-12-22 06:48:14

如何去開(kāi)發(fā)一款基于RGB-D相機(jī)與機(jī)械臂的三維重建無(wú)序抓取系統(tǒng)

基于RGB-D相機(jī)與機(jī)械臂的三維重建無(wú)序抓取系統(tǒng)有哪些關(guān)鍵技術(shù)？如何去開(kāi)發(fā)一款基于RGB-D相機(jī)與機(jī)械臂的三維重建無(wú)序抓取系統(tǒng)？基于RGB-D相機(jī)與機(jī)械臂的三維重建無(wú)序抓取系統(tǒng)是由哪些部分組成的？

2021-09-08 06:12:06

如何實(shí)現(xiàn)三維數(shù)據(jù)的采集？

本文主要從觸摸屏工作原理、ADS7846的工作方式以及單片機(jī)89S51對(duì)ADS7846的控制等方面來(lái)分析如何實(shí)現(xiàn)三維數(shù)據(jù)的采集。

2021-04-07 06:11:54

安徽三維動(dòng)畫制作和二維動(dòng)畫有哪些區(qū)別呢？（三）

制作生成和鏡頭輸出由計(jì)算機(jī)根據(jù)人工設(shè)置的參數(shù)自動(dòng)生成。因此，制作動(dòng)畫制作長(zhǎng)片效率較高，制作動(dòng)畫制作長(zhǎng)片的周期較短。一部高品質(zhì)的三維動(dòng)畫制作電影制作周期一般為兩年。

2022-01-25 10:34:36

安徽三維動(dòng)畫制作和二維動(dòng)畫有哪些區(qū)別呢？（一）

的，沒(méi)有使用真正意義的三維顯示技術(shù)播放。我們平時(shí)所謂的“二維動(dòng)畫”與“三維動(dòng)畫”指的是動(dòng)畫的創(chuàng)作空間。按照在制作過(guò)程中攝像機(jī)或者虛擬攝像機(jī)是否可以任意進(jìn)行旋轉(zhuǎn)來(lái)劃分二維動(dòng)畫和三維動(dòng)畫。三維動(dòng)畫制作是利用計(jì)算機(jī)

2022-01-22 10:02:07

廣州三維動(dòng)畫制作流程（一）

了越來(lái)越重要的作用。那么三維動(dòng)畫是如何制作的呢？根據(jù)實(shí)際制作流程，一個(gè)完整的影視類三維動(dòng)畫制作總體上可分為前期制作、動(dòng)畫片段制作與后期合成三個(gè)部分。首先便是前期制作，前期制作是指在使用計(jì)算機(jī)制作前，對(duì)動(dòng)畫片

2021-12-30 10:06:04

廣西掃描服務(wù)三維檢測(cè)三維掃描儀

和型腔，測(cè)量速度慢、效率低，人力成本極高，并有可能損傷工件。采用激光三維掃描儀進(jìn)行三維檢測(cè)，采集速度快，兼容性強(qiáng)，可直接在計(jì)算機(jī)中實(shí)時(shí)操作，大大節(jié)省了人力和時(shí)間成本。不僅僅是制造工業(yè)，像其他如建筑

2018-08-29 14:42:40

怎樣去設(shè)計(jì)一種基于RGB-D相機(jī)的三維重建無(wú)序抓取系統(tǒng)？

為什么要開(kāi)發(fā)一種三維重建無(wú)序抓取系統(tǒng)？三維重建無(wú)序抓取系統(tǒng)是由哪些部分組成的？三維重建無(wú)序抓取系統(tǒng)有哪些關(guān)鍵技術(shù)和創(chuàng)新點(diǎn)？

2021-07-02 06:29:28

整車三維掃描及其零部件三維掃描解決方案

，不用貼點(diǎn)，掃描速度快。掃描情況：掃描五根放在模具上的空調(diào)管路，掃描速度很快并能快速地以三角網(wǎng)格形式呈現(xiàn)在計(jì)算機(jī)上，可以進(jìn)行編輯，客戶很滿意效果。然后又用handyprobe檢測(cè)空調(diào)管路模具并出具檢測(cè)

2018-08-21 10:17:40

無(wú)人機(jī)三維建模的信息

項(xiàng)目需要調(diào)研一下無(wú)人機(jī)三維建模的信息無(wú)人機(jī)三維建模核心技術(shù)是三維重建，或者說(shuō)基于圖片的建模（Image-Based Modeling）。項(xiàng)目需要是建立園區(qū)的三維模型，其他應(yīng)用上可以用于古街道、文物

2021-09-16 06:55:27

智慧醫(yī)療//瑞迅科技ARM工控MTB-903助力醫(yī)療三維光學(xué)重建便攜檢測(cè)機(jī)穩(wěn)定運(yùn)行

本期導(dǎo)讀伴隨著醫(yī)學(xué)三維重建的技術(shù)成熟，但設(shè)備單價(jià)高昂、體積龐大，讓其保有量非常有限，而含有相關(guān)基礎(chǔ)模塊、高級(jí)模塊醫(yī)學(xué)三維重建類的設(shè)備，不失為更好的解決方案。今天為大家分享瑞迅科技ARM工控

2021-12-02 10:03:15

智能芯片的三維內(nèi)存解析

三維內(nèi)存對(duì)人們生產(chǎn)生活方面的貢獻(xiàn)智能芯片的三維內(nèi)存

2020-12-24 06:54:39

匯總 |計(jì)算機(jī)視覺(jué)系統(tǒng)學(xué)習(xí)資料下載精選資料分享

計(jì)算機(jī)視覺(jué)干貨資料，涉及相機(jī)標(biāo)定、三維重建、立體視覺(jué)、SLAM、深度學(xué)習(xí)、點(diǎn)云后處理、姿態(tài)估計(jì)、多視圖幾何、多傳感器融合等方向【計(jì)算...

2021-07-27 07:51:42

江西南昌三維動(dòng)畫制作的優(yōu)勢(shì)

江西南昌三維動(dòng)畫制作的優(yōu)勢(shì)三維動(dòng)畫技術(shù)是隨著計(jì)算機(jī)軟硬件技術(shù)的發(fā)展而產(chǎn)生的一新興技術(shù)，它可以用在各種領(lǐng)域之中，例如直觀地表達(dá)復(fù)雜的施工過(guò)程、構(gòu)建出奇幻瑰麗的魔幻世界、還原出工程完成后的建筑

2021-04-19 10:50:18

汽車整車三維掃描有手持式藍(lán)光掃描儀就夠啦！

3D掃描儀，手持式藍(lán)色激光3D掃描儀，在工業(yè)制造領(lǐng)域使用范圍非常廣，在汽車的整車及制造，航空航天、軌道交通、機(jī)械制造的逆向造型、質(zhì)量控制、產(chǎn)品設(shè)計(jì)方面都發(fā)揮了重要作用，大大減少三維重建的時(shí)間，提高三維重建

2019-10-20 11:16:44

自動(dòng)駕駛系統(tǒng)要完成哪些計(jì)算機(jī)視覺(jué)任務(wù)？

Geiger 的研究主要集中在用于自動(dòng)駕駛系統(tǒng)的三維視覺(jué)理解、分割、重建、材質(zhì)與動(dòng)作估計(jì)等方面。他主導(dǎo)了自動(dòng)駕駛領(lǐng)域著名數(shù)據(jù)集 KITTI 及多項(xiàng)自動(dòng)駕駛計(jì)算機(jī)視覺(jué)任務(wù)的基準(zhǔn)體系建設(shè)，KITTI 是目前最大的用于自動(dòng)駕駛的計(jì)算機(jī)視覺(jué)公開(kāi)數(shù)據(jù)集。

2020-07-30 06:49:20

高薪誠(chéng)聘高薪圖形處理算法大牛了，地點(diǎn)在人間天堂的杭州，有山有水，沒(méi)霧霾

圖像融合算法.c. 雙目及多目相機(jī)標(biāo)定及相機(jī)姿態(tài)估計(jì) d. 三維重建算法,如雙目立體三維重建,SfM. e. 降質(zhì)圖像恢復(fù), 如模糊圖像解卷積及多幀高噪聲圖像合成增強(qiáng).f. SLAM視覺(jué)空間定位及避障

2017-05-11 14:59:26

高速攝像系統(tǒng)在三維運(yùn)動(dòng)康復(fù)中的應(yīng)用案例

廣泛適用的。運(yùn)動(dòng)康復(fù)中所必備的實(shí)驗(yàn)儀器之一就是三維圖像解析系統(tǒng)。盡管人體信息可以用數(shù)值、曲線、圖像等多種形式表示，但是圖像所包含的信息量遠(yuǎn)遠(yuǎn)超過(guò)數(shù)值和曲線。三維圖像解析系統(tǒng)實(shí)現(xiàn)方式有四種：光學(xué)式

2015-09-02 14:21:21

基于紋理映射的醫(yī)學(xué)圖像三維重建

提出了一種基于紋理映射的體繪制算法，提高了圖像的重建效率，增強(qiáng)了圖像的重建效果。算法實(shí)現(xiàn)了對(duì)二維醫(yī)學(xué)圖像序列的三維重建，在目前通用的個(gè)人計(jì)算機(jī)上可以以近似實(shí)

2008-12-14 11:10:19

建筑場(chǎng)景三維重建中影像方位元素的獲取方法

摘要：基于影像的三維重建需要確定影像的內(nèi)、外方位元素，影像中的滅點(diǎn)為其提供了重要的線索，但滅點(diǎn)位置的不確定性，影響了方位元素計(jì)算的結(jié)果。通過(guò)分析滅點(diǎn)幾何，建

2009-01-09 22:10:57

管道切片的三維重建

管道切片的三維重建該論文根據(jù)問(wèn)題以離散形式給出數(shù)據(jù)而所求軸心軌跡及切片輪廓實(shí)質(zhì)是連續(xù)曲線的特點(diǎn),并充分利用生成球的某個(gè)位置在上,下半徑距離范圍內(nèi)的切片都有截點(diǎn)

2009-09-16 11:54:57

基于激光掃描儀的樹(shù)干三維重建方法研究

本文介紹了一種利用三維激光掃描儀，對(duì)樹(shù)木枝干進(jìn)行三維重建的方法。首先利用激光掃描儀獲取一系列樹(shù)木枝干的坐標(biāo)數(shù)據(jù)，繼而通過(guò)篩選這些數(shù)據(jù)來(lái)重建一系列樹(shù)木枝干的片

2010-01-22 11:58:01

MC三維重建算法的二義性消除研究

面繪制法進(jìn)行三維重建是三維重建技術(shù)的主要方法，Marching Cubes(移動(dòng)立方體)算法是經(jīng)典的面繪制法。本文在剖析了MC 算法的基礎(chǔ)上，針對(duì)其存在的二義性問(wèn)題，給出了消除二義性

2010-01-22 12:02:11

一種新穎實(shí)用的基于視覺(jué)導(dǎo)航的三維重建算法

一種新穎實(shí)用的基于視覺(jué)導(dǎo)航的三維重建算法根據(jù)立體視覺(jué)在視覺(jué)導(dǎo)航應(yīng)用中的特點(diǎn)，提出了由視差圖重建三維場(chǎng)景的整套算法。首先，推導(dǎo)視差圖里各點(diǎn)在攝

2010-02-27 09:24:07

基于FPGA的醫(yī)學(xué)圖像三維重建系統(tǒng)設(shè)計(jì)與實(shí)現(xiàn)

目前大部分的醫(yī)學(xué)圖像三維重建過(guò)程都是在PC機(jī)上完成的，由于PC機(jī)本身性能的限制和重建算法的復(fù)雜性，使得重建效率不高。針對(duì)這個(gè)問(wèn)題，設(shè)計(jì)與實(shí)現(xiàn)了一個(gè)基于FPGA（Field Programmable Gate Array，現(xiàn)場(chǎng)可編程門陣列）的三維重建系統(tǒng)，系統(tǒng)中建立了一種基于FS

2011-03-15 13:52:59

基于MC算法的光刻仿真微結(jié)構(gòu)的三維重建_宮珊珊

基于MC算法的光刻仿真微結(jié)構(gòu)的三維重建_宮珊珊

2017-03-18 09:06:38

基于非量測(cè)相片的三維模型重建

三維激光掃描技術(shù)進(jìn)行三維重建和傳統(tǒng)的室內(nèi)三維重建。近年來(lái)，數(shù)碼攝像產(chǎn)品性價(jià)比進(jìn)一步提高得到廣泛使用且其數(shù)碼攝像技術(shù)有了突破性進(jìn)展，攝影成像的質(zhì)量和分辨率有了大幅度的提高，為三維模型構(gòu)建提供了廣闊的發(fā)展空間。

2018-02-23 10:30:27

AI+AR將用于智能三維重建領(lǐng)域

AI與AR的關(guān)系日漸微妙，正在不斷融合、相互促進(jìn)。在計(jì)算機(jī)視覺(jué)中, 三維重建是指根據(jù)單視圖或者多視圖的二維圖像重建三維信息·的過(guò)程。在虛擬現(xiàn)實(shí)、電影、視頻行為監(jiān)控等領(lǐng)域中均有著廣泛的應(yīng)用前景。

2018-09-21 10:33:00

4415

如何使用智能手機(jī)進(jìn)行三維模型重建的方法概述

三維重建一直是計(jì)算機(jī)視覺(jué)中的重要的研究領(lǐng)域，這是突破現(xiàn)有數(shù)字計(jì)算機(jī)的信息處理能力，將其擴(kuò)展為能處理多維信息的重要途徑之一。針對(duì)三維模型重建成本高、操作繁瑣、周期長(zhǎng)等問(wèn)題，提出了一種基于智能手機(jī)的三維

2018-11-15 16:15:31

如何使用單目視覺(jué)進(jìn)行高精度三維場(chǎng)景重建技術(shù)研究

近年來(lái)，隨著計(jì)算機(jī)硬件的不斷快速更新，計(jì)算機(jī)的處理能力也不斷變強(qiáng)。同時(shí)場(chǎng)景三維模型的獲取技術(shù)越來(lái)越成熟，我們獲得場(chǎng)景的三維模型數(shù)據(jù)的方式更多也更加方便了。而目前在基于單目和雙目的三維重建技術(shù)

2018-12-24 15:55:08

奧比中光舉辦AI 3D感知論壇學(xué)術(shù)專家共話三維計(jì)算機(jī)視覺(jué)前沿科技

，來(lái)自國(guó)內(nèi)多所知名大學(xué)的七位頂尖專家就基于深度學(xué)習(xí)的三維場(chǎng)景重建、動(dòng)態(tài)場(chǎng)景三維重建、基于三維信息的行為理解、視覺(jué)SLAM、三維人臉和表情識(shí)別、三維人臉建模、三維場(chǎng)景智能感知與理解等三維計(jì)算機(jī)視覺(jué)領(lǐng)域的前沿科技進(jìn)行闡述。深圳南山科創(chuàng)

2019-01-24 16:44:49

1654

計(jì)算機(jī)視覺(jué)的爆發(fā) 三維重建或許是一個(gè)突破口

三維重建指對(duì)三維物體建立適合計(jì)算機(jī)表示和處理的數(shù)學(xué)模型,是在計(jì)算機(jī)環(huán)境下對(duì)其進(jìn)行處理、操作和分析其性質(zhì)的基礎(chǔ),也是在計(jì)算機(jī)中建立表達(dá)客觀世界的虛擬現(xiàn)實(shí)的關(guān)鍵技術(shù)。

2019-06-13 09:38:21

1209

計(jì)算機(jī)視覺(jué)研究方向有哪些

本視頻主要詳細(xì)介紹了計(jì)算機(jī)視覺(jué)研究方向有哪些，分別是圖像分類、目標(biāo)檢測(cè)、圖像分割、目標(biāo)跟蹤、圖像濾波與降噪、圖像增強(qiáng)、風(fēng)格化、 三維重建、圖像檢索。

2019-04-04 16:11:19

49564

為什么說(shuō)三維重建才是計(jì)算機(jī)視覺(jué)的靈魂?

權(quán)龍教授為我們介紹了三維重建的歷史發(fā)展與應(yīng)用前景。

2019-07-02 14:18:34

30469

計(jì)算機(jī)視覺(jué)的發(fā)展歷史_計(jì)算機(jī)視覺(jué)的應(yīng)用方向

計(jì)算機(jī)視覺(jué)40多年的發(fā)展中，盡管人們提出了大量的理論和方法，但總體上說(shuō)，計(jì)算機(jī)視覺(jué)經(jīng)歷了4個(gè)主要?dú)v程。即：馬爾計(jì)算視覺(jué)、主動(dòng)和目的視覺(jué)、多視幾何與分層三維重建和基于學(xué)習(xí)的視覺(jué)。下面將對(duì)這4項(xiàng)主要內(nèi)容進(jìn)行簡(jiǎn)要介紹。

2020-07-30 17:21:44

6145

面向踝關(guān)節(jié)功能的三維測(cè)量與重建系統(tǒng)設(shè)計(jì)

光正反條紋圖像檢測(cè)結(jié)構(gòu)光邊緣并實(shí)現(xiàn)亞像素定位。利用主動(dòng)立體視覺(jué)原理實(shí)現(xiàn)踝關(guān)節(jié)姿勢(shì)的三維測(cè)量與三維重建，并根據(jù)三維重建模型分析踝關(guān)節(jié)功能性不穩(wěn)。實(shí)驗(yàn)結(jié)果表明，該系統(tǒng)可有效地分析踝關(guān)節(jié)功能性不穩(wěn)，為早期發(fā)現(xiàn)踝關(guān)節(jié)

2021-03-16 10:54:05

淺析面向圖像三維重建的無(wú)人機(jī)航線規(guī)劃

隨著無(wú)人機(jī)技術(shù)的發(fā)展，無(wú)人機(jī)序列影像三維重建越來(lái)越受到人們的關(guān)注。為完整重建任務(wù)區(qū)域的三維模型并減少無(wú)

2021-04-06 08:58:06

3582

透明物體的三維重建研究綜述

透明物體的三維重建一直以來(lái)都被認(rèn)為是很有挑戰(zhàn)性的問(wèn)題。不同于傳統(tǒng)重建算法對(duì)物體表面的漫反射屬性假設(shè)，因?yàn)橥该魑矬w與光線之間存在復(fù)雜的，如反射和折射等，與視角相關(guān)的光學(xué)效應(yīng)，將導(dǎo)致傳統(tǒng)重建算法無(wú)法直接

2021-04-21 14:21:37

面向動(dòng)態(tài)三維重建的地圖序列快速生成方法

為了獲得真實(shí)的動(dòng)態(tài)重建體驗(yàn)，需要在重建幾何的基礎(chǔ)上進(jìn)一步重建顏色信息，并高效地進(jìn)行數(shù)據(jù)編碼傳輸。為此提出一種面向動(dòng)態(tài)三維重建的紋理地圖序列快速生成方法。首先基于動(dòng)態(tài)三維重建的基準(zhǔn)網(wǎng)格序列的幾何相似

2021-06-03 15:02:10

基于分布式傳感的實(shí)時(shí)三維重建系統(tǒng)

基于分布式傳感的實(shí)時(shí)三維重建系統(tǒng)

2021-06-25 11:25:39

嵌入式雙目視覺(jué)系統(tǒng)和三維重建技術(shù)研究

嵌入式雙目視覺(jué)系統(tǒng)和三維重建技術(shù)研究(嵌入式開(kāi)發(fā)方向)-該文檔為嵌入式雙目視覺(jué)系統(tǒng)和三維重建技術(shù)研究總結(jié)文檔，是一份很不錯(cuò)的參考資料，具有較高參考價(jià)值，感興趣的可以下載看看………………?

2021-07-30 11:50:03

基于圖像的三維物體重建：在深度學(xué)習(xí)時(shí)代的最新技術(shù)和趨勢(shì)綜述之訓(xùn)練

前面幾節(jié)討論了直接從二維觀測(cè)重建三維對(duì)象的方法。本節(jié)展示了如何使用附加提示，如中間表示和時(shí)間相關(guān)性來(lái)促進(jìn)三維重建。

2022-01-26 19:55:11

NVIDIA Omniverse平臺(tái)助力三維重建服務(wù)協(xié)同發(fā)展

計(jì)算機(jī)視覺(jué)的進(jìn)步為元宇宙的數(shù)字孿生應(yīng)用打下堅(jiān)實(shí)基礎(chǔ)。在計(jì)算機(jī)視覺(jué)中，三維重建是指根據(jù)單視圖或者多視圖的圖像重建三維信息的過(guò)程。數(shù)字孿生開(kāi)發(fā)者可借助三維重建服務(wù)，加速 3D 模型構(gòu)建，提升數(shù)字虛擬內(nèi)容創(chuàng)作效率。

2022-10-13 09:45:31

840

結(jié)構(gòu)光三維重建：相移法的基本原理及應(yīng)用優(yōu)勢(shì)

在結(jié)構(gòu)光三維重建中，最常見(jiàn)的方法就是相移法，相移是通過(guò)投影一系列相移光柵圖像編碼，從而得到物體表面一點(diǎn)在投影儀圖片上的相對(duì)位置或者絕對(duì)位置。下面，筆者將詳細(xì)介紹如何制作相移編碼圖片，以及如何對(duì)獲取的相移圖片進(jìn)行解碼，最后筆將粗淺的談?wù)勏嘁葡啾绕渌椒ǎㄈ绺窭状a）有什么優(yōu)勢(shì)。

2022-12-21 09:47:31

1405

深度學(xué)習(xí)背景下的圖像三維重建技術(shù)進(jìn)展綜述

根據(jù)三維模型的表示形式可以將圖像三維重建方法分類為基于體素的三維重建、基于點(diǎn)云的三維重建和基于網(wǎng)格的三維重建，其中基于網(wǎng)格的三維重建方法包含單一顏色的網(wǎng)格三維重建和具有色彩紋理的網(wǎng)格三維重建

2023-01-09 14:26:56

1368

淺談三維重建的相關(guān)理論各種視覺(jué)三維重建技術(shù)的對(duì)比

機(jī)器學(xué)習(xí)其實(shí)就是使機(jī)器具有學(xué)習(xí)的能力, 從而不斷獲得新知識(shí)以及新技能得到有效提升.機(jī)器學(xué)習(xí)在三維環(huán)境重建中一直是重點(diǎn)研究對(duì)象。

2023-01-11 10:53:50

1684

如何使用純格雷碼進(jìn)行三維重建？

對(duì)于新手來(lái)說(shuō)，使用格雷碼做單目結(jié)構(gòu)光三維重建是一個(gè)入門級(jí)的訓(xùn)練。但是在復(fù)現(xiàn)時(shí)往往會(huì)遇到一個(gè)問(wèn)題，明明解碼都很不錯(cuò)了，重建后的點(diǎn)云精度卻很低，甚至重建出來(lái)的平面點(diǎn)云出現(xiàn)斷層現(xiàn)象。

2023-01-13 11:41:16

802

基于NeRF的三維場(chǎng)景重建和理解

這種拍攝方式在SLAM或者SFM中更多見(jiàn)，而傳統(tǒng)三維重建或者RGBD重建是很難做出 NeRF 或者 Semantic-NeRF 這種效果的。所以方法可能很簡(jiǎn)單，但是這個(gè)工作很有意義。

2023-02-06 10:50:01

2870

NerfingMVS：引導(dǎo)優(yōu)化神經(jīng)輻射場(chǎng)實(shí)現(xiàn)室內(nèi)多視角三維重建

既然Nerf可以表示場(chǎng)景的三維信息，一個(gè)自然的想法是能不能將NeRF應(yīng)用到室內(nèi)場(chǎng)景三維重建任務(wù)中呢。NeRF有著一些優(yōu)勢(shì)：相較于傳統(tǒng)的MVS,SfM算法，NeRF蘊(yùn)含了整個(gè)場(chǎng)景的信息，所以有潛力重建出低紋理區(qū)域的三維結(jié)構(gòu)；

2023-02-13 11:20:41

2302

三維重建：從入門到入土

經(jīng)典三維重建系統(tǒng)的整個(gè)pipeline從相機(jī)標(biāo)定、基礎(chǔ)矩陣與本質(zhì)矩陣估計(jì)、特征匹配到運(yùn)動(dòng)恢復(fù)結(jié)構(gòu)（SFM），從SFM到稠密點(diǎn)云重建、表面重建、紋理貼圖。熟悉SFM的工程師已經(jīng)是行業(yè)內(nèi)的佼佼者，能掌握

2023-03-03 10:17:47

701

基于RGB-D相機(jī)的三維重建和傳統(tǒng)SFM和SLAM算法有什么區(qū)別？

輸入數(shù)據(jù)流不同。在基于RGB-D相機(jī)的三維重建中，輸入有深度信息和彩色信息，并且深度信息起主導(dǎo)作用，而在SLAM和SFM算法中輸入的是主要是彩色信息，個(gè)別工作也有結(jié)合深度信息。

2023-03-23 12:28:51

1006

介紹一種基于圖像的三維重建方法

當(dāng)前，對(duì)于一個(gè)場(chǎng)景的快速重建是重要的，目標(biāo)是實(shí)現(xiàn)一個(gè)快速的、全面的三維重建模型?？梢詰?yīng)用于野外的林業(yè)資源保護(hù)、火災(zāi)和地震的災(zāi)后搶救、邊境安防、油田或者海上平臺(tái)油氣設(shè)施、電力設(shè)施監(jiān)測(cè)都有十分重要的價(jià)值。

2023-04-12 18:21:34

732

三維重建之結(jié)構(gòu)光編碼方案研究

接下來(lái)進(jìn)入主題，正式介紹結(jié)構(gòu)光編碼方案。結(jié)構(gòu)光三維重建按照所投影的圖案一般可以分為以下三類，點(diǎn)結(jié)構(gòu)光、線結(jié)構(gòu)光和面結(jié)構(gòu)光，其中面結(jié)構(gòu)光按照編碼原理又可以基于時(shí)域編碼的結(jié)構(gòu)光和基于空域編碼的結(jié)構(gòu)光。

2023-08-16 16:52:22

577

如何實(shí)現(xiàn)整個(gè)三維重建過(guò)程

在計(jì)算機(jī)視覺(jué)中，三維重建是指根據(jù)單視圖或者多視圖的圖像重建三維信息的過(guò)程。由于單視頻的信息不完全，因此三維重建需要利用經(jīng)驗(yàn)知識(shí)，而多視圖的三維重建(類似人的雙目定位)相對(duì)比較容易，其方法是先對(duì)攝像機(jī)進(jìn)行標(biāo)定，即計(jì)算出攝像機(jī)的圖像坐標(biāo)系與世界坐標(biāo)系的關(guān)系，然后利用多個(gè)二維圖像中的信息重建出三維信息。

2023-09-01 11:06:19

693

基于光學(xué)成像的物體三維重建技術(shù)研究

隨著計(jì)算機(jī)科學(xué)和數(shù)字成像技術(shù)的飛速發(fā)展，光學(xué)成像技術(shù)在許多領(lǐng)域中得到了廣泛應(yīng)用，其中之一便是物體三維重建。物體三維重建技術(shù)是一種通過(guò)計(jì)算機(jī)處理圖像數(shù)據(jù)，獲得物體三維信息的技術(shù)。光學(xué)成像技術(shù)作為物體

2023-09-15 09:29:34

494

基于深度學(xué)習(xí)的三維重建技術(shù)

多視圖立體幾何（Multi-View Stereo，MVS）是計(jì)算機(jī)視覺(jué)中重要的研究領(lǐng)域，也是邁入三維計(jì)算機(jī)視覺(jué)研究的重點(diǎn)問(wèn)題。它通過(guò)利用多張互相重疊的圖像恢復(fù)出原始三維場(chǎng)景的幾何結(jié)構(gòu)和紋理信息，是現(xiàn)實(shí)中拍攝照片的逆過(guò)程。

2023-12-04 10:08:21

525

已全部加載完成

搜索歷史

計(jì)算機(jī)視覺(jué)的三維重建是什么 常見(jiàn)的三維重建表達(dá)方式有哪些

評(píng)論

計(jì)算機(jī)視覺(jué)的三維重建是什么常見(jiàn)的三維重建表達(dá)方式有哪些