一、原理介紹
圖像拼接(Image Stitching)是一種利用實景圖像組成全景空間的技術(shù),它將多幅圖像拼接成一幅大尺度圖像或360度全景圖,圖像拼接技術(shù)涉及到計算機視覺、計算機圖形學、數(shù)字圖像處理以及一些數(shù)學工具等技術(shù)。圖像拼接其基本步驟主要包括以下幾個方面:攝相機的標定、傳感器圖像畸變校正、圖像的投影變換、匹配點選取、全景圖像拼接(融合),以及亮度與顏色的均衡處理等,以下對各個步驟進行分析。
攝相機標定
由于安裝設(shè)計,以及攝相機之間的差異,會造成視頻圖像之間有縮放(鏡頭焦距不一致造成)、傾斜(垂直旋轉(zhuǎn))、方位角差異(水平旋轉(zhuǎn)),因此物理的差異需要預先校準,得到一致性好的圖像,便于后續(xù)圖像拼接。
相機的運動方式與成像結(jié)果之間的關(guān)系見下圖。
圖1:相機的運動方式與成像結(jié)果之間的關(guān)系
圖像坐標變換
在實際應用中,全景圖像的獲得往往需要攝像機以不同的位置排列和不同的傾角拍攝。例如由于機載或車載特性,相機的排列方式不盡相同,不能保證相機在同一面上,如柱面投影不一定在同一個柱面上,平面投影不一定在同一平面上;另外為了避免出現(xiàn)盲區(qū),相機拍攝的時候往往會向下傾斜一定角度。這些情況比較常見,而且容易被忽略,直接投影再拼接效果較差。因而有必要在所有圖像投影到某個柱面(或平面)之前,需要根據(jù)相機的位置信息和角度信息來獲得坐標變換后的圖像。
理論上只要滿足靜止三維圖像或者平面場景的兩個條件中的任何一個,兩幅圖像的對應關(guān)系就可以用投影變換矩陣表示,換句話說只要滿足這其中任何一個條件,一個相機拍攝的圖像可以通過坐標變換表示為另一個虛擬相機拍攝的圖像。
一般情況下8參數(shù)的透視投影變換最適合描述圖像之間的坐標關(guān)系,其中8參數(shù)的矩陣為[m0,m1,m2;m3,m4,m5; m6,m7,1];各參數(shù)對應的相機運動表示如下:
如圖2顯示的是相機向下傾斜一定角度拍攝圖像,這個角度與m6和m7具有對應關(guān)系,如果要獲得校正圖像,只需要對8參數(shù)矩陣求逆后進行坐標變換。
(a) 原始圖像
圖2:(a) 原始圖像;(b)x方向形變效果;(c)傾斜校正后效果
圖像畸變校正
由于制造、安裝、工藝等原因,鏡頭存在著各種畸變。為了提高攝像機拼接的精度,在進行圖像拼接的時候必須考慮成像鏡頭的畸變。一般畸變分為內(nèi)部畸變和外部畸變,內(nèi)部畸變是由于攝影本身的構(gòu)造為起因的畸變,外部畸變?yōu)橥队胺绞降膸缀我蛩仄鹨虻幕?。鏡頭畸變屬于內(nèi)部畸變,由鏡頭產(chǎn)生的畸變一般可分為徑向畸變和切向畸變兩類。徑向畸變就是集合光學中的畸變像差,主要是由于鏡頭的徑向曲率不同而造成的,有桶形畸變和枕型畸變兩種。切向畸變通常被人為是由于鏡頭透鏡組的光學中心不共線引起的,包括有各種生成誤差和裝配誤差等。一般人為,光學系統(tǒng)成像過程當中,徑向畸變是導致圖像畸變的主要因素。徑向畸變導致圖像內(nèi)直線成彎曲的像,且越靠近邊緣這種效果越明顯。根據(jù)徑向畸變產(chǎn)生的機理,對視頻圖像進行校正。效果如圖3(b)所示,經(jīng)過校正的圖像,其有效像素區(qū)域縮小,一般可通過電子放大的方式進行校正,如圖3(c)所示。
(b) (c)
圖3:(a)為原始采集圖像;(b)為經(jīng)過徑向失真校正的圖像;(c)為經(jīng)過放大的圖像
圖像投影變換
由于每幅圖像是相機在不同角度下拍攝得到的,所以他們并不在同一投影平面上,如果對重疊的圖像直接進行無縫拼接,會破壞實際景物的視覺一致性。所以需要先對圖像進行投影變換,再進行拼接。一般有平面投影、柱面投影、立方體投影和球面投影等。
平面投影就是以序列圖像中的一幅圖像的坐標系為基準,將其圖像都投影變換到這個基準坐標系中,使相鄰圖像的重疊區(qū)對齊,稱由此形成的拼接為平面投影拼接;柱面投影是指采集到的圖像數(shù)據(jù)重投影到一個以相機焦距為半徑的柱面,在柱面上進行全景圖的投影拼接;球面投影是模擬人眼觀察的特性,將圖像信息通過透視變換投影到眼球部分,構(gòu)造成一個觀察的球面;立方體投影是為了解決球面影射中存在的數(shù)據(jù)不宜存儲的缺點,而發(fā)展出來的一種投影拼接方式,它適合于計算機生成圖像,但對實景拍攝的圖像則比較困難。如下圖4所示,圖像拼接處理流程示意圖。
圖4:圖像拼接處理流程示意圖
匹配點選取與標定
由于特征點的方法較容易處理圖像之間旋轉(zhuǎn)、仿射、透視等變換關(guān)系,因而經(jīng)常被使用,特征點包括圖像的角點以及相對于其領(lǐng)域表現(xiàn)出某種奇異性的興趣點。Harris等提出了一種角點檢測算法,該算法是公認的比較好的角點檢測算法,具有剛性變換不變性,并在一定程度上具有仿射變換不變性,但該算法不具有縮放變換不變性。針對這樣的缺點,Lowe提出了具有縮放不變性的SIFT特征點。
圖5 兩幅圖像中標定的匹配特征點
如上圖5所示,圖像的拼接需要在圖像序列中找到有效的特征匹配點。圖像的特征點尋找直接影響圖像拼接的精度和效率。對于圖像序列,如果特征點個數(shù)≥4個,則很容易自動標定圖像匹配點;如果特征點很少,圖像拼接往往不能取得較為理想的效果。
圖像拼接融合
圖像拼接的關(guān)鍵兩步是:配準(registration)和融合(blending)。配準的目的是根據(jù)幾何運動模型,將圖像注冊到同一個坐標系中;融合則是將配準后的圖像合成為一張大的拼接圖像。
在多幅圖像配準的過程中,采用的幾何運動模型主要有:平移模型、相似性模型、仿射模型和透視模型。
圖像的平移模型是指圖像僅在兩維空間發(fā)生了 方向和 方向的位移,如果攝像機僅僅發(fā)生了平移運動,則可以采用平移模型。圖像的相似性模型是指攝像機本身除了平移運動外還可能發(fā)生旋轉(zhuǎn)運動,同時,在存在場景的縮放時,還可以利用縮放因子 多縮放運動進行描述,因此,當圖像可能發(fā)生平移、旋轉(zhuǎn)、縮放運動時,可以采用相似性模型。圖像的仿射模型是一個6參數(shù)的變換模型,即具有平行線變換成平行線,有限點映射到有限點的一般特性,具體表現(xiàn)可以是各個方向尺度變換系數(shù)一致的均勻尺度變換或變換系數(shù)不一致的非均與尺度變換及剪切變換等,可以描述平移運動、旋轉(zhuǎn)運動以及小范圍的縮放和變形。圖像的透視模型是具有8個參數(shù)的變換模型,可以完美地表述各種表換,是一種最為精確變換模型。
圖像融合技術(shù)一般可分為非多分辨率技術(shù)和多分辨率技術(shù)兩類。在非多分辨率技術(shù)中主要有平均值法、帽子函數(shù)法、加權(quán)平均法和中值濾波法等。多分辨率技術(shù)主要有高斯金字塔、拉普拉斯金字塔、對比度金字塔,梯度金字塔和小波等。
(e)
圖6 柱面全景圖像拼接
(a)-(d)為四幅不同視角的圖像,(e)為最終拼接得到的柱面全景圖像
亮度與顏色的均衡處理
因為相機和光照強度的差異,會造成一幅圖像內(nèi)部,以及圖像之間亮度的不均勻,拼接后的圖像會出現(xiàn)明暗交替,這樣給觀察造成極大的不便。
亮度與顏色均衡處理,通常的處理方式是通過相機的光照模型,校正一幅圖像內(nèi)部的光照不均勻性,然后通過相鄰兩幅圖像重疊區(qū)域之間的關(guān)系,建立相鄰兩幅圖像之間直方圖映射表,通過映射表對兩幅圖像做整體的映射變換,最終達到整體的亮度和顏色的一致性。
二、國內(nèi)外現(xiàn)狀
全景拼接偵察系統(tǒng)在國外已經(jīng)有了較早的研究,早在1992年,劍橋大學的L.G.Brown就對圖像拼接的核心技術(shù)進行總結(jié),1996年微軟研究院的Richard Szeliski提出基于運動的全景拼接模型。Szeliski后來又相繼發(fā)表了若干這方面論文,2000年Shmuel Peleg提出改進方法,根據(jù)相機的運動方式自適應選擇拼接模型,2003年M.Brown發(fā)表了SIFT特征進行圖像拼接的方法,但計算量很大,2007年Seong Jong Ha提出移動相機系統(tǒng)的全景拼接方法,不僅保證效果,而且運算速度也不錯。
在國內(nèi)方面,也有不少高??蒲袡C構(gòu)對視頻拼接技術(shù)及應用進行研究,其中,上海凱視力成信息科技有限公司研發(fā)的“全景視覺態(tài)勢感知系統(tǒng)” 最具代表性,該系統(tǒng)功能完善、技術(shù)先進、性能可靠,并已成功應用于多種車型。
上海凱視力成信息科技有限公司全景視覺態(tài)勢感知系統(tǒng)——PVS9112型是實時的全固態(tài)無機械運動的高清360度凝視視頻系統(tǒng),系統(tǒng)提供實時的連續(xù)覆蓋整個戰(zhàn)場的全運動視頻,人機交互界面直觀快捷。系統(tǒng)適應于惡劣環(huán)境,支持彩色和紅外傳感器,可以黑天和白天全天候工作,實時地圖像處理和高清視頻的顯示,顯示界面同時提供360度全景窗口和感興趣區(qū)域的高清畫面。系統(tǒng)提供開發(fā)式結(jié)構(gòu),便于同其它系統(tǒng)如雷達等集成到一起,以獲得一個完整的態(tài)勢理解。
傳感頭:
圖8 幾種傳感頭
圖形界面:
圖9 PVS9112圖形界面
特點:
實時的360度視頻全景顯示,便于對態(tài)勢的感知理解、安全監(jiān)視、目標探測。從而提高平臺的攻擊能力和安全防護性。
支持高清彩色和紅外傳感器。日夜均可工作。
顯示全局拼接畫面、局部感興趣。
圖形交互界面。并支持多種人機交互接口,支持觸摸屏、鼠標、鍵盤、自定義按鍵、操縱搖桿等,可無縫接入已有系統(tǒng)。
無運動部件,高可靠性。
適應車船飛機等惡劣的工作環(huán)境。
可選特征:
目標檢測與告警
自動多目標跟蹤
視頻記錄和回放
可選支持PTZ長距離光電探測系統(tǒng),在全景視頻上可以通過觸摸的方式控制PTZ的快速轉(zhuǎn)動到指定的位置,克服了傳統(tǒng)操控PTZ方式的缺陷,使得PTZ攝像機的功效大大提高。
圖像透霧增強算法
電子穩(wěn)像算法
開放式體形架構(gòu):
二、應用
從圖像拼接的實際應用來看,主要有大型航空照片,衛(wèi)星圖像拼接,車載系統(tǒng)監(jiān)控,虛擬場景實現(xiàn),視頻壓縮;很多資料上都提及車載系統(tǒng)的拼接,這種拼接偵查系統(tǒng)可以用于不同車輛,如反恐、安全監(jiān)視、偵察、巡邏和警車等;系統(tǒng)給操作者提供車輛周圍的實時全景圖像,使之能夠感知全面而豐富的態(tài)勢,操縱車輛的同時還可以有效將自己保護在車內(nèi),不用通過車輛的擋風玻璃就可以實時操控。全景圖像極大地增強了用戶的視覺感知系統(tǒng),使其在特種車輛、軍用以及民用方面都擁有廣闊的市場前景。與傳統(tǒng)的多畫面監(jiān)控相比,全景拼接畫面更符合人眼觀察,極大地提高了偵察的準確性。但很少提及機載系統(tǒng),因此,機載方面只要設(shè)計合理,應用前景是巨大的。
應用實例:
方式一:基本模式
攝像機組 + 一或兩個終端,支持記錄或不記錄,每個終端所顯示內(nèi)容可以不同。
方式二:增強模式
攝像機組 + 2以上終端,可通過GigE網(wǎng)絡(luò)來擴展連接其他設(shè)備,如視頻記錄儀等。 采集和預處理模塊,實現(xiàn)對視頻信號的捕獲,并對攝像機組進行管理,如PTZ控制等。在這一層,實現(xiàn)對不同路數(shù)、不同接口形式的攝像機的支持。并作必要的預處理功能,如圖像的縮放平移投影變換、數(shù)據(jù)壓縮等,為后續(xù)處理器準備好數(shù)據(jù)。模塊還通過多個GigE網(wǎng)絡(luò),將視頻數(shù)據(jù)分發(fā)給多個不同的處理器或其它設(shè)備,如視頻記錄儀等。這種組成結(jié)構(gòu),可適應不同應用需求:如不同的攝像機種類和數(shù)量,終端處理功能要求不同等等。
關(guān)于視頻拼接產(chǎn)品的介紹
-
圖像拼接
+關(guān)注
關(guān)注
0文章
28瀏覽量
10757 -
全景視頻
+關(guān)注
關(guān)注
0文章
4瀏覽量
7696
發(fā)布評論請先 登錄
相關(guān)推薦
國際視頻編碼標準mpeg簡述及AVS視頻關(guān)鍵技術(shù)
【視頻】智能家居系統(tǒng)關(guān)鍵技術(shù)分析與應用
DDRx的關(guān)鍵技術(shù)介紹(中)
LTE-Advanced的關(guān)鍵技術(shù)和標準進展介紹
什么是5G高頻關(guān)鍵技術(shù)?
超寬帶認知無線電的關(guān)鍵技術(shù)是什么?
MIMO-OFDM中有哪些關(guān)鍵技術(shù)?
視覺導航關(guān)鍵技術(shù)及應用
【技術(shù)案例】RK3588 AVS全景拼接
![【<b class='flag-5'>技術(shù)</b>案例】RK3588 AVS<b class='flag-5'>全景</b><b class='flag-5'>拼接</b>](https://file.elecfans.com/web2/M00/10/E9/pYYBAGEfInyAb9dQAABH4pzjonI981.jpg)
評論