圖像
1、模擬圖像
模擬圖像,又稱連續(xù)圖像,是指在二維坐標(biāo)系中連續(xù)變化的圖像,即圖像的像點(diǎn)是無限稠密的,同時(shí)具有灰度值(即圖像從暗到亮的變化值)。
2、數(shù)字圖像
數(shù)字圖像,又稱數(shù)碼圖像或數(shù)位圖像,是二維圖像用有限數(shù)字?jǐn)?shù)值像素的表示。
數(shù)字圖像是由模擬圖像數(shù)字化得到的、以像素為基本元素的、可以用數(shù)字計(jì)算機(jī)或數(shù)字電路存儲和處理的圖像。
通常的二維數(shù)字圖像是一個(gè)矩陣,可以用一個(gè)二維數(shù)組 f(x,y) 來表示,其中 x,y 是二維空間中的某坐標(biāo)系的坐標(biāo),f(x,y) 表示圖像在該點(diǎn)處的灰度值等性質(zhì)。
3、顏色模式(顏色存儲)
顏色具有三個(gè)特性,即色相,明度和飽和度。顏色的三個(gè)特性及其相互關(guān)系可以用三度空間的顏色立體說明。
顏色模式,是將某種顏色表現(xiàn)為數(shù)字形式的模型,或者說是一種記錄圖像顏色的方式。分為:RGB模式、CMYK模式、HSB模式、Lab模式、位圖模式、灰度模式、索引顏色模式、雙色調(diào)模式和多通道模式。
● RGB模式(發(fā)光模式)
RGB 是最常用的彩色模式,RGB 分別代表紅、綠、藍(lán)三原色,RGB 采用此模式每個(gè)像素占用 3 個(gè)字節(jié)(一個(gè)字節(jié) 8 位),分別用于表示顏色的 R、G、B 分量(255、255、255)屬加色模式 0-255(黑色-白色)。
特點(diǎn)文件小。色彩豐富且飽滿。RGB模式是一種發(fā)光的彩色模式。屏幕上顯示的圖像,就一般都是以 RGB 模式,因?yàn)轱@示器的物理結(jié)構(gòu)就是遵循 RGB 的 。
當(dāng)3種基色的亮度值相等時(shí),產(chǎn)生灰色;當(dāng)3種亮度值都是255時(shí),產(chǎn)生純白色;而當(dāng)所有亮度值都是0時(shí),產(chǎn)生純黑色。當(dāng)3種色光混合生成的顏色一般比原來的顏色亮度值高,所以RGB模式產(chǎn)生顏色的方法又被稱為色光加色法。
4、色彩模式(顯示方式)
色彩模式是數(shù)字世界中表示顏色的一種算法,在數(shù)學(xué)世界中,為了表示各種顏色,人們通常將顏色劃分為若干分量。由于成色原理的不同,決定了顯示器、投影儀、掃描儀這類靠色光直接合成顏色的顏色設(shè)備和打印機(jī)、印刷機(jī)這類靠顏料的印刷設(shè)備在生成顏色方式上的區(qū)別。分為:RGB模式、CMYK模式、HSB模式、Lab模式、位圖模式、灰度模式、索引顏色模式、雙色調(diào)模式和多通道模式。
5、圖像的分型
(1) 二值圖像
只有黑白兩種顏色。黑為0,白為1。二值圖像適合于由黑白兩色構(gòu)成而沒有灰度陰影的圖像。
(2)灰度圖像(GrayScale)
灰度圖像矩陣元素的取值范圍通常為[0,255]。因此其數(shù)據(jù)類型一般為8位無符號整數(shù)的(int8),這就是人們經(jīng)常提到的256灰度圖像?!?”表示純黑色,“255”表示純白色,中間的數(shù)字從小到大表示由黑到白的過渡色?;叶葓D像只有灰度顏色而沒有彩色。我們通常所說的黑白照片,其實(shí)包含了黑白之間的所有灰度色調(diào)。
(3)索引顏色圖像(Index Color)
顏色表紅、綠、藍(lán)分量值不全相等;像素值是圖像顏色表的索引地址。
在這種模式下,顏色都是預(yù)先定義的,并且可供選用的一組顏色也很有限,索引顏色的圖像最多只能顯示256種顏色。
索引顏色通常也稱為映射顏色,一幅索引顏色圖像在圖像文件里定義,當(dāng)打開該文件時(shí),構(gòu)成該圖像具體顏色的索引值就被讀入程序里,然后根據(jù)索引值找到最終的顏色。
索引圖像的文件結(jié)構(gòu)比較復(fù)雜,除了存放圖像的二維矩陣外,還包括一個(gè)稱之為顏色索引矩陣MAP的二維數(shù)組。MAP的大小由存放圖像的矩陣元素值域決定,如矩陣元素值域?yàn)閇0,255],則MAP矩陣的大小為256Ⅹ3,用MAP=[RGB]表示。MAP中每一行的三個(gè)元素分別指定該行對應(yīng)顏色的紅、綠、藍(lán)單色值,MAP中每一行對應(yīng)圖像矩陣像素的一個(gè)灰度值。
索引圖像的數(shù)據(jù)類型一般為 8 位無符號整形(int8),相應(yīng)索引矩陣MAP的大小為256Ⅹ3,因此一般索引圖像只能同時(shí)顯示256種顏色,但通過改變索引矩陣,顏色的類型可以調(diào)整。
索引圖像一般用于存放色彩要求比較簡單的圖像,如Windows中色彩構(gòu)成比較簡單的壁紙多采用索引圖像存放,如果圖像的色彩比較復(fù)雜,就要用到RGB真彩色圖像。
(4)真彩色RGB圖像
RGB圖像與索引圖像一樣,它分別用紅(R)、綠(G)、藍(lán)(B)三原色的組合來表示每個(gè)像素的顏色。
但與索引圖像不同的是,RGB 圖像每一個(gè)像素的顏色值(由RGB三原色表示)直接存放在圖像矩陣中,由于每一像素的顏色需由 R、G、B 三個(gè)分量來表示,每個(gè)分量占 1 個(gè)字節(jié),表示0到255之間的不同的亮度值,這三個(gè)字節(jié)組合可以產(chǎn)生1670萬種不同的顏色。
M、N分別表示圖像的行列數(shù),三個(gè)M x N的二維矩陣分別表示各個(gè)像素的R、G、B三個(gè)顏色分量。RGB 圖像的數(shù)據(jù)類型一般為8位無符號整形,通常用于表示和存放真彩色圖像,當(dāng)然也可以存放灰度圖像。
RGB 圖像按行列存儲,每列含有三個(gè)通道(注意:通道的順序是 BGR 而不是 RGB)
5、rgb圖像和索引圖像的主要區(qū)別
(1)RGB彩色模式圖像:又叫加色模式圖,是屏幕顯示的最佳顏色,由紅、綠、藍(lán)三種顏色組成,每一種顏色可以有0-255的亮度變化。
(2)索引顏色圖像:這種顏色下圖像像素用一個(gè)字節(jié)表示它最多包含有256色的色表儲存并索引其所用的顏色,它圖像質(zhì)量不高。它的數(shù)據(jù)信息包括一個(gè)數(shù)據(jù)矩陣和一個(gè)雙精度色圖矩陣,它的數(shù)據(jù)矩陣中的值直接指定該點(diǎn)的顏色為色圖矩陣中的某一種,色圖矩陣中,每一行表示一種顏色,每行有三個(gè)數(shù)據(jù),分別表示該種顏色中紅、綠、藍(lán)的比例情況,所有元素值都在[0,1]內(nèi)。占空間較少。通常用于網(wǎng)絡(luò)上的圖片傳輸、對圖像像素、大小有嚴(yán)格要求的地方。
6、像素
像素是指由圖像的小方格組成的,這些小方塊都有一個(gè)明確的位置和被分配的色彩數(shù)值,小方格顏色和位置就決定該圖像所呈現(xiàn)出來的樣子。數(shù)字圖像均由像素點(diǎn)構(gòu)成,依據(jù)坐標(biāo)原點(diǎn)位置的不同常分為兩類,每個(gè)像素點(diǎn)標(biāo)示為 I(r,c) 或 f(x,y)?;叶葓D像的值域 I 是一個(gè)一元標(biāo)量: I=greylevel ;彩色圖像的值域 I 是一個(gè)多元向量: 如 I=(r,g,b)。
可以將像素視為整個(gè)圖像中不可分割的單位或者是元素。不可分割的意思是它不能夠再切割成更小單位抑或是元素,它是以一個(gè)單一顏色的小格存在。
每一個(gè)點(diǎn)陣圖像包含了一定量的像素,這些像素決定圖像在屏幕上所呈現(xiàn)的大小。
7、分辨率
分辨率是度量位圖圖像內(nèi)數(shù)據(jù)量多少的一個(gè)參數(shù)。通常表示成每英寸像素(Pixel per inch, ppi)和每英寸點(diǎn)(Dot per inch, dpi)。
(1)圖像分辨率
圖像中每單位長度上的像素?cái)?shù)目,稱為圖像的分辨率,其單位為像素/英寸(PPI)或是像素/厘米。在相同尺寸的兩幅圖像中,高分辨率的圖像包含的像素比低分辨率的圖像包含的像素多。
圖像的尺寸、圖像的分辨率和圖像文件的大小三者之間有著密切的聯(lián)系。圖像的尺寸越大,圖像的分辨率越高,圖像文件也就越大。調(diào)整圖像的大小和分辨率即可改變圖像文件的大小。
(2)屏幕分辨率
屏幕分辨率是顯示器上每單位長度顯示的點(diǎn)的數(shù)目 (DPI)。屏幕分辨率取決于顯示器大小及其像素設(shè)置。
當(dāng)圖像分辨率高于顯示器分辨率時(shí),屏幕中顯示的圖像比實(shí)際尺寸大。
圖像數(shù)學(xué)模型
1、兩種基本的圖像數(shù)學(xué)模型
連續(xù)模型
一般的圖像都是能量的連續(xù)分布,我們前面所說的膠卷成像。
離散模型
把數(shù)字圖像看成離散采樣點(diǎn)的集合,每個(gè)點(diǎn)具有其各自的屬性。處理運(yùn)算就是對這些離散單元的操作。不能反映出圖像的整體狀態(tài)以及圖像內(nèi)容間的聯(lián)系。用卷積進(jìn)行操作會更好。
兩個(gè)模型都各有優(yōu)缺,但之后的方向還是離散模型,其便于計(jì)算機(jī)處理,之后我們主要還是從離散模型出發(fā),進(jìn)行圖像處理。
2、圖像數(shù)學(xué)模型的應(yīng)用原則
在圖像處理中,根據(jù)任務(wù)和目的的不同,經(jīng)常會采用不同的模型來處理圖像,或者在不同的階段是用不同的模型,保證系統(tǒng)的最佳性能。圖像在數(shù)字化時(shí)必須滿足采樣定理,這樣離散的圖像才能與它的連續(xù)形式對應(yīng)?!皵?shù)字圖像處理”不是指“數(shù)字圖像的處理”,而是指“圖像的數(shù)字處理”。
3、采樣定理
采樣定理是美國電信工程師H.奈奎斯特在1928年提出的,在數(shù)字信號處理領(lǐng)域中,采樣定理是連續(xù)時(shí)間信號(通常稱為“模擬信號”)和離散時(shí)間信號(通常稱為“數(shù)字信號”)之間的基本橋梁。該定理說明采樣頻率與信號頻譜之間的關(guān)系,是連續(xù)信號離散化的基本依據(jù)。它為采樣率建立了一個(gè)足夠的條件,該采樣率允許離散采樣序列從有限帶寬的連續(xù)時(shí)間信號中捕獲所有信息。
4、數(shù)字化(連續(xù) —> 離散)
將一幅圖像從其原來的形式轉(zhuǎn)換為數(shù)字形式的處理過程,包括“掃描” (scanning)、“采樣” (sampling)與“量化”
(quantization)三個(gè)步驟。通常將“掃描”合并到“采樣”階段,合并為兩個(gè)過程。
(1)采樣
采樣是將空間上連續(xù)的圖像變換成離散的點(diǎn),采樣頻率越高,還原的圖像越真實(shí)。
采樣把一幅連續(xù)圖像在空間上分割成 M×N 個(gè)網(wǎng)格,每個(gè)網(wǎng)格用一亮度值來表示。一個(gè)網(wǎng)格稱為一個(gè)像素。M×N 的取值滿足采樣定理。
(2)量化
量化是將采樣出來的像素點(diǎn)轉(zhuǎn)換成離散的數(shù)量值,一幅數(shù)字圖像中不同灰度值得個(gè)數(shù)稱為灰度等級,級數(shù)越大,圖像越是清晰。
量化就是把采樣點(diǎn)上對應(yīng)的亮度連續(xù)變化區(qū)間轉(zhuǎn)換為單個(gè)特定數(shù)碼的過程。
量化后,圖像就被表示成一個(gè)整數(shù)矩陣。每個(gè)像素具有兩個(gè)屬性:位置和灰度。位置由行、列表示?;叶缺硎驹撓袼匚恢蒙狭涟党潭鹊恼麛?shù)。此數(shù)字矩陣M×N就作為計(jì)算機(jī)處理的對象了。灰度級一般為0-255(8bit量化)。下圖表示的是如何將連續(xù)的轉(zhuǎn)化為離散的情況。
綜合而言的數(shù)字化過程如下圖所示,其表示的是從圖像的真實(shí)來源,到最后的數(shù)字圖像:
圖像處理
數(shù)字圖像處理包括內(nèi)容:
● 圖像數(shù)字化;
● 圖像變換;
● 圖像增強(qiáng);
● 圖像恢復(fù);
● 圖像壓縮編碼;
● 圖像分割;
● 圖像分析與描述;
● 圖像的識別分類。
常用圖像變換算法
圖像的幾何變換(圖像畸變校正、圖像縮放:雙線性插值、旋轉(zhuǎn)、拼接)
圖像變換(傅立葉、余弦、沃爾什-哈達(dá)瑪、K-L變換、小波變換)
圖像頻域處理(增強(qiáng)算法:高頻率提升、同態(tài)濾波;平滑去噪:低通濾波)
圖像增強(qiáng)
圖像增強(qiáng)的目的是要改善圖像的視覺效果,針對給定圖像的應(yīng)用場合,有目的的增強(qiáng)圖像的整體或局部特性,將原來不清晰的圖像變得清晰或增強(qiáng)某些感興趣的特征,擴(kuò)大圖像中不同物體的特征之間的差別,抑制不感興趣的特征,使之改善圖像質(zhì)量、豐富信息量,將強(qiáng)圖像判讀和識別效果,滿足某些特征分析的需求。
常用圖像增強(qiáng)方法:圖像的線性變換;圖像的非線性變化;圖像的直方圖均衡化和規(guī)定化。
圖像復(fù)原
圖像在形成、傳輸和記錄中,由于成像系統(tǒng)、傳輸介質(zhì)和設(shè)備的不完善,導(dǎo)致圖像質(zhì)量下降,這一現(xiàn)象稱為圖像退化。圖像復(fù)原需知道圖像退化的機(jī)制和過程等先驗(yàn)知識,據(jù)此找出一種相應(yīng)的逆過程解算方法,從而得到復(fù)原的圖像。如果圖像已退化,應(yīng)先做復(fù)原處理,再做增強(qiáng)處理。
常用的圖像復(fù)原方法:
● 代數(shù)恢復(fù)方法:無約束復(fù)原;約束最小二乘法
● 頻域恢復(fù)方法:逆濾波恢復(fù)法;去除由均勻運(yùn)動引起的模糊;維納濾波復(fù)原法
圖像壓縮
圖像數(shù)據(jù)之所以可以被壓縮,是因?yàn)閿?shù)據(jù)中存在著冗余。在圖像壓縮中,有三種基本的數(shù)據(jù)冗余:編碼冗余;像素間冗余;視覺冗余。
● 無損壓縮:是對文件本身的壓縮,和其它數(shù)據(jù)文件的壓縮一樣,是對文件的數(shù)據(jù)存儲方式進(jìn)行優(yōu)化,采用某種算法表示重復(fù)的數(shù)據(jù)信息,文件可以完全還原,不影響文件內(nèi)容,對于數(shù)字圖像而言,也不會使圖像細(xì)節(jié)有任何損失。無損(亦稱無失真、無誤差、信息保持)編碼中刪除的僅僅是圖像數(shù)據(jù)中冗余的數(shù)據(jù),經(jīng)解碼重建的圖像和原始圖像沒有任何失真。
● 有損壓縮:是對圖像本身的改變,在保存圖像時(shí)保留了較多的亮度信息,而將色相和色純度的信息和周圍的像素進(jìn)行合并,合并的比例不同,壓縮的比例也不同,由于信息量減少了,所以壓縮比可以很高,圖像質(zhì)量也會相應(yīng)的下降。有損(亦稱有誤差、有失真)編碼是指解碼重建的圖像與原圖像相比有失真,不能精確的復(fù)原,但視覺效果上基本相同,是實(shí)現(xiàn)高壓縮比的編碼方式。??
編輯:黃飛
?
評論