圖像處理,是使用計算機對圖像進行一系列加工,以達到所需的結(jié)果。常見的處理有圖像數(shù)字化、圖像編碼、圖像增強、圖像復(fù)原、圖像分割和圖像分析等。圖像處理一般指數(shù)字圖像處理。雖然某些處理也可以用光學(xué)方法或模擬技術(shù)實現(xiàn),但它們遠不及數(shù)字圖像處理那樣靈活和方便,因而數(shù)字圖像處理成為圖像處理的主要方面。
圖像_圖像處理 -簡介
所謂數(shù)字圖像處理[7]就是利用計算機對圖像信息進行加工以滿足人的視覺心理或者應(yīng)用需求的行為。實質(zhì)上是一段能夠被計算機還原顯示和輸出為一幅圖像的數(shù)字碼。 21世紀是一個充滿信息的時代,圖像作為人類感知世界的視覺基礎(chǔ),是人類獲取信息、表達信息和傳遞信息的重要手段。數(shù)字圖像處理[9],即用計算機對圖像進行處理,其發(fā)展歷史并不長。數(shù)字圖像處理技術(shù)源于20世紀20年代,當時通過海底電纜從英國倫敦到美國紐約傳輸了一幅照片,采用了數(shù)字壓縮技術(shù)。首先數(shù)字圖像處理技術(shù)可以幫助人們更客觀、準確地認識世界,人的視覺系統(tǒng)可以幫助人類從外界獲取3/4以上的信息,而圖像、圖形又是所有視覺信息的載體,盡管人眼的鑒別力很高,可以識別上千種顏色,但很多情況下,圖像對于人眼來說是模糊的甚至是不可見的,通過圖象增強技術(shù),可以使模糊甚至不可見的圖像變得清晰明亮。另一方面,通過數(shù)字圖像處理中的模式識別技術(shù),可以將人眼無法識別的圖像進行分類處理。通過計算機模式識別技術(shù)可以快速準確的檢索、匹配和識別出各種東西。數(shù)字圖像處理技術(shù)已經(jīng)廣泛深入地應(yīng)用于國計民生休戚相關(guān)的各個領(lǐng)域。在計算機中,按照顏色和灰度的多少可以將圖像分為二值圖像、灰度圖像、索引圖像和真彩色RGB圖像四種基本類型。大多數(shù)圖像處理軟件都支持這四種類型的圖像。中國物聯(lián)網(wǎng)校企聯(lián)盟認為圖像處理將會是物聯(lián)網(wǎng)產(chǎn)業(yè)發(fā)展的重要支柱之一,它的具體應(yīng)用是指紋識別技術(shù)。二值圖像一幅二值圖像的二維矩陣僅由0、1兩個值構(gòu)成,“0”代表黑色,“1”代白色。由于每一像素(矩陣中每一元素)取值僅有0、1兩種可能,所以計算機中二值圖像的數(shù)據(jù)類型通常為1個二進制位。二值圖像通常用于文字、線條圖的掃描識別(OCR)和掩膜圖像的存儲。灰度圖像灰度圖像矩陣元素的取值范圍通常為[0,255]。因此其數(shù)據(jù)類型一般為8位無符號整數(shù)的(int8),這就是人們經(jīng)常提到的256灰度圖像?!?”表示純黑色,“255”表示純白色,中間的數(shù)字從小到大表示由黑到白的過渡色。在某些軟件中,灰度圖像也可以用雙精度數(shù)據(jù)類型(double)表示,像素的值域為[0,1],0代表黑色,1代表白色,0到1之間的小數(shù)表示不同的灰度等級。二值圖像可以看成是灰度圖像的一個特例。索引圖像索引圖像的文件結(jié)構(gòu)比較復(fù)雜,除了存放圖像的二維矩陣外,還包括一個稱之為顏色索引矩陣MAP的二維數(shù)組。MAP的大小由存放圖像的矩陣元素值域決定,如矩陣元素值域為[0,255],則MAP矩陣的大小為256Ⅹ3,用MAP=[RGB]表示。MAP中每一行的三個元素分別指定該行對應(yīng)顏色的紅、綠、藍單色值,MAP中每一行對應(yīng)圖像矩陣像素的一個灰度值,如某一像素的灰度值為64,則該像素就與MAP中的第64行建立了映射關(guān)系,該像素在屏幕上的實際顏色由第64行的[RGB]組合決定。也就是說,圖像在屏幕上顯示時,每一像素的顏色由存放在矩陣中該像素的灰度值作為索引通過檢索顏色索引矩陣MAP得到。索引圖像的數(shù)據(jù)類型一般為8位無符號整形(int8),相應(yīng)索引矩陣MAP的大小為256Ⅹ3,因此一般索引圖像只能同時顯示256種顏色,但通過改變索引矩陣,顏色的類型可以調(diào)整。索引圖像的數(shù)據(jù)類型也可采用雙精度浮點型(double)。索引圖像一般用于存放色彩要求比較簡單的圖像,如Windows中色彩構(gòu)成比較簡單的壁紙多采用索引圖像存放,如果圖像的色彩比較復(fù)雜,就要用到RGB真彩色圖像。RGB彩色圖像RGB圖像與索引圖像一樣都可以用來表示彩色圖像。與索引圖像一樣,它分別用紅(R)、綠(G)、藍(B)三原色的組合來表示每個像素的顏色。但與索引圖像不同的是,RGB圖像每一個像素的顏色值(由RGB三原色表示)直接存放在圖像矩陣中,由于每一像素的顏色需由R、G、B三個分量來表示,M、N分別表示圖像的行列數(shù),三個M x N的二維矩陣分別表示各個像素的R、G、B三個顏色分量。RGB圖像的數(shù)據(jù)類型一般為8位無符號整形,通常用于表示和存放真彩色圖像,當然也可以存放灰度圖像。數(shù)字化圖像數(shù)據(jù)有兩種存儲方式[6]:位圖存儲(Bitmap)和矢量存儲(Vector)我們平常是以圖像分辨率(即像素點)和顏色數(shù)來描述數(shù)字圖象的。例如一張分辨率為640*480,16位色的數(shù)字圖片,就由2^16=65536種顏色的307200(=640*480)個素點組成。位圖圖像:位圖方式是將圖像的每一個象素點轉(zhuǎn)換為一個數(shù)據(jù),當圖像是單色(只有黑白二色)時,8個象素點的數(shù)據(jù)只占據(jù)一個字節(jié)(一個字節(jié)就是8個二進制數(shù),1個二進制數(shù)存放象素點);16色(區(qū)別于前段“16位色”)的圖像每兩個象素點用一個字節(jié)存儲;256色圖像每一個象素點用一個字節(jié)存儲。這樣就能夠精確地描述各種不同顏色模式的圖像圖面。位圖圖像彌補了矢量式圖像的缺陷,它能夠制作出色彩和色調(diào)變化豐富的圖像,可以逼真地表現(xiàn)自然界的景象,同時也可以很容易地在不同軟件之間交換文件,這就是位圖圖像的優(yōu)點;而其缺點則是它無法制作真正的3D圖像,并且圖像縮放和旋轉(zhuǎn)時會產(chǎn)生失真的現(xiàn)象,同時文件較大,對內(nèi)存和硬盤空間容量的需求也較高。位圖方式就是將圖像的每一像素點轉(zhuǎn)換為一個數(shù)據(jù)。如果用1位數(shù)據(jù)來記錄,那么它只能代表2種顏色(2^1=2);如果以8位來記錄,便可以表現(xiàn)出256種顏色或色調(diào)(2^8=256),因此使用的位元素越多所能表現(xiàn)的色彩也越多。通常我們使用的顏色有16色、256色、增強16位和真彩色24位。一般所說的真彩色是指24位(2^24)的位圖存儲模式適合于內(nèi)容復(fù)雜的圖像和真實照片。但隨著分辨率以及顏色數(shù)的提高,圖像所占用的磁盤空間也就相當大;另外由于在放大圖像的過程中,其圖像勢必要變得模糊而失真,放大后的圖像像素點實際上變成了像素“方格”。 用數(shù)碼相機和掃描儀獲取的圖像都屬于位圖。矢量圖像:矢量圖像存儲的是圖像信息的輪廓部分,而不是圖像的每一個象素點。例如,一個圓形圖案只要存儲圓心的坐標位置和半徑長度,以及圓的邊線和半徑長度,以及圓的邊線和內(nèi)部的顏色即可。該存儲方式的缺點是經(jīng)常耗費大量的時間做一些復(fù)雜的分析演算工作,圖像的顯示速度較慢;但圖像縮放不會失真;圖像的存儲空間也要小得多。所以,矢量圖比較適合存儲各種圖表和工程圖像_圖像處理 -數(shù)據(jù)
圖像處理離不開海量、豐富的基礎(chǔ)數(shù)據(jù),包括視頻、靜態(tài)圖像等多種格式,如Berkeley分割數(shù)據(jù)集和基準500 (BSDS500)、西門菲沙大學(xué)不同光照物體圖像數(shù)據(jù)庫、神經(jīng)網(wǎng)絡(luò)人臉識別數(shù)據(jù)、CBCL-MIT StreetScenes(麻省理工學(xué)院街景數(shù)據(jù)庫)等。圖像_圖像處理 -數(shù)字化
通過取樣和量化過程將一個以自然形式存在的圖像變換為適合計算機處理的數(shù)字形式。圖像在計算機內(nèi)部被表示為一個數(shù)字矩陣,矩陣中每一元素稱為像素。圖像數(shù)字化需要專門的設(shè)備,常見的有各種電子的和光學(xué)的掃描設(shè)備,還有機電掃描設(shè)備和手工操作的數(shù)字化儀。圖像_圖像處理 -圖像編碼

對圖像信息編碼,以滿足傳輸和存儲的要求。編碼能壓縮圖像的信息量,但圖像質(zhì)量幾乎不變。為此,可以采用模擬處理技術(shù),再通過模-數(shù)轉(zhuǎn)換得到編碼,不過多數(shù)是采用數(shù)字編碼技術(shù)。編碼方法有對圖像逐點進行加工的方法,也有對圖像施加某種變換或基于區(qū)域、特征進行編碼的方法。脈碼調(diào)制、微分脈碼調(diào)制、預(yù)測碼和各種變換都是常用的編碼技術(shù)。
圖像_圖像處理 -圖像壓縮
由數(shù)字化得到的一幅圖像的數(shù)據(jù)量十分巨大,一幅典型的數(shù)字圖像通常由500×500或1000×1000個像素組成。如果是動態(tài)圖像,是其數(shù)據(jù)量更大。因此圖像壓縮對于圖像的存儲和傳輸都十分必要。有兩類壓縮算法,即無損壓縮和有損壓縮。最常用的無損壓縮算法取空間或時間上相鄰像素值的差,再進行編碼。游程碼就是這類壓縮碼的例子。有損壓縮算法大都采用圖像交換的途徑,例如對圖像進行快速傅里葉變換或離散的余弦變換。著名的、已作為圖像壓縮國際標準的JPEG和MPEG均屬于有損壓縮算法。前者用于靜態(tài)圖像,后者用于動態(tài)圖像。它們已由芯片實現(xiàn)。圖像_圖像處理 -增強復(fù)原
圖像增強的目標是改進圖片的質(zhì)量,例如增加對比度,去掉模糊和噪聲,修正幾何畸變等;圖像復(fù)原是在假定已知模糊或噪聲的模型時,試圖估計原圖像的一種技術(shù)。圖像增強按所用方法可分成頻率域法和空間域法。前者把圖像看成一種二維信號,對其進行基于二維傅里葉變換的信號增強。采用低通濾波(即只讓低頻信號通過)法,可去掉圖中的噪聲;采用高通濾波法,則可增強邊緣等高頻信號,使模糊的圖片變得清晰。具有代表性的空間域算法有局部求平均值法和中值濾波(取局部鄰域中的中間像素值)法等,它們可用于去除或減弱噪聲。早期的數(shù)字圖像復(fù)原亦來自頻率域的概念。現(xiàn)代采取的是一種代數(shù)的方法,即通過解一個大的方程組來復(fù)原理想的圖片。以提高圖像質(zhì)量為目的的圖像增強和復(fù)原對于一些難以得到的圖片或者在拍攝條件十分惡劣情況下得到的圖片都有廣泛的應(yīng)用。例如從太空中拍攝到的地球或其他星球的照片,用電子顯微鏡或X光拍攝的生物醫(yī)療圖片等。圖像增強使圖像清晰或?qū)⑵滢D(zhuǎn)換為更適合人或機器分析的形式。與圖像復(fù)原不同,圖像增強并不要求忠實地反映原始圖像。相反,含有某種失真(例如突出輪廓線)的圖像可能比無失真的原始圖像更為清晰。常用的圖像增強方法有:①灰度等級直方圖處理:使加工后的圖像在某一灰度范圍內(nèi)有更好的對比度;②干擾抑制:通過低通濾波、多圖像平均、施行某類空間域算子等處理,抑制疊加在圖像上的隨機性干擾;③邊緣銳化:通過高通濾波、差分運算或某種變換,使圖形的輪廓線增強;④偽彩色處理:將黑白圖像轉(zhuǎn)換為彩色圖像,從而使人們易于分析和檢測圖像包含的信息。圖像復(fù)原除去或減少在獲得圖像過程中因各種原因產(chǎn)生的退化。這類原因可能是光學(xué)系統(tǒng)的像差或離焦、攝像系統(tǒng)與被攝物之間的相對運動、電子或光學(xué)系統(tǒng)的噪聲和介于攝像系統(tǒng)與被攝像物間的大氣湍流等。圖像復(fù)原常用二種方法。當不知道圖像本身的性質(zhì)時,可以建立退化源的數(shù)學(xué)模型,然后施行復(fù)原算法除去或減少退化源的影響。當有了關(guān)于圖像本身的先驗知識時,可以建立原始圖像的模型,然后在觀測到的退化圖像中通過檢測原始圖像而復(fù)原圖像。圖像分割將圖像劃分為一些互不重疊的區(qū)域,每一區(qū)域是像素的一個連續(xù)集。通常采用把像素分入特定區(qū)域的區(qū)域法和尋求區(qū)域之間邊界的境界法。區(qū)域法根據(jù)被分割對象與背景的對比度進行閾值運算,將對象從背景中分割出來。有時用固定的閾值不能得到滿意的分割,可根據(jù)局部的對比度調(diào)整閾值,這稱為自適應(yīng)閾值。境界法利用各種邊緣檢測技術(shù),即根據(jù)圖像邊緣處具有很大的梯度值進行檢測。這兩種方法都可以利用圖像的紋理特性實現(xiàn)圖像分割。圖像_圖像處理 -形態(tài)學(xué)
形態(tài)學(xué)一詞通常指生物學(xué)的一個分支,它用于處理動物和植物的形狀和結(jié)構(gòu)。在數(shù)學(xué)形態(tài)學(xué)的語境中也使用該詞來作為提取圖像分量的一種工具,這些分量在表示和描述區(qū)域形狀(如邊界,骨骼和凸殼)時是很有用的。此外,我們還很關(guān)注用于預(yù)處理和后處理的形態(tài)學(xué)技術(shù),如形態(tài)學(xué)濾波、細化和裁剪。數(shù)學(xué)形態(tài)學(xué)的基本運算數(shù)學(xué)形態(tài)學(xué)的基本運算有4個:腐蝕、膨脹、開啟和閉合。數(shù)學(xué)形態(tài)學(xué)方法利用一個稱作結(jié)構(gòu)元素的”探針”收集圖像的信息,當探針在圖像中不斷移動時,便可考察圖像各個部分之間的相互關(guān)系,從而了解圖像的結(jié)構(gòu)特征。在連續(xù)空間中,灰度圖像的腐蝕、膨脹、開啟和閉合運算分別表述如下。腐蝕腐蝕“收縮”或“細化”二值圖像中的對象。收縮的方式和程度由一個結(jié)構(gòu)元素控制。數(shù)學(xué)上,A被B腐蝕,記為AΘB,定義為:換言之,A被B腐蝕是所有結(jié)構(gòu)元素的原點位置的集合,其中平移的B與A的背景并不疊加。膨脹膨脹是在二值圖像中“加長”或“變粗”的操作。這種特殊的方式和變粗的程度由一個稱為結(jié)構(gòu)元素的集合控制。結(jié)構(gòu)元素通常用0和1的矩陣表示。數(shù)學(xué)上,膨脹定義為集合運算。A被B膨脹,記為A愛華網(wǎng)本文地址 » http://www.klfzs.com/a/8103340103/63771.html
愛華網(wǎng)



