第2章數(shù)字圖像識別技術

上傳人：s*** IP屬地：浙江上傳時間：2023-04-18 格式：PPTX 頁數(shù)：102 大?。?.25MB 積分：30 舉報 版權申訴

已閱讀5頁，還剩97頁未讀，繼續(xù)免費閱讀

版權說明：本文檔由用戶提供并上傳，收益歸屬內容提供方，若內容存在侵權，請進行舉報或認領

文檔簡介

第2章數(shù)字圖像識別技術第一頁，共118頁。特性:客觀存在的，像是人的感覺，圖像則是二者的結合，因此，是客觀實體的原型.包含了巨大的信息量圖像的傳播雖然比語言文字的傳播要復雜得多，但它能提供比較直觀的模型，這不是語言文字的描述所能達到的。第二頁，共118頁。圖像的產生:

如工程技術人員以直尺和圓規(guī)來繪制各種圖紙，美術家用畫筆來復制客觀世界，電視用畫面來反映實地場景。

第三頁，共118頁。

識別：直接由人工或識別系統(tǒng)識別:經過處理，改善質量或提取出圖像的某些數(shù)據(jù)特征后才能識別。第四頁，共118頁。2.1.2數(shù)字圖像處理發(fā)展概況1.數(shù)字圖像處理（DigitalImageProcessing）含義:

又稱為計算機圖像處理，它是指將圖像信號轉換成數(shù)字信號并利用計算機對其進行處理的過程。第五頁，共118頁。2.發(fā)展最早出現(xiàn)于20世紀50年代:計算機來處理圖形學科大約形成于20世紀60年代初期。首次獲得實際成功應用是美國噴氣推進實驗室1972年英國EMI公司用于頭顱診斷的X射線計算機斷層攝影裝置，也就是我們通常所說的CT（ComputerTomograph）---1979年，這項無損傷診斷技術獲得了諾貝爾獎.從70年代中期開始理論和應用研究:視覺計算理論

第六頁，共118頁。左邊是嫦娥一號衛(wèi)星傳回的第一幅月面圖像。右邊是第一幅月面圖像的飛行效果圖。航天和航空技術方面的應用數(shù)字圖像處理技術第一幅月面圖像就是我們對月球的直觀感受和初步認識。一、圖像信息處理基礎知識2.1.3數(shù)字圖像處理的應用1第七頁，共118頁。2.1.3數(shù)字圖像處理的應用“嫦娥一號”第一幅月面圖像處理的過程如下：航天和航空技術方面的應用數(shù)字圖像處理技術第八頁，共118頁。遙感和航空測量遙感：主要用于資源、礦藏勘探、國土規(guī)劃、高速公路選線、災害調查、農作物估產、氣象預報以及軍事目標監(jiān)視等。氣象衛(wèi)星云圖土地變化監(jiān)測圖云南省大理州森林火災的遙感圖二、數(shù)字圖像處理的應用2.1.3數(shù)字圖像處理的應用第九頁，共118頁。生物醫(yī)學領域應用三維快速血管造影成像頭部CT主要應用如X射線層析攝影(CT)、核磁共振(MRI)、超聲成像、血管造影、細胞和染色體自動分類等。這些技術和設備大大提高了治療診斷水平，減輕了病人的痛苦。22.1.3數(shù)字圖像處理的應用第十頁，共118頁。以下是一個將圖像處理應用于臨床醫(yī)學的例子――CT腦血管醫(yī)學圖像三維重建。重建的腦血管三維圖像加入對比劑腦血管掃描圖像依次為第1層,第2層,第3層腦血管腦血管邊緣提取依次為第1層,第2層,第3層腦血管生物醫(yī)學領域應用22.1.3數(shù)字圖像處理的應用第十一頁，共118頁。通信工程常見的數(shù)字圖像和數(shù)字視頻設備如可視電話、會議電視、衛(wèi)星電視、數(shù)字電視、高清晰度電視、VCD、DVD等會議電視終端可視電話衛(wèi)星電視接收器32.1.3數(shù)字圖像處理的應用第十二頁，共118頁。基于H.323標準的遠程教學組網(wǎng)圖二、數(shù)字圖像處理的應用2.1.3數(shù)字圖像處理的應用第十三頁，共118頁。工業(yè)與交通應用該領域的應用從70年代起取得了迅速的發(fā)展，主要有產品質量檢測、生產過程的自動控制、CAD／CAM等。檢查瓶裝液體容量是否合格智能交通控制42.1.3數(shù)字圖像處理的應用第十四頁，共118頁。汽車牌照識別系統(tǒng)圖2.1.3數(shù)字圖像處理的應用第十五頁，共118頁。交通視頻監(jiān)控系統(tǒng)圖2.1.3數(shù)字圖像處理的應用第十六頁，共118頁。軍事公安軍事目標的偵察、制導和警戒系統(tǒng)、自動滅火器的控制及反偽裝等等都需要用到圖像處理技術；公安部門的現(xiàn)場照片、指紋、虹膜、面部、手跡、印章等的處理和辨識也要借助圖像處理。導彈制導指紋門鎖52.1.3數(shù)字圖像處理的應用第十七頁，共118頁。虹膜識別系統(tǒng)框圖二、數(shù)字圖像處理的應用2.1.3數(shù)字圖像處理的應用第十八頁，共118頁。生物識別技術的重要分支――自動指紋識別系統(tǒng)下圖是指紋圖像預處理各階段的結果：指紋原始圖像濾波后圖像二值化圖像細化圖像二、數(shù)字圖像處理的應用2.1.3數(shù)字圖像處理的應用第十九頁，共118頁。機器視覺

機器視覺主要用于軍事偵察、危險環(huán)境的自主機器人，郵政、醫(yī)院和家庭服務的智能機器人，裝配線工件識別、定位，太空機器人的自動操作等。

ASIMO踢球ASIMO上樓梯62.1.3數(shù)字圖像處理的應用第二十頁，共118頁。虛擬現(xiàn)實當人們通過虛擬現(xiàn)實瀏覽、觀賞時就如身臨其境一般，并且可以選擇任一角度，觀看任一范圍內的場景或選擇觀看物體的任一角度。虛擬漫游技術是虛擬現(xiàn)實（VR）技術的重要分支，在建筑、旅游、游戲、航空航天、醫(yī)學等多種行業(yè)發(fā)展很快。VR的相關設備72.1.3數(shù)字圖像處理的應用第二十一頁，共118頁。故宮VR——《紫禁城?天子的宮殿》中的一景

2.1.3數(shù)字圖像處理的應用第二十二頁，共118頁。電腦游戲中的建筑場景漫游2.1.3數(shù)字圖像處理的應用第二十三頁，共118頁。2.1.4數(shù)字圖像處理主要研究的內容圖像變換圖像編碼壓縮圖像增強和復原圖像分割圖像描述圖像分類（識別）第二十四頁，共118頁。（1）圖像變換傅里葉變換、沃爾什變換、離散余弦變換等間接處理技術，將空間域的處理變換為變換域處理。將空間域的圖像通過變換轉換到頻率域

第二十五頁，共118頁。（2）圖像編碼壓縮圖像編碼壓縮技術可減少描述圖像的數(shù)據(jù)量，以便節(jié)省圖像傳輸、處理時間和減少所占用的存儲器空間。第二十六頁，共118頁。（3）圖像增強和復原圖像編碼壓縮技術可減少描述圖像的數(shù)據(jù)量，以便節(jié)省圖像傳輸、處理時間和減少所占用的存儲器空間。第二十七頁，共118頁。

彩色圖像增強舉例左圖：原始圖像，細節(jié)不清晰，偏色右圖：增強后的圖像第二十八頁，共118頁。圖像復原舉例被正弦噪聲污染的圖像；(b)圖(a)的頻譜；(c)巴特沃斯帶阻濾波器；(d)濾波效果。第二十九頁，共118頁。圖像復原第三十頁，共118頁。（4）圖像分割圖像分割是將圖像中有意義的特征部分提取出來，其有意義的特征有圖像中的邊緣、區(qū)域等，這是進一步進行圖像識別、分析和理解的基礎。第三十一頁，共118頁。醫(yī)學圖像處理—銳化第三十二頁，共118頁。影視圖像處理

—由黑白圖像轉換的偽彩色圖像第三十三頁，共118頁。（5）圖像描述圖像描述是圖像識別和理解的必要前提。一般圖像的描述方法采用二維描述，他有邊界描述和區(qū)域描述。（6）圖像識別圖像分類（識別）屬于模式識別的范疇，其主要內容是圖像經過某些預處理后，進行圖像分割和特征提取，從而進行判決分類。第三十四頁，共118頁。視頻字幕識別第三十五頁，共118頁。舉例：圖像識別

圖5-12美國警方采用圖像識別系統(tǒng)辨別罪犯，該系統(tǒng)每分鐘以1500萬畫面的速率進行面部匹配第三十六頁，共118頁。舉例：人臉識別第三十七頁，共118頁。2.1.5數(shù)字圖像處理的基本特點信息量大數(shù)字圖像處理占用的頻帶較寬數(shù)字圖像中各個像素相關性大主觀性第三十八頁，共118頁。2.1.6數(shù)字圖像處理的優(yōu)點再現(xiàn)性好處理精度高適用面寬靈活性高第三十九頁，共118頁。2.2數(shù)字圖像處理基礎

為了方便地處理數(shù)字圖像，根據(jù)數(shù)字圖像的特性將其分成不同的類型。靜態(tài)圖像可分為矢量(Vector)圖和位圖（Bitmap），位圖也稱為柵格圖像。

矢量圖是用一系列繪圖指令來表示一幅圖，如AutoCAD中的繪圖語句。這種方法的本質是用數(shù)學(更準確地說是幾何學)公式描述一幅圖像。圖像中每一個形狀都是一個完整的公式，稱為一個對象。對象是一個封閉的整體，所以定義圖像上對象的變化和對象與其他對象的關系對計算機來說是簡單的，所有這些變化都不會影響到圖像中的其他對象。第四十頁，共118頁。公式化表示圖像使得矢量圖具有兩個優(yōu)點：一是它的文件數(shù)據(jù)量很小；二是圖像質量與分辨率無關，這意味著無論將圖像放大或縮小了多少次，圖像總是以顯示設備允許的最大清晰度顯示。在計算機計算與顯示一幅圖像時，也往往能看到畫圖的過程。但是，矢量圖有一個明顯的缺點，就是不易制作色調豐富或色彩變化太多的圖像，而且繪出來的圖像不是很逼真，同時也不易在不同的軟件間交換文件。第四十一頁，共118頁。

位圖是通過許多像素點表示一幅圖像，每個像素具有顏色屬性和位置屬性。位圖可以從傳統(tǒng)的相片、幻燈片上制作出來或使用數(shù)字相機得到，也可以利用Windows的畫筆(Painbrush)用顏色點填充網(wǎng)格單元來創(chuàng)建位圖。位圖又可以分成如下四種：線畫稿(LineArt)、灰度圖像(GrayScale)、索引顏色圖像(IndexColor)和真彩色圖像（TrueColor）。第四十二頁，共118頁。

1.線畫稿

線畫稿只有黑白兩種顏色，這種形式通常也稱為“黑白藝術”、“位圖藝術”、“一位元藝術”。用掃描儀掃描圖像，當設置成LineArt格式時，掃描儀以一位顏色模式來看待圖像。若樣點顏色為黑，則掃描儀將相應的像素位元置為0，否則置為1。線畫稿適合于由黑白兩色構成而沒有灰度陰影的圖像。第四十三頁，共118頁。

2.灰度圖像在灰度圖像中，像素灰度級用8bit表示，所以每個像素都是介于黑色和白色之間的256（28=256）種灰度中的一種?；叶葓D像只有灰度顏色而沒有彩色。我們通常所說的黑白照片，其實包含了黑白之間的所有灰度色調。從技術上來說，就是具有從黑到白的256種灰度色域的單色圖像。第四十四頁，共118頁。不同空間分辨率圖像（灰度級為8比特）1024×1024；(b)~(f)的原始空間分辨率依次為512×512，256×256，128×128，64×64，32×32像素。第四十五頁，共118頁。(a)453×374，256灰度級圖像；(b)~(d)保持空間分辨率不變，以灰度級為128，64和32顯示的圖像第四十六頁，共118頁。（續(xù)）(e)~(h)以16，8，4和2灰度級顯示的圖像第四十七頁，共118頁。

3.索引圖像

在介紹索引圖像之前，我們首先了解PC機是如何處理顏色的。大多數(shù)掃描儀都是以24位模式對圖像進行采樣，用這種方式獲得的顏色通常稱為RGB顏色。顏色深度為每像素24位的數(shù)字圖像是目前所能獲取、瀏覽和保存的顏色信息最豐富的彩色圖像，由于它所表達的顏色遠遠超出了人眼所能辨別的范圍，故將其稱為“真彩色”。在真彩色出現(xiàn)之前，由于技術上的原因，計算機在處理時并沒有達到每像素24位的真彩色水平，為此人們創(chuàng)造了索引顏色。索引顏色通常也稱為映射顏色，在這種模式下，顏色都是預先定義的，并且可供選用的一組顏色也很有限，索引顏色的圖像最多只能顯示256種顏色。一幅索引顏色圖像在圖像文件里定義，當打開該文件時，構成該圖像具體顏色的索引值就被讀入程序里，然后根據(jù)索引值找到最終的顏色。第四十八頁，共118頁。

4.真彩色圖像真彩色圖像將像素的色彩能力推向了頂峰。“真彩色”是RGB顏色的另一種流行的叫法。從技術角度考慮，真彩色是指寫到磁盤上的圖像類型，而RGB顏色是指顯示器的顯示模式。RGB圖像的顏色是非映射的，它可以從系統(tǒng)的“顏色表”里自由獲取所需的顏色，這種圖像文件里的顏色直接與PC機上的顯示顏色相對應。在真彩色圖像中，每一個像素由紅、綠和藍三個字節(jié)組成，每個字節(jié)為8bit，表示0到255之間的不同的亮度值，這三個字節(jié)組合可以產生1670萬種不同的顏色。第四十九頁，共118頁。索引圖像、RGB彩色圖像第五十頁，共118頁。位圖的有關術語

1.像素（Pixel）、點（Dot）和樣點（Sample）在計算機中，圖像是由顯示器上許多光點組成的，將顯示在顯示器上的這些點（光的單元）稱為像素。像素的分割有不同的方法，實際常用正方形網(wǎng)格點陣分割方案，這是因為其像素網(wǎng)格點陣規(guī)范，易于在圖像輸入、輸出設備上實現(xiàn)。在計算機圖像處理中，還常用到點和樣點這些術語。像素、點和樣點是在計算機上對不同階段的圖像進行度量的稱謂，這幾個術語很容易混淆，故特一一做介紹。第五十一頁，共118頁。

首先說明樣點和點的概念。掃描一幅圖像時，需設置掃描儀的分辨率（Resolution），分辨率決定了掃描儀從源圖像里每英寸取多少個樣點。掃描儀將源圖像看成由大量的網(wǎng)格組成，然后在每一個網(wǎng)格里取出一點，用該點的顏色值來代表這一網(wǎng)格里所有點的顏色值，這些被選中的點就是樣點。掃描儀的分辨率單位為dpi（每英寸點數(shù)），但激光打印機的dpi與掃描儀的dpi（樣點）是不同的。實際上，以150dpi分辨率掃描的圖像，它的效果相當于激光打印機的1200dpi的效果。像素并不像“克”和“厘米”那樣是絕對的度量單位，而是可大可小的。如果獲取圖像時的分辨率較低（如50dpi），則顯示該圖像時，每英寸所顯示的像素個數(shù)也很少，這樣就會使像素變得較大。第五十二頁，共118頁。

2.分辨率1）圖像分辨率

圖像分辨率是指每英寸圖像含有多少個點或像素，分辨率的單位為dpi。例如，250dpi表示的就是該圖像每英寸含有250個點或像素。在數(shù)字圖像中，分辨率的大小直接影響到圖像的質量。分辨率越高，圖像細節(jié)越清晰，但產生的文件尺寸大，同時處理的時間也就越長，對設備的要求也就越高。所以在制作圖像時要根據(jù)需要來選擇分辨率。另外，圖像的尺寸、圖像的分辨率和圖像文件的大小三者之間有著密切的聯(lián)系。圖像的尺寸越大，圖像的分辨率越高，圖像文件也就越大。所以，調整圖像的大小和分辨率即可改變圖像文件的大小。第五十三頁，共118頁。圖一：30ppi 圖二：300ppi 圖三：偽300ppi思考：為什么要用高分辨率的數(shù)碼相機第五十四頁，共118頁。

2）屏幕分辨率

顯示器上每單位長度顯示的像素或點的數(shù)量稱為屏幕分辨率。通常以每英寸點數(shù)(ppi)來表示。屏幕分辨率取決于顯示器的大小及其像素設置。屏幕分辨率由計算機的顯示卡決定，標準的VGA顯示卡的分辨率是640×480，即水平方向640點（像素），垂直方向480點（像素）?，F(xiàn)在高性能的顯示卡已支持2560×1600點以上的分辨率。第五十五頁，共118頁。

3）打印機分辨率

打印機分辨率又稱輸出分辨率，是指打印機輸出圖像時每英寸的點數(shù)(dpi)。打印機分辨率也決定了輸出圖像的質量，打印機分辨率越高，可以減少打印的鋸齒邊緣，在灰度的半色調表現(xiàn)上也會較為平滑。打印機的分辨率可達300dpi，甚至720dpi（需用特殊紙張）；而較老機型的激光打印機分辨率通常在300～360dpi之間，由于超微細碳粉技術的成熟，新的激光打印機的分辨率可達600～1200dpi，作為專業(yè)排版輸出已經綽綽有余了。第五十六頁，共118頁。

4）掃描儀分辨率

掃描儀分辨率的表示方法與打印機相類似，一般也用dpi表示，不過這里的點是樣點，與打印機的輸出點是不同的。一般掃描儀提供的方式是水平分辨率要比垂直分辨率高。臺式掃描儀的分辨率可以分為光學分辨率和輸出分辨率。光學分辨率是指掃描儀硬件所真正掃描到的圖像分辨率，目前市場上的產品，其光學分辨率可達800～1200dpi以上。輸出分辨率是通過軟件強化以及內插補點之后產生的分辨率，大約為光學分辨率的3～4倍。所以當你見到號稱分辨率高達4800dpi或6400dpi的掃描儀時，這一定指的是輸出分辨率。第五十七頁，共118頁。顯示與文件的對應關系若圖像分辨率比顯示分辨率高，則顯示出的圖像比實際圖像大。若圖像分辨率比顯示分辨率低，則顯示出的圖像比實際圖像小。圖片1：640像素*480像素*72ppi（22.58cm*16.93cm）圖片2：320像素*240像素*36ppi（22.58cm*16.93cm）利用photoshop軟件對比圖片1和圖片2。(請課后實驗之)第五十八頁，共118頁。2.2.2圖像數(shù)字化技術圖像處理方法模擬式:原理數(shù)字式:

過程:采樣量化

第五十九頁，共118頁。1采樣圖像在空間上的離散化稱為采樣。也就是用空間上部分點的灰度值代表圖像，這些點稱為采樣點。由于圖像是一種二維分布的信息，為了對它進行采樣操作，需要先將二維信號變?yōu)橐痪S信號，再對一維信號完成采樣。具體做法是，先沿垂直方向按一定間隔從上到下順序地沿水平方向直線掃描，取出各水平線上灰度值的一維掃描。而后再對一維掃描線信號按一定間隔采樣得到離散信號，即先沿垂直方向采樣，再沿水平方向采樣這兩個步驟完成采樣操作。對于運動圖像（即時間域上的連續(xù)圖像），需先在時間軸上采樣，再沿垂直方向采樣，最后沿水平方向采樣由這三個步驟完成。第六十頁，共118頁。圖5-13圖像采樣就是在水平方向和垂直方向上等間隔地將圖像分割成矩形網(wǎng)狀結構第六十一頁，共118頁。圖5-14不同采樣精度所獲得的圖像分辨率不同第六十二頁，共118頁。對一幅圖像采樣時，若每行（即橫向）像素為M個，每列（即縱向）像素為N個，則圖像大小為M×N個像素。在進行采樣時，采樣點間隔的選取是一個非常重要的問題，它決定了采樣后圖像的質量，即忠實于原圖像的程度。采樣間隔的大小選取要依據(jù)原圖像中包含的細微濃淡變化來決定。一般，圖像中細節(jié)越多，采樣間隔應越小。根據(jù)一維采樣定理，若一維信號g(t)的最大頻率為ω，以T≤1/2ω為間隔進行采樣，則能夠根據(jù)采樣結果g(iT)(i=…,-1,0,1，…)完全恢復g(t)，即式中第六十三頁，共118頁。圖2-2采樣示意圖第六十四頁，共118頁。2量化模擬圖像經過采樣后，在時間和空間上離散化為像素。但采樣所得的像素值（即灰度值）仍是連續(xù)量。把采樣后所得的各像素的灰度值從模擬量到離散量的轉換稱為圖像灰度的量化。圖2-3（a）說明了量化過程。若連續(xù)灰度值用z來表示，對于滿足zi≤z≤zi+1的z值，都量化為整數(shù)qi。qi稱為像素的灰度值，z與qi的差稱為量化誤差。一般，像素值量化后用一個字節(jié)8bit來表示。如圖2-3（b）所示，把由黑—灰—白的連續(xù)變化的灰度值，量化為0～255共256級灰度值，灰度值的范圍為0～255，表示亮度從深到淺，對應圖像中的顏色為從黑到白。第六十五頁，共118頁。圖2-3量化示意圖（a）量化；(b)量化為8bit第六十六頁，共118頁。連續(xù)灰度值量化為灰度級的方法有兩種，一種是等間隔量化，另一種是非等間隔量化。等間隔量化就是簡單地把采樣值的灰度范圍等間隔地分割并進行量化。對于像素灰度值在黑—白范圍較均勻分布的圖像，這種量化方法可以得到較小的量化誤差。該方法也稱為均勻量化或線性量化。為了減小量化誤差，引入了非均勻量化的方法。非均勻量化是依據(jù)一幅圖像具體的灰度值分布的概率密度函數(shù)，按總的量化誤差最小的原則來進行量化。具體做法是對圖像中像素灰度值頻繁出現(xiàn)的灰度值范圍，量化間隔取小一些，而對那些像素灰度值極少出現(xiàn)的范圍，則量化間隔取大一些。由于圖像灰度值的概率分布密度函數(shù)因圖像不同而異，所以不可能找到一個適用于各種不同圖像的最佳非等間隔量化方案。因此，實用上一般都采用等間隔量化。第六十七頁，共118頁。3采樣與量化參數(shù)的選擇一幅圖像在采樣時，行、列的采樣點與量化時每個像素量化的級數(shù)，既影響數(shù)字圖像的質量，也影響到該數(shù)字圖像數(shù)據(jù)量的大小。假定圖像取M×N個樣點，每個像素量化后的灰度二進制位數(shù)為Q，一般Q總是取為2的整數(shù)冪，即Q=2k,則存儲一幅數(shù)字圖像所需的二進制位數(shù)b為（2-2）字節(jié)數(shù)B為（2-3）第六十八頁，共118頁。對一幅圖像，當量化級數(shù)Q一定時，采樣點數(shù)M×N對圖像質量有著顯著的影響。如圖2-4所示，采樣點數(shù)越多，圖像質量越好；當采樣點數(shù)減少時，圖上的塊狀效應就逐漸明顯。同理，當圖像的采樣點數(shù)一定時，采用不同量化級數(shù)的圖像質量也不一樣。如圖2-5所示，量化級數(shù)越多，圖像質量越好，當量化級數(shù)越少時，圖像質量越差，量化級數(shù)最小的極端情況就是二值圖像，圖像出現(xiàn)假輪廓。第六十九頁，共118頁。圖2-4不同采樣點數(shù)對圖像質量的影響（a）原始圖像(256×256)；（b）采樣圖像1(128×128)；（c）采樣圖像2(64×64)；（d）采樣圖像3(32×32)；（e）采樣圖像4(16×16)；（f）采樣圖像5(8×8)第七十頁，共118頁。圖2-5不同量化級別對圖像質量的影響（a）原始圖像(256色)；（b）量化圖像1(64色)；（c）量化圖像2(32色)；（d）量化圖像3(16色)；（e）量化圖像4(4色)；（f）量化圖像5(2色)第七十一頁，共118頁。1973年的夏天，美國南加州大學信號與圖像處理研究所里，年輕的助理教授亞歷山大（AlexanderSawchuk）和研究員威廉（WilliamPratt）第七十二頁，共118頁。低bit量化的偽輪廓現(xiàn)象示意圖第七十三頁，共118頁。低采樣率導致圖像細節(jié)丟失第七十四頁，共118頁。一般，當限定數(shù)字圖像的大小時,為了得到質量較好的圖像可采用如下原則：（1）對緩變的圖像，應該細量化，粗采樣，以避免假輪廓。（2）對細節(jié)豐富的圖像，應細采樣，粗量化，以避免模糊（混疊）。對于彩色圖像，是按照顏色成分——紅（R）、綠（G）、藍（B）分別采樣和量化的。若各種顏色成分均按8bit量化，即每種顏色量級別是256，則可以處理256×256×256=16777216種顏色。第七十五頁，共118頁。4圖像數(shù)字化設備將模擬圖像數(shù)字化成為數(shù)字圖像，需要某種圖像數(shù)字化設備。常見的數(shù)字化設備有數(shù)字相機、掃描儀、數(shù)字化儀等。

1.圖像數(shù)字化設備的組成如前所述，采樣和量化是數(shù)字化一幅圖像的兩個基本過程。即把圖像劃分為若干圖像元素(像素)并給出它們的地址（采樣）；度量每一像素的灰度，并把連續(xù)的度量結果量化為整數(shù)（量化）；最后將這些整數(shù)結果寫入存儲設備。為完成這些功能，圖像數(shù)字化設備必須包含以下五個部分：第七十六頁，共118頁。

(1)采樣孔(Samplingaperture)：使數(shù)字化設備能夠單獨地觀測特定的圖像元素而不受圖像其他部分的影響。

(2)圖像掃描機構：使采樣孔按照預先確定的方式在圖像上移動，從而按順序觀測每一個像素。

(3)光傳感器：通過采樣檢測圖像的每一像素的亮度，通常采用CCD陣列。

(4)量化器：將傳感器輸出的連續(xù)量轉化為整數(shù)值。典型的量化器是A/D轉換電路，它產生一個與輸入電壓或電流成比例的數(shù)值。

(5)輸出存儲裝置：將量化器產生的灰度值按適當格式存儲起來，以用于計算機后續(xù)處理。第七十七頁，共118頁。

2.圖像數(shù)字化設備的性能雖然各種數(shù)字化設備的組成不相同，但可從如下幾個方面對其性能進行比較。

1)像素大小采樣孔的大小和相鄰像素的間距是兩個重要的性能指標。如果數(shù)字化設備是在一個放大率可變的光學系統(tǒng)上，那么對應于輸入圖像平面上的采樣點大小和采樣間距也是可變的。

2)圖像大小圖像大小即數(shù)字化設備所允許的最大輸入圖像的尺寸。第七十八頁，共118頁。

3)線性度對光強進行數(shù)字化時，灰度正比于圖像亮度的實際精確程度是一個重要的指標。非線性的數(shù)字化設備會影響后續(xù)過程的有效性。能將圖像量化為多少級灰度也是非常重要的參數(shù)。圖像的量化精度經歷了早期的黑白二值圖像、灰度圖像及現(xiàn)在的彩色及真彩色圖像。當然，量化精度越高，存儲像素信息需要的字節(jié)數(shù)也越大。第七十九頁，共118頁。

4)噪聲數(shù)字化設備的噪聲水平也是一個重要的性能參數(shù)。例如，數(shù)字化一幅灰度值恒定的圖像，雖然輸入亮度是一個常量，但是數(shù)字化設備中固有的噪聲卻會使圖像的灰度發(fā)生變化。因此數(shù)字化設備所產生的噪聲是圖像質量下降的根源之一，應當使噪聲小于圖像內的反差點(即對比度)。第八十頁，共118頁。灰度圖像顯示第八十一頁，共118頁。第八十二頁，共118頁。位平面第八十三頁，共118頁。抖動技術第八十四頁，共118頁。2.2.3圖像數(shù)字化設備的功能圖像輸入設備主要有：(1)基于CCD光電耦器件的輸入設備A、攝像機、數(shù)字攝像機B、數(shù)字相機C、平板掃描儀第八十五頁，共118頁?；诠怆姳对龉艿妮斎朐O備

--滾筒掃描儀采樣孔(aperturesampleing)圖像掃描機構光傳感器量化器:A／D轉換電路輸出存儲裝置第八十六頁，共118頁。2.2.4數(shù)字圖像的圖像文件格式國際標準：TIF(TagImage)、JPEG(JointPhotographer’sExpertsGroup)互聯(lián)網(wǎng)用：GIF(GraphicsInterchangeFormat)、JPEG、PNG印刷用：TIF、JPG、TAG、PCX第八十七頁，共118頁。2.2.4.1BMP圖像文件格式第八十八頁，共118頁。BMP文件結構第八十九頁，共118頁。第一部分為位圖文件頭BITMAP，它是一個結構體，其定義如下：

typedefstructtagBITMAP{WORD bfType;DWORD bfSize;WORD bfReserved1;WORD bfReserved2;DWORD bfOffBits;}BITMAP;這個結構的長度是固定的，為14個字節(jié)（WORD為無符號16位二進制整數(shù)，DWORD為無符號32位二進制整數(shù)）。第九十頁，共118頁。第二部分為位圖信息頭BITMAPINFOHEADER，也是一個結構，其定義如下：typedefstructtagBITMAPINFOHEADER{DWORD biSize;LONG biWidth;LONG biHeight;WORD biPlanes;WORD biBitCount;DWORD biCompression;DWORD biSizeImage;LONG biXPelsPerMeter;LONG biYPelsPerMeter;DWORD biClrUsed;DWORD biClrImportant;}BITMAPINFOHEADER;第九十一頁，共118頁。這個結構的長度是固定的，為40個字節(jié)（LONG為32位二進制整數(shù)）。其中，biCompression的有效值為BI_RGB、BI_RLE8、BI_RLE4、BI_BITFIELDS，這都是一些Windows定義好的常量。由于RLE4和RLE8的壓縮格式用的不多，今后僅討論biCompression的有效值為BI_RGB，即不壓縮的情況。第九十二頁，共118頁。第三部分為調色板(Palette)，當然，這里是對那些需要調色板的位圖文件而言的。真彩色圖像是不需要調色板的，BITMAPINFOHEADER后直接是位圖數(shù)據(jù)。調色板實際上是一個數(shù)組，共有biClrUsed個元素（如果該值為零，則有2的biBitCount次方個元素）。數(shù)組中每個元素的類型是一個RGBQUAD結構，占4個字節(jié)，其定義如下：typedefstructtagRGBQUAD{BYTErgbBlue; //該顏色的藍色分量

BYTErgbGreen; //該顏色的綠色分量

BYTErgbRed; //該顏色的紅色分量

BYTErgbReserved; //保留值}RGBQUAD;第九十三頁，共118頁。第四部分就是實際的圖像數(shù)據(jù)。對于用到調色板的位圖，圖像數(shù)據(jù)就是該像素顏色在調色板中的索引值，對于真彩色圖像，圖像數(shù)據(jù)就是實際的R、G、B值。下面就2色、16色、256色和真彩色位圖分別介紹。對于2色位圖，用1位就可以表示該像素的顏色（一般0表示黑，1表示白），所以一個字節(jié)可以表示8個像素。對于16色位圖，用4位可以表示一個像素的顏色，所以一個字節(jié)可以表示2個像素。對于256色位圖，一個字節(jié)剛好可以表示1個像素。第九十四頁，共118頁。2.2.4.2其他文件格式

1.TIF圖像文件格式標記圖像文件格式TIF(TagImage)，它是現(xiàn)存圖像文件格式中最復雜的一種，它提供存儲各種信息的完備的手段，可以存儲專門的信息而不違反格式宗旨，是目前流行的圖像文件交換標準之一。TIF格式文件的設計考慮了擴展性、方便性和可修改性，因此非常復雜，要求用更多的代碼來控制它，結果導致文件讀寫速度慢，TIF代碼也很長。TIF文件由文件頭、參數(shù)指針表與參數(shù)域、參數(shù)數(shù)據(jù)表和圖像數(shù)據(jù)4部分組成。如表2-2～表2-4所示。第九十五頁，共118頁。1）文件頭表2-2TIF文件文件頭結構第九十六頁，共118頁。2）參數(shù)指針表2-3TIF文件參數(shù)指針表由一個2字節(jié)的整數(shù)和其后的一系列12字節(jié)參數(shù)域構成，最后以一個長整型數(shù)結束。若最后的長整型數(shù)為0，表示文件的參數(shù)指針表到此為至，否則該長整數(shù)為指向下一個參數(shù)指針表的偏移。第九十七頁，共118頁。3）參數(shù)塊結構表2-4TIF文件參數(shù)塊結構第九十八頁，共118頁。TIFF文件格式第九十九頁，共118頁。

2.GIF圖像文件格式

CompuServe開發(fā)的圖形交換文件格式GIF（GraphicsInterchangeFormat），目的是在不同的系統(tǒng)平臺上交流和傳輸圖像。它是在Web及其他聯(lián)機服務上常用的一種文件格式，用于超文本標記語言(HTML)文檔中的索引顏色圖像，但圖像最大不能超過64M，顏色最多為256色。GIF圖像文件采取LZW壓縮算法，存儲效率高，支持多幅圖像定序或覆蓋，交錯多屏幕繪圖以及文本覆蓋。GIF主要是為數(shù)據(jù)流而設計的一種傳輸格式，而不是作為文件的存儲格式。換句話說，它具有順序的組織形式。GIF有五個主要部分以固定順序出現(xiàn)，所有部分均由一個或多個塊(block)組成。每個塊第一個字節(jié)中存放標識碼或特征碼標識。這些部分的順序為：文件標志塊、邏輯屏幕描述塊、可選的“全局”色彩表塊(調色板)、各圖像數(shù)據(jù)塊（或專用的塊）以及尾塊（結束碼）。GIF圖像文件格式如表2-5所示。第一百頁，共118頁。第一百零一頁，共118頁。GIF文件格式第一百零二頁，共118頁。

3.PCX文件

PCX文件格式由ZSoft公司設計,最早使用的圖像文件格式之一，由各種掃描儀掃描得到的圖像幾乎都能保存成PCX格式。PCX支持256種顏色，不如TARGA或TIF等格式功能強，但結構較簡單，存取速度快，壓縮比適中，適合于一般軟件的使用。

PCX格式常用于IBMPC兼容計算機。大多數(shù)PC軟件支持PCX格式的第5版。第3版文件使用標準的VGA調色板，不支持自定義調色板。

PCX格式支持RGB、索引顏色、灰度和位圖顏色模式，但不支持alpha通道。PCX支持RLE壓縮方法，圖像顏色的位數(shù)可以是1、4、8或24。第一百零三頁，共118頁。

PCX圖像文件由三個部分組成：文件頭、圖像數(shù)據(jù)和256色調色板。PCX的文件頭有128個字節(jié)，它包括版本號，被打印或掃描的圖像的分辨率(dpi)及大小(單位為像素)，每掃描行的字節(jié)數(shù)，每像素包含的位數(shù)據(jù)和彩色平面數(shù)。位圖數(shù)據(jù)用行程長度壓縮算法記錄數(shù)據(jù)。第一百零四頁，共118頁。

4.JPEG圖像格式

JPEG(JointPhotogr

人人文庫> 全部分類> 教育資料 > 課件下載

溫馨提示

1. 本站所有資源如無特殊說明，都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請下載最新的WinRAR軟件解壓。
2. 本站的文檔不包含任何第三方提供的附件圖紙等，如果需要附件，請聯(lián)系上傳者。文件的所有權益歸上傳用戶所有。
3. 本站RAR壓縮包中若帶圖紙，網(wǎng)頁內容里面會有圖紙預覽，若沒有圖紙預覽就沒有圖紙。
4. 未經權益所有人同意不得將文件中的內容挪作商業(yè)或盈利用途。
5. 人人文庫網(wǎng)僅提供信息存儲空間，僅對用戶上傳內容的表現(xiàn)方式做保護處理，對用戶上傳分享的文檔內容本身不做任何修改或編輯，并不能對任何下載內容負責。
6. 下載文件中如有侵權或不適當內容，請與我們聯(lián)系，我們立即糾正。
7. 本站不保證下載資源的準確性、安全性和完整性, 同時也不承擔用戶因使用這些下載資源對自己和他人造成任何形式的傷害或損失。

第2章數(shù)字圖像識別技術

文檔簡介

溫馨提示

最新文檔

評論

第2章數(shù)字圖像識別技術

文檔簡介

溫馨提示

最新文檔

評論

相關文檔