版權(quán)說明:本文檔由用戶提供并上傳,收益歸屬內(nèi)容提供方,若內(nèi)容存在侵權(quán),請(qǐng)進(jìn)行舉報(bào)或認(rèn)領(lǐng)
文檔簡(jiǎn)介
1、1幾何變換圖像分割圖像平滑與銳化形態(tài)學(xué)處理圖像壓縮與編碼圖像特征提取顏色形狀紋理高級(jí)數(shù)字圖像處理光流分析興趣點(diǎn)提取基于內(nèi)容的圖像檢索2數(shù)字圖像處理數(shù)字圖像處理的基礎(chǔ)知識(shí)概念、特點(diǎn)編程語言、應(yīng)用圖像的統(tǒng)計(jì)特性 圖像文件格式 圖像質(zhì)量的評(píng)價(jià)標(biāo)準(zhǔn) 3數(shù)字圖像處理數(shù)字圖像處理目的數(shù)字圖像處理內(nèi)容數(shù)字圖像處理應(yīng)用4數(shù)字圖像處理數(shù)字圖像處理,是對(duì)數(shù)字圖像進(jìn)行分析、加工和處理,使其滿足視覺、心理以及其它要求的技術(shù)數(shù)字圖像處理易于實(shí)現(xiàn)非線性處理,處理程序和處理參數(shù)可變,是一項(xiàng)通用性強(qiáng)、精度高、處理方法靈活、信息保存?zhèn)魉涂煽康膱D像處理技術(shù)數(shù)字圖像處理的研究內(nèi)容很多,如傅里葉變換、小波變換等各種圖像變換,對(duì)圖像進(jìn)
2、行編碼和壓縮,采用各種方法對(duì)圖像進(jìn)行復(fù)原和增強(qiáng),對(duì)圖像進(jìn)行分割、描述和識(shí)別等5數(shù)字圖像處理20世紀(jì)20年代,圖像處理首次得到應(yīng)用20世紀(jì)60年代中期,隨電子計(jì)算機(jī)的發(fā)展圖像處理得到普通應(yīng)用60年代末,圖像處理技術(shù)不斷完善,逐漸成為一個(gè)新興的學(xué)科數(shù)字圖像處理是信號(hào)處理在圖像領(lǐng)域上的一個(gè)應(yīng)用信號(hào)處理,在計(jì)算機(jī)控制、藥物分析、電子學(xué)等學(xué)科所關(guān)心的是信號(hào)的表示、變換和運(yùn)算,以及它們所包含的信息6數(shù)字圖像處理對(duì)于數(shù)字圖像處理的理解可以分為兩種一是借助于專業(yè)的圖像工具進(jìn)行處理二是使用某種計(jì)算機(jī)語言進(jìn)行編程面向終端用戶面向?qū)I(yè)編程Windows自帶的畫圖程序Adobe公司的Photoshop軟件C+Java
3、數(shù)字圖像處理目的7數(shù)字圖像處理8數(shù)字圖像處理Paint工具最大的特點(diǎn)就是簡(jiǎn)單,并且不失一般通用的數(shù)字圖像處理功能繪制直線使用指定顏色進(jìn)行區(qū)域填充將指定圖像設(shè)置為Windows桌面主題背景顯示柵格以進(jìn)行像素信息的精細(xì)調(diào)整處理從數(shù)碼相機(jī)或掃描儀得來的圖像將圖像作為電子郵件附件進(jìn)行發(fā)送關(guān)于Lena圖像,其來源一般不為人所知,相應(yīng)的出處可以在互聯(lián)網(wǎng)上查詢到,這也是比較有趣的現(xiàn)象,在學(xué)術(shù)界曾引起不小的爭(zhēng)執(zhí)9數(shù)字圖像處理10數(shù)字圖像處理Photoshop主要處理以像素所構(gòu)成的數(shù)字影像,利用其廣泛的編輯與繪圖工具,可以更有效的進(jìn)行圖片編輯工作。獨(dú)特的歷史記錄浮動(dòng)視窗和可編輯的圖層效果功能使用戶可以方便的測(cè)試
4、效果。對(duì)各種濾鏡的支持更令其用戶能夠輕松創(chuàng)造出各種奇幻的效果。Photoshop被人們認(rèn)為是最好的圖像處理軟件,也正在被更多的用于處理網(wǎng)絡(luò)圖片。11數(shù)字圖像處理目前編程語言很多,在選擇上并不存在傾向性很強(qiáng)的指導(dǎo)性原則。有的時(shí)候往往基于程序員的個(gè)人喜好和編程習(xí)慣,其原因就是運(yùn)用任意一種語言幾乎都能實(shí)現(xiàn)所要的目標(biāo)功能。設(shè)想使用匯編語言去開發(fā)一個(gè)信息管理系統(tǒng),肯定不會(huì)有人說一定不會(huì)成功,但也肯定不會(huì)有人實(shí)際去嘗試。對(duì)于數(shù)字圖像處理來說,一般使用下述三種語言進(jìn)行編程實(shí)現(xiàn),包括Matlab、Java和C+。12數(shù)字圖像處理MATLAB是一種由美國 MathWorks 公司出品的商業(yè)數(shù)學(xué)軟件,是一種數(shù)值計(jì)
5、算環(huán)境和編程語言,主要包括 MATLAB 和 Simulink 兩大部分。MATLAB基于矩陣(英語:Matrix)運(yùn)算,其全稱 MATrix LABoratory,即得名于此。在MATLAB中,有兩個(gè)工具箱,包括數(shù)字圖像處理和數(shù)字信號(hào)處理,提供了非常強(qiáng)大的處理功能。13數(shù)字圖像處理往往一個(gè)數(shù)字圖像處理算法,如果用C+編寫,可能需要上千行代碼,而在MATLAB中只需要一個(gè)函數(shù)就可以實(shí)現(xiàn),這都要?dú)w功于MATLAB所提供的強(qiáng)大的工具箱。MATLAB特別適合數(shù)字圖像處理相關(guān)的算法設(shè)計(jì),但是其執(zhí)行效能很低,在實(shí)際應(yīng)用中往往需要將MATLAB代碼轉(zhuǎn)換為C+代碼。鑒于MATLAB工具包的強(qiáng)大,本書提供了與
6、MATLAB的接口實(shí)現(xiàn)。14數(shù)字圖像處理Java是一種可以撰寫跨平臺(tái)應(yīng)用軟件的面向?qū)ο蟮某绦蛟O(shè)計(jì)語言,由Sun公司的James Gosling等人于1990年代初開發(fā)。Sun公司對(duì)Java編程語言的解釋是:Java編程語言是個(gè)簡(jiǎn)單、面向?qū)ο?、分布式、解釋性、健壯、安全、與系統(tǒng)無關(guān)、可移植、高性能、多線程和動(dòng)態(tài)的語言。在應(yīng)付數(shù)字圖像處理問題方面,Java和C#應(yīng)該說沒有太大的特色和優(yōu)勢(shì),既沒有MATLAB功能強(qiáng)大的工具箱,也沒有C+語言所帶來的編程靈活和運(yùn)行效率高的優(yōu)點(diǎn)。15數(shù)字圖像處理C+是一種使用非常廣泛的電腦程序設(shè)計(jì)語言,是一種靜態(tài)類型檢查的,支持多范型的通用程序設(shè)計(jì)語言。有一部分Unix
7、/C程序員對(duì)C+語言深惡痛絕,他們批評(píng)的理由如下:1)標(biāo)準(zhǔn)模板庫STL以非常丑陋的方式封裝了各種數(shù)據(jù)結(jié)構(gòu)和算法,寫出來的代碼難以理解、不美觀;2)C+編譯器復(fù)雜和不可靠,不適合構(gòu)建人命關(guān)天型的程序;3)一部分認(rèn)為面向?qū)ο蠹夹g(shù)徒增學(xué)習(xí)成本,不如面向過程的C語言簡(jiǎn)單容易使用。16數(shù)字圖像處理數(shù)字圖像處理的一個(gè)顯著特征就是數(shù)據(jù)量大,要求計(jì)算機(jī)語言具有運(yùn)算速度快、可以靈活編程等特點(diǎn),這恰恰就是C+語言的特點(diǎn)。眾所周知,在高級(jí)編程語言中C+所編譯的程序是最快的,但是這種快的優(yōu)點(diǎn)是基于C+語言特性(指針)之上,在編程中往往會(huì)表現(xiàn)為一種雙刃劍的作用快但不安全。Microsoft Visual C+OpenC
8、V17數(shù)字圖像處理本書所使用的版本是Microsoft Visual C+ 2008Microsoft Visual C+(簡(jiǎn)稱Visual C+、MSVC、VC+或VC),是微軟公司的C+開發(fā)工具,具有集成開發(fā)環(huán)境,可提供編輯C語言、C+以及C+/CLI等編程語言。Visual C+ 2008 ExpressVisual C+ 2008 StandardVisual C+ 2008 ProfessionalVisual C+ 2008 Team SystemOpenCV的全稱是Open Source Computer Vision Library,是一個(gè)跨平臺(tái)的計(jì)算機(jī)視覺庫?;贠penCV
9、的強(qiáng)大功能和易用性,本書在提供了與OpenCV的接口。18數(shù)字圖像處理底層圖像處理技術(shù)中層圖像處理技術(shù)高層圖像處理技術(shù)紋理RGBYIQHSV傅立葉描述子矩不變量形狀因子結(jié)構(gòu)方法統(tǒng)計(jì)方法面積圓度偏心度主軸方向共生矩陣模型頻譜分析句法分析顏色形狀19數(shù)字圖像處理底層圖像處理技術(shù)中層圖像處理技術(shù)高層圖像處理技術(shù)人臉識(shí)別人臉識(shí)別的算法人臉識(shí)別的應(yīng)用人臉特征點(diǎn)整幅人臉模板匹配神經(jīng)網(wǎng)絡(luò)網(wǎng)絡(luò)應(yīng)用門禁系統(tǒng)視頻監(jiān)控?cái)?shù)碼相機(jī)20數(shù)字圖像處理底層圖像處理技術(shù)中層圖像處理技術(shù)高層圖像處理技術(shù)視頻事件的提出是針對(duì)底層特征和視頻對(duì)象的,但是視頻事件的分析又建立在底層特征和視頻對(duì)象分析之上的“不正?!钡氖录x“用戶感興趣
10、”的事件定義事件挖掘事件檢索足球視頻分析事件是用戶感興趣的具有一定上下文線索并符合特定領(lǐng)域知識(shí)模型的高層語義時(shí)空實(shí)體21數(shù)字圖像處理圖像增強(qiáng)與恢復(fù)基于圖像的生物特征識(shí)別基于內(nèi)容的圖像檢索圖像序列分析計(jì)算機(jī)視覺22數(shù)字圖像處理圖像增強(qiáng),就是將原來不清晰的圖像變得清晰或強(qiáng)調(diào)某些感興趣的特征,抑制不感興趣的特征,使之改善圖像質(zhì)量、豐富信息量,加強(qiáng)圖像判讀和識(shí)別效果的圖像處理方法。圖像恢復(fù),就是指對(duì)受到損壞的圖像進(jìn)行修復(fù)重建或者去除圖像中的多余物體。圖像恢復(fù)常用方法包括偏微分方程方法、整體變分方法、基于曲率的擴(kuò)散模型、高斯卷積濾波和紋理合成方法。23數(shù)字圖像處理生物特征識(shí)別技術(shù)所研究的生物特征包括臉、
11、指紋、手掌紋、虹膜、視網(wǎng)膜、聲音(語音)、體形、個(gè)人習(xí)慣(例如敲擊鍵盤的力度和頻率、簽字)等識(shí)別技術(shù)就有人臉識(shí)別、指紋識(shí)別、掌紋識(shí)別、虹膜識(shí)別、視網(wǎng)膜識(shí)別、語音識(shí)別(用語音識(shí)別可以進(jìn)行身份識(shí)別,也可以進(jìn)行語音內(nèi)容的識(shí)別,只有前者屬于生物特征識(shí)別技術(shù))、體形識(shí)別、鍵盤敲擊識(shí)別、簽字識(shí)別等24數(shù)字圖像處理25數(shù)字圖像處理26數(shù)字圖像處理基于內(nèi)容的圖像檢索的提出,主要是針對(duì)基于關(guān)鍵字的搜索模式,后者典型的應(yīng)用包括互聯(lián)網(wǎng)上傳統(tǒng)的搜索引擎,如Google、百度等。基于內(nèi)容的圖像檢索目的是在給定查詢圖像的前提下,依據(jù)內(nèi)容信息或指定查詢標(biāo)準(zhǔn),在圖像數(shù)據(jù)庫中搜索并查找出符合查詢條件的相應(yīng)圖片。最早成功應(yīng)用基于
12、內(nèi)容的圖像檢索技術(shù)的是IBM的QBIC系統(tǒng)。27數(shù)字圖像處理28數(shù)字圖像處理圖像序列分析,有的時(shí)候也稱為視頻分析,就是根據(jù)圖像本身的內(nèi)容和圖像幀之間的相關(guān)性進(jìn)行目標(biāo)識(shí)別和場(chǎng)景分析,其是靜態(tài)圖像分析在三維空間上的拓展。動(dòng)作檢測(cè)與識(shí)別,也是圖像序列分析的一個(gè)例子,其在智能監(jiān)控和多媒體交互等領(lǐng)域有著廣泛的應(yīng)用前景。有一部分行為檢測(cè)和識(shí)別的研究,是基于真實(shí)的場(chǎng)景視頻,例如好萊塢電影或者是機(jī)場(chǎng)監(jiān)控錄像等。29數(shù)字圖像處理30數(shù)字圖像處理計(jì)算機(jī)視覺,目前已經(jīng)形成一個(gè)獨(dú)立的學(xué)科,主要指用攝像頭和電腦代替人眼對(duì)目標(biāo)進(jìn)行識(shí)別、跟蹤和測(cè)量等機(jī)器視覺,并進(jìn)一步做數(shù)字圖像處理,用電腦處理成為更合適人眼觀察或傳送給儀器
13、檢測(cè)的圖像。在計(jì)算機(jī)視覺和數(shù)字圖像處理領(lǐng)域,有三大國際會(huì)議值得關(guān)注,幾乎所有最新的相關(guān)技術(shù)都會(huì)首先出現(xiàn)在上面,其包括CVPR、ICCV和ECCV。31數(shù)字圖像處理32數(shù)字圖像處理33數(shù)字圖像處理 1.2 基本概念基本概念連續(xù)圖像 連續(xù)圖像也稱為模擬圖像。連續(xù)圖像在水平與垂直方向上,像點(diǎn)位置的變化以及每個(gè)像點(diǎn)的灰度變化都是連續(xù)的。可以認(rèn)為它是由無數(shù)個(gè)像點(diǎn)組成的,而且每個(gè)點(diǎn)上的灰度值都有無限多個(gè)可能的取值。它反映了客觀景物的亮度和顏色隨空間位置和方向上的變化而發(fā)生的連續(xù)變化。數(shù)字圖像 上述圖像進(jìn)行的兩個(gè)離散化操作也稱為圖像數(shù)字化處理。通過數(shù)字化處理,就可以獲得數(shù)字圖像。在這些小區(qū)域上獲取圖像的亮度
14、作為“樣本”的過程就是通常所說的采樣。采樣過程中獲取的亮度樣本。值仍然是連續(xù)的值。我們還需要將這些值“量化”為整數(shù)值。一般地將亮度值均勻地量化成256個(gè)等級(jí)。有兩種方法表示從白到黑的量化:一種是0255對(duì)應(yīng)由白到黑,另一種是0255對(duì)應(yīng)由黑到白。在圖像處理時(shí),應(yīng)該注意,相應(yīng)系統(tǒng)是采用那一種表示法。由(1.1.6)可知,離散圖像的寬度M是圖像矩陣的列數(shù),而高度N是行數(shù)。今后本書進(jìn)行處理的所有圖像除特別說明外均指數(shù)字圖像。根據(jù)圖像的不同,可以分為以下三類。1灰度圖像當(dāng)一幅圖像具有 灰度級(jí)時(shí),常稱該圖像是k比特圖像。比如,一幅有 28 =256個(gè)灰度級(jí),就稱其為8比特圖像?;叶葓D像矩陣元素 的取值范
15、圍通常為0, 255,所以,也常稱為256級(jí)灰度圖像。一般地,“0”級(jí)表示純黑色,“255”級(jí)表示純白色,中間的灰度級(jí)從小到大表示由黑到白的過渡。2. 二值圖像一幅二值圖像的二維矩陣僅由為0、1兩個(gè)值組成,“0”代表白色,“1”代表黑色。二值圖像通常用于文字、線條圖的掃描識(shí)別和掩模圖像的存儲(chǔ)。二值圖像可以看成是灰度圖像的一個(gè)特例。請(qǐng)注意,在圖像存儲(chǔ)時(shí),即使二值圖像其灰度值仍然在0, 255內(nèi),但它僅有兩個(gè)值:0和255。所以二值圖像在存儲(chǔ)時(shí),必須將0-1圖像序列轉(zhuǎn)化成255-0圖像序列。3. RGB彩色圖像 RGB圖像分別用紅(R)、綠(G)、藍(lán)(B)三原色的組合來表示每個(gè)像素的顏色。圖像中的
16、每個(gè)像素的顏色值,用RGB三原色表示直接存放在圖像矩陣中。由于每一像素的顏色需要R、G、B三個(gè)分量來表示,所以RGB圖像的圖像矩陣與其它類型的圖像矩陣不同,是一個(gè)三維矩陣可用MN3表示。比如,若表示彩色圖像,則在矩陣(1.1.6)中 是一個(gè)三維向量,由表示R、G、B值的3個(gè)分量組成。 1.2.3 顏色模型顏色模型RGB模型 這個(gè)模型基于笛卡爾坐標(biāo)系,3個(gè)軸分別為R、G、B,參見圖1-1-2。我們感興趣的部分形成一個(gè)立方體。原點(diǎn)對(duì)應(yīng)黑色,離原點(diǎn)最遠(yuǎn)的立方體的頂點(diǎn)對(duì)應(yīng)白色。在這個(gè)模型中,從黑到白的灰度值分布在從原點(diǎn)到離原點(diǎn)最遠(yuǎn)的頂點(diǎn)的連線上。在立方體內(nèi)其余各點(diǎn)對(duì)應(yīng)不同的顏色,可用從原點(diǎn)到該點(diǎn)的矢量
17、表示。 根據(jù)這個(gè)模型,每幅彩色圖像包括3個(gè)獨(dú)立的基色平面,或者說可以分解到3個(gè)基色平面上。反過來用3個(gè)獨(dú)立的基色平面可表示1幅彩色圖像。一幅“真”彩色RGB圖像用24 bit,即R、G、B三個(gè)分量各用8 bit表示。這樣,一幅“真”彩色RGB圖像的顏色總數(shù)有16 777 216種。HSI模型 RGB模型是從物理和光學(xué)的角度描述顏色的,而HSI則根據(jù)人類視覺主觀感覺對(duì)顏色進(jìn)行描述。研究與實(shí)踐均表明,人眼不能直接感覺R、G、B三種顏色的比例,只能通過感知顏色的色度、飽和度和亮度來區(qū)分物體。在HSI彩色空間中,H表示色度(hue),S表示飽和度(saturation),I表示強(qiáng)度(intensity
18、),即亮度。其中色度和飽和度表示顏色的彩色信息,而I決定了像素的整體亮度,與彩色信息無關(guān)。 這個(gè)模型有兩個(gè)特點(diǎn),其一是,分量I與圖像的彩色信息無關(guān),其二是,分量H和S與人感受的方式緊密相連。這兩個(gè)特點(diǎn)使得HSI模型非常適合于借助人的視覺系統(tǒng)來感知彩色特性的圖像處理算法由RGB到HSI的轉(zhuǎn)換公式如下:也可作相反的轉(zhuǎn)換。YIQ色彩系統(tǒng) YIQ色彩系統(tǒng)為歐洲的電視系統(tǒng)所采用,其中Y是指顏色的明視度(luminance),即亮度(brightness)。其實(shí),就是圖像的灰度值, 而I和Q是屬于色調(diào)(chrominance), 即描述圖像色彩及飽和度的屬性。RGB與YIQ系統(tǒng)之間可以轉(zhuǎn)換,對(duì)應(yīng)關(guān)系如下:
19、 1.3 圖像的統(tǒng)計(jì)特性圖像的統(tǒng)計(jì)特性1.3.1 基本統(tǒng)計(jì)分析量1. 圖像的信息量 一幅圖像如果有k種灰度值,且各灰度值出現(xiàn)的概率分別為 。根據(jù)香農(nóng)(Shannon)定理,圖像的信息量可用如下公式計(jì)算: 稱H為圖像的熵。當(dāng)圖像中各灰度值出現(xiàn)的概率彼此相等時(shí),則圖像的熵最大。信息量表示一幅圖像所包含信息的多少,常用于對(duì)不同圖像處理方法進(jìn)行比較。2. 圖像灰度平均值 稱圖像一塊區(qū)域中所有像素灰度值的算術(shù)平均值為這塊區(qū)域的灰度平均值。根據(jù)算術(shù)平均的定義,MN圖像區(qū)域的灰度平均值計(jì)算公式如下:在圖像處理中,常常要計(jì)算小塊區(qū)域,比如計(jì)算33或55小塊區(qū)域的灰度平均值。3. 圖像灰度中值 圖像中一塊區(qū)域的
20、灰度中值,簡(jiǎn) 稱中值是指區(qū)域內(nèi)全部像素的灰度值經(jīng)過大小排序后處于中間的灰度值。在應(yīng)用中,計(jì)算整幅圖像的灰度中值的機(jī)會(huì)很少。常用的是計(jì)算小塊區(qū)域,比如計(jì)算33小塊或55小塊的中值。例如下面的9個(gè)灰度值是某個(gè)33小塊的灰度值排序后的結(jié)果: 198,156,156,99,98,77,68,45,45 處于中間的98就是這個(gè)33小塊的中值。4. 圖像灰度方差 一塊MN圖像區(qū)域的灰度方差反映了該區(qū)域內(nèi)各像素灰度值與灰度平均值的離散程度。其計(jì)算公式如下:與熵一樣,圖像灰度方差是衡量圖像信息量大小的主要度量指標(biāo),也是圖像統(tǒng)計(jì)特性中最重要的統(tǒng)計(jì)量之一。一幅圖像的灰度方差越大,圖像的信息量也越大。 1.3.2
21、直方圖直方圖概念: 一幅圖像的灰度分布圖就是它的直方圖(histogram)。直方圖中的橫坐標(biāo)是灰度值 ,縱坐標(biāo)是該灰度值出現(xiàn)的頻率(像素的個(gè)數(shù) )。所以直方圖H可用下式:計(jì)算,其中w和h分別是圖像的寬度和高度。下圖1-2-1是圖像Lena的直方圖,它表示Lena圖中各灰度值出現(xiàn)的頻率,其中頻率最高的灰度值是19,共635次。1. 直方圖的另一種定義 假設(shè)一幅連續(xù)圖像平滑地從中心的高灰度級(jí)變化到邊緣的低灰度級(jí)。我們可以選擇某一灰度值r,然后定義一條輪廓線。該輪廓線連接了圖像上所有具有灰度值等于r的點(diǎn)。這種灰度值相等的輪廓線類似于地理中的“等高線”。所得的輪廓線形成了包圍灰度值大于等于r的封閉曲
22、線。記灰度值為r的輪廓線包圍區(qū)域的面積為A(r), 則當(dāng)灰度值為r時(shí)直方圖的值H(r)定義為:上式的負(fù)號(hào)是因?yàn)槊娣e函數(shù)A(r)是一個(gè)遞減函數(shù),參見圖1-2-2。對(duì)于數(shù)字圖像, 的最小值為1,所以用差分代替上面的導(dǎo)數(shù),得到:由上式可知, 直方圖 H(r)正是灰度值等于r的像素個(gè)數(shù)。所以,這種對(duì)連續(xù)圖像定義的直方圖是前面對(duì)離散的數(shù)字圖像直方圖定義的推廣。2. 直方圖的性質(zhì)(1) 直方圖是一幅圖像中各像素灰度值次數(shù)或頻數(shù)統(tǒng)計(jì)的結(jié)果,它只反映該圖像中不同灰度值出現(xiàn)的概率,而不能反映某一灰度值像素所在的位置信息。所以直方圖丟失了灰度值的位置信息。(2) 一幅圖像唯一地確定一幅直方圖。但不同的圖像可能有相
23、同的直方圖。即圖像與直方圖之間是一種多對(duì)一的映射關(guān)系。參見圖1-2-3,其左圖與右圖的直方圖相等。顯然還可以構(gòu)造出許多直方圖相等的圖像。(3) 根據(jù)直方圖的定義可知,當(dāng)一幅圖像看成若干幅子圖像拼接而成時(shí),則各子圖像直方圖之和等于原圖像的直方圖。3. 直方圖的作用(1) 數(shù)字化參數(shù) 直方圖給出了一個(gè)簡(jiǎn)單且直觀的可視化數(shù)據(jù)??捎糜谂袛嘁环鶊D像是否合理地利用了全部允許的灰度級(jí)范圍。一般一幅數(shù)字圖像應(yīng)該利用全部或幾乎全部可能的灰度級(jí),否則等于增加了量化間隔。一旦數(shù)字化圖像的灰度級(jí)數(shù)少于256,丟失的信息將不能恢復(fù)。在圖像取樣量化過程中對(duì)超出數(shù)字化器處理范圍的亮度值將被簡(jiǎn)單地置為0或255。由此將在直方
24、圖的一端或兩端產(chǎn)生尖峰。數(shù)字化時(shí)對(duì)直方圖進(jìn)行檢查是一個(gè)好辦法??梢约霸绨l(fā)現(xiàn)問題,以便糾正。(2) 選擇邊界閾值 假定一幅圖像背景是淺色的,前景是一個(gè)深色的物體,這類圖像的直方圖如圖1-2-4。物體中深色像素產(chǎn)生直方圖的左峰,而淺色背景形成直方圖的右峰。物體的邊界處產(chǎn)生兩峰之間的“谷”。選擇谷底作為灰度閾值將能分割背景與前景。 1.4 圖像文件格式圖像文件格式1.4.1 BMP圖像文件格式 1. BMP文件結(jié)構(gòu) 位圖(BitMap Picture,BMP)文件格式是Windows系統(tǒng)交換圖形、圖像數(shù)據(jù)的一種標(biāo)準(zhǔn)格式。BMP圖像的數(shù)據(jù)由四部分組成,如表1-3-1所示。第一部分為位圖文件頭BITMA
25、PFILEHEADER。它是一個(gè)結(jié)構(gòu)體,其定義如下: 其中,WORD為無符號(hào)16位二進(jìn)制整數(shù),DWORD為無符號(hào)32位二進(jìn)制整數(shù)。這個(gè)結(jié)構(gòu)的長度是固定的,為14個(gè)字節(jié)。第二部分為位圖信息頭BITMAPINFOHEADER,也是一個(gè)結(jié)構(gòu),其定義如下: 其中,LONG為32位二進(jìn)制整數(shù)。這個(gè)結(jié)構(gòu)的長度是固定的,為40個(gè)字節(jié)。biCompression的有效值為BI_RGB、BI_RLE8、BI_RLE4、BI_BITFIELDS。這些都是Windows定義好的常量。由于RLE4和RLE8的壓縮格式用的不多,今后僅討論biCompression的有效值為RI_RGB,即不壓縮的情況。 第三部分為調(diào)色
26、板(Palette),當(dāng)然,這里是對(duì)那些需要調(diào)色板的位圖文件而言的。真彩色圖像是不需要調(diào)色板的,BITMAPINFOHEADER后直接是位圖數(shù)據(jù)。調(diào)色板實(shí)際上是一個(gè)數(shù)組,共有biClrUsed個(gè)元素(如果該值為零,則有2的bi Bitcount次方個(gè)元素)。數(shù)組中每個(gè)元素的類型是一個(gè)RGBQUAD結(jié)構(gòu),占4個(gè)字節(jié),其定義如下: 第四部分就是實(shí)際的圖像數(shù)據(jù)。對(duì)于用到調(diào)色板的位圖,圖像數(shù)據(jù)就是該像素顏色在調(diào)色板中的索引值。對(duì)于真彩色圖像,圖像數(shù)據(jù)就是實(shí)際的R、G、B值。下面就2色、16色、256色和真彩色位圖分別介紹。 對(duì)于2色位圖,用1位就可以表示該像素的顏色,一般0表示黑,1表示白,所以一個(gè)字
27、節(jié)可以表示8個(gè)像素。 對(duì)于16色位圖,用4位可以表示一個(gè)像素的顏色,所以一個(gè)字節(jié)可以表示2個(gè)像素。 對(duì)于256色位圖,一個(gè)字節(jié)剛好可以表示1個(gè)像素。 下面兩點(diǎn)請(qǐng)讀者注意: (1) BMP文件每一行的字節(jié)數(shù)必須是4的整數(shù)倍。如果不是,則需要補(bǔ)齊。 (2) BMP文件的數(shù)據(jù)存放是從下到上,從左到右的。也就是說,從文件中最先讀到的是圖像最下面一行的左邊第一個(gè)像素,然后是左邊第二個(gè)像素,接下來是倒數(shù)第二行左邊第一個(gè)像素,左邊第二個(gè)像素。依次類推,最后得到的是最上面一行的最右邊的一個(gè)像素。 1.4.2 JPG圖像文件格式圖像文件格式 靜態(tài)圖像壓縮標(biāo)準(zhǔn)(Joint Photographic Experts
28、 Group, JPG, JPEG) 是最為廣泛使用的標(biāo)準(zhǔn)。JPEG圖像具有24位彩色處理能力,可以處理照片中微小色彩細(xì)節(jié),具有較高的圖像質(zhì)量。和相同圖象質(zhì)量的其它常用文件格式,如GIF,TIFF,PCX相比,JPEG是目前靜態(tài)圖像中壓縮比最高的。正是由于JPEG的高壓縮比,使得它廣泛地應(yīng)用于多媒體和網(wǎng)絡(luò)中。因?yàn)榫W(wǎng)絡(luò)的帶寬非常寶貴,選用一種高壓縮比的文件格式是十分必要的。 1.4.3 GIF圖像文件格式圖像文件格式 圖形交換格式(Graphics Interchange Format, GIF) 這個(gè)格式支持8位調(diào)色板圖像,即這種圖像只能使用256種顏色。因此,通常GIF圖像只用于色彩比較簡(jiǎn)單的插圖。GIF是Web及其聯(lián)機(jī)服務(wù)上常用的一種文件格式,用于超文本標(biāo)記語言(HTML)文檔中的索引顏色圖像,但圖像最大不能超過64MB,顏色最多為256色。GIF圖像文件采取LZW壓縮算法,存儲(chǔ)效率高,支持多幅圖像定序或覆蓋,交錯(cuò)多屏幕繪圖以及文本覆蓋。 GIF主要是為數(shù)據(jù)流而設(shè)計(jì)的一種傳輸格式,而不是作為文件的存儲(chǔ)格式。換句話說,它具有順序的組織形式。GIF有5個(gè)主要部分以固定順序出現(xiàn),所有部分均由一個(gè)或多個(gè)塊(block)組成。每個(gè)塊的第一個(gè)字節(jié)中存放標(biāo)識(shí)碼或特征碼標(biāo)識(shí)。這些部分的順序?yàn)椋何募?biāo)志塊、邏輯屏幕描述塊、可選的“全局”色彩表塊(調(diào)色板)、各圖像數(shù)據(jù)塊(或
溫馨提示
- 1. 本站所有資源如無特殊說明,都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請(qǐng)下載最新的WinRAR軟件解壓。
- 2. 本站的文檔不包含任何第三方提供的附件圖紙等,如果需要附件,請(qǐng)聯(lián)系上傳者。文件的所有權(quán)益歸上傳用戶所有。
- 3. 本站RAR壓縮包中若帶圖紙,網(wǎng)頁內(nèi)容里面會(huì)有圖紙預(yù)覽,若沒有圖紙預(yù)覽就沒有圖紙。
- 4. 未經(jīng)權(quán)益所有人同意不得將文件中的內(nèi)容挪作商業(yè)或盈利用途。
- 5. 人人文庫網(wǎng)僅提供信息存儲(chǔ)空間,僅對(duì)用戶上傳內(nèi)容的表現(xiàn)方式做保護(hù)處理,對(duì)用戶上傳分享的文檔內(nèi)容本身不做任何修改或編輯,并不能對(duì)任何下載內(nèi)容負(fù)責(zé)。
- 6. 下載文件中如有侵權(quán)或不適當(dāng)內(nèi)容,請(qǐng)與我們聯(lián)系,我們立即糾正。
- 7. 本站不保證下載資源的準(zhǔn)確性、安全性和完整性, 同時(shí)也不承擔(dān)用戶因使用這些下載資源對(duì)自己和他人造成任何形式的傷害或損失。
最新文檔
- 拱棚工程施工方案(3篇)
- 致敬英烈-緬懷革命先烈主題班會(huì)課件
- 2025年河北省職教高考《職測(cè)》核心考點(diǎn)必刷必練試題庫(含答案)
- 《道路交通安全法》知識(shí)考試題庫150題(含答案)
- 2025年江西師范高等??茖W(xué)校高職單招職業(yè)技能測(cè)試近5年??及鎱⒖碱}庫含答案解析
- 2025年江南影視藝術(shù)職業(yè)學(xué)院高職單招職業(yè)技能測(cè)試近5年??及鎱⒖碱}庫含答案解析
- 專題03 冠詞(第02期) 帶解析
- 2025科學(xué)儀器行業(yè)市場(chǎng)動(dòng)態(tài)與技術(shù)發(fā)展趨勢(shì)
- 無人駕駛與機(jī)器人行業(yè)的關(guān)聯(lián)與前景
- 消防設(shè)計(jì)工程合同模板
- 中央2025年公安部部分直屬事業(yè)單位招聘84人筆試歷年參考題庫附帶答案詳解
- 三年級(jí)數(shù)學(xué)(上)計(jì)算題專項(xiàng)練習(xí)附答案
- 中醫(yī)診療方案腎病科
- 2025年安慶港華燃?xì)庀薰菊衅腹ぷ魅藛T14人高頻重點(diǎn)提升(共500題)附帶答案詳解
- 人教版(2025新版)七年級(jí)下冊(cè)數(shù)學(xué)第七章 相交線與平行線 單元測(cè)試卷(含答案)
- 玩具有害物質(zhì)風(fēng)險(xiǎn)評(píng)估-洞察分析
- 春節(jié)節(jié)后復(fù)工全員安全意識(shí)提升及安全知識(shí)培訓(xùn)
- 2024年河南省公務(wù)員錄用考試《行測(cè)》真題及答案解析
- 2023年上海鐵路局集團(tuán)有限公司招聘筆試真題
- 信永中和在線測(cè)評(píng)85題
評(píng)論
0/150
提交評(píng)論