版權(quán)說(shuō)明:本文檔由用戶提供并上傳,收益歸屬內(nèi)容提供方,若內(nèi)容存在侵權(quán),請(qǐng)進(jìn)行舉報(bào)或認(rèn)領(lǐng)
文檔簡(jiǎn)介
1、圖像特征提取配套課件數(shù)字圖像處理 編程框架、理論分析、實(shí)例應(yīng)用和源碼實(shí)現(xiàn)數(shù)字圖像處理1圖像特征提取在計(jì)算機(jī)視覺(jué)與圖像處理領(lǐng)域,特征的概念被用于表示一定的信息,這些信息是為了解決與特定的應(yīng)用相關(guān)的某種計(jì)算任務(wù)。特征提取,就是指圖像特征的計(jì)算,用以作為對(duì)圖像中局部信息內(nèi)容進(jìn)行決策的中間結(jié)果。與特征提取相關(guān)的還有兩個(gè)概念,分別為維數(shù)壓縮和特征選擇。所謂維數(shù)壓縮,就是對(duì)于一個(gè)算法而言所輸入的數(shù)據(jù)過(guò)于巨大而難以進(jìn)行有效的處理,可以利用數(shù)據(jù)冗余性(數(shù)據(jù)量大,但是信息量不大)的特點(diǎn)將所輸入數(shù)據(jù)轉(zhuǎn)換為一種特征的精簡(jiǎn)表示形式(即特征向量)。特征選擇,通常用在機(jī)器學(xué)習(xí)中,用以選擇一個(gè)相關(guān)特征的子集,并進(jìn)行更為魯棒
2、的學(xué)習(xí)建模。數(shù)字圖像處理2圖像特征提取圖像特征提取,主要可以分為兩個(gè)層次,一層是底層特征提取,另一層是高層特征提取。高層特征提取,往往是基于語(yǔ)義層次的高度,如人臉識(shí)別、人的行為分析等等,這些都必須根據(jù)底層特征的提取結(jié)果并通過(guò)機(jī)器學(xué)習(xí)才能得到。底層特征提取,是一切圖像分析的基礎(chǔ),已經(jīng)得到了廣泛的研究和相對(duì)成熟的成果。數(shù)字圖像處理3顏色形狀紋理圖像色彩與灰度顏色是一種重要的視覺(jué)信息屬性,在數(shù)字圖像處理中是一種很有用的特征。相對(duì)于其它特征,顏色特征非常穩(wěn)定,對(duì)于旋轉(zhuǎn)、平移、尺度變化,甚至各種變形都不敏感,表現(xiàn)出相當(dāng)強(qiáng)的魯棒性,而且顏色特征計(jì)算簡(jiǎn)單,因此成為現(xiàn)有圖像處理系統(tǒng)中應(yīng)用最廣泛的特征。對(duì)于顏色
3、特征,分兩個(gè)部分進(jìn)行講述,包括彩色和灰度信息處理。對(duì)于彩色信息處理,主要講述幾種常見(jiàn)的色彩空間;而對(duì)于灰度信息處理,主要講述直方圖技術(shù)。數(shù)字圖像處理4彩色信息處理數(shù)字圖像處理5HSV色彩空間YUV色彩空間RGB色彩空間Lab色彩空間XYZ色彩空間RGB色彩空間根據(jù)人眼結(jié)構(gòu),所有顏色都可看作是3個(gè)基本顏色紅(Red),綠(Green)和藍(lán)(Blue)的不同組合。在RGB顏色空間的原點(diǎn)上,任一基色均沒(méi)有亮度,即原點(diǎn)為黑色。三基色都達(dá)到最高亮度時(shí)表現(xiàn)為白色。亮度較低的等量的三種基色產(chǎn)生灰色的影調(diào)。所有這些點(diǎn)均落在彩色立方體的對(duì)角線上,該對(duì)角線被稱為灰色線。彩色立方體中有三個(gè)角對(duì)應(yīng)于三基色,紅色、綠色
4、和藍(lán)色。剩下的三個(gè)角對(duì)應(yīng)于二次色,黃色、青色(藍(lán)綠色)和品紅(紫色)。數(shù)字圖像處理6RGB色彩空間數(shù)字圖像處理7RGB色彩空間數(shù)字圖像處理8原始彩色圖像紅色分量圖像綠色分量圖像藍(lán)色分量圖像HSV色彩空間數(shù)字圖像處理9從RGB到HSV顏色空間的轉(zhuǎn)換數(shù)字圖像處理10從RGB到HSV顏色空間的轉(zhuǎn)換數(shù)字圖像處理11從HSV到RGB顏色空間的轉(zhuǎn)換數(shù)字圖像處理12HSV色彩空間數(shù)字圖像處理13原始彩色圖像色調(diào)分量圖像飽和度分量圖像亮度分量圖像YUV色彩空間YUV是一種真彩色顏色空間的表示,其中Y表示亮度,U和V表示色度和濃度。YUV經(jīng)常與YCbCr等術(shù)語(yǔ)進(jìn)行混用,其中YUV主要是用來(lái)描述模擬信號(hào),而YCb
5、Cr則是用來(lái)描述離散的視頻信號(hào)。在常用的壓縮格式MPEG和JPEG中,YCbCr得到了很好的應(yīng)用,但是如今,YUV在電腦系統(tǒng)中也得到了廣泛的應(yīng)用。YUV格式可以分為兩種:緊縮格式:將Y、U、V值存儲(chǔ)為宏像素陣列,和RGB的存儲(chǔ)方式類似;平面格式:將Y、U、V三個(gè)分量分別存儲(chǔ)在不同的矩陣中。數(shù)字圖像處理14YUV色彩空間數(shù)字圖像處理15YUV色彩空間數(shù)字圖像處理16原始彩色圖像Y(亮度)分量圖像U(色度)分量圖像V(濃度)分量圖像XYZ色彩空間數(shù)字圖像處理17XYZ色彩空間數(shù)字圖像處理18原始彩色圖像X分量圖像Y分量圖像Z分量圖像Lab色彩空間數(shù)字圖像處理19Lab色彩空間數(shù)字圖像處理20Lab
6、色彩空間數(shù)字圖像處理21原始彩色圖像L分量圖像a分量圖像b分量圖像直方圖處理數(shù)字圖像處理22從灰度圖像統(tǒng)計(jì)直方圖數(shù)字圖像處理23CTArray CImageProcessing:Histogram_of_gray_image( const CTMatrix& gray_image )const long dimension = 256; / 直方圖維數(shù)CTArray histogram( dimension ); / 構(gòu)造直方圖for( int index = 0; index dimension; index + ) / 直方圖遍歷histogram index = 0; long imag
7、e_height = gray_image.Get_height(); / 圖像高度long image_width = gray_image.Get_width(); / 圖像寬度f(wàn)or( int row = 0; row image_height; row + )for( int column = 0; column image_width; column + ) histogram gray_imagerowcolumn +; return histogram; / 返回直方圖直方圖相似性度量數(shù)字圖像處理24直方圖相似性度量數(shù)字圖像處理25Bin-by-bin相似性度量數(shù)字圖像處理26C
8、ross-bin相似性度量數(shù)字圖像處理27直方圖均衡化數(shù)字圖像處理28數(shù)字圖像處理29CTMatrix CImageProcessing:Histogram_equalization( const CTMatrix& gray_image, long equal_scale )long image_height = gray_image.Get_height();long image_width = gray_image.Get_width();CTMatrix result_image( image_height, image_width );CTArray histogram = Norm
9、alize_histogram( Histogram_of_gray_image( gray_image ) );for( int index = 1; index histogram.GetDimension(); index + )histogram index += histogram index - 1 ;for( int index = 0; index histogram.GetDimension(); index + )histogram index = long( long( histogram index * equal_scale ) * ( 256.0 / double(
10、 equal_scale ) ) );histogram index = max( 0, histogram index );histogram index = min( 255, histogram index );for( int row = 0; row image_height; row + )for( int column = 0; column image_width; column + )result_image row column = BYTE( histogram gray_image row column );return result_image;直方圖均衡化數(shù)字圖像處
11、理30原始圖像直方圖高斯模型數(shù)字圖像處理31直方圖高斯模型數(shù)字圖像處理32直方圖高斯模型數(shù)字圖像處理33直方圖高斯模型數(shù)字圖像處理34投影直方圖數(shù)字圖像處理35形狀特征提取基于圖像內(nèi)物體形狀的檢索是基于內(nèi)容檢索當(dāng)中一個(gè)最具挑戰(zhàn)性的問(wèn)題之一,因?yàn)閷ふ曳先搜鄹兄匦缘男螤钐卣鞑皇且患?jiǎn)單的工作。首要的困難是要將不同物體從圖像中分割出來(lái),這是計(jì)算機(jī)視覺(jué)的困難問(wèn)題之一。形狀的描述也是困難的問(wèn)題,常用的方法有傅立葉描述子、矩不變量、各種簡(jiǎn)單的形狀因子(如面積、圓度、偏心度、主軸方向)等。除了這些全局特征以外,有時(shí)也用一些局部特征(如直線段、圓弧、角點(diǎn)、高曲率點(diǎn)等),以解決遮擋問(wèn)題。數(shù)字圖像處理36形狀
12、特征提取數(shù)字圖像處理37Hu不變矩傅里葉描述子Hough變換Zernike不變矩Radon變換Hu不變矩矩是一種完備的數(shù)學(xué)表示,其優(yōu)點(diǎn)是能夠直接用于包含感興趣目標(biāo)的區(qū)域而不需事先把目標(biāo)分離出來(lái)。區(qū)域的矩是用所有屬于區(qū)域內(nèi)的點(diǎn)計(jì)算出來(lái)的,因而不太受噪聲等的影響。由于低階矩對(duì)噪聲和量化誤差不敏感,所以矩為描述區(qū)域提供了一種雖不完備但卻有用的總體表示。矩在圖像檢索中,特別是在商標(biāo)圖像檢索中,得到了廣泛的應(yīng)用。Hu不變矩具有良好的尺度、平移和旋轉(zhuǎn)不變性,在基于形狀的商標(biāo)圖像檢索中取得了非常好的檢索性能。數(shù)字圖像處理38Hu不變矩?cái)?shù)字圖像處理39Hu不變矩?cái)?shù)字圖像處理40Hu不變矩?cái)?shù)字圖像處理41Zer
13、nike不變矩?cái)?shù)字圖像處理42Zernike不變矩?cái)?shù)字圖像處理43偽Zernike不變矩計(jì)算數(shù)字圖像處理44Hough變換數(shù)字圖像處理45Hough變換數(shù)字圖像處理46Hough變換數(shù)字圖像處理47Hough變換數(shù)字圖像處理48Radon變換數(shù)字圖像處理49Radon變換數(shù)字圖像處理50Radon變換Radon變換的具體實(shí)現(xiàn),大致可以分為四個(gè)步驟將坐標(biāo)原點(diǎn)移至圖像中心直線參數(shù)計(jì)算直線坐標(biāo)的最大最小值計(jì)算根據(jù)角度進(jìn)行分區(qū)討論數(shù)字圖像處理51Radon變換數(shù)字圖像處理52傅里葉描述子數(shù)字圖像處理53傅里葉描述子為了驗(yàn)證所得到的傅里葉描述子是否正確,可以對(duì)傅里葉描述子進(jìn)行傅里葉逆變換,然后從所得到的
14、一維復(fù)數(shù)數(shù)組中恢復(fù)二值圖像,通過(guò)比較新舊圖像就可以看出所得到的傅里葉描述子是否正確。數(shù)字圖像處理54從二值圖像得到一維傅里葉正變換輸入的源碼實(shí)現(xiàn)數(shù)字圖像處理55CTArray CImageProcessing:Position_from_binary_image( const CTMatrix& binary_image, BlackWhite object_color )long number_of_objects = 0;long image_height = binary_image.Get_height();long image_width = binary_image.Get_wid
15、th();for( int row = 0; row image_height; row + )for( int column = 0; column image_width; column + )if( binary_image row column = object_color )number_of_objects +;CTArray array_of_positions( number_of_objects );number_of_objects = 0;for( int row = 0; row image_height; row + )for( int column = 0; col
16、umn image_width; column + )if( binary_image row column = object_color )array_of_positions number_of_objects .m_re = row;array_of_positions number_of_objects .m_im = column;number_of_objects +;return array_of_positions;從一維傅里葉逆變換的輸出恢復(fù)二值圖像的源碼實(shí)現(xiàn)數(shù)字圖像處理56CTMatrix CImageProcessing:Binary_image_from_positio
17、n( const CTArray& array_of_positions, long image_height, long image_width, BlackWhite object_color )CTMatrix binary_image( image_height, image_width );for( int row = 0; row image_height; row + )for( int column = 0; column image_width; column + )binary_image row column = ( object_color = White ? Blac
18、k : White );long dimension = array_of_positions.GetDimension();for( int index = 0; index dimension; index + )long row = long( array_of_positions index .m_re );long column = long( array_of_positions index .m_im );if( binary_image.Is_point_valid( CImagePoint( row, column ) ) )binary_image row column =
19、 object_color;return binary_image;紋理特征提取通常認(rèn)為紋理是在圖像上表現(xiàn)為灰度或顏色分布的某種規(guī)律性,這種規(guī)律性在不同類別的紋理中有其不同特點(diǎn)。紋理大致可分為兩類:一類是規(guī)則紋理,它由明確的紋理基本元素(簡(jiǎn)稱紋理基元)經(jīng)有規(guī)則排列而成,常被稱為人工紋理。另一類是準(zhǔn)規(guī)則紋理,它們的紋理基元沒(méi)有明確的形狀,而是某種灰度或顏色的分布。常用的三種紋理分析方法是:統(tǒng)計(jì)分析方法例如使用直方圖的各階矩或區(qū)域灰度共生矩陣;結(jié)構(gòu)分析方法例如利用紋理基元及其排列規(guī)律;頻譜分析方法例如選取紋理模式的主方向和基本周期。數(shù)字圖像處理57統(tǒng)計(jì)分析方法數(shù)字圖像處理58用于紋理分析的頻域變換
20、數(shù)字圖像處理59Gabor變換Gabor變換是根據(jù)模擬人類視覺(jué)系統(tǒng)而產(chǎn)生的。通過(guò)模擬人類視覺(jué)系統(tǒng),可以將視網(wǎng)膜成像分解成一組濾波圖像,每個(gè)分解的圖像能夠反映頻率和方向在局部范圍內(nèi)的強(qiáng)度變化。通過(guò)一組多通道Gabor濾波器,可以獲得紋理特征。Gabor變換的根本就是Gabor濾波器的設(shè)計(jì),而濾波器的設(shè)計(jì)又是其頻率函數(shù)和高斯函數(shù)參數(shù)的設(shè)計(jì)。通過(guò)頻率參數(shù)和高斯函數(shù)參數(shù)的選取,Gabor變換可以選取很多紋理特征,但是Gabor是非正交的,不同特征分量之間有冗余,所以在對(duì)紋理圖像的分析中效率不太高。數(shù)字圖像處理60Gabor變換數(shù)字圖像處理61Gabor變換數(shù)字圖像處理62小波變換數(shù)字圖像處理63離散小波變換所使用的濾波器銀行數(shù)字圖像處理64離散小波變換系數(shù)分解
溫馨提示
- 1. 本站所有資源如無(wú)特殊說(shuō)明,都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請(qǐng)下載最新的WinRAR軟件解壓。
- 2. 本站的文檔不包含任何第三方提供的附件圖紙等,如果需要附件,請(qǐng)聯(lián)系上傳者。文件的所有權(quán)益歸上傳用戶所有。
- 3. 本站RAR壓縮包中若帶圖紙,網(wǎng)頁(yè)內(nèi)容里面會(huì)有圖紙預(yù)覽,若沒(méi)有圖紙預(yù)覽就沒(méi)有圖紙。
- 4. 未經(jīng)權(quán)益所有人同意不得將文件中的內(nèi)容挪作商業(yè)或盈利用途。
- 5. 人人文庫(kù)網(wǎng)僅提供信息存儲(chǔ)空間,僅對(duì)用戶上傳內(nèi)容的表現(xiàn)方式做保護(hù)處理,對(duì)用戶上傳分享的文檔內(nèi)容本身不做任何修改或編輯,并不能對(duì)任何下載內(nèi)容負(fù)責(zé)。
- 6. 下載文件中如有侵權(quán)或不適當(dāng)內(nèi)容,請(qǐng)與我們聯(lián)系,我們立即糾正。
- 7. 本站不保證下載資源的準(zhǔn)確性、安全性和完整性, 同時(shí)也不承擔(dān)用戶因使用這些下載資源對(duì)自己和他人造成任何形式的傷害或損失。
最新文檔
- 澳門(mén)(2024年-2025年小學(xué)六年級(jí)語(yǔ)文)統(tǒng)編版隨堂測(cè)試(下學(xué)期)試卷及答案
- 高速公路項(xiàng)目計(jì)劃書(shū)
- xx市算力產(chǎn)業(yè)園項(xiàng)目可行性研究報(bào)告
- 二零二五年度國(guó)際貿(mào)易反擔(dān)保合同范本3篇
- 信息技術(shù)項(xiàng)目進(jìn)度安排
- 二零二五年度學(xué)生宿舍床鋪配置合同3篇
- 再生利用建設(shè)項(xiàng)目可行性研究報(bào)告申請(qǐng)立項(xiàng)備案
- 中科院2022年物理化學(xué)(甲)考研真題(含答案)
- 廣東省汕尾市2023-2024學(xué)年高一上學(xué)期期末教學(xué)質(zhì)量監(jiān)測(cè)化學(xué)試卷(含答案解析)
- 《熱電阻溫度傳感器》課件
- 抖音酒店直播可行性方案
- 信訪業(yè)務(wù)培訓(xùn)班課件
- 物資清運(yùn)方案及
- 熱穩(wěn)定校驗(yàn)計(jì)算書(shū)
- 北京市房山區(qū)2023-2024學(xué)年三年級(jí)上學(xué)期期末數(shù)學(xué)試卷
- 婦產(chǎn)科課件-子宮內(nèi)膜息肉臨床診療路徑(2022版)解讀
- 人教版六年級(jí)數(shù)學(xué)上冊(cè)典型例題系列之第三單元分?jǐn)?shù)除法應(yīng)用題部分拓展篇(原卷版)
- 課本含注音的注釋匯總 統(tǒng)編版語(yǔ)文八年級(jí)上冊(cè)
評(píng)論
0/150
提交評(píng)論