基于顏色不變性的圖像檢索算法研究論文_第1頁
基于顏色不變性的圖像檢索算法研究論文_第2頁
基于顏色不變性的圖像檢索算法研究論文_第3頁
基于顏色不變性的圖像檢索算法研究論文_第4頁
基于顏色不變性的圖像檢索算法研究論文_第5頁
已閱讀5頁,還剩38頁未讀, 繼續(xù)免費閱讀

下載本文檔

版權說明:本文檔由用戶提供并上傳,收益歸屬內容提供方,若內容存在侵權,請進行舉報或認領

文檔簡介

1、PAGE PAGE II學號:本科畢業(yè)論文學 院 計算機與信息技術學院 專 業(yè) 計算機科學與技術 年 級 姓 名 論文題目 基于顏色不變性的圖像檢索算法研究 指導教師 職稱 年月日目 錄 TOC o 1-3 h z u HYPERLINK l _Toc325563820 摘要 PAGEREF _Toc325563820 h 1 HYPERLINK l _Toc325563821 關鍵詞 PAGEREF _Toc325563821 h 1 HYPERLINK l _Toc325563822 Abstract PAGEREF _Toc325563822 h 1 HYPERLINK l _Toc32

2、5563823 Keywords PAGEREF _Toc325563823 h 1 HYPERLINK l _Toc325563824 1引言 PAGEREF _Toc325563824 h 2 HYPERLINK l _Toc325563825 2研究現(xiàn)狀 PAGEREF _Toc325563825 h 2 HYPERLINK l _Toc325563828 3顏色不變性描述 PAGEREF _Toc325563828 h 3 HYPERLINK l _Toc325563829 3.1顏色直方圖介紹 PAGEREF _Toc325563829 h 3 HYPERLINK l _Toc325

3、563830 3.1.1全局直方圖 PAGEREF _Toc325563830 h 3 HYPERLINK l _Toc325563832 3.1.2 累加直方圖 PAGEREF _Toc325563832 h 3 HYPERLINK l _Toc325563833 3.1.3 顏色直方圖構造過程及關鍵技術 PAGEREF _Toc325563833 h 4 HYPERLINK l _Toc325563835 3.2顏色不變性描述子介紹 PAGEREF _Toc325563835 h 5 HYPERLINK l _Toc325563836 3.2.1顏色不變性描述概要 PAGEREF _Toc

4、325563836 h 5 HYPERLINK l _Toc325563837 3.2.2基于圖像輪廓的顏色不變性描述子 PAGEREF _Toc325563837 h 5 HYPERLINK l _Toc325563838 3.2.3 基于顏色角度的顏色不變性描述子 PAGEREF _Toc325563838 h 6 HYPERLINK l _Toc325563839 3.3存在問題 PAGEREF _Toc325563839 h 8 HYPERLINK l _Toc325563840 4基于顏色不變性的特征提取研究和圖像檢索系統(tǒng) PAGEREF _Toc325563840 h 8 HYPE

5、RLINK l _Toc325563841 4.1 基于不變矩的顏色不變性描述 PAGEREF _Toc325563841 h 8 HYPERLINK l _Toc325563843 4.2不變矩 PAGEREF _Toc325563843 h 9 HYPERLINK l _Toc325563844 4.3不變矩特征提取流程 PAGEREF _Toc325563844 h 10 HYPERLINK l _Toc325563858 4.4圖像檢索系統(tǒng)流程 PAGEREF _Toc325563858 h 10 HYPERLINK l _Toc325563860 4.4.1圖像檢索系統(tǒng)概述 PAGE

6、REF _Toc325563860 h 11 HYPERLINK l _Toc325563862 4.4.2圖像檢索系統(tǒng)的目標 PAGEREF _Toc325563862 h 11 HYPERLINK l _Toc325563864 4.4.3圖像檢索系統(tǒng)流程 PAGEREF _Toc325563864 h 11 HYPERLINK l _Toc325563866 4.4.4圖像檢索系統(tǒng)功能及特點 PAGEREF _Toc325563866 h 11 HYPERLINK l _Toc325563870 5實驗結果及分析 PAGEREF _Toc325563870 h 12 HYPERLINK

7、l _Toc325563871 5.1實驗數(shù)據(jù)集分析 PAGEREF _Toc325563871 h 12 HYPERLINK l _Toc325563878 5.2算法性能分析 PAGEREF _Toc325563878 h 13 HYPERLINK l _Toc325563879 6總結與展望 PAGEREF _Toc325563879 h 14 HYPERLINK l _Toc325563880 6.1總結 PAGEREF _Toc325563880 h 14 HYPERLINK l _Toc325563881 6.2展望 PAGEREF _Toc325563881 h 14 HYPER

8、LINK l _Toc325563882 參考文獻 PAGEREF _Toc325563882 h 16PAGE 40基于顏色不變性的圖像檢索算法研究姓 名: 學號: 學 院:計算機與信息技術學院 專業(yè):計算機科學與技術指導老師 職稱摘要:在現(xiàn)代社會中,圖像檢索系統(tǒng)的發(fā)展越來越快,系統(tǒng)中所包含的圖像越來越多。當今的圖像檢索特征提取算法主要包括顏色直方圖、基于圖像的紋理和形狀等特征進行提取。顏色和形狀都是基于內容的圖像檢索系統(tǒng)中經(jīng)常使用的特征。在圖像檢索系統(tǒng)中提取與光照無關的、能夠刻畫物體表面物理反射特性的顏色特征,被稱為顏色不變性描述。與其他顏色特征計算相比,顏色不變形描述不需要精確的到圖像的

9、光照信息,在很多計算機視覺的實際應用問題中,顏色不變形描述子則顯得更為實用和重要一些。本文提出一種新算法,即利用不變矩公式進行顏色不變性特征計算。經(jīng)過大量實驗后,能夠表明不變矩算法在總體檢索效率上具有良好的性能。關鍵詞:顏色不變性;圖像檢索;不變矩;描述子Abstract:In modern society, the development of image retrieval system becomes more and more quickly, the system contained in the image more and more. Current image retrieva

10、l feature extraction algorithm mainly include color histogram, image based on the texture and shape features extraction. Color and shape are the content based image retrieval systems often use characteristics. In the system of image retrieval, extraction and illumination invariant to describe the su

11、rface physical reflection characteristics of color features, known as color invariant description. And other color feature computation compared, color deformation description need not accurate to the image of the light information, in many computer vision applications, color invariant shape descript

12、ors is more practical and important. This paper presents a new algorithm, namely the use of moment invariant color invariant feature calculation formula. After a lot of experiments, that moment invariants algorithm in overall retrieval efficiency with good performance.Keywords: color invariant; imag

13、e retrieval; moment invariant; descriptor1引言本文研究了基于顏色不變性的圖像檢索算法。一共提出了三種算法來進行試驗測試。第一種算法利用顏色直方圖進行檢索,此算法在檢索效率和準確率上大多不能滿足用戶的要求。第二種算法是基于物理反射率對顏色的一致性進行推導,得到一個顏色不變性計算公式,此種算法容易受到污點和陰影的影響。第三種算法是利用不變矩來推導一個顏色不變性計算公式,此算法不容易受到污點效應的影響,對第二種算法進行了有效的改進。算法的基本思想是對一幅圖中的所有像素點進行不變矩計算,把所有像素點映射到一個一維基本特征向量上,再由一維基本特征向量通過一些運算

14、消除規(guī)模因素的影響的到另一個一位復合特征向量,復合特征向量就是圖像顏色特征的一個表示。上述算法的共性是都擁有一個圖像檢索和匹配的過程。2研究現(xiàn)狀現(xiàn)階段對于利用顏色不變性進行圖像檢索,國內外已經(jīng)有一些成型的算法。圖像顏色不變性特征的算法描述主要有以下方法:1)基于物體反射率對顏色一致性的研究,國外學者提出了一種名為顏色不變形派生算法,這種算法用來匹配相鄰像素之間的比率。在此算法中,圖像成像時每個點的R、G、B值都與物體表面的反射率相關,由最基本的傳感器反映公式求微分把積分符號去掉后,可以得到一個像素點描述,然后把這個描述子求導進行演算后,把不必要的變量去掉能最終得到顏色不變性描述子。這個描述子把

15、每個點的R、G、B、進行了全新的定義,它可以有效的去除光照對物體成像的影響。2)對于上述算法國外有些學者進行了拓展,主要思想是在上述描述子特征基礎上,把三種獨立的顏色比率映射成兩種相互獨立的顏色比率,改進后的算法大大的改變了計算的效率,使得搜索效率大幅提高,這兩種描述子雖然考慮了光照條件對物體成像的影響,但是污點對算法檢索效率影響很大。3)上述兩種算法在圖像污點影響的處理上都沒有達到最佳的效果,由于圖像描述子是基于圖像上的每一個像素點來實現(xiàn)的,圖像上的很多像素點可能都是污點,這樣夾雜五點的顏色不變性描述肯定會有很大的缺陷,很多查詢結果就會失真。后來人們從顏色比率的公式來研究去除污點影響的算法,

16、最后得出結論,可以利用顏色比率的分散性來減少對圖像模糊的依賴性。由顏色比率公示推到出顏色入角公式,利用該公式進行顏色不變形描述并進行圖像特征的提取。4)顏色比率推導的不變性描述計算起來費時費力,在時間性能上往往達不到人們的要求。由此人們又對顏色比率推導出顏色不變性描述進行了更深入的推到和假設,最后又得到一個更加簡潔的不變性描述子,該不變性描述子利用了顏色恒常性和幾何光照不變性來減少圖像顏色比率對圖像模糊的敏感性,相比之前的顏色不變性描述子,從效率性能上進行了改進。上述四種算法都是利用顏色導數(shù)計算得到的,對于擁有豐富邊緣信息圖像,這些算法都不能把圖像特征提取完全,存在一定的缺陷。3顏色不變性描述

17、3.1顏色直方圖介紹圖像顏色特征最為直接的一種算法就是顏色直方圖,顏色直方圖反映的是圖像中顏色的組成分布,及出現(xiàn)了那些顏色以及出現(xiàn)的概率。3.1.1全局直方圖全局直方圖的定義如(1): h(k)=nk/N (1)其中,k代表圖像的像素值,nk代表顏色像素值為k的像素的個數(shù),N是圖像像素點的總數(shù)。全局制直方圖包含了該圖像中所有顏色值出現(xiàn)的頻數(shù),但是丟失了某像素所在的空間位置信息。直方圖與圖像是一對多的關系,正是由于這個原因,造成了直方圖在顏色特征上的表示誤差。由于顏色直方圖的圖像檢索結果的不穩(wěn)定性,人們對顏色直方圖又做了進一步的研究,把顏色直方圖進行了分解和累加。3.1.2 累加直方圖累加顏色直

18、方圖能增加直方圖的魯棒性,更準確的表示圖像的顏色信息。若一副圖像的某一特征的一般直方為H(p)=(hx1,hx2,.hxk),則該特征的累加直方圖能根據(jù)下面的式子計算得到: G(p)=(Gx1,Gx2Gxn) (2)上式說明了累加直方圖是圖像中的各個子直方圖的線性組合。 R G B R G B圖(1)圖像顏色直方圖圖(1)給出了一個圖像顏色直方圖的實例。從圖中可以看出,無論用哪種方法提取顏色直方圖,兩幅圖雖然場景內容完全一樣,但是由于光照影響,它們的顏色直方圖分布差異很大。顏色直方圖雖然具有對圖像的旋轉、縮放、仿射等變換的魯棒性,但是很容易受到光照變化的影響。因此,在實際的檢索系統(tǒng)中,無論直方

19、圖信息怎樣優(yōu)化,利用起所提取的顏色特征向量始終無法彌補光照條件帶來的檢索誤差。3.1.3 顏色直方圖構造過程及關鍵技術基于特征數(shù)據(jù)庫的直方圖構造可概括為兩個階段:首先確定直方圖的顏色集,然后任意一副圖像可以通過映射表量化到顏色集,經(jīng)過統(tǒng)計的到直方圖。具體步驟如下所示:首先轉換顏色空間;在圖像數(shù)據(jù)庫中統(tǒng)計各幅圖像各個顏色的概率分布;用直方圖的顏色集量化輸入圖像的到量化圖像;在量化后圖像上統(tǒng)計顏色直方圖,作為圖像的顏色信息的表示。 在以上各個階段采用不同的方法,都可以產(chǎn)生新的直方圖夠早算法,但是在各個階段如何選擇算法和參數(shù),尚沒有最佳的選擇。構造顏色直方圖的關鍵技術主要包括: 如何選擇直方圖代表顏

20、色集。顏色空間的選區(qū)和特征分析。如何使顏色空間、直方圖顏色集的選取更符合人眼的視覺特性。如何提高直方圖的構造速度。3.2顏色不變性描述子介紹3.2.1顏色不變性描述概要 圖像顏色不變性最重要的一個描述就是基于圖像派生的一種描述1。這種基于圖像派生描述的最大缺點是它們對圖像上污點變換是非常敏感的,圖像上污點的形成是基于很多音速的,例如在成像時焦距偏失,或是在成像時相機的移動及被成像時物體的移動,還有不正確的參數(shù)設置都有可能造成物體成像時出現(xiàn)污點。Ballard和Swaint2提出的顏色直方圖的算法不能有效的克服光照條件對于物體成像的影響?;谖矬w反射率對顏色一致性的一個模型,他們又推出了一個新的

21、顏色不變性描述子。這種顏色不變性描述子能夠克服光照變化對成像的影響。利用這種描述子進行圖像檢索的基本思想也是把描述子轉換為顏色直方圖,然后進行結果相似度匹配計算后輸出。這些不變性描述是依賴于光照幾何原理的,所以由于物體成像時的方向轉變或者相機的角度變換仍然能夠改變物體成像時的顏色不變性描述子。對于這個問題的解決方法被Gervers和Smeulders提出,他們介紹了一種顏色不變性描述子,這種顏色不變性描述子能夠克服光照對物體成像時的影響以及對光照幾何原理的依賴性。接下來將具體介紹幾個顏色不變性描述子,利用這些描述子,不僅能夠有效的克服物體成像污點的影響,并且還能夠適應不同光照對物體成像產(chǎn)生的一

22、系列影響。3.2.2基于圖像輪廓的顏色不變性描述子人類的傳感器把顏色映射到RGB空間,因此有CRGB.相機的敏感度用fC來表示,這樣就形成一個傳感器反映公示,如公式(3)所示: C(x)=mb(x)b(,x)e()fC()fC()d (3)其中mb代表一個能夠體現(xiàn)幾何光照變化的描述子,b代表物體表面的反射率e(),代表特殊的光照分布。如果假設函數(shù)(3)被積分出來,進行實體估計,進而上述公式能夠演化成以下算式,如式(4)所示: C(x)=mb(x)bc(x)ec (4) 這時,bc(x)=b(c,x), ec=e(c)。 首先假設光照幾何在計算中保持不變,則mb是獨立于x的。經(jīng)過這種假設這個公式

23、就可以叫做Mordian,或者叫做平滑公式。Funt和Finlayson推到了一個獨立于光照條件的顏色不變性描述子,及對上述公式求導如式(5)所示: c(x)= (bc(x)+ mb+ ec)= (5)上述公式只依賴于物體表面反射率,獨立于其他任何和光照有關的參數(shù)。公示下方的x是用來指示顏色空間的不同,這樣三個顏色通道就可以形成三個顏色比率即P=。現(xiàn)在推論另外一個模型希望能夠取代Mordian公式。無論觀看物體的角度或者物體的方向如何變換,mb(x)總與x成正比?;谏鲜鏊枷耄瑢剑?)做進一步推導,這個推導主要是由Gervers和Smeulders提出的,此公式具有顏色不變性和對幾何光照的

24、獨立性,如式(6)所示: =-= (6)上式中,D并且DC。由此三個顏色通道可以被映射到兩個獨立的顏色通道比率上,如式(7)所示: m= (7)3.2.3 基于顏色角度的顏色不變性描述子物體成像時被降級是由于污點的各種不良影響而造成的3。在成像時相機的顫動或者某些敏感參數(shù)變換都可以產(chǎn)生污點。上面介紹的兩種不變形描述子都是基于顏色導數(shù)空間得到的,因此,兩種顏色不變性描述子都依賴于圖像的邊緣信息。然而,由于圖像污點的不良影響,圖像的邊緣卻很容易受到圖像模糊的干擾。因此顏色不變性描述子p和m對圖像模糊非常的敏感。如圖(2)所示,同一場景下的兩幅圖像,由于相對運動造成的圖像模糊使得兩幅圖像的邊緣產(chǎn)生了

25、很大的差異。 圖(2)下面來討論成像時的污點造成上述兩種不變性描述子失真的根本原因,然后提出一個能夠克服的方法,并推導另外一個能降低顏色比率對五點的敏感性的不變性描述子。上面介紹的顏色比率被高斯在規(guī)模上進行派生計算。經(jīng)過計算后,一系列的顏色比率都有了一定的規(guī)模。利用高斯內核公式進行回旋計算,能夠構造一種污點效果,這種污點效果和在不同的規(guī)模上進行顏色比率的計算的效果是一樣的。這樣可推導出式(7): (7)也就是說,如果克服了在不同規(guī)模上進行顏色比率計算的不良效果,實際上污點的效果就隨之克服了。經(jīng)過推導得出對圖像模糊魯棒的描述子和分別如式(8)和(9)所示: arctan() (8) (9)3.3

26、存在問題在上述的一系列顏色不變性描述子中,不論是對圖像模糊敏感的描述子p和m,還是對模糊魯棒的描述子和都是基于圖像顏色導數(shù)空間計算得到的。因此他們都依賴于圖像的邊緣信息。對于邊緣豐富的圖像,如圖(3)A,基于邊緣的顏色不變性描述子還能夠很好的描述圖像的顏色特征。然而對于邊緣稀少紋理簡單的圖像,如圖(3)B,這些基于邊緣的描述子會造成大量的顏色信息的丟失。可能使圖像主體內容顏色信息丟失嚴重。圖(3)A原始圖像圖(3)B相機成像時抖動或其他原因造成的邊緣模糊的圖像4基于顏色不變性的特征提取研究和圖像檢索系統(tǒng)4.1 基于不變矩的顏色不變性描述在上面提到的比較經(jīng)典的顏色不變性描述子計算算法大體上可以分

27、成兩組1)基于物體表面反射率對顏色一致性的推導算法4。該類算法在傳感器反映公式的基礎上,進行一些假設,把變量轉換為常量。這種算法有效的去除了光照影響,但它存在一個缺陷,它對圖像污點不能很好的處理。Gervers和Smeuldes又提出了另外一種算法,它具有顏色不變性和對幾何光照理論的獨立性,其思想是把上述算法的三維空間映射到兩維空間上,進而提升了算法的效率。上述兩個算法雖然在技術上比較容易實現(xiàn),但是在現(xiàn)實生活中限制條件過多,有些假設條件不易滿足,所以說他們并不適合于現(xiàn)實生活的圖像檢索系統(tǒng)。2)基于顏色比率的公式進行推導的算法。該算法能夠圖像污點對檢索結果的影響。算法中主要由顏色角度公式進行推導

28、,得到一個獨立于顏色不變性和光照幾何不變性的公式。這個公式不依賴于規(guī)模,利用它進行顏色不變性計算,就可有效的去除污點的影響。 以上提到的所有顏色不變性特征描述算法都是在特定的成像假設基礎上推導出的,這些假設包括可能光源的集合、場景的空間或相機的焦距或者物體成像時的運動狀態(tài)以及其他一些可假定的條件。這些假設可能在實際生活中不能夠全部成立。為了克服這個缺點,下面基于不變矩理論,同時在原始圖像和邊緣圖像上提出一種新的顏色不變性描述子。4.2不變矩矩函數(shù)在圖像分析中有著廣泛的應用。一個從一幅圖像中計算出來的矩集,通常描述了該圖像形狀的全局特征,并提取了大量關于該圖像的不同類型的幾何特征信息4。矩特征主

29、要表征了圖像區(qū)域的幾何特征,又稱為幾何矩。由于具有旋轉、平移、尺度等特性的不變特征,所以又稱其為不變矩。在圖像處理中,幾何不變矩可以作為一個重要的特征來表示物體,據(jù)此特征對圖像進行分類等操作?,F(xiàn)在來考慮平面區(qū)域上的矩,對于數(shù)字圖像f(x,y),若它分段連續(xù)且只在XY平面上有限個點不為零,則可表明它的各階矩存在。區(qū)域的矩是用所有屬于區(qū)域內的點計算出來的,因而不易受噪聲和其他一些不良影響5。f(x,y)的p+q階矩陣如式(10)所示: f(x,y) (10)可以表明,唯一的被f(x,y)確定,反之也唯一的確定了f(x,y)。f(x,y)的p+q階中心矩可以定義為式(11):p(q (11)其中 (

30、12) (13)由上式可以推得,f(x,y) 的歸一化中心矩可以表示為式(14) ,其中 (14)根據(jù)歸一化的二階和三階中心矩Hu提出了七個幾何矩的不變量6,這些不變量滿足圖像平移、伸縮和旋轉不變性。在現(xiàn)代的凸顯愛那個檢索技術中,利用不變矩進行圖像的特征提取還是非常普遍的。圖像的矩不變量能夠提供圖像的信息,例如,圖像的總面積、圖像的中心坐標等。這些形狀特點又能進一步構造特征向量,而這些特征向量在圖像的平移、旋轉、尺度變化式保持不變。零階到三階矩陣用于描述總體水平上的圖像特征,而更高階的矩則含有更好的圖像細節(jié),但通常對噪聲敏感,所以通常利用其他變換方式減少或消除噪聲的影響。4.3不變矩特征提取流

31、程下面給出利用不變矩來描述顏色特征向量算法的步驟:1)利用VC讀取多媒體數(shù)據(jù)庫中一幅位圖圖像;2)分配一個三維數(shù)組存儲圖像中各個像素點信息;3)利用CDC指針把圖像讀入內存,循環(huán)遍歷圖像各個像素點;4)判斷像素值是否為(0,0,0);5)若否則三維數(shù)組中記錄相應像素點信息,即相應三維空間像素數(shù)加1,之后累加各顏色通道像素數(shù),把圖像有效像素點數(shù)再加1;6)若是則判斷圖像像素是否遍歷完畢,若否則轉步驟(3);7)若是則根據(jù)前面記錄的結果,求得圖像中三維顏色通道的平均值;8)循環(huán)遍歷保存顏色信息的三位數(shù)組,進而計算基本特征向量;9)判斷空間像素是否為0;10)若否則相應的基本特征向量進行累加運算,其

32、中像素點百分比項可用當前空間像素數(shù)除以圖像中有效像素點總數(shù)求得;11)若是則判斷三維空間是否歷練完畢,若否則轉步驟(8);12)若是則根據(jù)前面基本特征向量的結果,計算復合特征向量;4.4圖像檢索系統(tǒng)流程在前面的小節(jié)中,分別從兩個方面介紹了圖像檢索技術,一是圖像特征的提取,二是圖像檢索技術的應用7。接下來主要是基于內容的圖像檢索系統(tǒng)的總體流程?;趦热莸膱D像檢索實驗系統(tǒng),其設計目標是一個實驗性的框架系統(tǒng),主要作為各種檢索算法的測試平臺。在系統(tǒng)中,主要測試各個圖像特在圖像檢索中的有效性。4.4.1圖像檢索系統(tǒng)概述基于內容的圖像檢索系統(tǒng),可分為單機系統(tǒng)和分布式系統(tǒng)8。單機系統(tǒng)就是用戶檢索,數(shù)據(jù)存儲和

33、數(shù)據(jù)維護都在一臺工作站上進行,這適合于小型的檢索系統(tǒng)和實驗性的檢索系統(tǒng)。單機系統(tǒng)具有設計簡單,易于維護等優(yōu)點,缺點是不能很好的利用網(wǎng)絡資源。分布式也就是用戶檢索、數(shù)據(jù)存儲、數(shù)據(jù)維護等各個模塊分布在不同的服務器和工作站上,適用于大型的圖像檢索系統(tǒng)。4.4.2圖像檢索系統(tǒng)的目標本文所設計的圖像檢索系統(tǒng)是基于樣例圖像為主的檢索系統(tǒng),目標是通過對圖像特征的提取,利用精確的特征匹配技術對圖像顏色不變性特征進行匹配,實現(xiàn)精確的圖像檢索系統(tǒng)。系統(tǒng)中包括三種顏色不變性描述子,即顏色直方圖特征、由物體表面的反射率推導的顏色比率特征和利用不變據(jù)提取的顏色不變性特征向量。4.4.3圖像檢索系統(tǒng)流程在檢索開始前要進入

34、圖庫。入庫過程中,要對入庫圖像進行預處理,包括顏色空間轉換和量化等處理9?;趦热莸膱D像檢索的基本方法是在進行圖像檢索時,由用戶給定示例圖像,并給出檢索算法類型,由相應算法進行圖像預處理病提取該圖像的不變形特征向量,由相似度匹配模塊把檢索示例的圖像特征與多媒體數(shù)據(jù)庫內的各個圖像特征進行相似度量,圖像提取模塊將圖像檢索結果按照相似度大小排列返回給用戶,從而完成檢索。4.4.4圖像檢索系統(tǒng)功能及特點本文利用VC和MFC框架實現(xiàn)了顏色直方圖檢索算法、基于物體表面反射率對顏色一致性算法以及不變矩描述顏色不變性的算法9。該檢索系統(tǒng)具有以下特點:1)圖像是BMP類型的圖像,圖像大小統(tǒng)一為636468像素;

35、2)提供圖像入庫功能,用戶可以隨意選擇需要的圖像,如果不是圖庫中圖像,將圖像路徑拷貝至圖像數(shù)據(jù)庫中的查詢圖像路徑存儲即可。5實驗結果及分析5.1實驗數(shù)據(jù)集分析在本文所實現(xiàn)的圖像檢索系統(tǒng)多媒體數(shù)據(jù)庫中一共有11個光源照射成像,每個光源提取30張場景圖,共有33張圖像。圖(3)顯示了在一個光源下這些場景之中的所有圖像。這些圖像含有不同程度的光照效果。實驗程序如下所述:首先,構建一個新的場景。然后將一個用于參考的白色標準板放到該場景的中間,和光源的方向垂直。光源的位置擺放應使得圖像中不完整像素個數(shù)達到最少。這意味著如果在場景中間有熒光,圖像就會特意的曝光不足。然后得到了一張在白色標準板上成像的圖像,

36、這個圖像就代表了光源的顏色。最后把白色標準版去掉,放上場景和物體,并且取50張連續(xù)的圖片平均來獲得最終的輸入圖像,然后對剩下的10個光源重復這個過程,進而移至下一個場景繼續(xù)進行圖像提取。在上面描述的過程結束后,圖像就和原場景的顏色輻射成比例了,并且明顯的比利用相同的攝像機照射出來的單張圖像清晰。應該注意到提取的平均化對一些噪聲源和鏡頭的閃爍并沒有幫助。上述過程提取的圖像可以1以10倍的因子比例化,并且沒有導致太多的噪音,在視覺上比得上正常曝光的圖像,跟所期待的改進相一致。在線性化和其他調整后,圖像的灰度水平范圍大約為0到240.一些算法對在一個或更多的顏色通道上的小數(shù)值是敏感的,因此在應用完上

37、述的線性化和其他的糾正后,還應去除任何R、G或B值大于240的像素點。這些像素同樣也可能是修剪過的10。使用比實際修剪水平稍低的值是因為框架平均化過程或者噪音都有可能對像素值的修剪。要盡可能的在圖像的捕捉過程中避免修剪,因為這些修剪可能只能適用于圖像中的一小部分像素。 圖(3)用于實驗學習的場景圖,每幅圖像在11個光源下成像5.2算法性能分析1)顏色直方圖算法只是機械的把圖像顏色信息完整提取,對每個像素點的顏色值不做任何改動,這樣導致的結果為其對光照變化不能有很好的適應性,在選擇去光算法時,不能選取直方圖算法作為算法備選集。在適應光照變化影響方面,基于物體表面反射率對顏色一致性推導算法和不變矩

38、算法要優(yōu)于顏色直方圖算法11。2)對提取邊緣信息不豐富的結果集,基于物體表面反射率推倒的算法很有局限性。在實驗三中,無論是從單次訓練的角度還是從整體圖像集的角度來看,其性能都很差,而不變矩算法在每次訓練時幾乎都能把所有正確結果檢索出,而且檢出的結果在最終的檢索結果中排名靠前和集中,可見不變矩算法在這方面性能要優(yōu)于物體表面反射率模型算法,其細致、全面的體現(xiàn)圖像的顏色的本質內容,較好解決了圖像邊緣信息較少與圖像特征提取算法之間的沖突。3)不變矩算法提取的顏色不變性描述子對光照的光譜變化具有很好的魯棒性,即不受光照變化帶來的對圖像顏色的影響。上面提出的基于不變矩的顏色不變性描述子在整個推導過程中,始

39、終是以消除光照影響為目的進行的,因此理論上顏色不變性描述子具有此項魯棒性12。6總結與展望6.1總結本文研究了基于顏色不變性的圖像檢索問題,現(xiàn)有算法雖然能夠在技術上去除光照條件的影響,但是這些算法都要基于特定成像假設,比如可能光源的集合、光的波長、光譜特征或者其他一些可假定的條件,而沒有一種通用的算法能夠很好的適應現(xiàn)實生活中基于顏色不變性的圖像檢索系統(tǒng)。再加上顏色本身的不穩(wěn)定性,很容易受到光照變化的影響,獲取一種對光照魯棒的、具有顏色恒長性功能的顏色描述子對整個計算機視覺系統(tǒng)來說是非常重要的。本文正是提出這樣一種算法,拋棄一些假設條件,能夠直接針對圖像本身來進行顏色不變性秒數(shù)字的計算,算法的性

40、能很優(yōu)異,并且能夠去除顏色特征對圖像污點的敏感性。本文實現(xiàn)了三種算法進行對比研究。第一種算法為最傳統(tǒng)的顏色直方圖算法,這種算法無論從準確度還是時間上都遠不能滿足用戶對檢索的需求。第二種算法為基于物體表面反射率對顏色一致性推導的顏色不變性特征描述,這種算法容易受到圖像污點的影響。如果圖像邊緣特征比較稀少,邊緣的顏色不變性描述子還會丟失大量的顏色信息,所以在現(xiàn)實生活中的應用很少。第三種算法是基于不變矩理論,提出一種新的顏色不變性描述子,這種描述子不僅能夠表現(xiàn)原始圖像的顏色特征,而且對于邊緣特征稀少的圖像,也能全面的提取圖像顏色特征信息,從而更全面的對圖像的顏色進行描述。6.2展望在現(xiàn)實生活中有著不

41、可預測的大量圖像集,所以任何某個單一的算法并不能適合所有的情況。顏色不變性計算方法的一個重要方向是如何有效的提取圖像原始顏色的基本特征,而且要求所提取的顏色特征既不受光照的影響,也不受物體成像時污點的影響?;诓蛔兙乩碚摰乃惴ㄟm應性很強,而算法的計算復雜度卻明顯降低,所以這一方向已經(jīng)越來越受到重視。另外光照條件作為光照的一個特殊情況,主要存在兩種光源太陽光(Suanlight)和天空光照(Skylight)5,因此可以進一步增加顏色不變性的限制條件。并且戶外光照下的顏色不變性計算具有較強的實用意義和應用前景,戶外光照條件下的顏色不變性計算將成為的顏色不變性計算的一個熱點。參考文獻: 1R.L.

42、Lagendijk,J.Biemond.Basic Methods For Image Restoration And Identification.The Image And Video Processing Handbook,A.Bovik,Ed,Academic Press.1999:125-139.2M.J.Swain,D.H.Balland.Color.Idexing.International Jumal Cmputer Vision.1991.3Gonzalez R C,Woods R E.Digital Image Procesing.2rd.ed. Addison-Wesle

43、y.2002.4Milan Sonka,Vaclav Hlavac and Roger Boyle. Digital Image Processing.Analysis and Machine vision. 2rd.ed. Thomson Learning and PT Press,2001.4王耀明.圖像的矩函數(shù)原理、算法及應用.華東理工大學出版社.2002.5李兵.顏色恒常性計算研究,北京交通大學博士論文.2009.6高鷹.免疫粒子群優(yōu)化算法.計算機工程與應用.2004,40(6):4-67李向陽,莊越挺,潘云鶴.基于內容的圖像檢索技術與計算機研究與發(fā)展.2001,38(3):344-3

44、54.8牛玲.基于貝葉斯推理的顏色恒常性計算.北京交通大學.碩士論文.2008.9蔡珣,孟祥旭,向輝.光照色調顏色恒常性算法研究.中國圖形圖像學報.2004.10馮松鶴.面向感知的圖像檢索及自動標注算法 研究.北京交通大學.博士論文.2009.11阮秋琦.數(shù)字圖像處理.北京:電子工業(yè)出版社,2001.12容觀澳.計算機圖像處理.北京:清華大學出版社,2000.附錄資料:不需要的可以自行刪除 C語言-INT10中斷號視頻服務程序00H(設置視頻模式)輸入: AH=00H AL=視頻模式輸出: 無 說明:視頻服務程序00H用來設置視頻配置為表10-l中列出之一。AL寄存器給定所需視頻模式。若設置了

45、新視頻模式,則清除屏幕。 視頻服務程序0lH(設置光標大小)輸入: AH=01H CH=光標開始掃描行 CL=光標結束掃描行輸出: 無說明:該服務程序用于正文模式。在一個字符單元內由一行或幾行組成的光標將在字符顯示位置得閃爍。該服務程序定義光標的顯示行數(shù)。對CGA模式,8掃描行(07)用于光標。對EGA模式,使用14行(013)。MCGA和VGA適配器,光標可具有16掃描行(015)高。缺省設置如下: CGA: CH6,CL7 EGA: CHll,CL12 MCGA和VGA: CH量13,CL1 視頻服務程序02H(設置光標位置)輸入: AH=02H BH=光標頁號 DH=光標行號 DL=光標

46、列號輸出: 無說明:該服務器序用于將光標移到指定行和列位置。該服務程序即可用于正文模式也可用于圖形模式;然而,僅在正文模式下才顯示光標。屏幕左上角為坐標系統(tǒng)的原點。對支持多頁的正文和圖形模式,則必須指定頁號,以保證光標位置正確。視頻服務程序03H(讀光標位置)輸入: AH=03H BH=頁號輸出: CH=光標開始行 CL=光標結束行 DH=行號 DL列號說明:該服務程序用于獲取光標大小和位置。BH給定了頁號。CH中存放光標開始掃描行,而CL中為光標結束掃描行。DH中存放行位置,DL中為列位置。視頻服務程序05H(設置活動顯示頁)輸入: AH=05H AL=活動頁號輸出: 無 說明:該服務程序為

47、正文和圖形模式用來設置活動顯示頁號。AL指定所需頁號。對多數(shù)正文模式,頁號范圍為0一7。對具有足夠視頻緩沖EGA和VGA適配器,可支持多頁圖形。對所有正文和圖形模式,缺省為0頁。視頻服務程序06H(向上翻滾活動窗口)。輸入:AH=06HAL=翻滾行數(shù)BH=空白行屬性CH左上角行號CL=左上角列號 DH右下角行號 Dl右下角列號輸出: 無 說明:該服務程序用來創(chuàng)建和翻滾一正文窗口。CH和CL中給出了正文窗口左上角坐標,DH和DL中給出了正文窗口右下角坐標。AL中定義了翻滾的行數(shù)。若AL00H,則正文窗口為空白。當滾動窗口時,底部行是空白行,其屬性由BH中指定。視頻服務程序07H(向下翻滾窗口)輸

48、入:AH=07HAL=翻滾行數(shù)BH=空白行屬性CH=左上角行號CL=左上角列號DH=右下角行號DL=右下角列號輸出: 無說明:該服務程序用來創(chuàng)建和翻滾一正文窗口。CH和CL中給出了正文窗口左上角坐標,DH和DL中給出了正文窗口右下角坐標。AL中定義了翻滾的行數(shù)。若AL00H,則正文窗口為空白。當滾動窗口時,頂部行為空白,其屬性由BH中指定。視頻服務程序08H(讀字符和屬性)輸入: AH=08H BH=活動頁號輸出: AH=字符屬性 AL=字符碼說明:該服務程序用于讀取正文或視頻模式下,光標所在處字符。在圖形模式下,獲取的字符同圖形模式下使用的字符生成表有關。在正文模式下,將獲得字符的ASCII

49、碼。字符屬性存放在AH中,字符ASCII碼存放在AL中。圖形模式下,AH中內容無意義.視頻服務程序09H(寫字符和屬性)輸入: AH09H AL=寫字符的ASCII碼 BL=寫字符的屬性 BH=活動頁號 CX=重復寫字符和屬性次數(shù)輸出: 無 說明:該服務程序寫一個字符到屏幕當前光標處。AL中指定字符碼。正文模式下,BL中指定字符屬性。圖形模式下,BL指定背景顏色。字符可重復寫。CX為寫字符及屬性的次數(shù)。視頻服務程序0FH(取當前視頻模式)輸入: AH0FH輸出: AH每行字符數(shù) AL當前顯示模式 BH活動頁號說明:該服務程序用來獲取當前視頻模式,屏幕寬(以字符計),以及活動顯示頁號;視頻顯示模

50、式存放在AL中。屏幕寬度(以字符計)存放在AH中,活動頁號存放在BH中。文件相關函數(shù)函數(shù)名: fopen功 能: 打開一個流用 法: FILE *fopen(char *filename, char *type);函數(shù)名: fclose功 能: 關閉一個流用 法: int fclose(FILE *stream); fopen()函數(shù)提供了幾種打開文件的方式,這是由其字符指針參數(shù)type決定的。以下給出打開方式列表:參數(shù)作用R只讀W新建、可寫,如果文件存在則覆蓋A存在則在文件后附加,如果不存在則新建后寫r+更新一個存在的文件(讀和寫)w+增加一個新的文件更新(讀和寫),如果文件存在則覆蓋a+存

51、在則在文件后附加(讀和寫),如果不存在則新建后更新(讀和寫)*以文本模式打開一個存在或新建的文件,附加”t”在參數(shù)后(rt, w+t, etc.)。*以二進制模式打開一個存在或者新建的文件,附加”b”在參數(shù)后(wb, a+b, etc.)。函數(shù)名: fseek功 能: 重定位流上的文件指針用 法: int fseek(FILE *stream,long offset,int fromwhere); 讀取文件函數(shù):函數(shù)名: fread功 能: 從一個流中讀數(shù)據(jù)用 法: int fread( void *ptr, int size, int nitems, FILE *stream ); 寫入文件

52、函數(shù):函數(shù)名: fwrite功 能: 寫內容到流中用 法: int fwrite( void *ptr, int size, int nitems, FILE *stream ); fseek()函數(shù)提供了文件指針的三個初始位置,這是由其參數(shù)fromwhere決定的,以下給出其列表:常量值文件定位SEEK_SET0從文件頭開始尋找SEEK_CUR1從文件當前位置開始尋找SEEK_END2從文件最后開始尋找函數(shù)名: fprintf功 能: 傳送格式化輸出到一個流中用 法: int fprintf( FILE *stream, char *format, argument,. );函數(shù)名: fsc

53、anf功 能: 從一個流中執(zhí)行格式化輸入用 法: int fscanf( FILE *stream, char *format,argument. );發(fā)聲函數(shù)函數(shù)名: sound功 能: 以指定頻率打開PC揚聲器用 法: void sound(unsigned frequency);函數(shù)名: nosound功 能: 關閉PC揚聲器用 法: void nosound(void);常規(guī)內存操作函數(shù)申請函數(shù):malloc(),farmalloc(),calloc(),farcalloc(),realloc(),farealloc()函數(shù)名: malloc功 能: 內存分配函數(shù)用 法: void *

54、malloc(unsigned size);函數(shù)名: farmalloc功 能: 從遠堆中分配存儲塊用 法: void far *farmalloc(unsigned long size);函數(shù)名: calloc功 能: 分配主存儲器用 法: void *calloc(size_t nelem, size_t elsize);函數(shù)名: farcalloc功 能: 從遠堆棧中申請空間用 法: void far *farcalloc( unsigned long units, unsigned ling unitsz );函數(shù)名: realloc功 能: 重新分配主存用 法: void *real

55、loc(void *ptr, unsigned newsize);函數(shù)名: farrealloc功 能: 調整遠堆中的分配塊用 法: void far *farrealloc( void far *block, unsigned long newsize );使用函數(shù):memcpy(),memset(),memmove(),movedata()函數(shù)名: memcpy功 能: 從源source中拷貝n個字節(jié)到目標destin中用 法: void *memcpy(void *destin,void *source,unsigned n);函數(shù)名: memset功 能: 設置s中的所有字節(jié)為ch,

56、s數(shù)組的大小由n給定用 法: void *memset(void *s, char ch, unsigned n);函數(shù)名: memmove功 能: 移動一塊字節(jié)用 法: void *memmove(void *destin,void *source,unsigned n);函數(shù)名: movedata功 能: 拷貝字節(jié)用 法: void movedata(int segsrc, int offsrc, int segdest, int offdest, unsigned numbytes);釋放函數(shù):free(),farfree()函數(shù)名: free功 能: 釋放已分配的塊用 法: void

57、free(void *ptr);函數(shù)名: farfree功 能: 從遠堆中釋放一塊用 法: void farfree(void);指針操作函數(shù):MK_FP(),FP_OFF(),FP_SEG()函數(shù)名: MK_FP功 能: 設置一個遠指針用 法: void far *MK_FP(unsigned seg, unsigned off);函數(shù)名: FP_OFF功 能: 獲取遠地址偏移量用 法: unsigned FP_OFF(void far *farptr);函數(shù)名: FP_SEG功 能: 獲取遠地址段值用 法: unsigned FP_SEG(void far *farptr);如果想知道還剩

58、下多少常規(guī)內存,我們可以使用以下函數(shù):函數(shù)名: coreleft()功 能: 獲取空閑內存用 法: unsigned coreleft(void);函數(shù)名: farcoreleft()功 能: 獲取遠堆空閑內存用 法: unsigned long farcoreleft(void);XMS功能調用索引表:功能號功能版本功能00H功能01H功能02H功能03H功能04H功能05H功能06H功能07H功能08H功能09H功能0AH功能0BH功能0CH功能0DH功能0EH功能0FH功能10H功能11H取XMS版本號請求高內存區(qū)HMA釋放高內存區(qū)HMA全程啟用A20全程停用A20局部啟用A20局部停用

59、A20查詢A20狀態(tài)查詢自由擴展內存分配擴展內存塊釋放擴展內存塊移動擴展內存塊鎖住擴展內存塊擴展內存塊解鎖取EMB句柄信息重新分配擴展內存塊請求上位存儲塊UMB釋放上位存儲塊UMBXMS規(guī)范V2.0XMS規(guī)范V2.0XMS規(guī)范V2.0XMS規(guī)范V2.0XMS規(guī)范V2.0XMS規(guī)范V2.0XMS規(guī)范V2.0XMS規(guī)范V2.0XMS規(guī)范V2.0XMS規(guī)范V2.0XMS規(guī)范V2.0XMS規(guī)范V2.0XMS規(guī)范V2.0XMS規(guī)范V2.0XMS規(guī)范V2.0XMS規(guī)范V2.0XMS規(guī)范V2.0XMS規(guī)范V2.0XMS功能調用函數(shù)1. 測試xms是否存在使用中斷2fH的43H(AH)功能的00H(AL)子功

60、能,可以獲得是否安裝了XMS驅動程序的信息,如果AL返回為80H則說明XMS安裝了。以下給出具體函數(shù):char test_xms() asm mov ax,0 x4300int 0 x2f if (_AL=0 x80) XMS=1; return(XMS);2. 獲取xms驅動程序入口地址使用中斷2fH的43H(AH)功能的10H(AL)子功能,可以獲得xms驅動程序入口地址,返回的ES:BX便是具體的入口。以下給出具體函數(shù):void get_driver_address() if (XMS) asm mov ax,0 x4310 /功能號43H int 0 x2f /調用中斷2fH xms=

溫馨提示

  • 1. 本站所有資源如無特殊說明,都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請下載最新的WinRAR軟件解壓。
  • 2. 本站的文檔不包含任何第三方提供的附件圖紙等,如果需要附件,請聯(lián)系上傳者。文件的所有權益歸上傳用戶所有。
  • 3. 本站RAR壓縮包中若帶圖紙,網(wǎng)頁內容里面會有圖紙預覽,若沒有圖紙預覽就沒有圖紙。
  • 4. 未經(jīng)權益所有人同意不得將文件中的內容挪作商業(yè)或盈利用途。
  • 5. 人人文庫網(wǎng)僅提供信息存儲空間,僅對用戶上傳內容的表現(xiàn)方式做保護處理,對用戶上傳分享的文檔內容本身不做任何修改或編輯,并不能對任何下載內容負責。
  • 6. 下載文件中如有侵權或不適當內容,請與我們聯(lián)系,我們立即糾正。
  • 7. 本站不保證下載資源的準確性、安全性和完整性, 同時也不承擔用戶因使用這些下載資源對自己和他人造成任何形式的傷害或損失。

評論

0/150

提交評論