版權(quán)說(shuō)明:本文檔由用戶提供并上傳,收益歸屬內(nèi)容提供方,若內(nèi)容存在侵權(quán),請(qǐng)進(jìn)行舉報(bào)或認(rèn)領(lǐng)
文檔簡(jiǎn)介
1、海 南 大 學(xué)畢 業(yè) 論 文(設(shè)計(jì))題 目: 圖像檢索系統(tǒng)的設(shè)計(jì)與研究 學(xué) 號(hào): vv 姓 名: www 年 級(jí): 2010級(jí) 學(xué) 院: vv 系 別: vv 專(zhuān) 業(yè): vv 指導(dǎo)教師: 完成日期: 年 月 日 摘 要本次研究主要是基于顏色和形狀兩種特征的圖像檢索系統(tǒng)的設(shè)計(jì),其包括特征提取和相似度計(jì)算兩個(gè)主要的技術(shù),當(dāng)顏色、形狀等圖像特征被提取后,形成了特征向量,圖像檢索系統(tǒng)的關(guān)鍵在于計(jì)算出數(shù)據(jù)庫(kù)圖像特征與圖像檢索的距離,當(dāng)下使用較為廣泛的相似度提取技術(shù)是基于歐氏距離函數(shù)來(lái)測(cè)度的。 圖像檢索系統(tǒng)采用visual c+ 6.0運(yùn)行環(huán)境下開(kāi)發(fā)實(shí)現(xiàn),設(shè)置幾種檢索途徑,顏色、形狀以及綜合兩種物理特征的
2、三種方法,輸入待檢索圖像利用上述特征從圖像庫(kù)里面預(yù)先存在的多種圖像檢索出與之相似的圖像,并按一定順序排列出一組結(jié)果,將結(jié)果顯示出來(lái)。關(guān)鍵字:顏色空間轉(zhuǎn)換;顏色特征;形狀特征;不變矩;歐氏距離;otsu法abstract this research is mainly about color and shape of image retrieval system ,which is designed based on two kinds of features, including feature extraction and similarity calculation of two main
3、 technology, when the color, shape and other image features are extracted to form the feature vector, image retrieval system, the key is to calculate the database image features and image retrieval distance at present, using similarity extraction techniques are widely used to measure based on euclid
4、ean distance function. image retrieval system using visual c+ 6 runtime environment development environment, set several retrieval approach, three kinds of method of color, shape and two physical characteristics, input to the variety of image retrieval using the features from the image repository of
5、 pre-existing images are similar, and are arranged according to a certain order of a group the results, the results are displayed. key words:color space conversion;color feature;shape feature;invariant moment ;euclidean distance;otsu method目錄1.緒論(1)1.1選題背景(1)1.2圖像檢索新方法的研究(2)1.2.1基于內(nèi)容的檢索方法概述(2)1.2.2基
6、于內(nèi)容的查詢方法和基于文本的查詢方法相比(2)2. cbir系統(tǒng)的核心技術(shù)原理(3)2.1圖像特征提取技術(shù)(3)2.1.1.基于顏色特征(3)2.1.2.基于形狀特征(7)2.1.3紋理特征(8)2.1.4.空間關(guān)系特征(8)2.1.5圖像特征提取的性能評(píng)價(jià)標(biāo)準(zhǔn)(8)2.2相似度計(jì)算技術(shù)(9)3. 系統(tǒng)分析(9)3.1需求分析(9)3.2實(shí)現(xiàn)環(huán)境(10)3.3系統(tǒng)的功能(10)3.4總體結(jié)構(gòu)與流程(10)3.4.1總體結(jié)構(gòu)圖(10)3.4.2主要流程圖(11)4.系統(tǒng)實(shí)現(xiàn)(12)4.1系統(tǒng)設(shè)置模塊(12)4.1.1需要檢索用戶圖像模塊設(shè)置(13)4.1.2檢索庫(kù)掃描模塊設(shè)置(13)4.2 圖像
7、檢索模塊 (系統(tǒng)核心部分)(14)4.2.1檢索引導(dǎo)模塊(15)4.2.2特征提取模塊(16)4.2.3相似度計(jì)算模塊(17)4.2.4結(jié)果處理和顯示模塊(18)5.程序調(diào)試及界面效果(18)6.個(gè)人總結(jié)和體會(huì)(22)致謝(23)參考文獻(xiàn)(23)1.緒論1.1選題背景 如今信息技術(shù)發(fā)展十分迅速,各種形式的信息數(shù)量也在迅速增長(zhǎng)中,人們對(duì)圖像信息的需求也不斷擴(kuò)大,日常生活當(dāng)中充斥著豐富多樣的圖像信息,那么,人們應(yīng)該如何做到在這么多選擇中快速地找到自己需要的圖像信息,這也漸漸的引起了越來(lái)越多人們關(guān)注。怎樣提供一種快速有效的方法來(lái)檢索這些內(nèi)容豐富的圖像信息的方法或者途徑,儼然,這已經(jīng)成為當(dāng)今圖像檢索領(lǐng)
8、域的一個(gè)至關(guān)重要的研究熱點(diǎn)。 縱觀傳統(tǒng)的圖像檢索技術(shù),大多都是基于文本的檢索技術(shù)。文本檢索技術(shù)可以追溯到70年代末,它依靠人工對(duì)圖像進(jìn)行手工注解,然后根據(jù)關(guān)鍵字對(duì)圖像進(jìn)行檢索,用對(duì)圖像的一些描述信息來(lái)作為檢索時(shí)的關(guān)鍵字,如作者、標(biāo)題、大致內(nèi)容、創(chuàng)作時(shí)間等。廣泛流行的商用搜索引擎,如g00gle、百度。目前很多大型圖像數(shù)據(jù)庫(kù)以及web上大部分的圖像搜索引擎使用的都是這種技術(shù)。在這些圖像庫(kù)或搜索引擎中,圖像只被松散地按類(lèi)組織在一起,比如:人體、動(dòng)物、自然場(chǎng)景等等。所有這些圖像的索引都由人工標(biāo)注,在標(biāo)注過(guò)程中,標(biāo)注者列出他認(rèn)為重要的或用戶可能會(huì)感興趣的物體以及對(duì)圖像的描述。這種基于文本的圖像檢索方式
9、的缺陷在于:一是要對(duì)規(guī)模不斷龐大的圖像庫(kù)一一進(jìn)行人工標(biāo)注,代價(jià)和工作量太大;二是由于圖像中包含著極為豐富的信息,而不同的人對(duì)于圖像會(huì)有不同的感知與理解,因此難以避免標(biāo)注過(guò)程中的主觀性和不精確性。將基于文本關(guān)鍵字的檢索方法直接應(yīng)用到圖像檢索中會(huì)存在很多局限性1。本次研究主要是在傳統(tǒng)文本檢索方式的基礎(chǔ)上,引出如今使用廣泛的檢索技術(shù),基于內(nèi)容的檢索方式(content based image retrieval,cbir)。 采用cbir方法開(kāi)發(fā)的第一個(gè)功能較為齊全的系統(tǒng)是ibm公司almadell研究中心開(kāi)發(fā)的基于圖像內(nèi)容查詢(query by image content,qbic)系統(tǒng),它利用顏
10、色、形狀、紋理和草圖等多種方法進(jìn)行檢索,給出用戶示例圖像或草圖,可在圖像庫(kù)中找到相似的圖像來(lái)。 美國(guó)加州大學(xué)伯克利分校與加州水資源部合作進(jìn)行了chabot計(jì)劃,開(kāi)發(fā)系統(tǒng)用于檢索水資源部大量的水資源方面的圖片。另外,密歇根州立大學(xué)也開(kāi)發(fā)了一種商標(biāo)、圖標(biāo)圖像檢索系統(tǒng),該系統(tǒng)通過(guò)計(jì)算歸一化的顏色直方圖之間的歐氏距離,并用canny算子提取邊緣點(diǎn),用邊緣點(diǎn)的方向直方圖來(lái)表示形狀,從而綜合了顏色和形狀兩種特征,使得檢索精確度有較大的提高。 目前,國(guó)內(nèi)也有很多研究機(jī)構(gòu)和人員在積極參與研究與cbir的圖像檢索方法,并有許多成果出現(xiàn),本次研究主要是本著學(xué)習(xí)的態(tài)度探索綜合顏色與形狀特征的檢索方法。1.2圖像檢索
11、新方法的研究 由于各個(gè)領(lǐng)域?qū)D像信息的大量需求,這樣就不得不使研究人員不斷創(chuàng)新、思考,實(shí)現(xiàn)更加有效的、快速并且準(zhǔn)確的檢索辦法,如今,圖像檢索的方法主要是基于內(nèi)容的檢索。1.2.1基于內(nèi)容的方法概述 基于內(nèi)容的圖像檢索(cbir)是基于內(nèi)容檢索技術(shù)的一種側(cè)重于提取圖像本身特征的一種檢索方法。利用圖像特征來(lái)表征的圖像的內(nèi)容,而基于內(nèi)容的檢索就是將兩幅不同圖片的特征按照一定的方法進(jìn)行比較、匹配,一般采用相似性度量來(lái)實(shí)現(xiàn)的,顯然,圖像特征的提取是圖像特征匹配的首要任務(wù)。 圖像的特征分為低層物理特征和高層語(yǔ)意特征兩大類(lèi),前者主要是依據(jù)圖像的視覺(jué)特征,例如顏色、形狀、紋理、輪廓以及空間關(guān)系等。后者主要是對(duì)
12、物體進(jìn)行識(shí)別和解釋?zhuān)柚祟?lèi)的知識(shí)推理,如對(duì)圖像的個(gè)人感受等。高層特征大多是通過(guò)人工注釋的方法來(lái)實(shí)現(xiàn),即基于文本的檢索的傳統(tǒng)方法,此方法不易實(shí)現(xiàn)自動(dòng)化且主觀色彩太強(qiáng),不利于標(biāo)準(zhǔn)化的實(shí)現(xiàn)。相比之下,低層次的特征更加容易提取,能夠更客觀地反映出兩幅圖像之間的異同之處。1.2.2基于內(nèi)容的查詢方法和基于文本的查詢方法相比前者的擁有的優(yōu)勢(shì)如下:(l)將圖像中提取出來(lái)的顏色、形狀、紋理等真實(shí)特征作為檢索的依據(jù),而不是根據(jù)的圖片的名稱、文字信息和索引關(guān)系;(2)采用近似查詢的方法對(duì)視覺(jué)特征進(jìn)行相似性度量。(3)可使用實(shí)例查詢語(yǔ)言qbe(query by example),創(chuàng)建示例表來(lái)編寫(xiě)查詢。即給出
13、示例圖像,從圖庫(kù)中查找與之相似的結(jié)果圖像來(lái)。 cbir并不需要計(jì)算機(jī)識(shí)別出具體的目標(biāo)是什么,計(jì)算機(jī)可以在完全不了解具體內(nèi)容的意義的情況下,而找出若干幅類(lèi)似的圖像來(lái),另外,圖像檢索是模糊的相似性判斷,檢索結(jié)果應(yīng)盡可能包含圖像庫(kù)中的所有相關(guān)圖像,并且允許在結(jié)果中存在不相關(guān)的圖像。2. cbir系統(tǒng)的核心技術(shù)原理 cbir的核心是利用圖像的視覺(jué)特征對(duì)圖像進(jìn)行檢索。它是一種近似匹配技術(shù),融合了計(jì)算機(jī)視覺(jué)、圖像處理、圖像理解和數(shù)據(jù)庫(kù)等多個(gè)領(lǐng)域的技術(shù)成果,其中的特征提取和索引的建立可由計(jì)算機(jī)自動(dòng)完成,避免了人工描述的主觀性。因此,基于內(nèi)容的圖像檢索是一個(gè)綜合的學(xué)科領(lǐng)域,而實(shí)現(xiàn)一個(gè)cbir系統(tǒng)也必須要考慮以
14、下幾個(gè)關(guān)鍵的步驟:(1)確定研究的的圖像特征或幾種綜合特征。(需要考慮適當(dāng)?shù)念伾臻g);(2)選擇有效的特征提取算法;(3)根據(jù)相似性度計(jì)算方法確定相似圖像結(jié)果;2.1基于內(nèi)容的幾種圖像特征提取技術(shù) 2.1.1.基于顏色特征 基于顏色特征的檢索是圖像最底層、最直觀的統(tǒng)計(jì)圖像的一種全局物理特性,很多情況下,顏色是描述一幅圖像最簡(jiǎn)單、最有效的特征,具有旋轉(zhuǎn)不變性、平移不變性和尺度不變性的特點(diǎn),具有一定的穩(wěn)定性。顏色的表示取決于色彩空間的選擇,不同的場(chǎng)合采用的方式也是不同,在大多數(shù)彩色圖形顯示器使用紅、綠、藍(lán)三原色,但rgb色彩空間中不能與人的感知顏色相聯(lián)系。在所有的色彩空間中,hsv模型(hue,
15、saturation,value)對(duì)應(yīng)于畫(huà)家配色模型,具有與人觀察顏色方式相一致的特點(diǎn),能較好反映人對(duì)色彩的感知和鑒別能力。rgb顏色空間模型 此模型也稱為基色混合型顏色空間,彩色圖像可以分解成紅(r)、綠(g)、藍(lán)(b)三個(gè)單色圖像,任何一種顏色都可以由這三種顏色混合構(gòu)成。用基色光單位來(lái)表示光的量,則在rgb色彩空間,任意色光f都可以用r、g、b三色不同分量的相加混合而成: 其中:(r,g,b) 分別是一個(gè)顏色的紅、綠和藍(lán)坐標(biāo),它們的值是在 0 到 1 之間的實(shí)數(shù)。圖21 rgb顏色空間模型六角錐體模型(hexcone model) hsv(hue saturation value)模型的三
16、維表示從rgb立方體演化而來(lái)。設(shè)想從rgb沿立方體對(duì)角線的白色頂點(diǎn)向黑色頂點(diǎn)觀察,就可以看到立方體的六邊形外形。六邊形邊界表示色彩,水平軸表示純度,明度沿垂直軸測(cè)量。參數(shù):色調(diào)(h),用角度度量,取值范圍為0°360°; 飽和度(s),取值范圍為0.01.0;亮度(v),取值范圍為0.0(黑色)1.0(白色)。 圖22 hsv顏色空間模型 rgb空間模型轉(zhuǎn)換到hsv色彩空間 rgb顏色模型都是面向硬件的,而hsv顏色模型是面向用戶的。 rgb圖像到hsv色彩空間的轉(zhuǎn)化方程如下:常用的顏色特征提取方法主要有顏色直方圖、累計(jì)直方圖、顏色矩。(1) 顏色直方圖 對(duì)于一幅數(shù)字圖像,
17、統(tǒng)計(jì)每一種顏色在該圖像中出現(xiàn)的像素點(diǎn)數(shù),以顏色為橫坐標(biāo),以顏色出現(xiàn)的像素點(diǎn)數(shù)為縱坐標(biāo):顏色直方圖h定義如下: 第k種顏色在圖像中出現(xiàn)的像素點(diǎn)頻數(shù)如下: 其中和表示圖像中的寬和高。 (2)累計(jì)直方圖 如果圖像特征向量不能取到所有可能值,許多零值會(huì)出現(xiàn)在顏色直方圖中,從而影響直方圖相交運(yùn)算,導(dǎo)致匹配結(jié)果不能合理地反映圖像間的顏色差別。 (3)顏色矩 這種方法的數(shù)學(xué)基礎(chǔ)在于圖像中任何的顏色分布可以用它的矩來(lái)表示,其實(shí)顏色的分部信息主要集中在低階矩中,因此,采用顏色的一階矩、二階矩和三階矩就足夠表示圖像的顏色分布。2.1.2.基于形狀特征形狀特征符合人對(duì)圖像的認(rèn)識(shí)是駐要集中在某個(gè)目標(biāo)區(qū)域這個(gè)事實(shí),具有
18、不受目標(biāo)顏色、紋理及背景變化影響等特點(diǎn),主要是對(duì)位移、旋轉(zhuǎn)和尺度變換的不變性,以圖像的分割為前提,經(jīng)常要依靠人工或半人工的方法勾勒目標(biāo)形狀邊界,操作繁復(fù)。對(duì)于形狀的描述有兩種方法,一是基于邊界,只利用形狀的外部邊緣。二是基于區(qū)域,利用形狀的全部區(qū)域。本論文采用第二種,最常用的的是不變矩來(lái)描述形狀的區(qū)域特征: 不變矩是圖像的一種統(tǒng)計(jì)特征,她利用圖像灰度分布的各階矩來(lái)描述圖像灰度的分布特性。(1)對(duì)于離散的數(shù)字圖像f(x,y)的p+q普通階矩和中心矩定義為:的一階矩用于確定圖像質(zhì)心,也作為圖像區(qū)域中心(2)當(dāng)圖像發(fā)生變化時(shí),中心矩會(huì)改變,而中心矩具有平移不變性,但對(duì)旋轉(zhuǎn)比較敏感,就此提出歸一化中心
19、矩,這樣圖像特征就具有了平移、旋轉(zhuǎn)以及比例的不變性。 (3)基于標(biāo)準(zhǔn)化的二階和三階中心矩提出了7個(gè)幾何矩的不變量,這些不變量滿足于圖像平移、伸縮和旋轉(zhuǎn)不變,hu不變矩的公式:2.1.3紋理特征 紋理是一種不依賴于顏色或亮度變化的視覺(jué)特征,描述了圖像像素鄰域灰度空間分布的規(guī)律,可以從微觀上區(qū)分圖像中不同的物體,它是所有物體表面固有的內(nèi)在特性,不同物體具有不同的紋理,如花、草、樹(shù)木、云彩等都有各自的紋理特征。具有旋轉(zhuǎn)不變性,并且對(duì)于噪聲有較強(qiáng)的抵抗能力。2.1.4空間關(guān)系特征 顏色、形狀和紋理等多種特征反映的都是圖像的整體特征,而無(wú)法體現(xiàn)圖像中所包含的對(duì)象或物體??臻g關(guān)系是指圖像中分割出來(lái)的多個(gè)目
20、標(biāo)之間互相的空間位置或相對(duì)方向關(guān)系,例如,連接/領(lǐng)接、交疊/重疊以及包含/包容關(guān)系等。 因此,得到不同分塊目標(biāo)之間的空間位置對(duì)于圖像辨別也是比較重要的手段之一,就像藍(lán)色的天空和蔚藍(lán)的海洋的在顏色直方圖上是非常接近而難以辨別。但如果指明是“處于圖像上半部分的藍(lán)色區(qū)域”,就可以大概區(qū)分天空和海洋了。2.1.5.圖像特征提取的性能評(píng)價(jià)標(biāo)準(zhǔn) 首先,檢索的目的是發(fā)現(xiàn)和提取需要的圖像。為了判定各種檢索算法的優(yōu)劣,要求我們考慮所檢索出來(lái)的相似圖像的數(shù)量和排列次序,下面兩個(gè)重要的參數(shù)作為性能指標(biāo)和計(jì)量準(zhǔn)則:查全率和準(zhǔn)確率。查全率=檢索出來(lái)的有關(guān)聯(lián)的結(jié)果/圖像庫(kù)中所有關(guān)聯(lián)的結(jié)果(1-1)查準(zhǔn)率=檢索出來(lái)的有關(guān)聯(lián)
21、的結(jié)果/檢索出來(lái)的所有結(jié)果(1-2) 綜上所述,查全率反映了檢索算法找到關(guān)聯(lián)結(jié)果的全面程度,它涉及到漏檢的問(wèn)題;而查準(zhǔn)率則反映了算法每次檢索出來(lái)有效關(guān)聯(lián)結(jié)果的能力,它涉及到誤檢的問(wèn)題。顯而易見(jiàn)的,查全率和查準(zhǔn)率的計(jì)算都需要知道圖庫(kù)中真實(shí)的存儲(chǔ)內(nèi)容,所以這兩個(gè)參數(shù)可用于實(shí)驗(yàn)系統(tǒng)的研究,而對(duì)實(shí)際系統(tǒng)的評(píng)價(jià)則不適用。2.2相似度計(jì)算技術(shù) 當(dāng)圖像特征提取出來(lái)后,形成了特征向量,圖像檢索的關(guān)鍵在于判斷檢索圖像同數(shù)據(jù)庫(kù)中圖像的相似度,即確定檢索庫(kù)圖像與數(shù)據(jù)庫(kù)圖像特征向量間的距離,目前在圖像檢索中常用到方法都是基于向量空間模型,就是把視覺(jué)特征視為向量空間中的某個(gè)點(diǎn),計(jì)算兩點(diǎn)之間的距離來(lái)度量圖像特征間的相似度
22、。本文主要采用歐氏距離:歐氏距離具有簡(jiǎn)單、有清晰的物理意義,其計(jì)算復(fù)雜較小,具有空間旋轉(zhuǎn)不變性的特點(diǎn)。3. 系統(tǒng)分析3.1需求分析 本系統(tǒng)的最大的目標(biāo)是為用戶提供高效率、快捷的服務(wù),減少了人工處理的繁瑣與誤差,準(zhǔn)確快速地反映圖像檢索的結(jié)果,盡可能滿足人們檢索工作的需求,根據(jù)市場(chǎng)的需求具體的目標(biāo)包括:(1)對(duì)圖像的輸入和顯示處理(2)對(duì)圖像進(jìn)行變動(dòng)處理(3)不同模式下的特征提取實(shí)現(xiàn)(4)相似度計(jì)算的實(shí)現(xiàn)(5)觀察和分析結(jié)果(6)退出程序其中(3)和(4)能是圖形檢索系統(tǒng)的核心部分,它是一個(gè)可以用多種方法實(shí)現(xiàn)彩色圖像檢索的系統(tǒng),其主要的檢索方法有:(1)基于顏色特征的查詢(2)基于形狀特征的查詢(
23、3)基于顏色和形狀綜合特征的查詢3.2實(shí)現(xiàn)環(huán)境 從目前比較流行的數(shù)據(jù)庫(kù)開(kāi)發(fā)、管理軟件來(lái)看,對(duì)于比較簡(jiǎn)單的中小型數(shù)據(jù)庫(kù),visual c+ 6.0和sql的結(jié)合無(wú)疑是在實(shí)際應(yīng)用中較為成功的一種解決方案。前者為用戶提供了windows所一貫堅(jiān)持的非常友好、操作簡(jiǎn)單的用戶界面.;后者則可對(duì)數(shù)據(jù)庫(kù)實(shí)施操作、維護(hù)和權(quán)限識(shí)別功能,也可通過(guò)與語(yǔ)句的結(jié)合對(duì)數(shù)據(jù)庫(kù)進(jìn)行更為復(fù)雜的操作。對(duì)本系統(tǒng)而言,上述的結(jié)合方式是可行的。3.3系統(tǒng)的功能(1)在顏色特征模式下,選擇顏色直方圖、累計(jì)直方圖、顏色矩其中一種進(jìn)行檢索(2)在形狀特征模式下,采用不變矩方法進(jìn)行檢索(3)在顏色和形狀綜合特征模式下,選擇顏色和形狀各自所占百
24、分比所得綜合特征進(jìn)行檢索3.4總體結(jié)構(gòu)與流程3.4.1總體結(jié)構(gòu)圖 圖31 圖像檢索系統(tǒng)總體結(jié)構(gòu)3.4.2主要流程圖 圖32 圖像檢索系統(tǒng)主要流程4. 系統(tǒng)實(shí)現(xiàn)本次圖像檢設(shè)計(jì)與研究利用vc+6.0開(kāi)發(fā)軟件實(shí)現(xiàn)4.1系統(tǒng)設(shè)置模塊 由圖像檢索系統(tǒng)總體結(jié)構(gòu)中可知,首先進(jìn)入的是系統(tǒng)設(shè)置模塊,該模塊主要提供使用者輸入需要檢索的圖像、參與檢索的圖像和圖庫(kù)的路徑接口建立,建立兩個(gè)全局變量cstring strfile 和cstring m_strpath 分別作為需要檢索圖像和檢索庫(kù)的保存路徑,還需對(duì)檢索庫(kù)圖像進(jìn)行掃描設(shè)置。重要的兩個(gè)標(biāo)志位以及五個(gè)常用全局變量:1) 需要檢索的用戶圖像標(biāo)志位bool open
25、_pic2)檢索庫(kù)圖像標(biāo)志位bool_dir3)需要檢索的用戶圖像路徑和檢索庫(kù)路徑:cstring strfile 和cstring m_strpath4)檢索庫(kù)中所有圖像的路徑:cstring *temp1005)檢索庫(kù)圖像計(jì)數(shù)器和臨時(shí)的檢索庫(kù)圖像計(jì)數(shù)器:int counts和int tempi4.1.1需要檢索用戶圖像模塊設(shè)置輸入用戶待檢索圖像 通過(guò)點(diǎn)擊按鈕 進(jìn)入函數(shù) cimagetrievaldlg:on open()對(duì)輸入圖像進(jìn)行設(shè)置的。void cimagetrievaldlg:onopen() cfiledialog fileopendlg(true);if (fileopendl
26、g.domodal () != idok) return;open_pic=true; /標(biāo)志位設(shè)置為true,表示待檢索圖像已設(shè)置cwnd* pwnd = getdlgitem(idc_view);cdc* pdc = pwnd->getdc();pwnd->invalidate();pwnd->updatewindow();position pos = fileopendlg.getstartposition();/對(duì)于選擇了多個(gè)文件的情況得到第一個(gè)文件位置strfile = fileopendlg.getnextpathname(pos);/得到待檢索圖像的路徑show
27、pic(strfile,idc_view);/顯示待檢索圖像 本模塊中調(diào)用了顯示待檢索用戶圖像函數(shù)cimagetrievaldlg:showpic(cstring pathfile, int idc),函數(shù)的參數(shù)pathfile為待顯示的文件路徑,idc為圖像顯示控件的id號(hào)4.1.2檢索庫(kù)掃描模塊設(shè)置選擇檢索庫(kù)路徑點(diǎn)擊按鈕 進(jìn)入函數(shù)cimagetrievaldlg:onpath() 實(shí)現(xiàn)該模塊設(shè)置:本模塊主要向用戶提供設(shè)置檢索庫(kù)的接口的功能,通過(guò)掃描檢索庫(kù)得到庫(kù)中的圖像個(gè)數(shù)和每個(gè)圖像的保存的詳細(xì)路徑,為了方便其他模塊使用,將它們分別保存在counts、temp100中。void cimage
28、trievaldlg:onpath() /打開(kāi)通用對(duì)話框,browseinfo結(jié)構(gòu)中包含有用戶選中目錄的重要信息browseinfo browse;zeromemory(&browse,sizeof(browse);/fills a block of memory with zeros.browse.hwndowner = null;browse.pszdisplayname = m_strpath.getbuffer(max_path);browse.lpsztitle = "請(qǐng)選擇一個(gè)圖像目錄"/shbrowseforfolder函數(shù)返回一個(gè)itemidlist
29、結(jié)構(gòu)的指針,包含了用戶選擇文件夾的信息lpitemidlist lpitem = shbrowseforfolder(&browse);if(lpitem = null) return ;m_strpath.releasebuffer();/shgetpathfromidlist把項(xiàng)目標(biāo)志符列表轉(zhuǎn)換為文檔系統(tǒng)路徑if(shgetpathfromidlist(lpitem,m_strpath.getbuffer(max_path) = false) return;m_strpath.releasebuffer();dir=true; /標(biāo)志位設(shè)置為true,表示待檢索圖像已設(shè)置afxme
30、ssagebox("您選擇的目錄為:"+m_strpath,mb_iconinformation|mb_ok);/掃描檢索庫(kù),得到圖像目錄下文件的路徑cstring tempath;cstring temps;tempath=m_strpath;tempath.trimright();tempath.trimleft(); /去除前后多余cstring strfilepath=tempath;tempi=0;counts=0;/計(jì)數(shù)器清零/檢索庫(kù)中圖像個(gè)數(shù)放入counts中,其路徑放入temp100中startdir(strfilepath); temps.format(&
31、quot;該目錄下共有%d幅圖像!",counts); afxmessagebox(temps,mb_iconinformation|mb_ok);4.2 圖像檢索模塊 (系統(tǒng)核心部分)主要涉及兩個(gè)核心技術(shù):圖像特征提取技術(shù)、相似度計(jì)算技術(shù)包括三種檢索模式:顏色特征提取模式、形狀特征提取模式、顏色和形狀綜合特征提取模式。其中,顏色特征模式有三種方法:顏色直方圖、累計(jì)直方圖、顏色矩;基于形狀特征模式采用不變矩的方法;系統(tǒng)中所有的特征的相似度計(jì)算均采用歐氏距離。1)本模塊中兩個(gè)重要標(biāo)志位:如果標(biāo)志位值為true,說(shuō)明此方法在當(dāng)前檢索庫(kù)、待檢索圖像下已經(jīng)使用過(guò)?;陬伾卣髂J綑z索的狀態(tài)標(biāo)
32、志位:bool_color基于形狀特征模式檢索的狀態(tài)標(biāo)志位:bool_shape2) 主要的全局變量如下:1 圖像特征提取模式int method:值為1、2、3分別對(duì)應(yīng)三種檢索模式2 顏色特征模式 int c_method:值為1、2、3分別表示采用顏色直方圖、累計(jì)值直方圖、顏色矩double pix10001000 :當(dāng)前分析圖像的像素double feature_shape8 :待檢索圖像的形狀特征double feature_shape_18:當(dāng)前分析圖像的形狀特征double feature_color312:待檢索圖像的顏色特征double feature_color_1312:當(dāng)
33、前分析圖像的顏色特征picture image_color_1:基于顏色特征顏色直方圖模式下的檢索信息picture image_color_2:基于顏色特征累計(jì)直方圖模式下的檢索信息picture image_color_3:基于顏色特征顏色矩模式下的檢索信息picture image_color_temp:臨時(shí)的基于顏色特征模式下的檢索信息picture image_shape:基于形狀特征模式下的檢索信息picture image_shape_temp:臨時(shí)的基于形狀特征模式下的檢索信息picture image:基于顏色和形狀綜合特征模式下的檢索信息4.2.1檢索引導(dǎo)模塊開(kāi)始檢索點(diǎn)擊按
34、鈕 進(jìn)入函數(shù)cimagetrievaldlg:onstart() ,首先檢查是否設(shè)置了待檢索圖像和檢索庫(kù)路徑,其次設(shè)置待檢索圖像及其檢索庫(kù)路徑,再根據(jù)所選擇的的具體模式,先調(diào)用特征提取函數(shù),得到待檢索圖像的特征,然后調(diào)用所提取特征的相似度計(jì)算函數(shù)。4.2.2特征提取模塊(包括4個(gè)特征函數(shù))每個(gè)函數(shù)都含有兩個(gè)傳遞參數(shù):cstring pathfile 圖像路徑 、int mode模式狀態(tài),當(dāng)mode=1時(shí),說(shuō)明計(jì)算的是待檢索圖像,并且,將提取出來(lái)的顏色特征值、形狀特征值分別保存在feature_color312、feature_shape8中,當(dāng)mode=2時(shí),說(shuō)明計(jì)算的是檢索庫(kù)中的圖像,并且,
35、將提取出來(lái)的顏色特征值、形狀特征值分別保存在feature_color312、feature_shape8中feature_color_1312、feature_shape_18中。由于所有顏色特征均是在hsv空間中進(jìn)行的,因此,首先要將rab顏色空間轉(zhuǎn)換成hsv顏色空間模型,利用函數(shù):rgbtohsv(getrvalue(color),getgvalue(color),getbvalue(color),&h,&s,&v);void cimagetrievaldlg:rgbtohsv(int r,int g,int b,double *h,double *s,doubl
36、e *v)*h=acos(r-g+r-b)/(2.0*sqrtf(float)(r-g)*(r-g)+(float)(r-b)*(g-b);if(b>g)*h=2*pi-*h; *s=(mymax(r,g,b)-mymin(r,g,b)/(float)mymax(r,g,b);*v=mymax(r,g,b)/255.0;int cimagetrievaldlg:mymax(int a,int b,int c)/尋找最大int cimagetrievaldlg:mymin(int a,int b,int c)/尋找最?。?) 顏色直方圖提取函數(shù) 計(jì)算顏色直方圖:pathfile為圖像的路徑
37、,mode為模式狀態(tài)位,為1時(shí),表示計(jì)算的是待檢索圖像,為2時(shí),表示計(jì)算的是檢索庫(kù)中的圖像void cimagetrievaldlg:general(cstring pathfile,int mode)(2)累計(jì)直方圖提取函數(shù) 計(jì)算累計(jì)直方圖:pathfile為圖像的路徑,mode=1,表示計(jì)算的是待檢索圖像;mode=2,表示計(jì)算的是檢索庫(kù)中的圖像;void cimagetrievaldlg:succession(cstring pathfile,int mode)(3) 顏色矩提取函數(shù) 計(jì)算顏色矩:pathfile為圖像的路徑,mode為模式狀態(tài)位,為1時(shí),表示計(jì)算的是待檢索圖像;為2時(shí),
38、表示計(jì)算的是檢索庫(kù)中的圖像;void cimagetrievaldlg:centerm(cstring pathfile,int mode)(4) 形狀不變矩提取函數(shù)cimagetrievaldlg:torque(cstring pathfile,int mode) 本系統(tǒng)基于圖像的區(qū)域分割,函數(shù)采用基于otsu的閾值分割法:基本原理:通過(guò)設(shè)定不同的特征閾值k,將圖像的像素點(diǎn)進(jìn)行分類(lèi),其中,大于k的像素為0,小于k的像素為1,使圖像成為二值圖像,主要是利用otsu計(jì)算出最佳的k值,再對(duì)圖像進(jìn)行分割。 otsu重要式子,g值意義在于,從最小灰度值遍歷閾值k,使得g值取到最大時(shí)的k值,找到了最佳分割閾值:最佳k值把圖像分割成了兩部分,
溫馨提示
- 1. 本站所有資源如無(wú)特殊說(shuō)明,都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請(qǐng)下載最新的WinRAR軟件解壓。
- 2. 本站的文檔不包含任何第三方提供的附件圖紙等,如果需要附件,請(qǐng)聯(lián)系上傳者。文件的所有權(quán)益歸上傳用戶所有。
- 3. 本站RAR壓縮包中若帶圖紙,網(wǎng)頁(yè)內(nèi)容里面會(huì)有圖紙預(yù)覽,若沒(méi)有圖紙預(yù)覽就沒(méi)有圖紙。
- 4. 未經(jīng)權(quán)益所有人同意不得將文件中的內(nèi)容挪作商業(yè)或盈利用途。
- 5. 人人文庫(kù)網(wǎng)僅提供信息存儲(chǔ)空間,僅對(duì)用戶上傳內(nèi)容的表現(xiàn)方式做保護(hù)處理,對(duì)用戶上傳分享的文檔內(nèi)容本身不做任何修改或編輯,并不能對(duì)任何下載內(nèi)容負(fù)責(zé)。
- 6. 下載文件中如有侵權(quán)或不適當(dāng)內(nèi)容,請(qǐng)與我們聯(lián)系,我們立即糾正。
- 7. 本站不保證下載資源的準(zhǔn)確性、安全性和完整性, 同時(shí)也不承擔(dān)用戶因使用這些下載資源對(duì)自己和他人造成任何形式的傷害或損失。
最新文檔
- 2025版事業(yè)單位聘用合同書(shū)(二零二五年度)修訂本3篇
- 2025年水庫(kù)水面旅游開(kāi)發(fā)合作協(xié)議3篇
- 2025年采摘果園休閑農(nóng)業(yè)項(xiàng)目承包經(jīng)營(yíng)合同3篇
- 2025年鐵路旅客承運(yùn)人服務(wù)質(zhì)量提升與旅客滿意度合同3篇
- 二零二五版跨區(qū)域二手房產(chǎn)權(quán)轉(zhuǎn)移協(xié)助合同
- 2025版烏笑與配偶離婚后子女教育費(fèi)用支付調(diào)整協(xié)議3篇
- 萬(wàn)科物業(yè)2024全年服務(wù)細(xì)則協(xié)議版
- 三方借款協(xié)作協(xié)議2024年適用版版B版
- 美容院綠色環(huán)保材料采購(gòu)與2025年度股份合作協(xié)議4篇
- 2025年版餐飲服務(wù)消費(fèi)者免責(zé)條款協(xié)議3篇
- 招標(biāo)師《招標(biāo)采購(gòu)項(xiàng)目管理》近年考試真題題庫(kù)(含答案解析)
- 微生物組與唾液腺免疫反應(yīng)-洞察分析
- 2024公共數(shù)據(jù)授權(quán)運(yùn)營(yíng)實(shí)施方案
- 2024年國(guó)家焊工職業(yè)技能理論考試題庫(kù)(含答案)
- 《向心力》 教學(xué)課件
- 結(jié)構(gòu)力學(xué)數(shù)值方法:邊界元法(BEM):邊界元法的基本原理與步驟
- 北師大版物理九年級(jí)全一冊(cè)課件
- 2024年第三師圖木舒克市市場(chǎng)監(jiān)督管理局招錄2人《行政職業(yè)能力測(cè)驗(yàn)》高頻考點(diǎn)、難點(diǎn)(含詳細(xì)答案)
- RFJ 006-2021 RFP型人防過(guò)濾吸收器制造與驗(yàn)收規(guī)范(暫行)
- 盆腔炎教學(xué)查房課件
- 110kv各類(lèi)型變壓器的計(jì)算單
評(píng)論
0/150
提交評(píng)論