基于內(nèi)容的圖像檢索_第1頁
基于內(nèi)容的圖像檢索_第2頁
基于內(nèi)容的圖像檢索_第3頁
基于內(nèi)容的圖像檢索_第4頁
基于內(nèi)容的圖像檢索_第5頁
已閱讀5頁,還剩23頁未讀 繼續(xù)免費閱讀

下載本文檔

版權(quán)說明:本文檔由用戶提供并上傳,收益歸屬內(nèi)容提供方,若內(nèi)容存在侵權(quán),請進行舉報或認領

文檔簡介

1、. . . 基于容的圖像檢索方法的研究摘要近年來,隨著多媒體技術和計算機互聯(lián)網(wǎng)技術的快速發(fā)展,數(shù)字圖像的數(shù)量正以驚人的速度增長。面對日益豐富的圖像信息海洋,人們需要有效地從中獲取所期望得到多媒體信息。因此,在大規(guī)模的圖像數(shù)據(jù)庫中進行快速、準確的檢索成為人們研究的熱點。為了實現(xiàn)快速而準確地檢索圖像,利用圖像的視覺特征,如顏色、紋理、形狀等來進行圖像檢索的技術,也就是基于容的圖像檢索技術(CBIR)應運而生。其中,顏色特征作為圖像的一種重要的視覺特征,已得到廣泛的應用。本文主要研究基于圖像顏色特征的檢索。選用基于顏色直方圖的算法,并利用Visual Basic程序設計語言和Access數(shù)據(jù)庫技術設

2、計實現(xiàn)了基于顏色直方圖算法的圖像檢索系統(tǒng)。主要做法是:采用符合人類視覺特征的HSV顏色空間來表示圖像的顏色特征,利用人對顏色的感知來對顏色分量進行非等間隔的量化并形成特征矢量,用相似性度量函數(shù)進行圖像的相似性匹配,從而實現(xiàn)圖像的檢索。關鍵字:圖像數(shù)據(jù)庫;CBIR;顏色直方圖;相似距離The Research of Content-based Image Retrieval MethodABSTRACTWith the rapid development of multimedia and computer network technique, the quantity of digital i

3、mage and video is going up fabulously. Facing the vast ocean of information of image, it has a good sense to obtain the desired multimedia information.Currently, rapid and effective searching for desired image from large-scale image databases becomes an hot research topic. In order to retrieve image

4、 quickly and accurately using image visual features such as color, texture, shape,which named content-based image retrieval (CBIR) came into being. Among them, the color features as an important visual features of the image has been widely used. This paper studies the retrieval based on image color

5、characteristics. Using algorithm based on color histogram, and the Visual Basic programming language and Access Database Design toimplement the image retrieval system based on color histogram algorithm. The main approach is: to represent the image's color characteristics consistent with human vi

6、sual characteristics of the HSV color space, using the perception of color to the color component unequal interval quantization and to form a feature vector, using measure function to match image similarity, in order to achieve image retrieval.Key words: Image database; CBIR; Color histogram; Simila

7、rity distance23 / 28目錄前言11.1課題背景與研究意義11.2基于容的圖像檢索技術研究的現(xiàn)狀和發(fā)展方向11.3本文主要研究容22基于容的圖像檢索32.1概念32.2特點32.3CBIR過程的一般框架33圖像特征提取與相似性度量53.1圖像的文件格式53.2顏色模型63.2.1RGB顏色空間63.2.2HSV顏色空間73.2.3RGB 顏色空間到 HSV 顏色空間的轉(zhuǎn)換73.3顏色量化83.4顏色直方圖83.5基于子塊顏色直方圖算法93.6圖像的相似性度量103.6.1圖像的相似度103.6.2相似度計算公式104基于顏色特征的圖像檢索系統(tǒng)設計和實現(xiàn)124.1系統(tǒng)結(jié)構(gòu)設計12

8、4.2圖像特征數(shù)據(jù)庫設計124.3系統(tǒng)開發(fā)環(huán)境124.4系統(tǒng)流程134.5系統(tǒng)的實現(xiàn)134.5.1圖像的獲取134.5.2圖像特征的提取144.5.3圖像的檢索165總結(jié)18參考文獻19致20前言1.1課題背景與研究意義近年來,伴隨著計算機網(wǎng)絡技術和多媒體數(shù)據(jù)庫技術的迅猛發(fā)展,特別是大量圖像數(shù)據(jù)的廣泛應用,實現(xiàn)圖像檢索成為多媒體數(shù)據(jù)庫中最基本也是最普遍的要求。傳統(tǒng)的圖像檢索是基于文本方式,對圖像庫中的每一幅圖像使用關鍵字進行標記,然后利用文字屬性的匹配進行對圖像的檢索。這種基于文本的圖像檢索需要人工注解的工作量很大,且文本描述很難準確的表達圖像中豐富的信息,常常會因為不同人對同一容的描述方式不

9、同而千差萬別,造成檢索的準確程度降低。在信息需求的不斷增加和日益迫切的今天,原始的圖像檢索系統(tǒng)已經(jīng)遠遠不能滿足要求。因此,基于容的圖像檢索技術的研究越來越成為人們研究的熱點。特別是多媒體容描述接口MPEG-7MPEG的全名為Moving Pictures Experts Group,中文譯名是動態(tài)圖像專家組。的制定和完善,更加推動了這一技術的開發(fā)和運用?;谌莸膱D像檢索技術對促進圖像技術的發(fā)展具有重要的作用。首先,在檢索圖像的準確度上,基于容的圖像檢索技術把圖像的顏色、形狀、紋理等視覺特征作為圖像的容來查找和匹配圖像,通過算法實現(xiàn)圖像特征的提取和圖像間的相似性匹配,提高了檢索結(jié)果的準確性。其次

10、,隨著數(shù)據(jù)庫技術研究的深入、計算機視覺以與人工智能的發(fā)展,我們可以對圖像的這些特征進行自動的提取和匹配,大大減少了人工的工作量,從而在提高檢索準確度的同時,降低了圖像檢索所需要的時間。目前,這項技術已經(jīng)廣泛應用于圖像的網(wǎng)絡搜索、遙感、數(shù)字圖書館、計算機輔助設計、地理信息系統(tǒng)、商標管理等諸多領域,具有廣闊的應用前景。1.2基于容的圖像檢索技術研究的現(xiàn)狀和發(fā)展方向目前,對圖像的檢索在圖像索引與研究中應用最為廣泛,基于圖像顏色特征、紋理特征、形狀特征和物體空間方位的檢索方法是比較成熟的幾種。近年來,基于容的圖像檢索引起了多交叉學科研究人員的注意。在國外,特別是在美國等發(fā)達國家,這項技術已成為一個研究

11、熱點。一些科研部門、高等院校、商業(yè)公司甚至于政府機構(gòu)都紛紛投入大量人力和物力進行系統(tǒng)的研究和開發(fā),以期取得領先地位。目前已經(jīng)推出了一些CBIR系統(tǒng)的產(chǎn)品,如美國的IBM公司、Virage和Excalibur都已經(jīng)開發(fā)出了的基于圖像容的相似性特征的圖像庫檢索引擎,并在網(wǎng)上提供了演示站點。國的研究主要集中在基于圖像顏色的查詢,也有一部分基于紋理和形狀的查詢。自20世紀90年代以來,基于容的圖像檢索成為一個研究熱點。目前,該技術已成功應用于人臉識別技術;針對商標與設計專利類的圖像進行檢索,防止專利糾紛的產(chǎn)生。除此之外,它還可以解譯影像數(shù)據(jù)中的建筑、村莊、耕地等不同種類的地形信息,實現(xiàn)對遙感圖像的檢索

12、?;谌莸膱D像檢索技術研究的發(fā)展方向主要有:(1)兩類圖像檢索技術的結(jié)合傳統(tǒng)的圖像搜索引擎主要側(cè)重于對圖像容的文本描述,而圖像庫檢索技術則更側(cè)重于通過算法對圖像容的特征的提取和匹配,它們雖然側(cè)重不同卻相互補充。如果能將二者結(jié)合起來,取長補短,則圖像檢索技術必將會有新的進展。(2)對基于容的編碼技術的研究自20世紀90年代起,國際上就有了對基于容的圖像檢索技術的研究。從基本的顏色檢索,到綜合利用多種圖像特征進行檢索,推出了大量原型系統(tǒng)。其中,部分已經(jīng)投入到實際應用中并取得良好效果。在Internet環(huán)境下,MPEG專家組制定了一個基于容的多媒體描述方案,即MPEG-7標準,對各種不同類型的多媒體

13、信息容的描述方式進行了標準化定義,從而實現(xiàn)CBIR與TBIR(基于圖像文本特征的檢索)的互連。總之,該項技術在實際中的應用會越來越廣泛,而且必將在各個領域當中占據(jù)主導地位,并帶動相關產(chǎn)業(yè)的發(fā)展,促進多媒體信息化的交流。1.3本文主要研究容本文在介紹基于顏色特征的圖像檢索技術的基礎上,將顏色直方圖作為研究重點,對CBIR技術進行了較為全面的研究,以多媒體圖像數(shù)據(jù)庫為平臺,將CBIR作為一種信息檢索技術,應用到圖像數(shù)據(jù)庫中,作為檢索引擎來實現(xiàn)基于顏色特征的圖像檢索功能。(1)詳細討論了常見的顏色特征表示方法以與從RGB模型到HSV模型的轉(zhuǎn)換和顏色特征的提取方法,采用符合人類視覺感知特征的HSV模型

14、來提取顏色特征,并按照人的視覺分辨能力將顏色量化為36柄的一維特征向量。(2)運用相似性度量算法,用戶可以根據(jù)自己的興趣,針對不同的區(qū)域,靈活地調(diào)整權(quán)重系數(shù),更準確地實現(xiàn)圖像顏色特征的匹配。(3)在開發(fā)工具上,選用Visual Basic 6.0程序設計語言,對圖像進行了定義,完成圖像特征的讀入和提取,用Access數(shù)據(jù)庫存放圖像的特征索引向量,并通過顏色匹配算法實現(xiàn)基于圖像顏色特征的檢索功能。2基于容的圖像檢索2.1概念基于容的圖像檢索(CBIR)是指根據(jù)圖像顏色、紋理、形狀等視覺特征,從已定的圖像庫中查找含有特定特征的圖像。與傳統(tǒng)的圖像檢索手段不同,它融合了圖像理解技術,在輸入圖像的同時將

15、其相應的特征向量也存入特征庫。在進行圖像檢索時,對每一幅給定的關鍵圖,進行圖像分析,并提取圖像的特征向量。將該圖像的特征向量和特征庫中的特征向量進行匹配,根據(jù)相似距離的大小在圖像庫中進行搜索就可以得到所需要的檢索圖了。2.2特點CBIR 方法利用圖像的視覺特性,實現(xiàn)了用圖像來檢索圖像。這比利用傳統(tǒng)的文字標注等要有效的多。基于容的圖像檢索是根據(jù)圖像的顏色 、形狀、紋理等特征以與這些特征的組合來查詢圖像的,這是計算機圖像處理和數(shù)據(jù)庫技術的很好的結(jié)合。它具有以下幾個顯著的特點1:(1)用于檢索的是反映圖像容的各種量化特征;(2)使用基于相似性度量的近似查詢;(3)大多采用實例查詢QBE(Query

16、By Example)方法。對于基于容的圖像檢索有三個關鍵:一是要選取恰當?shù)膱D像特征;二是要采取有效的特征提取算法;三是要有準確的特征匹配算法。2.3CBIR過程的一般框架CBIR系統(tǒng)可以看作是一個用戶和圖像數(shù)據(jù)庫之間的一個界面或通道2,其過程的一般框架可以描述為如圖2-1。用戶界面查詢描述匹配驗證提取圖像庫圖2-1基于容的圖像檢索各模塊的作用:(1)查詢模塊:為用戶提供多樣的查詢手段,以支持用戶進行多種類型的查詢;(2)描述模塊:將用戶查詢的外部表達轉(zhuǎn)化成為對圖像信息容的部表達和描述;(3)匹配模塊:將查詢描述與庫中被查詢信息的描述進行匹配,確定它們?nèi)莸囊恢滦院拖嗨菩?;?)提取模塊:把滿足

17、既定條件的信息自動的從庫中提取出來;(5)驗證模塊:為用戶提供方便的驗證手段以評價提取的效果。目前,很多基于容的圖像檢索系統(tǒng)中還包含有用戶反饋機制,其主要功能是收集檢索出的圖像信息,根據(jù)用戶自己的期望,對搜索到的圖像進行粗略的判斷,然后修改查詢信息并提交給查詢模塊。3圖像特征提取與相似性度量基于容的圖像檢索系統(tǒng)在進行圖像檢索的過程中,將關鍵圖和被檢索的圖像進行圖像分析,提取出這些圖像的特征向量,再將關鍵圖的特征向量和被檢索的圖像的特征向量進行相似性匹配,根據(jù)相似距離檢索到期望的圖像。由這個工作原理可知,該系統(tǒng)的關鍵點包括:選取恰當?shù)膱D像格式,以便提取其有效的顏色特征;選擇準確的特征匹配算法,從

18、而實現(xiàn)圖像的相似性匹配。因此,如何恰當?shù)奶崛☆伾卣鳎耘c對顏色特征如何進行有效地抽取和匹配也就成為CBIR研究領域的重點。3.1圖像的文件格式本文采用的圖像格式是BMP格式。BMP文件是常見的圖像文件格式之一,是 Windows 操作系統(tǒng)中的標準文件格式。由于不進行圖像壓縮,所以BMP圖像文件能夠表達豐富的色彩信息。BMP圖像文件的結(jié)構(gòu)可以分為四個部分:文件頭數(shù)據(jù)結(jié)構(gòu)、文件信息數(shù)據(jù)結(jié)構(gòu)、調(diào)色板以與圖像數(shù)據(jù)。其中,文件頭的長度為固定值54個字節(jié);調(diào)色板數(shù)據(jù)對所有的不超過256色的圖像模式都需要進行設置,即使是單色圖像模式也不例外;圖像數(shù)據(jù)既可以采用一定的壓縮算法進行處理,也可以不必對圖像處理軟

19、件進行壓縮處理,這不僅與圖像文件的大小有關,而且也與對應的圖像處理軟件是否支持經(jīng)過壓縮處理的BMP圖像文件相關3。圖像文件的文件頭和文件信息頭的定義形式如下:(1)文件頭(BITMAPFILEHEADER)Public Type bitmapfileheaderbftype As Integerbfsize As Longbfreserved1 As Integerbfreserved2 As Integerbfofbits As LongEnd Type該程序中定義了BMP文件的類型、大小,以與圖像數(shù)據(jù)的偏移量,即從文件頭開始多少個字節(jié)后是圖像數(shù)據(jù)的起始。(2)文件信息頭(BITMAPINF

20、OHEADER)Public Type bitmapinfoheaderbisize As Longbiwidth As Longbiheight As Longbiplanes As Integerbibitcount As Integerbicompress As Longbisizeimage As Longbixpelspermeter As Longbiypelspermeter As Longbicirused As LongBMP文件信息頭基本上包含圖像的所有重要的信息,包括寬度、高度和每像素的位數(shù)。3.2顏色模型所謂顏色模型2是指某個三維顏色空間中的一個可見光子集,包括某個顏色

21、域的所有顏色。常見的顏色模型包括RGB(紅、綠、藍),HSV(色調(diào)、飽和度、亮度),CMYK(青、洋紅、黃、黑)等。其中,HSV空間是一種符合人類視覺感知特征的顏色空間,特別適合于人類肉眼對顏色的識別,因此被廣泛應用于計算機視覺領域。3.2.1RGB顏色空間RGB 顏色空間是一種常用的顏色空間。目前,圖像采集系統(tǒng)以與彩色顯示器等硬件顯示設備大都采用了 RGB 顏色空間來表示顏色。數(shù)字圖像一般也都采用這一顏色空間來表示。如圖 3-1所示,RGB顏色模型是三維直角坐標顏色系統(tǒng)的一個單位正方體。它以紅(R)、綠(G)、藍(B)作為三基色。在空間坐標系的原點上,三基色的亮度均為零,此時代表黑色;當三基

22、色同時達到最高亮度時為白色;由等量的三基色組合而成的顏色是灰色,這些灰色點均落在RGB彩色立方體的對角線上。白黑品紅藍青紅黃綠圖3-1RGB顏色空間雖然RGB空間模型在實際生活中廣泛應用,但是它并不具有視覺一致性,不符合人對顏色的感知心理,且RGB顏色空間上的距離并不代表人眼視覺上的差異。因此,需要用另一種符合人的視覺感知的顏色模型來表示顏色。3.2.2HSV顏色空間藍2400品紅H綠1200黃青紅00SVHSV顏色空間具有視覺一致性,它比RGB顏色空間更符合人的視覺特性。HSV顏色空間把常見顏色表示為三種屬性:色調(diào) H(Hue)、飽和度S(Saturation)和亮度 V(Value)。HS

23、V模型對應于圓柱體坐標系的一個圓錐子集。圓錐的頂面對應于V=1,色調(diào)H又繞V軸給定,飽和度S取值從0到1,由圓心向圓周過度。H表示色調(diào)信息,即所處的光譜顏色的位置,通常由顏色名稱來辨別,如紅、橙、黃、綠等,它用角度-180180或0360來度量。飽和度S為一比例值,指顏色的深淺程度,圍從0%到濃度完全飽和的100%,它表示所選顏色的純度和該顏色最大的純度之間的比率,即在純色中包含白色光的成分。V表示色彩的明亮程度, 0%為最暗的黑色,而100%為最亮的白色3。HSV顏色模型如圖3-2所示。圖 3-2HSV 顏色空間模型HSV顏色空間直接對應于人眼色彩視覺特征的三要素,通道之間各自獨立,因此可以

24、獨立感知各顏色分量的變化,其中色調(diào)尤其影響著人的視覺判斷。因此在基于容的圖像檢索中,應用這種顏色空間模型會更適合用戶的視覺判斷。3.2.3RGB 顏色空間到 HSV 顏色空間的轉(zhuǎn)換一般情況下,人們認識到的圖像都是在RGB顏色空間描述的,但在圖像檢索的應用過程中,HSV空間模型更適合于人的視覺感知。因此,應該將圖像從RGB空間模型轉(zhuǎn)換到HSV空間模型4。設r,g,b0,1,2,255,由RGB顏色空間模型到HSV顏色空間模型的轉(zhuǎn)化為:設v=max(r,g,b),定義r,g,b為:r=v'-rv'-min(r,g,b),g=v'-g'v'-min(r,g,b

25、), b=v'-bv'-min(r,g,b),則 v=v/255,v0,1S=v'-minr,g,bv',max(r,g,b)min(r,g,b) 0 , maxr,g,b=min(r,g,b) ,S0,1 (3-1)5+b,若r=max(r,g,b)且g=min(r,g,b)。1-g,若r=max(r,g,b)且gmin(r,g,b)60h= 1+r, 若g=max(r,g,b)且b=min(r,g,b) ,S=0, &S0,0.251, S0.25,1 (3-2)3-b,若g=max(r,g,b)且bmin(r,g,b)3+g,若b=max(r,g,

26、b)且r=min(r,g,b)5-r, 否則 這里r,g,b0,255,h0,3604。3.3顏色量化顏色量化是指確定一組顏色以表示圖像的顏色空間,然后確定從顏色空間到選定顏色集合的映射,即將顏色空間映射到一個給定大小的子集中,并使其總體誤差最小。因為 CBIR 中采用的HSV顏色空間具有視覺一致性的特點,而且人眼分辨顏色的能力是有限的5。因此,在量化時可以考慮按照人的顏色感知對顏色空間進行非等間距的量化,量化結(jié)果為:0,H0,601,H60,120 0, V0,0.3H= 2,H120,180 ,S=0, &S0,0.251, S0.25,1 , V= 1, V0.3,0.8 (3-

27、3)3,H180,240 2, V0.8,14,H240,3005,H300,360量化結(jié)束后,可以將HSV顏色空間劃分為LHLSLV個相似色空間,其中量化級數(shù)LH=6,LS=2,LV=3。故把三個分量合并成一個一維的特征矢量就是L=LS×LV×H+LV×S+V=6H+3S+V。這樣H、S、V三個分量分布在一維矢量上,L的取值圍為0,35,即顏色量化后的圖像可以得到36柄的一維顏色直方圖3。3.4顏色直方圖對于基于顏色的圖像檢索系統(tǒng),關鍵問題之一是對顏色特征的提取。目前,大部分基于顏色的檢索系統(tǒng)都是以比例分布作為顏色的基本特征,這也就是圖像的顏色直方圖。顏色的直方

28、圖特征是圖像檢索領域中提出最早、算法最簡單,而且具有尺度不變性和旋轉(zhuǎn)不變性2,因此成為使用最為廣泛的顏色特征之一。它是在確定顏色空間的基礎上,統(tǒng)計出圖像中每種顏色分量的像素數(shù)占圖像總像素數(shù)的比值,從而得到圖像各種顏色分量的比例分布直方圖,將其轉(zhuǎn)換成為一維的特征向量,作為這幅圖像的特征。顏色直方圖是顏色信息的函數(shù),它表示圖像中具有同顏色級別的像素的個數(shù),其橫坐標是顏色級別,縱坐標是顏色出現(xiàn)的頻率,即像素的個數(shù)。顏色直方圖是一種概率統(tǒng)計的方法。它將圖像中各顏色像素的個數(shù)進行統(tǒng)計,并用直方圖的形式表達出來,具體定義為:H(P)=(hc1(L),hc2(L),hc3(L),hci(L))其中,hci(

29、L)=|Lci|N,|Lci|表示圖像中所有顏色為Ci的像素的個數(shù)。這種顏色直方圖只反映了圖像中所占的百分比,而丟失了圖像顏色的空間分布信息,也就是說兩幅顏色空間分布完全不同的圖像(如天空和海洋)仍可以具有一樣的直方圖,這勢必造成檢索的誤差。這時,可以加進顏色的空間分部信息。3.5基于子塊顏色直方圖算法一般顏色直方圖在算法上比較簡單,但圖像檢索時卻不夠準確,因為顏色直方圖相似的圖像可能容差別很大。這時便可以通過利用基于子塊顏色直方圖算法來實現(xiàn)圖像的檢索。將圖像劃分為幾個單元,然后分別計算這些單元顏色直方圖。在計算圖像的相似距離時,先計算每圖像中每個單元之間的距離,然后將這些距離組合起來,便可以

30、得到圖像與圖像的距離?;谧訅K顏色直方圖的圖像檢索方法可以采用一種比較簡單的固定劃分策略,將圖像分解成為若干個大小一樣并且互相不重疊的單元區(qū)域。同時,用戶可以對自己感興趣的子塊增大權(quán)重,提高檢索準確率。通常情況下,主要容位于圖像的中間區(qū)域,圖像的四周大多是背景畫面。因此可以采用這樣一種分塊方法3:41325圖3-3分塊策略由此劃分方法可知:圖像的主要區(qū)域位于第5塊,其余的標號為1、2、3、4的屬于背景。在特征的提取過程中,提取第5塊的主顏色,提取1、2、3、4塊的平均顏色,剩下圖像的四角部分對圖像特征影響不大,往往可以忽略。提取特征的方法為:(1)計算各個分塊的一般顏色直方圖設二維數(shù)組LI,j

31、中存放的是圖像各像素點量化后的HSV顏色值,其中i,j為各像素點坐標。數(shù)組PicCenterk中存放中心區(qū)域的一般直方圖,k為量化后的HSV顏色值。(2)然后計算第5塊(中心區(qū)域)的主顏色m5主顏色是指圖像中出現(xiàn)次數(shù)最多的那種顏色,即main=取下標(maxhc)。將設定好的顏色區(qū)域窗口沿直方圖從左向右移動,并記錄窗口顏色的總頻數(shù)。得到總頻數(shù)最大的窗口位置時,此窗口顏色的加權(quán)平均值即為圖像的主顏色,即main=ci×hci/hci。(3)計算1、2、3、4塊的平均顏色ei,i=1,2,3,4平均顏色是一般直方圖顏色的加權(quán)平均:mean=c=035c×hc/c=035hc。(

32、4)圖像分塊顏色特征向量由第5塊的主顏色和1、2、3、4塊的平均顏色共同組成了分塊顏色特征向量:F=m5,e1,e2,e3,e4。3.6圖像的相似性度量在基于容的圖像檢索中,特征的相似距離的度量也是需要解決的重要問題之一。只有在得到了圖像的特征后進行特征的相似性度量,才能有效的根據(jù)相似距離進行比較,準確地實現(xiàn)圖像檢索。3.6.1圖像的相似度為了達到圖像檢索的目的,需要對提取的特征進行相似度計算。相似度是以數(shù)值的形式來表示兩幅圖像之間的相似程度的度量結(jié)果,即相似距離。將圖像的特征看作是坐標空間中的點,兩個點的接近程度即相似度通常用他們之間的距離表示,不同類型的特征數(shù)據(jù)所采用的相似性度量函數(shù)是不一

33、樣的,相似度公式的選擇的恰當與否對檢索的精確度有很大的影響。合適的距離算法的選擇,有助于基于容的圖像檢索的性能提高。3.6.2相似度計算公式圖像顏色特征相似關系的研究通常使用的是幾何模型。對于幾何相似距離的數(shù)學表達形式可以采用以下幾種表示方法2:(1)歐式距離公式歐式距離是一個常見的判斷兩個對象相似的公式,圖像X和圖像Y之間的距離定義為:Sim(X,Y)=|X-Y|=i=1nxi-yi(xi-yi) (3-4)當Sim(X,Y)越大時,兩幅圖像在這一特征上的差異就越大,反之兩幅圖像就越相似。但是由于歐式距離在計算中沒有考慮顏色間的相似性,不符合人的視覺感受,可以采用直方圖二次型距離法克服這一缺

34、陷。(2)直方圖的二次型距離這種計算距離的公式中加進了顏色相似矩陣,其形式為D (Hm,Hk) = (Hm-Hk)T A (Hm-Hk),矩陣An×n=aij,權(quán)aij表示Hm中第i個元素Hmci,與Hkcj的相似程度,aij=aji且aii=1,其中Hm為目標圖像顏色直方圖,Hk為庫中顏色直方圖。(3)分塊顏色特征向量計算法對于分塊顏色特征,可以采用下式計算相似距離:D(Q,T)=w5mQ-mTmQ-mT+i=1,2,3,4wi(eQ-eT)(eQ-eT) (3-5)wi=0.4, & 當i=5時 0.15, 當i=1,2,3,4時其中wi為加權(quán)系數(shù),以上wi值為系統(tǒng)所設定

35、的初值,用戶可以根據(jù)圖像實際情況設置不同的加權(quán)系數(shù)。4基于顏色特征的圖像檢索系統(tǒng)設計和實現(xiàn)4.1系統(tǒng)結(jié)構(gòu)設計在系統(tǒng)的實現(xiàn)上,將系統(tǒng)結(jié)構(gòu)劃分為圖像入庫子系統(tǒng)和圖像檢索子系統(tǒng)。圖像處理與分析特征提取圖像處理與分析圖像特征庫特征提取相似匹配輸入圖像檢索圖像圖4-1圖像檢索系統(tǒng)的組成結(jié)構(gòu)圖圖像入庫部分的主要功能是圖像獲取、圖像特征的提取和讀入。在圖像獲取過程中,采用BMP圖像組成圖像數(shù)據(jù)庫,用戶可隨意選擇需要的圖像。提取特征時,將BMP圖像的RGB顏色空間轉(zhuǎn)換為HSV空間并提取圖像的顏色特征作為索引,寫入圖像特征數(shù)據(jù)庫中。圖像檢索部分是完成基于圖像顏色的檢索。運用顏色特征匹配算法,通過相似性距離函數(shù)將

36、待檢索圖像的特征和特征庫中的對應特征進行匹配,實現(xiàn)圖像的檢索,并最終把檢索結(jié)果顯示出來。4.2圖像特征數(shù)據(jù)庫設計在CBIR系統(tǒng)的設計過程中,還需要考慮圖像數(shù)據(jù)庫中圖像存放的形式與圖像數(shù)據(jù)庫的格式。圖像特征數(shù)據(jù)庫用于存放圖像庫中各圖像的顏色特征。在這里,將得到的一維直方圖特征作為圖像的特征向量存放到Access相應的特征表中,組成特征數(shù)據(jù)庫。可將Access數(shù)據(jù)表的模式設計為(No,t0,t1,t2,t35,文件名稱,相似距離),其中t0t35字段用來存放每圖像的一維直方圖特征向量。文件名稱字段存放檢索出來的圖像的名稱。相似距離字段存放的是待檢索圖和圖像庫中圖像之間的相似距離,用數(shù)字表示出來。4

37、.3系統(tǒng)開發(fā)環(huán)境Visual Basic 6.0是微軟公司推出功能強大的面向?qū)ο蟮目梢暬某绦蛟O計語言。它具有強大的圖像處理功能,如Image控件,Picture Box控件等。同時,VB6.0還使用兩種數(shù)據(jù)訪問技術:JET數(shù)據(jù)庫引擎和ODBC技術,這是數(shù)據(jù)訪問的核心部分。而且數(shù)據(jù)庫引擎能夠把數(shù)據(jù)控件和數(shù)據(jù)訪問對象所提出的數(shù)據(jù)庫操作轉(zhuǎn)變成對數(shù)據(jù)庫的物理操作。4.4系統(tǒng)流程根據(jù)對實驗系統(tǒng)中的圖像數(shù)據(jù)庫結(jié)構(gòu)與其算法、顏色模型、距離度量函數(shù)等方面的設計,開發(fā)了圖像檢索系統(tǒng)。檢索系統(tǒng)流程圖如圖4-2。開始選擇關鍵圖像特征提取相似度計算輸出檢索結(jié)果用戶系統(tǒng)圖4-2檢索系統(tǒng)流程圖4.5系統(tǒng)的實現(xiàn)4.5.1

38、圖像的獲取圖像入庫的界面如圖4-3所示,用戶可以自由添加圖像,并將該圖像的顏色特征讀入圖像特征數(shù)據(jù)庫中,形成自定義的特征庫。除此之外,用戶還可以自主選擇待檢索的關鍵圖。圖4-3圖像入庫界面4.5.2圖像特征的提取特征提取是把圖像的顏色特征信息提取出來存入圖像特征數(shù)據(jù)庫,以此特征來進行對待檢索圖像的檢索。在這個過程中,先將圖像的RGB模型轉(zhuǎn)換成HSV模型,量化后得到36柄的一維直方圖,其算法如下:For i = 0 To 35 t(i) = 0Next iFor j = 0 To YPos - 1For i = 0 To XPos - 1r = PicCol(i, j, 2): g = PicC

39、ol(i, j, L): b = PicCol(i, j, 0)v1 = Max(r, g, b): v = v1 / 255If v1 = Min(r, g, b) Thenr1 = 0: g1 = 0: v1 = 0: s = 0Elser1 = (v1 - r) / (v1 - Min(r, g, b)g1 = (v1 - g) / (v1 - Min(r, g, b)b1 = (v1 - b) / (v1 - Min(r, g, b)s = (v1 - Min(r, g, b) / v1End IfIf r = g And g = b Thenh1 = 5 - r1ElseIf r =

40、 Max(r, g, b) And g = Min(r, g, b) Thenh1 = 5 + b1ElseIf r = Max(r, g, b) And g <> Min(r, g, b) Thenh1 = 1 - g1ElseIf g = Max(r, g, b) And b = Min(r, g, b) Thenh1 = 1 + r1ElseIf g = Max(r, g, b) And b <> Min(r, g, b) Thenh1 = 3 - b1ElseIf b = Max(r, g, b) And r = Min(r, g, b) Thenh1 = 3

41、+ g1Elseh1 = 5 - r1End IfEnd Ifh = h1 * 60Select Case h '量化HSV模型Case 0 To 60hh = 0Case 60 To 120hh = 1Case 120 To 180hh = 2Case 180 To 240hh = 3Case 240 To 300hh = 4Case 300 To 360hh = 5End SelectSelect Case sCase 0 To 0.25ss = 0Case 0.25 To 1ss = 1End SelectSelect Case vCase 0 To 0.3vv = 0Case

42、0.3 To 0.8vv = 1Case 0.8 To 1vv = 2End SelectL_PicCol(i, j) = 6 * hh + 3 * ss + vvt(L_PicCol(i, j) = t(L_PicCol(i, L) + 1Next iNext j這里給出一幅示例圖像,如圖4-4中的“國旗”圖像,利用上述算法得到的該圖像的36柄一維直方圖,并將其作為特征向量讀入圖像特征數(shù)據(jù)庫,如表4-1所示。圖4-4示例圖像表4-1示例圖像的特征向量Not0t1t2t3t4t5t6t7t81000000000t9t10t11t12t13t14t15t16t17t180007808936193

43、711t19t20t21t22t23t24t25t26t27t28020008600000t29t30t31t32t33t34t35074141087204.5.3圖像的檢索在用戶自主選擇好圖像特征信息庫,將圖像的顏色特征都讀入其中后,便可以選擇一待檢索的圖像,根據(jù)待檢索圖像和圖像特征信息庫中的圖像之間的相似距離來檢索出與待檢索圖像顏色特征最為相近的圖像來,并按照相似距離的大小排列顯示。圖像檢索的算法為:Public Sub Search() Dim sumRecord As Integer Dim distance As Long Dim similar(6) As String Set m

44、ycon = New connection mycon.Open "provider=Microsoft.Jet.oledb.4.0;data source=" & App.Path & "圖像特征數(shù)據(jù)庫圖像特征.mdb;persist security info = false" Set rtezh = New Recordset rtezh.Open "select * from tezheng", mycon, adOpenKeyset, adLockPessimistic sumRecord = rtezh.R

45、ecordCount Do Until rtezh.EOF = True distance = 0 For a = 0 To 35 distance = distance + (rtezh.Fields(a + 1) - t(a) * (rtezh.Fields(a + 1) - t(a) Next a distance = Sqr(distance) rtezh.Fields(38) = distance rtezh.Update rtezh.MoveNext Loop rtezh.Close End Sub這里將另一幅“國旗”圖像作為待檢索圖像,“開始檢索”后,圖像庫中各圖像與待檢索圖像相

46、似距離由歐式距離算法得到,并按照相似距離由小到大將圖像進行排列。如圖4-5所示。圖4-5圖像檢索界面本系統(tǒng)可以自行建立若干幅圖像的圖像庫與特征數(shù)據(jù)庫,支持一般直方圖的特征檢索方法,對待檢索圖像和圖像庫中的圖像之間的有了較好的匹配,并通過界面顯示出圖像間的相似距離和檢索結(jié)果的路徑。5總結(jié)本文在研究國外基于容的圖像檢索技術的歷史發(fā)展和應用狀況的基礎上,在圖像的眾多視覺特征中,選用圖像的顏色特征進行提取和檢索。主要進行了以下工作:(1)選擇圖像的格式,定義其文件信息。本文選用Windows環(huán)境下的標準圖像格式BMP圖像格式,通過文件結(jié)構(gòu)的分析,對其進行了文件頭和文件信息的定義,為系統(tǒng)功能的實現(xiàn)確定了

47、圖像標準。(2)概括常見的幾種顏色空間,對RGB和HSV顏色空間進行了重點闡述,并介紹了這兩種顏色空間的轉(zhuǎn)換以與HSV空間量化方法。(3)在一維顏色直方圖的基礎上,介紹了基于子塊的顏色直方圖的改進算法,通過用戶自主選擇感興趣的區(qū)域,自主調(diào)整權(quán)重系數(shù),使圖像的檢索結(jié)果更加符合用戶視覺感知。在實現(xiàn)CBIR系統(tǒng)的兩個關鍵問題是:圖像容的特征提取和基于容特征的圖像相似性匹配方法。本文對顏色特征的研究和探索,實現(xiàn)了設計預期的基本功能,對于基于容的圖像檢索技術的發(fā)展具有一定的參考價值和意義。但是對于基于容的圖像檢索系統(tǒng),僅僅按照顏色特征得到的檢索結(jié)果圖和人的視覺觀察還不完全吻合,且本系統(tǒng)的待檢索圖像和被讀

48、入圖像有一定的圖像格式和像素的要求。如果能夠結(jié)合形狀、紋理等視覺特征,在不同的檢索條件下,采用不同的特征或者幾種特征的組合形式,且打破系統(tǒng)的圖像像素的束縛,就能夠顯著提高系統(tǒng)的性能。參考文獻1周.基于顏色特征的圖像檢索系統(tǒng)的研究與實現(xiàn)D.:大學,2003:132余芳.基于顏色特征的圖像檢索技術研究D.:中國石油大學計算機學院,2007:9153王冰.基于顏色特征的圖像檢索方法研究D.:大學控制學院,2005:23304斌.基于顏色容的圖像檢索J.情報雜志,2000,19:50515冬梅.基于顏色直方圖的圖像檢索技術應用研究D.:河海大學計算機與信息工程學院,2004:29306閆樂林,亓萊濱,

49、蔡平勝.一種基于容的圖像檢索系統(tǒng)的設計與實現(xiàn)J.計算機技術與發(fā)展,2009, 12:2052087朱從旭.Visual Basic程序設計綜合教程M.:清華大學,2009:651138周穎.Visual Basic 6.0實例精通M.:清華大學,2000:871099史永利.中文版Access2007寶典M.:電子工業(yè),2008:16724310Minakshi Banerjee, Malay K. Kundu, Pradipta Maji et al.Content-based image retrieval using visually significant point features

50、J. Fuzzy sets and Systems, 2009, 160:3323334111Remco C. Veltkamp, Mirela Tanase.Content-Based Image Retrieval Systems: A SurveyJ. Department of Computing Science, Utrecht University, 2000, 34:305112呂學安.淺析VB中用數(shù)據(jù)庫存取圖像的方法J.教育學院學報,2010,11:183184致在此論文完成之際,我由衷地感大學四年來關心、幫助和支持我的人們。特別感我的指導老師許靜老師,從論文的選題到最終完稿,

51、許靜老師花費了大量的時間和精力,幫助我攻克課題上的一道又一道難題。同時,許靜老師以淵博的專業(yè)知識、嚴格的學術標準和嚴謹?shù)慕虒W態(tài)度影響著我,使我最終能堅持完成此論文,并在專業(yè)知識方面有了進一步提升,更加注重學以致用。感大學電子信息工程學院的各位老師以與一起相處、學習的同學,與他們的交流學習開闊了我的視野,促進了我的進步。最后,對評閱此論文的老師們表示感,能夠得到你們的點評,我深感榮幸。附錄1 存取BMP圖像程序:Public PicColor(800, 600, 2) As BytePublic BF As BITMAPFILEHEADERPublic BI As BITMAPINFOHEADERPublic PictureFileName As StringPublic PictureNameSave As StringPublic PicCol(800, 600, 2) As BytePublic M

溫馨提示

  • 1. 本站所有資源如無特殊說明,都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請下載最新的WinRAR軟件解壓。
  • 2. 本站的文檔不包含任何第三方提供的附件圖紙等,如果需要附件,請聯(lián)系上傳者。文件的所有權(quán)益歸上傳用戶所有。
  • 3. 本站RAR壓縮包中若帶圖紙,網(wǎng)頁內(nèi)容里面會有圖紙預覽,若沒有圖紙預覽就沒有圖紙。
  • 4. 未經(jīng)權(quán)益所有人同意不得將文件中的內(nèi)容挪作商業(yè)或盈利用途。
  • 5. 人人文庫網(wǎng)僅提供信息存儲空間,僅對用戶上傳內(nèi)容的表現(xiàn)方式做保護處理,對用戶上傳分享的文檔內(nèi)容本身不做任何修改或編輯,并不能對任何下載內(nèi)容負責。
  • 6. 下載文件中如有侵權(quán)或不適當內(nèi)容,請與我們聯(lián)系,我們立即糾正。
  • 7. 本站不保證下載資源的準確性、安全性和完整性, 同時也不承擔用戶因使用這些下載資源對自己和他人造成任何形式的傷害或損失。

評論

0/150

提交評論