版權(quán)說(shuō)明:本文檔由用戶提供并上傳,收益歸屬內(nèi)容提供方,若內(nèi)容存在侵權(quán),請(qǐng)進(jìn)行舉報(bào)或認(rèn)領(lǐng)
文檔簡(jiǎn)介
1、基于內(nèi)容的圖像檢索研究 摘要:基于內(nèi)容的圖像檢索是圖像檢索中較高層次的檢索,文中對(duì)cbir的各種特征提取方法進(jìn)行了分析比較,最后指出了當(dāng)前的研究熱點(diǎn)和今后的發(fā)展方向。 關(guān)鍵詞:cbir;特征提取;顏色;紋理;形狀 research of content-based image retrieval li cong, zhang ming-xin, qiao xiao-ni, zhang a-hong (college of mathematics and information science,northwest normal university,lanzhou 730070,china) a
2、bstract:content-based image retrieval is the high level of the retrieval.this paper introduce and compare various methods for feature extraction and similarity measurement.in the end,the hot research and future research trends are presented. key words: content-based image retrieval,feature extractio
3、n,colour features,texture features,shape features 1 前言 據(jù)統(tǒng)計(jì),人類(lèi)接受的外部信息,70%以上來(lái)自視覺(jué),圖像作為一種內(nèi)容豐富,表現(xiàn)直觀的多媒體信息被大量廣泛的使用,如何有效的管理、檢索圖像信息成為迫切需要解決的問(wèn)題。傳統(tǒng)的基于文本的檢索無(wú)法滿足海量環(huán)境下多媒體信息庫(kù)的檢索要求。為了克服基于文本方法的局限性,出現(xiàn)了基于內(nèi)容的圖像檢索。 2 特征檢索技術(shù) 在基于內(nèi)容的圖像檢索中,特征提取是很關(guān)鍵的步驟,所提取的特征直接影響后續(xù)的圖像相似性匹配過(guò)程、檢索有效性等。 2.1 顏色特征檢索 顏色特征檢索是當(dāng)前絕大多數(shù)基于內(nèi)容的圖像和視頻檢索的多媒體數(shù)
4、據(jù)庫(kù)中使用的特征之一。基于顏色特征檢索主要采用的方法有:顏色直方圖、顏色相關(guān)圖、顏色矩等。 2.1.1 顏色直方圖 顏色直方圖法1的具體做法是,在確定顏色空間的基礎(chǔ)上,計(jì)算每種顏色的像素個(gè)數(shù),并構(gòu)造直方圖,最后把直方圖作為圖像的顏色特征進(jìn)行圖像檢索。特征的相似性度量是通過(guò)對(duì)直方圖之間的距離的設(shè)定,當(dāng)它們的距離小于給定的閾值時(shí),即認(rèn)為符合檢索結(jié)果。其改進(jìn)方法有stricker和dimai于1996年提出的基于顏色空間的固定劃分方法,既先將圖像分割為適當(dāng)?shù)姆謮K,然后用分塊的顏色直方圖和分塊的顏色矩為每個(gè)分塊提取響應(yīng)的局部顏色特征,從而提高圖像檢索的準(zhǔn)確性。文獻(xiàn)2 采納gaussian向量量化技術(shù)提
5、出顏色直方圖,文獻(xiàn)3 采用距離角度直方圖方法,統(tǒng)計(jì)每一種顏色在特定距離和角度內(nèi)的顏色直方圖,文獻(xiàn)4提出了一種基于位平面直方圖的檢索方法,文獻(xiàn)5研究了不同顏色視覺(jué)感知強(qiáng)度間的差異,通過(guò)構(gòu)建顏色主觀信息量函數(shù),實(shí)現(xiàn)對(duì)這種差異的量化描述。在此基礎(chǔ)上構(gòu)建了符合視覺(jué)感知特性的顏色直方圖。 2.1.2 顏色相關(guān)圖 顏色相關(guān)圖6color correlogram)是圖像顏色分布的另一種表達(dá)方式。這種特征不但刻畫(huà)了某一種顏色的像素?cái)?shù)量占整個(gè)圖像的比例,還反映了不同顏色對(duì)之間的空間相關(guān)性。顏色相關(guān)圖的圖像檢索效果很好,但是它的缺點(diǎn)就是計(jì)算量很大。 2.1.3 顏色矩 顏色矩7 (color moments)由s
6、tricker 和orengo所提出。這種方法的數(shù)學(xué)基礎(chǔ)在于圖像中任何的顏色分布均可以用它的矩來(lái)表示。此外,由于顏色分布信息主要集中在低階矩中,因此僅采用顏色的一階矩(mean)、二階矩(variance)和三階矩(skewness)就足以表達(dá)圖像的顏色分布。與顏色直方圖相比,該方法的好處在于無(wú)需對(duì)特征進(jìn)行向量化。 2.2 紋理特征檢索 一般將圖像在局部區(qū)域內(nèi)呈現(xiàn)不規(guī)則性,而在整體上表現(xiàn)出某種規(guī)律性的特性稱(chēng)為紋理。紋理特征通常被看作圖像的某種局部特征,它不僅反映圖像的灰度統(tǒng)計(jì)信息,而且反映圖像的空間分布信息和結(jié)構(gòu)信息。 基于內(nèi)容的圖像檢索中常用的紋理特征提取算法,主要有灰度共生矩陣、tamur
7、a紋理特征、小波變換等。 2.3 形狀特征檢索 形狀是圖像的可視內(nèi)容的一個(gè)重要特征。對(duì)于形狀匹配來(lái)說(shuō),hough變換是最經(jīng)典的方法。常用的形狀匹配方法還有歐氏距離、馬氏距離,幾何參數(shù)法,小波重要系數(shù)法。在眾多形狀匹配算法中,barrow等人提出的chamfer比較法吸引了不少研究者的興趣,該方法能夠以線性的時(shí)間復(fù)雜度比較兩個(gè)圖像的形狀塊集合。在形狀描述方面,主要包括邊界特征法、傅立葉形狀描述符法(fourier shape descriptors)、幾何參數(shù)法、形狀不變矩法、有限元方法(finite element method,fem)、小波描述子法等。 2.4 圖像內(nèi)容的空間關(guān)系 上述的顏
8、色、紋理和形狀等多種特征反映的都是圖像的整體特征,而無(wú)法體現(xiàn)圖像中所包含的對(duì)象或物體。事實(shí)上,圖像中對(duì)象所在的位置和對(duì)象之間的空間關(guān)系同樣是圖像檢索中非常重要的特征。 在基于空間關(guān)系的圖像檢索方面國(guó)內(nèi)外學(xué)者做了大量的研究,如文獻(xiàn)8提出的基于空間關(guān)系的圖像檢索,該方法對(duì)一幅圖像從幾個(gè)方向的投影作為這幅圖像的顏色特征分布,并對(duì)圖像做小波分解來(lái)減少檢索時(shí)運(yùn)算的數(shù)據(jù)量,然后對(duì)分解后圖像的低頻子帶做radon變換得到顏色空間分布的特征向量,并根據(jù)這個(gè)特征進(jìn)行檢索。文獻(xiàn)9中提出一種改進(jìn)的基于模糊量化的顏色量化方法并在此基礎(chǔ)上提出了一種基于顏色-空間特征的檢索方法。文獻(xiàn)10中提出一種通過(guò)提取顏色特征、灰度特
9、征,獲取圖像物體的形狀和空間特征,綜合檢索圖像的方法,檢索結(jié)果不受圖像大小、旋轉(zhuǎn)和輕微的光照變化的影響,相對(duì)于傳統(tǒng)的顏色直方圖法,這種方法能明顯改善檢索效果。 3 目前的研究的熱點(diǎn)領(lǐng)域 3.1 mpeg-7在基于內(nèi)容的圖像檢索中的應(yīng)用 mpeg-7標(biāo)準(zhǔn)在一個(gè)穩(wěn)定的底層架構(gòu)上為用戶提供了較大的靈活性。這一標(biāo)準(zhǔn)的發(fā)布,對(duì)圖像低層特征的提取和描述將更具規(guī)范性,結(jié)合mpeg-7標(biāo)準(zhǔn)的圖像檢索可在特征及其提取、查詢(xún)接口、檢索引擎、索引等方面進(jìn)一步深入研究。mpeg-7多媒體內(nèi)容描述標(biāo)準(zhǔn)的制定將極大的促進(jìn)cbir的廣泛應(yīng)用。目前基于mpeg-7的圖像檢索的研究主要集中在模型的研究。如文獻(xiàn)11文獻(xiàn)12的基于
10、mpeg-7標(biāo)準(zhǔn)的圖像檢索系統(tǒng)的抽象模型。 3.2 圖像數(shù)據(jù)庫(kù)技術(shù) 由于基于內(nèi)容的圖像檢索需要將圖像的顏色、文理和形狀等作為索引,用戶通過(guò)選擇具有代表性的一幅或多幅例子圖像來(lái)構(gòu)造圖像,因此關(guān)系數(shù)據(jù)庫(kù)在基于內(nèi)容的圖像檢索中面臨著諸多問(wèn)題,基于內(nèi)容的圖像數(shù)據(jù)庫(kù)的研究變的由為重要。面向?qū)ο髷?shù)據(jù)庫(kù)所支持的多媒體的各種結(jié)構(gòu)和類(lèi)型數(shù)據(jù)能較好的解決目前所面臨的問(wèn)題。文獻(xiàn)13中提出基于內(nèi)容圖像數(shù)據(jù)庫(kù)的結(jié)構(gòu)并構(gòu)造了一個(gè)按內(nèi)容檢索的面向?qū)ο髷?shù)據(jù)模型。 3.3 基于內(nèi)容的圖像檢索的性能評(píng)價(jià)的度量方法的研究 對(duì)于性能評(píng)價(jià)的度量方法,目前采用最多的方法還是傳統(tǒng)的信息檢索領(lǐng)域中普遍采用的查準(zhǔn)率和查全率,但查全率和查準(zhǔn)率的
11、局限性在于沒(méi)有考慮檢索結(jié)果中相似圖像所處的位置。研究者們還用以下幾種度量方法來(lái)評(píng)價(jià)圖像檢索的性能:1)3點(diǎn)平均植:查全率為0.2,0.5,0.8處查準(zhǔn)率的平均植14。2)11點(diǎn)平均植:在11個(gè)查準(zhǔn)率點(diǎn)處查準(zhǔn)率的平均植。3)當(dāng)準(zhǔn)確率下降到0.5時(shí)的查全率14 (4)berman和shapiro通過(guò)判斷相關(guān)圖像出現(xiàn)在返回的前50幅和前500幅圖像中的比例來(lái)評(píng)判檢索性能15。5)hwang et al 所使用的錯(cuò)誤率的方法,即檢測(cè)出的不相關(guān)的圖像和圖像總數(shù)的比值來(lái)判斷檢索性能15。 4 結(jié)束語(yǔ) 自20世紀(jì)90年代以來(lái),隨著互聯(lián)網(wǎng)的高速發(fā)展、數(shù)字圖像的廣泛應(yīng)用,使得如何有效組織、管理和檢索大規(guī)模的圖像
12、數(shù)據(jù)成為亟待解決的問(wèn)題,因此,cbir技術(shù)成為一個(gè)研究熱點(diǎn),目前,世界各國(guó)的相關(guān)研究人員沿著基于內(nèi)容的圖像檢索研究方向也已成功的開(kāi)發(fā)出許多帶有商業(yè)性質(zhì)或者研究性質(zhì)的cbir系統(tǒng),但是,在這個(gè)領(lǐng)域目前還有很多值得深入研究的課題。正如john eakins博士所言:基于內(nèi)容檢索的圖像分析與檢索技術(shù)的研究不會(huì)是曇花一現(xiàn),它不像某些過(guò)分熱情洋溢的學(xué)者所期望的那么有效,它也不像某些批評(píng)者所想的那么糟糕,它會(huì)繼續(xù)得到 發(fā)展和改進(jìn)。 參考文獻(xiàn): 1 michaelswain,danaballard.colorindexingj.international journal of computer vision
13、,1991. 2 jeong s,won c s,gray r m.image retrieval using color histograms generated by gauss mixture vector quantizationj.computer vision and image understanding,2004,9(1-3):44-46. 3 ediz saykol,ugur gudukbay,ozgur ulusoy.a histogram-based approach for object-based query-by-shape-and-color in image a
14、nd video databasesj.image and vision computing,2005(23),1170-1180. 4 王向陽(yáng),胡峰麗.基于位平面顏色直方圖的圖象檢索新方法j.小型微型計(jì)算機(jī)系統(tǒng),2007(4). 5 胡珊,郭雷,沈云濤.基于視覺(jué)感知特性的顏色直方圖j.計(jì)算機(jī)應(yīng)用,2006(12). 6 mao a k jain.textureclassification and segmentation using multiresolution simultaneous autoregressive modelsj.pattern recognition,1992,25(
15、2):173-188. 7 markus stricker,markus orengo.similarity of color imagesc/proc spie storage and retrieval for image and video databases,1995. 8 牛蕾,倪林,苗原.基于顏色空間分布特征的圖像檢索j.算機(jī)工程與應(yīng)用,2005(4). 9 方俊, 郭雷, 汪子強(qiáng).一種改進(jìn)的基于顏色-空間特征的圖像檢索方法j.計(jì)算機(jī)工程與應(yīng)用,2005(25). 10 錢(qián)瑛,須文波.基于顏色空間特征的圖像檢索j.江南大學(xué)學(xué)報(bào):自然科學(xué)版,2007,6(2). 11 李嵐,馮剛.mpeg-
溫馨提示
- 1. 本站所有資源如無(wú)特殊說(shuō)明,都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請(qǐng)下載最新的WinRAR軟件解壓。
- 2. 本站的文檔不包含任何第三方提供的附件圖紙等,如果需要附件,請(qǐng)聯(lián)系上傳者。文件的所有權(quán)益歸上傳用戶所有。
- 3. 本站RAR壓縮包中若帶圖紙,網(wǎng)頁(yè)內(nèi)容里面會(huì)有圖紙預(yù)覽,若沒(méi)有圖紙預(yù)覽就沒(méi)有圖紙。
- 4. 未經(jīng)權(quán)益所有人同意不得將文件中的內(nèi)容挪作商業(yè)或盈利用途。
- 5. 人人文庫(kù)網(wǎng)僅提供信息存儲(chǔ)空間,僅對(duì)用戶上傳內(nèi)容的表現(xiàn)方式做保護(hù)處理,對(duì)用戶上傳分享的文檔內(nèi)容本身不做任何修改或編輯,并不能對(duì)任何下載內(nèi)容負(fù)責(zé)。
- 6. 下載文件中如有侵權(quán)或不適當(dāng)內(nèi)容,請(qǐng)與我們聯(lián)系,我們立即糾正。
- 7. 本站不保證下載資源的準(zhǔn)確性、安全性和完整性, 同時(shí)也不承擔(dān)用戶因使用這些下載資源對(duì)自己和他人造成任何形式的傷害或損失。
最新文檔
- 2025年粵人版九年級(jí)歷史上冊(cè)階段測(cè)試試卷含答案
- 2025年浙教新版九年級(jí)歷史下冊(cè)月考試卷
- 2025年人教版PEP九年級(jí)地理上冊(cè)月考試卷含答案
- 2025年成都航空職業(yè)技術(shù)學(xué)院高職單招職業(yè)技能測(cè)試近5年??及鎱⒖碱}庫(kù)含答案解析
- 2025年全國(guó)科技活動(dòng)周科普知識(shí)競(jìng)賽試題庫(kù)及答案
- 2025年廣州工程技術(shù)職業(yè)學(xué)院高職單招語(yǔ)文2018-2024歷年參考題庫(kù)頻考點(diǎn)含答案解析
- 2025年太湖創(chuàng)意職業(yè)技術(shù)學(xué)院高職單招職業(yè)適應(yīng)性測(cè)試近5年常考版參考題庫(kù)含答案解析
- 2025年北京科技職業(yè)學(xué)院高職單招職業(yè)技能測(cè)試近5年常考版參考題庫(kù)含答案解析
- 2025至2031年中國(guó)老化母粒行業(yè)投資前景及策略咨詢(xún)研究報(bào)告
- 2025至2031年中國(guó)皮帶盤(pán)卡具行業(yè)投資前景及策略咨詢(xún)研究報(bào)告
- 2025中國(guó)大唐集團(tuán)內(nèi)蒙古分公司招聘高頻重點(diǎn)提升(共500題)附帶答案詳解
- 充血性心力衰竭課件
- GB 4793-2024測(cè)量、控制和實(shí)驗(yàn)室用電氣設(shè)備安全技術(shù)規(guī)范
- 挖掘機(jī)售后保養(yǎng)及維修服務(wù)協(xié)議(2024版)
- 2023-2024年度數(shù)字經(jīng)濟(jì)與驅(qū)動(dòng)發(fā)展公需科目答案(第5套)
- 職業(yè)分類(lèi)表格
- 廣東省深圳高級(jí)中學(xué)2023-2024學(xué)年八年級(jí)下學(xué)期期中考試物理試卷
- 電網(wǎng)建設(shè)項(xiàng)目施工項(xiàng)目部環(huán)境保護(hù)和水土保持標(biāo)準(zhǔn)化管理手冊(cè)(變電工程分冊(cè))
- 口腔門(mén)診部設(shè)置可行性研究報(bào)告
- 體檢科運(yùn)營(yíng)可行性報(bào)告
- 北京市豐臺(tái)區(qū)市級(jí)名校2024屆數(shù)學(xué)高一第二學(xué)期期末檢測(cè)模擬試題含解析
評(píng)論
0/150
提交評(píng)論