版權(quán)說明:本文檔由用戶提供并上傳,收益歸屬內(nèi)容提供方,若內(nèi)容存在侵權(quán),請進行舉報或認領(lǐng)
文檔簡介
PAGE24基于內(nèi)容的圖像檢索-—累加直方圖算法?摘要?隨著多媒體、網(wǎng)絡(luò)技術(shù)的迅速發(fā)展,圖像信息的應(yīng)用日益廣泛,對規(guī)模越來越大的圖像數(shù)據(jù)庫、可視信息進行有效的管理成為迫切需要解決的問題,靈活、高效、準確的圖像檢索策略是解決這一問題的關(guān)鍵技術(shù)之一。因此,基于內(nèi)容的圖像檢索已成為國內(nèi)外學者研究的主要熱點問題,并取得了不少的成果。本文主要對當今熱門的基于內(nèi)容的圖像檢索技術(shù)進行了研究,重點對它的算法進行研究。在半年的時間里,通過查閱很多相關(guān)的資料,并認真學習了基于內(nèi)容的圖像檢索的基本理論,特別是深入研究了顏色直方圖理論和累加直方圖算法,最后在MATLAB平臺下編程實現(xiàn)此系統(tǒng),該系統(tǒng)可以實現(xiàn)基本圖像檢索的功能,根據(jù)用戶輸入的樣本圖像來與圖像庫中的圖像進行特征匹配,然后找出與樣本圖像距離比較小的若干幅圖像,并按照圖像之間的距離由小到大的順序顯示給用戶。經(jīng)過對該系統(tǒng)進行反復的調(diào)試運行后,該系統(tǒng)所實現(xiàn)的功能基本達到了設(shè)計目標,并且運行良好。當用戶提供出所要查詢的關(guān)鍵圖后,系統(tǒng)就可以從用戶提供的圖像庫中檢索到與關(guān)鍵圖相似的圖片并排序返回給用戶,達到了預期效果。關(guān)鍵詞:圖像檢索累加直方圖顏色特征MATLABTitleContent-BasedImageRetrieval—-cumulativehistogramalgorithmAbstractWiththerapiddevelopmentofthemultimediaandthenetworktechnology,theimageinformationbecomesmorewidelyavailable,increasingthesizeoftheimagedatabase,visualinformationforeffectivemanagementofanurgentneedtoaddresstheproblem,flexible,efficientandaccurateimageretrievalstrategysolvethisproblemoneofthekeytechnologies.TheresearchersaresokeenonContent—BasedImageRetrievalthattheyhavemademuchprogress。Inthispaper,today’spopularcontent-basedimageretrievaltechnologyisanalyzed。Anditmainlyfocusesontheresearchofitsalgorithm。Inaperiodofhalfayear,Throughaccesstorelevantinformationandtoseriouslystudythecontent-basedimageretrievalofthebasictheory,inparticular,in-depthstudyofthecolorhistogramtheoryandcumulat(yī)ivehistogramalgorithm。Finally,thissystemshouldbeimplementedundertheplatformoftheMATLABbyprogramming。Inthissystem,thebasicimageretrievalfunctionscanbeachieved。itcanaccordtothesamplesuserinputsandthepicturesoftheimagelibrarytomatch.Italsocanidentifytheimagesthathaveashortdistancetothesampleimages,andpresenttotheuserinaccordancewiththeordersteeled.Afterrepeatedlyonthissystemdebuggingoperation,thesystemhaveachievethebasicfunctionsofthedesigngoals,andrunninggood.Whenuserswanttoprovideamapforthekey,thesystemcanprovideimagesfromtheimagelibrarytoretrievethekeyplansandsimilarsortofpicturethenreturnedthemtotheuser.Itachievedtheexpectedresults.KeywordsImageRetrievalCumulativeHistogramAlgorithmColorFeaturesMATLAB目次TOC\o"1—3"\h\z\uHYPERLINK\l”_1__緒論”1緒論?PAGEREF_Toc167715557\h1HYPERLINK\l”_1.1__國內(nèi)外的研究現(xiàn)狀”1.1國內(nèi)外的研究現(xiàn)狀?1HYPERLINK\l”_1。2_選題意義及本文研究的內(nèi)容"1。2選題意義及本文研究的內(nèi)容?3HYPERLINK\l"_2__基于內(nèi)容的圖像檢索的簡介”2基于內(nèi)容的圖像檢索的簡介?4HYPERLINK\l”_2。1_基于內(nèi)容的圖像檢索概述"2.1基于內(nèi)容的圖像檢索技術(shù)的概述?4HYPERLINK\l”_2.2_基于內(nèi)容的圖像檢索的關(guān)鍵技術(shù)”2。2基于內(nèi)容的圖像檢索的關(guān)鍵技術(shù)?5HYPERLINK\l”_3_基于內(nèi)容的圖像檢索原理和特點”3基于內(nèi)容的圖像檢索原理和特點 6HYPERLINK\l”_3.1_基于內(nèi)容的圖像檢索的原理及處理過程"3.1基于內(nèi)容的圖像檢索的原理及處理過程?6HYPERLINK\l”_3。2_基于內(nèi)容圖像檢索的特點"3。2基于內(nèi)容圖像檢索的特點?8HYPERLINK\l"_4_顏色特征理論”4顏色特征理論?8HYPERLINK\l”_4。1_顏色模型”4.1顏色模型?9HYPERLINK\l"_4.2_顏色特征提取”4.2顏色特征提取 10HYPERLINK\l"_5_顏色直方圖理論"5直方圖理論?12HYPERLINK\l"_5。1_顏色直方圖"5.1顏色直方圖?12HYPERLINK\l"_5.2_直方圖的矩"5。2直方圖的矩?13HYPERLINK\l"_5.3_直方圖均衡化算法"5.3直方圖均衡化算法?14HYPERLINK\l"_5.4_基于直方圖的圖像檢索技術(shù)分析"5.4基于直方圖的圖像檢索技術(shù)分析?14HYPERLINK\l”_6_累加直方圖算法”6累加直方圖算法?16HYPERLINK\l"_6。1_累加直方圖"6.1累加直方圖?16HYPERLINK\l"_6.2_算法實現(xiàn)”6.2算法實現(xiàn)?18HYPERLINK\l”_6.3_改進的局部累加直方圖算法”6.3改進的局部累加直方圖算法 18HYPERLINK\l”_6。4_算法總結(jié)"6。4算法總結(jié) 19HYPERLINK\l"_6。5_實驗結(jié)果”6.5實驗結(jié)果?19HYPERLINK\l"_7_系統(tǒng)的性能評價"7系統(tǒng)的性能評價?22HYPERLINK\l”_7。1_查全率和查準率"7。1查全率和查準率?22HYPERLINK\l"_7.2_排序評價方法"7.2排序評價方法?23HYPERLINK\l"_結(jié)__論”結(jié)論?24HYPERLINK\l"_致__謝”致謝?25HYPERLINK\l”_參_考_文_獻”參考文獻?261緒論隨著多媒體技術(shù)和計算機網(wǎng)絡(luò)的飛速發(fā)展,全球的數(shù)字圖像的容量正以驚人的速度增長。面對如此豐富且散布在世界范圍內(nèi)的海量圖像資源,如何從海量的圖像數(shù)據(jù)中高效、快速地檢索出所需信息是當前許多應(yīng)用領(lǐng)域所面臨的重要問題.傳統(tǒng)的基于關(guān)鍵詞、文本的圖像檢索技術(shù)的不足日益凸顯,主要體現(xiàn)在僅用關(guān)鍵詞對圖像資源描述的局限性,這種基于個體對圖像特征主觀認識的描述方法不能充分描述圖像資源;而基于內(nèi)容的圖像檢索技術(shù)(Content—BasedImageRetrieval,CBIR)的研究就是在這種現(xiàn)實需要的前提下提出并展開的.基于內(nèi)容的圖像檢索這一課題目前已是一個非?;钴S的研究領(lǐng)域,其在數(shù)字圖書館、數(shù)據(jù)挖掘及多媒體視覺內(nèi)容檢索等領(lǐng)域都起著十分重要的作用,在工業(yè)和科研領(lǐng)域具有廣泛的應(yīng)用性,例如醫(yī)學研究機構(gòu)的病理圖像資料管理、公安機關(guān)的犯罪數(shù)據(jù)分析、氣象局的衛(wèi)星照片管理和網(wǎng)上時興的電子購物等。但是CBIR評價研究還處于起步階段,評價方案和評價標準都處在探索之中,而特征維度較高、缺乏大規(guī)模的公用測試數(shù)據(jù)集等問題也給CBIR評價的研究工作帶來了很大的困難和挑戰(zhàn)。本論文的研究工作就是在這樣的情況下開展的。1.1國內(nèi)外的研究現(xiàn)狀1.1.1國內(nèi)的研究現(xiàn)狀隨著我國社會和經(jīng)濟的發(fā)展,使得從公共媒體到家庭娛樂,從自然科學到社會科學,每一個領(lǐng)域都滲透著對多媒體技術(shù)和因特網(wǎng)技術(shù)的應(yīng)用,都要求對各種資料的智能化的管理。隨著我國國防科技和航天事業(yè)的快速發(fā)展,軍事領(lǐng)域?qū)D像檢索技術(shù)也提出了更高的要求,大量的宇航圖片和衛(wèi)星圖片的產(chǎn)生,要求高效率的管理和查找。因此,在國內(nèi)不論是民用還是軍用,都使圖像檢索技術(shù)的研究具有極為重要的應(yīng)用價值。在我國從上個世紀末至今,基于內(nèi)容的圖像檢索技術(shù)逐漸成為研究和應(yīng)用的熱點。目前,我國的醫(yī)藥衛(wèi)生領(lǐng)域,工業(yè)生產(chǎn)和機械制造加工領(lǐng)域,農(nóng)業(yè)生產(chǎn)領(lǐng)域,國防科技領(lǐng)域,以及娛樂文化領(lǐng)域等都逐漸研究并應(yīng)用這項技術(shù)。在醫(yī)學領(lǐng)域,利用基于內(nèi)容的圖像檢索技術(shù)對醫(yī)學病理圖像進行檢索,輔助醫(yī)生的診斷和治療。工業(yè)生產(chǎn)中,利用這項技術(shù)對加工的產(chǎn)品進行質(zhì)量檢測,在新研制的汽車維修和零件銷售中,進行網(wǎng)上選購和訂貨。農(nóng)業(yè)生產(chǎn)中對農(nóng)作物進行病蟲害的監(jiān)測和防治工作。軍事領(lǐng)域中,開發(fā)智能導彈自動選擇目標實施攻擊。這些領(lǐng)域都是我國己經(jīng)和正在發(fā)展及應(yīng)用的實例[1]。從目前究和應(yīng)用的現(xiàn)狀來看,基于內(nèi)容的圖像家檢索技術(shù)主要應(yīng)用在專業(yè)圖庫中進行圖像的檢索.如在商標圖庫中,在掃描得到的報紙庫中,在農(nóng)產(chǎn)品如煙葉圖庫中.目前,市場上推出的基于圖像內(nèi)容的檢索系統(tǒng)軟件雖然各有所長,但是始終不能盡如人意,而且針對海量數(shù)據(jù)的特點如何快速地進行圖像的檢索還需要解決。1.1.2國外的研究現(xiàn)狀在國外,基于圖像內(nèi)容的檢索技術(shù)是隨著數(shù)字圖書館的發(fā)展,而逐漸發(fā)展并成為一個研究熱點。1994年美國啟動了持續(xù)四年的“數(shù)字圖書館”項目。1998年,美國自然科學基金會,國防部高級研究計劃署,國家航空航天局,國家醫(yī)學圖書館,國會圖書館,國家人文科學基金會和聯(lián)邦調(diào)查局聯(lián)合自主第二期計劃的的實施,掀起了全球性的數(shù)字圖書館研究熱潮[2]在數(shù)字圖書館中,其中一個關(guān)鍵的問題是檢索問題,集中在以下兩個方面:一是解決目前Internet的信息檢索問題,二是多媒體信息的檢索。因為圖像屬于一種視覺信息,所以圖像檢索問題在兩個方面中都存在[3]。IBM公司的QBIC系統(tǒng)可能是最著名的產(chǎn)品,它可以作為獨立的軟件產(chǎn)品使用,也可以作為IBM公司的數(shù)字圖書館的一個組成部分.QBIC系統(tǒng)實現(xiàn)了基于顏色、紋理或形狀的組合查詢,以及文字關(guān)鍵字的查詢。查詢接口方式實現(xiàn)了基于模板圖像的查找,基于調(diào)色板的查找,基于草圖的查找。Virage公司的VIR圖像工程系統(tǒng)也具有獨立性及附屬性,并且被應(yīng)用于AltaVista的網(wǎng)絡(luò)圖片查詢工具AVPhotoFinder中.Excalibur公司的Excalibur視覺檢索產(chǎn)品是在公司長期研究的模式識別理論和數(shù)據(jù)庫技術(shù)的基礎(chǔ)上研制出來的,現(xiàn)已被成功地應(yīng)用于Yaho上,即圖像沖浪組件,實現(xiàn)了基于內(nèi)容的圖像檢索。這些產(chǎn)品共同特征是:都是基于圖像特征矢量的檢索,數(shù)據(jù)庫中的每一幅圖像都由一個不超過500個元素的特征矢量描述。特征矢量一旦產(chǎn)生,就永久性地存儲下來,查詢時的搜索只是基于特征矢量的查詢。特征矢量之間的歐氏距離作為相似性度量的準則,按照距離的大小給出查詢結(jié)果[4]。1。2選題意義及本文研究的內(nèi)容1.2.1課題的目的和意義隨著Internet網(wǎng)絡(luò)技術(shù)的不斷發(fā)展,網(wǎng)絡(luò)用戶越來越多,網(wǎng)絡(luò)已成為目前最重要的信息來源之一。事實上,來自網(wǎng)絡(luò)的信息量比任何一種渠道的信息量都要大。所涉及的領(lǐng)域之廣、更新速度之快和搜集成本之低也是其他任何手段無法比擬的。網(wǎng)絡(luò)將會改變?nèi)祟惖囊磺?這已不是謠言,而是一個不爭的事實。但是,網(wǎng)絡(luò)的確是一個名副其實的“雙刃劍”,利用好它可以發(fā)揮它無窮的威力;反之,就會給自己帶來無窮的禍害,給國家?guī)砭薮蟮膿p失.從廣義上講,網(wǎng)絡(luò)就是一個巨型數(shù)據(jù)庫,人人都可以從中取到自己所需的東西。利用搜索引擎合法的在網(wǎng)上搜索特定信息本身就是網(wǎng)絡(luò)的建設(shè)目的之一。目前,國內(nèi)外許多研究者正在研究基于網(wǎng)絡(luò)的信息收集和檢索技術(shù)。特別是隨著網(wǎng)絡(luò)的普及,數(shù)據(jù)檢索和收集顯得越來越重要,已成為人們達到特定目的最有效的方法和手段之一.隨著圖像處理、圖像理解和模式識別研究的發(fā)展和深入,以及對人眼圖像理解機制的深入研究,基于圖像的搜索引擎得到了很大的發(fā)展,從傳統(tǒng)的語義注釋的圖像檢索到基于圖像內(nèi)容的圖像檢索技術(shù)(CBIR,Content-BasedImageRetrieval)發(fā)展,標志著圖像檢索技術(shù)根本性的變革。CBIR技術(shù)是隨著計算機視覺、圖像理解與圖像處理研究的進步而逐漸發(fā)展成熟的一種圖像媒體檢索技術(shù).1。2.2研究的主要內(nèi)容本文主要討論了基于顏色直方圖的圖像檢索技術(shù)一些基本的理論知識,著重研究的是用累加直方圖算法來實現(xiàn)一個系統(tǒng),并用該系統(tǒng)達到實現(xiàn)圖像檢索的目的,還要給出對該系統(tǒng)性能評價的一般標準。下面是本文的內(nèi)容介紹:本文第一部分簡要介紹了基于內(nèi)容地圖像檢索技術(shù)的背景資料和研究發(fā)展狀況,說明了研究該項技術(shù)的必要性.第二部分說明基于內(nèi)容的圖像檢索的基本概念綜述以及其關(guān)鍵技術(shù)。第三部分講述基于內(nèi)容的圖像檢索的原理工作過程和其特點。第四和第五部分主要講顏色特征理論和直方圖理論,這是為后面的算法研究打下理論基礎(chǔ)。第六部分主要介紹累加直方圖算法,這也是本文的最核心部分。后面一個部分講的是基于內(nèi)容的圖像檢索的評價標準。最后結(jié)論部分介紹的是總結(jié)和圖像檢索的研究趨勢.2基于內(nèi)容的圖像檢索的簡介2。1基于內(nèi)容的圖像檢索技術(shù)的概述基于內(nèi)容的圖像檢索涉及到圖像處理、計算機視覺、模式識別以及神經(jīng)網(wǎng)絡(luò)等學科,同時也和人腦的認識程度緊密相關(guān),這諸多因素使得基于內(nèi)容的圖像檢索的研究成為一項極富挑戰(zhàn)性的課題.本章從基于內(nèi)容的圖像檢索的基本原理、流程、關(guān)鍵技術(shù)、特點等多個方面對基于內(nèi)容的圖像檢索進行介紹和分析。2.1。1基于內(nèi)容的圖像檢索的基本概念所謂基于內(nèi)容的圖像檢索技術(shù)(Content-BasedImageRetrieval,CBIR),它是指利用圖像的顏色(灰度)、形狀、紋理、語義等特征對圖像進行查詢,試圖在理解圖像內(nèi)容的基礎(chǔ)上,檢索出與示例相類似的圖像。這種檢索不同于傳統(tǒng)的檢索,它用于檢索的是反映媒體內(nèi)容并與媒體存儲在一起的各種量化特征,使用的是基于相似性度量的示例查詢(QueryByExample)方法。它區(qū)別于傳統(tǒng)的檢索手段,融合了圖像理解技術(shù)、模式識別技術(shù),從而可以為信息用戶提供更加有效的檢索手段.2.1。2基于內(nèi)容的圖像檢索的體系結(jié)構(gòu)基于內(nèi)容的圖像檢索涉及了數(shù)據(jù)庫管理、計算機視覺、圖像處理、模式識別、信息檢索和認知心理學等諸多學科。目前圖像檢索系統(tǒng)的高性能還必須建立在人機交互的基礎(chǔ)上,如圖2。1為一種系統(tǒng)結(jié)構(gòu)圖[6]。系統(tǒng)結(jié)構(gòu)中有三個數(shù)據(jù)庫。原始圖像數(shù)據(jù)庫存儲用于視覺顯示的所有原始圖像??紤]到在圖像檢索過程中可能對圖像的分辨率由不同要求,因此,需對圖像進行預處理.視覺特征數(shù)據(jù)庫用來存儲提取出的圖像視覺特征,這是基于內(nèi)容的圖像檢索的必備信息,主要涉及計算機視覺和圖像理解技術(shù)。文本注釋數(shù)據(jù)庫包括圖像的關(guān)鍵詞和對圖像自由描述的文本。它是基于內(nèi)容的圖像檢索的必要補充,主要涉及文本信息檢索和數(shù)據(jù)庫管理技術(shù)。多維索引模塊是為了提高在大規(guī)模圖像庫中檢索圖像時的運行速度。盡管目前大部分實驗系統(tǒng)上未能采用這項技術(shù),但它是未來高性能圖像檢索系統(tǒng)必不可少的部分。這個模塊主要涉及計算幾何、數(shù)據(jù)庫管理和模式識別技術(shù).搜索引擎模塊包括查詢接口子模塊和查詢處理子模塊。前者主要是檢索用戶的信息需求,并顯示系統(tǒng)的檢索結(jié)果,后者確保系統(tǒng)能夠以最佳的方式處理用戶的查詢.查詢查詢接口查詢處理多維索引原始圖像庫可視化特征庫文本注釋庫特征提取及索引圖2.1基于內(nèi)容的圖像檢索系統(tǒng)結(jié)構(gòu)圖2.2基于內(nèi)容的圖像檢索的關(guān)鍵技術(shù)基于內(nèi)容的圖像檢索系統(tǒng)的關(guān)鍵技術(shù)包括以下幾個方面:(1)數(shù)學模型。數(shù)學模型是CBIR系統(tǒng)的核心,它決定了CBIR所能支持的查詢類型和檢索性能.建立的數(shù)學模型要充分反映圖像對象的內(nèi)容,反映與領(lǐng)域無關(guān)的和能夠有效存儲的物理特性及邏輯特征。(2)特征提取.特征提取是基于內(nèi)容的圖像檢索的基礎(chǔ)。特征提取算法應(yīng)簡單易用,且具有自動提取的功能,所選擇的特征應(yīng)盡可能表達原始圖像的信息。同時可以借助一些先進的數(shù)學工具來提取圖像特征。(3)索引技術(shù).在對圖像的檢索中,最主要的方式是相似性檢索。即在圖像數(shù)據(jù)庫中找到與給定圖像最為相似的一幅。它的一般做法是提取出圖像的特征建立特征庫。由于圖像特征一般都是高維的矢量數(shù)據(jù),所以這時圖像檢索就轉(zhuǎn)化為對空間數(shù)據(jù)庫中高維數(shù)的近鄰檢索問題.為了能夠高效的進行數(shù)據(jù)特征索引,從而實現(xiàn)圖像信息的檢索,目前對索引技術(shù)的研究主要集中在降低索引維數(shù)和建立良好的索引方法上.(4)累加直方圖算法。累加直方圖能體現(xiàn)信號在分布軸上各抽樣點間的相關(guān)性,即分布軸上相對某個抽樣點距離越近的點,在某種特性意義上就越相似于該抽樣點。但是累加直方圖能體現(xiàn)這個性質(zhì)的前提是:信號本身要有這樣的特性,即特征分布軸上距離小的兩點要比距離大的兩點更相似。3基于內(nèi)容的圖像檢索原理和特點3.1基于內(nèi)容的圖像檢索的原理及處理過程3.1。1基于內(nèi)容的圖像檢索的原理目前,基于內(nèi)容的圖像檢索的研究主要是借助圖像的特征來進行的,其基本工作原理是在建立圖像庫時,分析輸入圖像,提取圖像的特征作為特征向量,與圖像一起存儲在數(shù)據(jù)庫中。圖像檢索時,則提取給定查詢范例圖像的特征或由用戶指出要查詢圖像的特征,與數(shù)據(jù)庫中的特征向量進行匹配,并根據(jù)匹配結(jié)果返回相應(yīng)圖像。一個基于內(nèi)容的圖像檢索系統(tǒng)通常由四個組成部分(如圖3.1):圖像數(shù)據(jù)庫管理、相似匹配、查詢方式、結(jié)果輸出與反饋機制。根據(jù)CBIR系統(tǒng)的原理,可歸納出以下幾部分[7]:(1)圖像數(shù)據(jù)庫系統(tǒng)。由圖像庫、特征庫、和知識庫組成。圖像庫的內(nèi)容為數(shù)字化的圖像信息;特征庫存儲是從圖像中提取的各種特征;知識庫包含專門和通用的知識,以利于查詢優(yōu)化和快速匹配;有效地組織圖像數(shù)據(jù)庫并建立高效的索引,加快圖像的檢索速度。(2)圖像預處理。圖像格式轉(zhuǎn)換、尺寸統(tǒng)一、圖像增強與去噪聲等功能。(3)特征提取。包括特征選擇和提取特征,特征選擇即選取適當?shù)膱D像特征組成特征空間,一旦特征確定了,其對應(yīng)的特征空間也就確定了。選擇的特征對于相似的圖像具有穩(wěn)定性,對于不同的圖像要具有較強的區(qū)分性。提取特征是指從包含大量信息的圖像中分解出不同種類的特征信息.特征的提取可以是整幅圖像,也可以是圖像的某個區(qū)域或具體的內(nèi)容對象。(4)相似匹配。如何進行圖像匹配,即確定相似性度量算法?;趦?nèi)容的圖像檢索中,圖像之間的匹配不是傳統(tǒng)意義下的精確匹配,而是一種相似匹配。檢索是利用特征之間的距離函數(shù)來進行相似性匹配,模仿人類的認知過程,可以從特征庫中尋找匹配的特征,也可以臨時計算對象的特征。匹配引擎中包括一個較為有效、可靠的相似度函數(shù)集。特征1特征1特征n反饋信息檢索結(jié)果特征提取特征比較特征數(shù)據(jù)庫特征提取圖像數(shù)據(jù)庫范例圖像或草圖查詢方式結(jié)果輸出與反饋機制相似匹配圖像數(shù)據(jù)庫管理圖3.1系統(tǒng)原理框圖3.1.2基于內(nèi)容圖像檢索的處理過程基于內(nèi)容的查詢和檢索是一個逐步求精的過程,存在著一個特征調(diào)整、重新匹配的循環(huán)過程,如圖3。2所示。(1)提查詢要求。用戶查找一個數(shù)據(jù)對象時,利用系統(tǒng)人機界面提供的輸入方式形成一個查詢條件。查詢接口一般要對所提交的數(shù)據(jù)進行預處理,然后再傳遞給搜索引擎。(2)相似性匹配。用戶提交的查詢要求經(jīng)處理形成查詢特征,將查詢特征與數(shù)據(jù)庫中的特征按照一定的匹配算法進行匹配。用戶的查詢說明用戶的查詢說明·示例·一般性描述相似性匹配修改查詢說明返回一組候選結(jié)果滿意?結(jié)束從候選結(jié)果中選擇一個示例NY圖3。2基于內(nèi)容圖像檢索的處理過程(3)返回查詢結(jié)果.滿足一定相似性的一組候選結(jié)果按相似度大小排列返回給用戶,因此,系統(tǒng)人機界面要有顯示瀏覽查詢結(jié)果的功能。(4)調(diào)整查詢特征。對系統(tǒng)返回的一組查詢結(jié)果,用戶可以通過遍歷挑選滿意的結(jié)果,也可以從候選結(jié)果中選擇一個示例,進行查詢特征調(diào)整,形成一個新的查詢。如此逐步求精,直到滿意為止.用戶提交查詢樣本用戶提交查詢樣本選擇檢索類型庫中圖像對查詢樣本提取特征輸出檢索結(jié)果從特征庫中提取特征圖像檢索圖3。3圖像查詢流程圖3.2基于內(nèi)容圖像檢索的特點基于內(nèi)容的圖像檢索具有下列主要特點:(1)從圖像內(nèi)容中由計算機自動提取視覺特征,并根據(jù)這些特征從圖像數(shù)據(jù)庫中查找、檢索出具有相似特征的圖像數(shù)據(jù)?;趦?nèi)容的圖像檢索直接對圖像內(nèi)容進行分析,抽取特征和語義,把檢索過程與語義提取直接聯(lián)系起來,使得檢索過程更加有效,適應(yīng)性更強。(2)使用相似匹配代替精確匹配。在傳統(tǒng)的基于文本的圖像檢索中,是以精確匹配為主.在基于內(nèi)容的圖像檢索中,通常采用相似匹配方式,從而獲得類似圖像,不斷縮小檢索范圍,直至定位于所要求的目標,與傳統(tǒng)數(shù)據(jù)庫檢索的精確匹配不同.(3)直觀的可視化查詢方式,交互性強.基于內(nèi)容的圖像檢索通常采用范例檢索方式,在許多現(xiàn)存的基于內(nèi)容的圖像檢索系統(tǒng)中都運用其中的一種或幾種相結(jié)合的查詢方式。(4)滿足多層次的檢索要求。系統(tǒng)通常包含圖像庫、特征庫,可滿足多方面的檢索要求。用戶可以向系統(tǒng)提交與所需查詢的圖像一致或類似的例圖、繪制草圖或進行單個特征的檢索、基于多個特征的綜合檢索、基于對象的檢索等。4顏色特征理論顏色特征是圖像檢索中使用最廣泛的一種視覺特征,也是最直觀和最簡單的一種,它具有很多優(yōu)良的性質(zhì),它對于圖像的平移、旋轉(zhuǎn)、大小的變化具有良好的適應(yīng)能力。顏色直方圖是提取顏色特征最常用的一種表示方法。最早采用顏色進行圖像檢索是由Swain和Ballard提出的基于顏色直方圖的檢索方法[8],其核心思想是在一定的顏色空間中對圖像中的各種顏色出現(xiàn)的頻數(shù)進行統(tǒng)計,然后圖像之間相似的問題就轉(zhuǎn)化成比較圖像直方圖之間的相似性問題。4.1顏色模型4.1.1RGB顏色模型RGB模型是基于三基色模型的代表。整個顏色空間位于邊長為1的立方體中,每個像素實際上任何可能量化的顏色都能用三維空間中第一個象限的一個點來表示,如圖4.1所示:藍(0,0,1)藍(0,0,1)青(0,1,1)白(1,1,1)綠(0,1,0)RGB紅(1,0,0)品紅(1,0,1)黃(1,1,0)黑(0,0,0)灰度圖4.1RGB顏色模型這個模型基于笛卡兒坐標系。原點上,任一基色均沒有亮度,即原點對應(yīng)于黑色.三個軸分別為R、G、B三基色.離原點最遠的頂點對應(yīng)于白色。亮度較低的等量的三種基色產(chǎn)生灰色的陰影,所有這些點均落在彩色立方體的對角線上,該對角線被稱為灰色線。該模型是數(shù)字圖像處理所使用的最重要的彩色模型。然而,RGB顏色模型與人的視覺感知有一定差距,例如給定一個顏色,人很難判定其中的R,G,B分量,這時使用面向視覺感知的顏色模型比較方便一些。4.1.2HSV顏色模型從數(shù)字圖像中一般都得到RGB值,但RGB顏色空間中的顏色不能與感知上的顏色模型聯(lián)系.在所有的顏色空間中,HSV模型對應(yīng)于畫家配色模型,它能較好反映人對顏色的感知和鑒別能力,非常適合基于顏色的圖像相似比較,而且HSV和RGB顏色空間的轉(zhuǎn)換是可逆的.視頻采集卡得到幀圖像一般采用RGB模型,因此要把RGB模型轉(zhuǎn)換成HSV模型,具體算法如下[9]:設(shè)定義為:則v=/255(4.1)(4.2)這里,,。4。2顏色特征提取顏色是一種能簡化目標提取和分類的重要描述符,所以選擇合適,對顏色的表達方式是很重要的.另一方面,對顏色的特征表達依賴于所用的顏色模型,最好選擇與人的感覺相一致的顏色空間.最早在基于內(nèi)容的圖像索引的色彩直方圖中得到應(yīng)用.顏色特征定義比較明確,抽取也相對容易,并且具有尺度不變性、旋轉(zhuǎn)不變性和位置不變性等特點,因此在圖像檢索中得到廣泛的重視和研究,并提出了很多改進算法。最早的全局色彩特征索引方法是由Swain和Ballard提出的基于色彩直方圖的檢索法,其主要思想是在一定的色彩空間中對圖像各種色彩出現(xiàn)的頻數(shù)進行統(tǒng)計,既描述的是不同色彩在整幅圖像中所占的比例。而并不關(guān)心每種色彩所處的空間位置,所以顏色直方圖特別適合于描述那些難以進行自動分割的圖像和不需要考慮物體空間位置的圖像。顏色直方圖可以基于不同的顏色空間和坐標系。大部分的數(shù)字圖像采用RGB色彩空間,但這種空間結(jié)構(gòu)并不符合人們對顏色相似性的主觀判斷.因此,有人提出了基于HSV空間、Luv空間和Lab空間的顏色直方圖.除了基于這些顏色空間的直方圖外,還提出了許多改進的方法,例如,何恒等提出的綜合顏色和紋理特征的模糊直方圖方法,該方法將圖像分快處理,得到圖像在HSV空間的顏色模糊直方圖,然后用紋理特征對顏色模糊直方圖進行擴展,從而得到綜合模糊直方圖,同時還給出了抽取圖像顏色和紋理特征的方法和建立圖像綜合模糊直方圖的計算程。王禹等提出的基于廣義直方圖的圖像檢索方法[10],該方法把圖像和它的平滑圖像組合起來,形成一個二元組即“廣義圖像”,廣義圖像的直方圖稱為廣義直方圖。除此之外還有累積直方圖法、均值直方圖法等。5直方圖理論5.1顏色直方圖顏色直方圖是最常用的顏色特征提取方法之一,其核心思想是在一定的顏色空間中對圖像各種顏色出現(xiàn)的頻數(shù)進行統(tǒng)計。目前,幾乎所有的基于顏色特征的檢索算法都是以顏色直方圖為基礎(chǔ)的。它的優(yōu)點就在于它能簡單描述一幅圖像中顏色的全局分布,即不同色彩在整幅圖像中所占的比例,特別適用于描述那些難以自動分割的圖像和不需要考慮物體空間位置的圖像[11].計算顏色直方圖需要將顏色空間劃分為若干個小的顏色區(qū)間,每個區(qū)間成為直方圖的一個柄(bin)。這個過程稱為顏色量化(colorquantizat(yī)ion).然后,通過計算顏色落在每個小區(qū)間的像素數(shù)量可以得到顏色直方圖。橫坐標表示顏色的色彩歸一化后的值,縱坐標表示每個小的顏色區(qū)間中所對應(yīng)的圖像像素的總和。顏色直方圖可以對應(yīng)于不同的顏色空間。最常用的是RGB顏色空間,因為大部分的數(shù)字圖像都是用這種顏色空間表達的。當圖像用RGB顏色空間表示時,彩色圖像的直方圖可以用R、G、B三個單色的直方圖來表示或者用一個RGB聯(lián)合分布的顏色直方圖來表示。當用三個單色直方圖表示時,各個直方圖表示的是圖像在這種顏色分量的統(tǒng)計分布,總共有三個不同的概率分布。而彩色圖像直接用一個顏色直方圖表示時,其統(tǒng)計的是不同顏色出現(xiàn)的頻數(shù),以色彩作為橫坐標,縱坐標為色彩出現(xiàn)的頻數(shù).在RGB顏色空間中,顏色直方圖可以看成是一個離散函數(shù),即(5.1)其中,k表示圖像的特征取值,L表示特征可取值的個數(shù),凡表示圖像中具體征值為k的像素個數(shù),n表示圖像像素的總個數(shù)。由此看出,顏色直方圖具有下列性質(zhì):位置無關(guān)性直方圖描述了每個灰度級的像素的個數(shù),但不能為這些像素在圖像中的位置提供任何線索。當一幅圖像被壓縮為直方圖后,所有的空間信息將全部丟失。因此,任一特定的圖像具有唯一的直方圖,例如圖5.1中(a)、(b)、(c)和(d)四幅圖像,如果陰影部分具有相同的灰度值而且面積相等,那么這四幅圖像的直方圖卻是完全相同的,這說明了不同的圖像可能具有完全相同的直方圖。(a)(a)(b)(c)(d)圖5.1直方圖的位置無關(guān)性疊加性如果一幅圖像由兩個不連接的區(qū)域組成,并且每個區(qū)域的直方圖己知,則整幅圖像的直方圖是該兩個區(qū)域的直方圖之和。顯然,該結(jié)論可推廣到任何數(shù)目的不連接區(qū)域的情形??傮w性(a)(a)(b)(c)(d)圖5.2直方圖的總體性直方圖是總體灰度概念,從直方圖中可以看出圖像整體的性質(zhì).如圖5。2所示:直方圖(a)表示圖像總體偏暗:直方圖(b)表示圖像總體偏亮;直方圖(c)表示圖像的灰度動態(tài)范圍太小,許多細節(jié)必然分辨不清楚;直方圖(d)表示圖像灰度級分布均勻,給人以清晰、明快的感覺。5.2直方圖的矩對直方圖來說,一、二、三階中心矩分別為:(5.2)(5。3)(5.4)設(shè),,分別為圖像Q的H(色度),S(飽和度),V(亮度)的階中心矩,分別為圖像I中的H,S,V的階中心矩,則距離度量函數(shù)為:(5。5)其中分別為加權(quán)系數(shù)。5.3直方圖均衡化算法(1)直方圖修正.空域圖像增強的基本方法是通過對圖像做灰度T:一般情況下,例如灰度級線性拉伸,我們直接指定所要進行的變換T.而直方圖修正也是灰度變換的一種,它試圖尋找這樣的灰度變換函數(shù)T,它能把映射為,使得的直方圖具有指定的(希望的)形式。因此它不是事先指定變換函數(shù)T,而是從及中計算得到T.(2)直方圖均衡化。直方圖均衡化是一種最常用的直方圖修正技術(shù),它是把給定圖像的直方圖分布改造成均勻直方圖分布,使輸出像素灰度的概率密度均勻分布。用信息學的理論來解釋,即具有最大嫡(信息量)的圖像為均衡化圖像。直方圖均衡化的基本原理是:當圖像中當所有的灰度級出現(xiàn)的概率是一個均勻分布時,圖像所暴露出來的信息量最大??紤]如下的變換:(5。6)即取變換函數(shù)為累積分布函數(shù)CDF。所以有:(5。7)由上式又能得出:這樣就得到了我們想要的均勻分布.5。4基于直方圖的圖像檢索技術(shù)分析灰度直方圖是反映灰度圖像的亮度概率分布的有效工具。顏色特征是圖像最直觀、明顯的特征,一般采用直方圖來描述?;陬伾珯z索的基本思想是將圖像間的距離歸結(jié)為其顏色直方圖間的差距,從而圖像檢索也就轉(zhuǎn)化為顏色直方圖的匹配。第一,直方圖的計算。圖像直方圖是一個N維向量,為灰度或顏色的級別數(shù),圖像直方圖對圖像的平移和旋轉(zhuǎn)具有不變性。當對圖像直方圖進行歸一化,將中灰度或顏色的頻數(shù)變成頻數(shù)比率,歸一化直方圖對圖像的尺寸變化具有不變性。(1)歸一化直方圖的計算記為圖像P某一特征值為的像素數(shù),N為圖像P的總像素數(shù),則圖像P的該特征的直方圖為:其中(5.8),N均為整數(shù)。(2)累積直方圖的計算己知圖像某一特征的歸一化直方圖為則該特征的累積直方圖可由下式計算:其中(5。9)為整數(shù)。第二,直方圖的匹配。常用兩種距離度量函數(shù):設(shè)分別為圖像的歸一化直方圖。(1)一般歐氏距離函數(shù)(5.10)(2)加權(quán)距離函數(shù)(5.11)傳統(tǒng)的顏色直方圖,要計算和存儲整幅圖像顏色空間的直方圖,計算量和存儲量巨大,這對于圖像檢索是沒有必要的,因為人能覺察到的圖像顏色一般不過幾十種。因此這些都需要分析研究、進一步去改進。6累加直方圖算法6。1累加直方圖在許多應(yīng)用中,圖像檢索結(jié)果只能由人來做主觀評價。人眼對顏色的分辨能力是有限的,例如對色調(diào)(Hue)的微小變化不敏感.換言之,在相同亮度和飽和度下,色調(diào)在一定范圍的變化,人眼無法覺察。如何適應(yīng)人的這個視覺特性,人們首先想到了加大量化間隔,將相近的顏色量化到Hue軸同一坐標上。有實驗表明,采用一般直方圖,當量化間隔時,檢索效果有很大改善。但這種簡單量化存在兩個嚴重問題,首先,對兩個相近顏色,這種量化既可能將它們量化到同一個Hue坐標上,也可能量化到不同的兩個Hue坐標上??梢?,簡單的加大量化間隔會導致誤檢。再者,色調(diào)(Hue)的分布有其自身的特殊性,從視覺角度來看,其相似性的分布并非均勻分布,如藍色的相近色的分布范圍要比黃色的更寬些,簡單的等間隔量化并不適合色調(diào)(Hue)信號。一般直方圖方法對每個顏色分量平等對待,沒有考慮顏色軸上相鄰顏色的相似性,在一些情況下可能會漏檢。如有三幅單色圖像,顏色分別為紅色、粉紅色和藍色,用歐幾里德距離對三幅圖像進行度量,結(jié)果粉紅圖像與紅色圖像的相似程度等同于藍色圖像與紅色圖像的相似程度,這不符合人的視覺感覺.在圖6。1中給出的三幅圖像的直方圖,人的視覺感覺很容易判斷和較相似,而它們與的區(qū)別顯著。但是用前述的距離度量方法,結(jié)果不如人意,例如歐幾里德距離:(6。1)H1H1H2H3圖6。1三幅顏色直方圖利用二次距離可以在一定程度上克服這一缺陷,但是相比其復雜的計算,其性能的提高是有限的。累加直方圖可以較好的解決這一問題。累加直方圖是以顏色作為橫坐標,縱坐標為顏色累加出現(xiàn)的頻數(shù),以此繪出的圖形。這樣圖像的累加直方圖空間可以定義為:(6.2)表示種顏色的像素的累加頻數(shù):圖6.1直方圖對應(yīng)的累加直方圖如圖6。2所示??梢?,在累加直方圖中,相鄰顏色在頻數(shù)上是相關(guān)的。累加直方圖消除了一般直方圖中常見的零值,也克服了一般直方圖量化過細過粗檢索效果都會下降的缺陷。圖6.2與圖6。1直方圖對應(yīng)的累加直方圖累加直方圖的距離度量采用一般直方圖的前三種方法。例如用歐氏距離,圖6.2的距離比較如下:(6.3)與人的視覺感覺相符.累加直方圖是密集的,即使其對應(yīng)的一般直方圖是稀疏的(有較多的0值)。相比一般直方圖,累加直方圖的存儲量和計算量有很小的增加,但是,累加直方圖有更好的魯棒性,因此我們可以用更寬的量化間隔來減少存儲量和計算量。6。2算法實現(xiàn)分塊非等色調(diào)區(qū)間局部累加直方圖計算在實際計算時,把每幀圖像分成2×2的子塊。對每一子塊,對色調(diào)取量化間隔為,分別計算每個相似色調(diào)區(qū)間的局部累加直方圖;對飽和度S和亮度V空間進行非均勻量化,量化為3個間隔:[0,0.2]、[0.2,0。7]、[0.7,1],并按上述量化間隔計算一般直方圖[12]。(1)一般直方圖計算:(6.4)其中L為量化間隔數(shù),為幀圖像某一特征量的第k區(qū)間,是幀圖像某一特征量在區(qū)間取值的象素的個數(shù)。(2)累加直方圖計算:(6.5)(3)近似匹配度量設(shè),分別為幀圖像Q和S的歸一化直方圖,對色調(diào)按歐氏距離法進行度量:(6。6)對飽和度和亮度用相交法進行度量:(6。7)按加權(quán)法計算每一子塊總匹配度:(6.8)最后,若兩幀圖像每個子塊都小于域值T,則認為匹配。6.3改進的局部累加直方圖算法對色彩比較復雜的自然景物圖象,一般累加直方圖算法在檢索中就會將不同色度的信號混淆起來。使用局部累加直方圖代替一般的累加直方圖需要對色度相似區(qū)進行合理的劃分[13]。算法1:當對色度的量化間隔為1°時,采用為區(qū)間的長度,將H軸共分成6個局部區(qū)間,通過分別計算每個局部區(qū)間的累加直方圖進行檢索。算法2:色度軸上各種顏色的分布實際上是連續(xù)過渡的,各顏色區(qū)之間并不存在截然的界限.算法1以為間隔來劃分相似色區(qū)域,雖然保證了在各局部區(qū)間內(nèi)使用累加直方圖的條件,但在區(qū)間分界處附近忽視了顏色的相似連續(xù)性,會造成與量化間隔過大而產(chǎn)生的相同問題。在算法2,先采用算法1計算出每個局部區(qū)間的累加直方圖,再改變區(qū)間的劃分為計算出這時每個局部區(qū)間的累加直方圖,最后將這2次計算的累加直方圖逐項相加取平均,作為最終的特征直方圖用于檢索.這樣在以歐氏距離為相似度測度時,更能體現(xiàn)色度信號在分布軸上各抽樣點間的相關(guān)性。算法3:將色度進行變換后,消除了一些參數(shù)變化的影響.算法3在此基礎(chǔ)上對以為間隔進行新的相似色區(qū)間劃分并按算法1計算局部累加直方圖進行檢索。算法4:類似算法2對算法1的改進,先用算法3計算出每個局部區(qū)間的累加直方圖,再改變區(qū)間劃分并計算出這時每個局部區(qū)間的累加直方圖。最后將這2次計算的累加直方圖逐項相加取平均,作為最終的特征直方圖用于檢索。6.4算法總結(jié)在以歐氏距離為相似度測度時,累加直方圖能體現(xiàn)信號在分布軸上各抽樣點間的相關(guān)性,即分布軸上相對某個抽樣點距離越近的點,在某種特性意義上就越相似于該抽樣點。但是累加直方圖能體現(xiàn)這個性質(zhì)的前提是:信號本身要有這樣的特性,即特征分布軸上距離小的2點要比距離大的2點更相似。色度信號相關(guān)的性質(zhì)比較簡單,故累加直方圖算法的檢索結(jié)果還比較令人滿意[14]。而對色彩比較復雜的自然景物圖像,一般累加直方圖算法在檢索中就會將不同色度的信號混淆起來,而在各局部區(qū)間內(nèi)分別應(yīng)用累加直方圖法就可以解決這個問題.累加顏色直方圖檢索算法是將顏色直方圖中每個分量進行逐步累加,生成新的直方圖,利用新的直方圖進行圖像的相似匹配,完成圖像的檢索。該算法能夠收到較好的檢索結(jié)果,但它必須有一個前提,即信號本身在特征分布軸上距離小的兩點要比距離大的兩點更相似。為此,有人提出局部累加直方圖檢索算法。該算法把色度沿分布軸分成若干個局部區(qū)間,而在各個局部區(qū)間內(nèi)分別應(yīng)用累加直方圖算法。實驗證明,局部累加直方圖檢索算法的檢索效率要優(yōu)于一般累加直方圖檢索算法。6.5實驗結(jié)果(1)測量歐幾里德距離和加權(quán)距離下面是兩幅花朵的圖片,現(xiàn)在在Matlab環(huán)境中編程實現(xiàn)用累加直方圖方法測歐氏距離和一般直方圖法測加權(quán)距離,經(jīng)過實驗測得:用累加直方圖法測得的歐氏距離為0。3442用一般直方圖法測加權(quán)距離為0。0065圖6.3測歐氏距離所用到的圖片(2)通過Mat(yī)lab程序?qū)崿F(xiàn)對輸入一幅彩色圖像,先將其灰度化,再繪制直方圖,最后輸出原來的輸入圖像和原圖像的直方圖。下圖分別給出了實驗結(jié)果:圖6.4輸入的圖像和輸出的直方圖(3)圖像檢索實例在對系統(tǒng)進行了多次調(diào)試運行后,系統(tǒng)基本達到設(shè)計目標,下圖6.5和圖6.6所示為兩次檢索結(jié)果的實例??梢钥吹?,根據(jù)用戶提供的查詢關(guān)鍵圖,系統(tǒng)從用戶選擇的圖像庫中檢索到與關(guān)鍵圖相似的圖片并排序返回給用戶。實驗中選擇了100多幅真彩圖作為測試圖像,基本達到了預期效果。左邊一幅為待查詢圖,其余從左到右相似度依次減小。以天空為范例的檢索結(jié)果為:圖6。5以天空為范例的檢索結(jié)果以大海為范例的檢索結(jié)果為:圖6。6以大海為范例的檢索結(jié)果7系統(tǒng)的性能評價7。1查全率和查準率查全率與查準率是信息檢索中的標準評價方法[15],現(xiàn)在已被越來越多地使用在基于內(nèi)容的圖像檢索當中[16~18].QBIC中就使用了該方法。以下用圖7.1的a,b,c,d的關(guān)系來說明檢索過程的查全率和查準率[19]:ccbad圖7。1a,b,c,d關(guān)系示意圖(圖中a+b+c+d=Qa+c=Aa+b=B)圖中Q為整個圖像數(shù)據(jù)庫,A代表相關(guān)圖像的集合,B代表檢索出的圖像集合。則查準率(7。1)查全率(7.2)誤檢率(7.3)即表示的意思如下:查全率的主要含義是在一次查詢過程中,用戶所查到的相關(guān)圖像的數(shù)目和數(shù)據(jù)庫中與目標圖像相關(guān)的所有圖像數(shù)目之比;而查準率主要指在一次查詢過程中所查到的相關(guān)圖像數(shù)目同該次查到的所有圖像數(shù)目之比。用戶在評價算法的時候,可以預先選定含有特有目標的圖像作為一組相關(guān)的圖像,然后根據(jù)返回的結(jié)果計算查全率和查準率。查全率和查準率越高,說明該檢索算法的效果越好。用查全率R作為x軸,查準率P作為y軸,繪制一條查準率-查全率曲線,簡稱為PVR曲線。設(shè)PVR曲線為,則與-軸圍成的面積為:(7.4)稱為PVR指數(shù).據(jù)研究,該指數(shù)越大,圖像檢索性能越好。由此可以看出,查全率反映檢索的全面性,而查準率則反映檢索的準確性,因此可以用查全率和查準率來評價系統(tǒng)的有效性.該方法的局限性在于沒有考慮檢索結(jié)果中相似圖像所處的位置,同時,高的準確率與查全率并不一定表明一個系統(tǒng)工作得好,這還要視具體的應(yīng)用而定[21]。7.2排序評價方法設(shè)查詢的返回圖像幅數(shù)為N,在N幅返回圖像中,為檢索到的相關(guān)圖像的數(shù)目,為相關(guān)圖像的排序序號,為實際的相關(guān)圖像數(shù),則評價參數(shù)如下[22]:檢索到的相關(guān)圖像的平均排序為(7.5)理想的相關(guān)圖像的平均排序為(7.6)相關(guān)圖像的丟失率r為(7.7)表示理想情況下的平均排序,即返回相關(guān)圖像全部排在最前面時的平均序號.越接近,表示查詢效果越好。此外,還有人提出了使用以下標準化的平均排序方法:(7.8)對于最理想的檢索,是0。結(jié)論本文開篇先談了基于內(nèi)容的圖像檢索的國內(nèi)外現(xiàn)狀,這也主要是說明該課題研究的必要性。接著比較詳細地介紹了目前基于內(nèi)容的圖像檢索技術(shù)中的關(guān)鍵技術(shù)和檢索原理和檢索流程,為下面進一步的研究打下理論基礎(chǔ).又對利用直方圖算法所用到的基礎(chǔ)理論進行介紹,主要介紹的是其中的顏色特征理論和顏色直方圖理論,因為這是本文直方圖算法的重點理論部分。在本文的第六部分又詳細介紹了本文的核心部分即累加直方圖算法理論及實際中的實驗結(jié)果。最后內(nèi)容還提到對基于內(nèi)容的圖像檢索系統(tǒng)的評價以及圖像檢索今后的研究趨勢。經(jīng)過實驗,我對我的系統(tǒng)進行了多次的修改,基本實現(xiàn)了預計的目標,圖像檢索的功能比較好的實現(xiàn)出來了,面且還證明了累加直方圖算法相比較于其它的算法是比較優(yōu)越的一種算法。目前,在基于內(nèi)容的圖像檢索領(lǐng)域,在諸多研究方面,如視覺特征提取、多特征組合檢索,以及高維索引的結(jié)構(gòu)等,己經(jīng)取得定進展,然而依然還有許名有待進一步解決的問題,(1)從自動分析到人機交互?;谟嬎銠C視覺的模式識別系統(tǒng)和圖像檢索系統(tǒng)的根本區(qū)別在于后者中人的參與是不可缺少的.早期人們強調(diào)全
溫馨提示
- 1. 本站所有資源如無特殊說明,都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請下載最新的WinRAR軟件解壓。
- 2. 本站的文檔不包含任何第三方提供的附件圖紙等,如果需要附件,請聯(lián)系上傳者。文件的所有權(quán)益歸上傳用戶所有。
- 3. 本站RAR壓縮包中若帶圖紙,網(wǎng)頁內(nèi)容里面會有圖紙預覽,若沒有圖紙預覽就沒有圖紙。
- 4. 未經(jīng)權(quán)益所有人同意不得將文件中的內(nèi)容挪作商業(yè)或盈利用途。
- 5. 人人文庫網(wǎng)僅提供信息存儲空間,僅對用戶上傳內(nèi)容的表現(xiàn)方式做保護處理,對用戶上傳分享的文檔內(nèi)容本身不做任何修改或編輯,并不能對任何下載內(nèi)容負責。
- 6. 下載文件中如有侵權(quán)或不適當內(nèi)容,請與我們聯(lián)系,我們立即糾正。
- 7. 本站不保證下載資源的準確性、安全性和完整性, 同時也不承擔用戶因使用這些下載資源對自己和他人造成任何形式的傷害或損失。
最新文檔
- 2025年己二酸二甲酯項目建議書
- 全程融資合同范本
- 商鋪轉(zhuǎn)租賃合同
- 超市柜臺租賃協(xié)議
- 佳木斯市個人車位租賃合同
- 2025年海洋潛標系統(tǒng)項目合作計劃書
- 2025年碳纖維正交三向織物項目合作計劃書
- 2025年X射線管項目發(fā)展計劃
- 2025個人承包土地合同書
- 2024年零星建筑工程施工合作合同范本版B版
- 手術(shù)室提高患者術(shù)中保溫措施的執(zhí)行率PDCA課件
- 報刊雜志發(fā)放登記表
- 大學物理(下)(太原理工大學)知到章節(jié)答案智慧樹2023年
- 布袋除塵器項目可行性分析報告
- 2023年安徽省公務(wù)員錄用考試《行測》真題及答案解析
- 我和我的祖國-電影賞析
- 基本事實要素表
- 市場監(jiān)督管理局企業(yè)注冊、經(jīng)營范圍登記規(guī)范表述:行業(yè)分類及條目代碼
- 2023-2024學年青海省西寧市小學數(shù)學二年級上冊期末自測試題
- 2023年中國工商銀行度校園招聘筆試題庫及答案解析
- 機械系統(tǒng)運動方案設(shè)計示例
評論
0/150
提交評論