基于對(duì)象的彩信圖像檢索系統(tǒng)的研究與實(shí)現(xiàn)_第1頁(yè)
基于對(duì)象的彩信圖像檢索系統(tǒng)的研究與實(shí)現(xiàn)_第2頁(yè)
基于對(duì)象的彩信圖像檢索系統(tǒng)的研究與實(shí)現(xiàn)_第3頁(yè)
免費(fèi)預(yù)覽已結(jié)束,剩余1頁(yè)可下載查看

下載本文檔

版權(quán)說(shuō)明:本文檔由用戶(hù)提供并上傳,收益歸屬內(nèi)容提供方,若內(nèi)容存在侵權(quán),請(qǐng)進(jìn)行舉報(bào)或認(rèn)領(lǐng)

文檔簡(jiǎn)介

基于對(duì)象的彩信圖像檢索系統(tǒng)的研究與實(shí)現(xiàn)

作者:武曉島袁津生郭敏哲李浩論文關(guān)鍵詞:彩信查詢(xún)圖像檢索對(duì)象識(shí)別圖像分析論文摘要:墓于對(duì)象的彩信圖像檢索系統(tǒng)是繼圖像檢索和彩信檢索結(jié)合的新一代信息檢索技術(shù),介紹了目前熱門(mén)的墓于對(duì)象的圖像檢索系統(tǒng)的概念,以及應(yīng)用到彩信檢索領(lǐng)域的工作原理。在基于對(duì)象的圖像檢索墓礎(chǔ)上,加入了對(duì)圖像中區(qū)域?qū)ο蟮淖R(shí)別過(guò)程,并將識(shí)別結(jié)果存入圖像屬性索引數(shù)據(jù)庫(kù),然后在檢索過(guò)程中根據(jù)用戶(hù)輸入的對(duì)象查詢(xún)請(qǐng)求,到數(shù)據(jù)庫(kù)里進(jìn)行檢索,最終將檢索結(jié)果返回給彩信用戶(hù)。0引言隨著彩信技術(shù)的快速發(fā)展和多媒體編碼技術(shù)的不斷進(jìn)步,其數(shù)字化圖像資源日益豐富,并在彩信領(lǐng)域中扮演著越來(lái)越重要的角色。面對(duì)如此龐大的圖像數(shù)據(jù)資源,如何方便快捷地獲取自己需要的圖像顯得尤為重要。由于在圖像檢索過(guò)程中,圖像中的對(duì)象(如圖像的主體和背景)往往才是人們感興趣的檢索內(nèi)容。因此,基于對(duì)象的圖像檢索成為了一項(xiàng)重要研究課題。本論文的主要工作是針對(duì)彩信圖像中主體對(duì)象的識(shí)別問(wèn)題進(jìn)行了一項(xiàng)有益的嘗試。本研究在圖像分析和彩信圖像文本提取的基礎(chǔ)上,實(shí)現(xiàn)一種利用圖像對(duì)象的視覺(jué)特征和知識(shí)庫(kù)來(lái)識(shí)別對(duì)象(圖像中的主要區(qū)域)的方法,并將圖像對(duì)象名、對(duì)象的視覺(jué)特征等存人圖像屬性索引數(shù)據(jù)庫(kù)中,實(shí)現(xiàn)基于對(duì)象語(yǔ)義的圖像檢索。1基于文本的圖像檢索技術(shù)傳統(tǒng)的圖像檢索技術(shù),主要是通過(guò)圖像進(jìn)行人工分析,對(duì)圖像特征進(jìn)行文字標(biāo)注,也稱(chēng)為基于文本的圖像檢索TBIR(TextbasedImageRetrieval)。這種檢索方式是用關(guān)鍵詞和描述性的文本的檢索,是先對(duì)圖像文件建立相應(yīng)的關(guān)鍵詞或描述字段,并對(duì)圖像的存儲(chǔ)標(biāo)識(shí)和關(guān)鍵詞對(duì)應(yīng)起來(lái),以結(jié)構(gòu)化的查詢(xún)語(yǔ)言或超鏈接方式進(jìn)行檢[1]。這種傳統(tǒng)的圖像檢索技術(shù)在圖像信息飛速增長(zhǎng)的今天有很大的局限性:l)手工操作,勞動(dòng)強(qiáng)度大,不能充分揭示和描述圖像有代表性的特征;2)主觀性大,由于個(gè)人的感知差異,不同的人對(duì)相同的圖像有不同的理解;3)處理速度慢,不能快速提出檢索的相關(guān)結(jié)果;4)漏檢,檢索中不能充分利用各種特征,容易忽略事先沒(méi)有注意到的特征。由于這種檢索技術(shù)根據(jù)圖像的文本等一些與圖像相關(guān)的因素來(lái)確定圖像的內(nèi)容,而不是抽取圖像本身的外部特征或從更高的語(yǔ)義層次來(lái)獲取圖像的內(nèi)容,由此確定的圖像內(nèi)容可能與圖像實(shí)際內(nèi)容存在著偏差,從而直接影響圖像檢索結(jié)果的可靠性。2基于對(duì)象的圖像檢索系統(tǒng)2.1CBIR的概念為了解決基于文本的圖像檢索存在的問(wèn)題,基于對(duì)象的圖像檢索CBIR(eontentBasedlm路eRetrieval)逐漸被人們所重視。這種技術(shù)由機(jī)器自動(dòng)提取包含圖像內(nèi)容的可視特征:顏色、紋理、形狀、對(duì)象的位置和相互關(guān)系等,對(duì)數(shù)據(jù)庫(kù)中圖像和查詢(xún)樣本圖像在特征空間進(jìn)行相似匹配,檢索出與樣本相似的圖像[2]。2.2CBIR的檢索方法其主要的CBIR的檢索方法有:基于顏色特征、紋理特征、輪廓特征、形狀特征、空間特征、時(shí)間關(guān)系及時(shí)空關(guān)系、語(yǔ)義特征等特征的檢索[3]。3墓于對(duì)象的彩信圖像檢索系統(tǒng)基于對(duì)象的彩信圖像檢索系統(tǒng)使用VisualC++6.0作為開(kāi)發(fā)工具,采用面向?qū)ο蟮捏w系結(jié)構(gòu),具有較好的可移植性和可擴(kuò)展性。后臺(tái)數(shù)據(jù)庫(kù)系統(tǒng)采用MicrosoftAcces2000,訪問(wèn)方法為ADO訪問(wèn)。該系統(tǒng)的功能是:用對(duì)象識(shí)別系統(tǒng)將圖像分析和對(duì)象識(shí)別的結(jié)果存入圖像屬性索引數(shù)據(jù)庫(kù);根據(jù)用戶(hù)輸人的檢索要求,檢索系統(tǒng)利用圖像屬性索引數(shù)據(jù)庫(kù)進(jìn)行檢索,根據(jù)相似度由大到小排列檢索結(jié)果,然后將檢索結(jié)果信息(包括圖像的縮微圖)發(fā)送到彩信群發(fā)器,再發(fā)送到用戶(hù)。3.1系統(tǒng)設(shè)計(jì)思想3.1.1圖像數(shù)據(jù)庫(kù)組成圖像數(shù)據(jù)庫(kù)系統(tǒng)是在傳統(tǒng)數(shù)據(jù)庫(kù)、數(shù)字圖像處理與模式識(shí)別等技術(shù)的基礎(chǔ)上發(fā)展起來(lái)的一門(mén)新興的綜合技術(shù)。圖像數(shù)據(jù)庫(kù)技術(shù)一直致力于解決海量數(shù)字圖像的有效存儲(chǔ)和管理問(wèn)題。圖像數(shù)據(jù)庫(kù)的產(chǎn)生拓展了傳統(tǒng)數(shù)據(jù)庫(kù)技術(shù)的應(yīng)用,又為圖像處理技術(shù)提供了有力的支持[4]。3.1.2圖像屬性索引數(shù)據(jù)庫(kù)建設(shè)圖像屬性索引數(shù)據(jù)庫(kù)中存放著從彩信頁(yè)中獲得的所有圖像及其屬性,以供用戶(hù)查詢(xún)使用。3.1.3動(dòng)態(tài)鏈接庫(kù)(DLL)中執(zhí)行函數(shù)的實(shí)現(xiàn)在試驗(yàn)平臺(tái)ImageHuntPlatform中特征生成和圖像檢索函數(shù)的實(shí)現(xiàn),采用了動(dòng)態(tài)鏈接庫(kù)(DLL)中的執(zhí)行函數(shù)。動(dòng)態(tài)鏈接庫(kù)(DLL)是用作共享函數(shù)庫(kù)的可執(zhí)行文件。DLL中的代碼在運(yùn)行時(shí)動(dòng)態(tài)加載。VisualC++中的類(lèi)庫(kù)MFC以3種不同的方式支持DLL的開(kāi)發(fā),即:l)與MFC靜態(tài)鏈接的常規(guī)DLL與MFC動(dòng)態(tài)鏈接的常規(guī)DLL及與MFC動(dòng)態(tài)鏈接的擴(kuò)展DLL。2)與MFC動(dòng)態(tài)鏈接的常規(guī)DLL與MFC動(dòng)態(tài)鏈接的常規(guī)DLL也是內(nèi)部使用MFC的DLL,DLL中的導(dǎo)出函數(shù)可以被MFC和非MFC可執(zhí)行程序調(diào)用。與前者的區(qū)別是,這種類(lèi)型的DLL在建立時(shí)使用的是MFC動(dòng)態(tài)鏈接庫(kù)。導(dǎo)出函數(shù)使用的也是標(biāo)準(zhǔn)C接口,但必須使用宏AFx_MANAGE_STATE兀來(lái)設(shè)置MFc模塊狀態(tài)[5]。3)與MFC動(dòng)態(tài)鏈接的擴(kuò)展DLL與MFC動(dòng)態(tài)鏈接的擴(kuò)展DLL是從已有的MFC來(lái)派生新的可再用類(lèi)的DLL。擴(kuò)展DLL在建立時(shí)使用的是MFc動(dòng)態(tài)鏈接庫(kù)。擴(kuò)展DLL中的導(dǎo)出函數(shù)只能由動(dòng)態(tài)鏈接MFC的MFC應(yīng)用程序調(diào)用。使用擴(kuò)展DLL,可以從MFC派生新的自定義類(lèi),然后提供MFC擴(kuò)展版給調(diào)用DLL的應(yīng)用程序。在試驗(yàn)平臺(tái)中,要求特征生成和圖像檢索函數(shù)作為DLL庫(kù)的導(dǎo)出函數(shù)。特征生成函數(shù)的原型為voidGenerateChar(),無(wú)參數(shù)。圖像檢索函數(shù)的原型為B00LColorHuni(cstringUst*PositivePath,CStringUst*NagetivePath,CobArray*fsimi-larArray),其中Positivepath為正例圖像的路徑鏈表,Nagetive-Path為反例圖像的路徑鏈表,fSimilarArray為返回結(jié)果的對(duì)象鏈表(包括檢索圖像的ID、檢索圖像的路徑和示例圖像的相適度)。動(dòng)態(tài)鏈接庫(kù)的方式可采用與MFC動(dòng)態(tài)鏈接的常規(guī)DLL或與MFC動(dòng)態(tài)鏈接的擴(kuò)展DLL。以圖像檢索函數(shù)為例,在試驗(yàn)平臺(tái)中動(dòng)態(tài)加載DLL庫(kù)的主要代碼如下:HINSTANCEhdll;ypedefBOOL(CALLBACK·MYPROC)(CStringLiat*,CStringList*,CobArray*);MYPROCdllproc;Hdll=loadLibrrary(“DLL所在路徑”);//可與從Windows注冊(cè)表中動(dòng)態(tài)取得If(hdll!=null){dllproc=(MYPROC)CetProcAddress(hdll,F(xiàn)unName);{AfxMessageBox(“輸入檢索圖像的函數(shù)名稱(chēng)有錯(cuò)誤!”);return;}Dllproc(…,…,…);}3.2系統(tǒng)工作流程其主要的工作流程為:用戶(hù)根據(jù)自己的需求輸人所孺要的圖像模型;將對(duì)象的輪廓區(qū)域從背景中區(qū)分出來(lái);分析、提取并識(shí)別對(duì)象區(qū)域的視覺(jué)特征(頗色、形狀、紋理、位置、大小、方向等),建立數(shù)據(jù)參數(shù)或語(yǔ)義級(jí)的文字描述;根據(jù)對(duì)象視覺(jué)特征知識(shí)庫(kù)和相關(guān)文本(彩信中的相關(guān)對(duì)象名和對(duì)象特征關(guān)鍵詞)識(shí)別對(duì)象,建立概念級(jí)的圖像對(duì)象文本標(biāo)注;利用對(duì)象的文本標(biāo)注和視覺(jué)特征描述,實(shí)現(xiàn)

溫馨提示

  • 1. 本站所有資源如無(wú)特殊說(shuō)明,都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請(qǐng)下載最新的WinRAR軟件解壓。
  • 2. 本站的文檔不包含任何第三方提供的附件圖紙等,如果需要附件,請(qǐng)聯(lián)系上傳者。文件的所有權(quán)益歸上傳用戶(hù)所有。
  • 3. 本站RAR壓縮包中若帶圖紙,網(wǎng)頁(yè)內(nèi)容里面會(huì)有圖紙預(yù)覽,若沒(méi)有圖紙預(yù)覽就沒(méi)有圖紙。
  • 4. 未經(jīng)權(quán)益所有人同意不得將文件中的內(nèi)容挪作商業(yè)或盈利用途。
  • 5. 人人文庫(kù)網(wǎng)僅提供信息存儲(chǔ)空間,僅對(duì)用戶(hù)上傳內(nèi)容的表現(xiàn)方式做保護(hù)處理,對(duì)用戶(hù)上傳分享的文檔內(nèi)容本身不做任何修改或編輯,并不能對(duì)任何下載內(nèi)容負(fù)責(zé)。
  • 6. 下載文件中如有侵權(quán)或不適當(dāng)內(nèi)容,請(qǐng)與我們聯(lián)系,我們立即糾正。
  • 7. 本站不保證下載資源的準(zhǔn)確性、安全性和完整性, 同時(shí)也不承擔(dān)用戶(hù)因使用這些下載資源對(duì)自己和他人造成任何形式的傷害或損失。

評(píng)論

0/150

提交評(píng)論