下載本文檔
版權說明:本文檔由用戶提供并上傳,收益歸屬內(nèi)容提供方,若內(nèi)容存在侵權,請進行舉報或認領
文檔簡介
圖像數(shù)據(jù)挖掘技術
圖像數(shù)據(jù)挖掘系統(tǒng)的基本功能現(xiàn)在,隨著圖像和存儲技術的進步,人們可以每天獲得大量的圖像數(shù)據(jù),如衛(wèi)星圖像、醫(yī)學圖像和數(shù)字圖像。這些圖像里有很多對用戶有用的信息,但不幸的是,缺乏有效的工具從這些圖像中搜索和發(fā)現(xiàn)有用的模式。圖像數(shù)據(jù)挖掘系統(tǒng)被要求能夠從圖像數(shù)據(jù)中自動地提取有用的語義信息。換句話說,圖像挖掘就是從圖像數(shù)據(jù)庫中提取隱含的知識、圖像數(shù)據(jù)之間的關系或隱含的其他模式。圖像挖掘已經(jīng)成為人們關注的焦點。圖像數(shù)據(jù)挖掘的實現(xiàn)需要包括計算機視覺,圖像處理,圖像檢索,數(shù)據(jù)挖掘,機器學習,數(shù)據(jù)庫和人工智能等的綜合學科共同實現(xiàn)。其中某些領域已經(jīng)發(fā)展地非常成熟,而圖像挖掘到數(shù)據(jù)挖掘還在成長研究期,處于經(jīng)驗階段。本文中我們將討論圖像挖掘的模型和技術。1圖像挖掘的研究圖像挖掘不同于低維的計算機視覺和圖像處理技術。圖像挖掘是指從大型圖像集中發(fā)現(xiàn)隱含的有用模式,而計算機視覺和圖像處理技術的目的是理解和(或)從單個圖像中發(fā)現(xiàn)特定的特征。圖像挖掘也不同于基于內(nèi)容的圖像檢索,雖然圖像檢索也是針對大的圖像集,但圖像挖掘更超出檢索相關圖像的問題,圖像挖掘的目標是發(fā)現(xiàn)圖像模式,圖像檢索的問題是檢索相關圖像?,F(xiàn)有的圖像挖掘系統(tǒng)和算法有:Simon大學開發(fā)的MultiediaMiner,可以進行圖像集的相關規(guī)則的挖掘;MihaiDatcu和KlausSeidel開發(fā)了一個智能衛(wèi)星挖掘系統(tǒng);MichaelC.Burletal.用圖像挖掘的技術對NASA的目標進行分析,獲取信息;MihaiDatcuetal.用貝葉斯方法進行信息聚合和圖像數(shù)據(jù)挖掘;MichaelC.Burletal.在文獻中討論了圖像數(shù)據(jù)挖掘的分布式結構;文獻討論了用圖像挖掘技術進行語義特征的抽取,進行圖像檢索的新方法。我們可以看到,人們對圖像挖掘研究的問題主要在于挖掘系統(tǒng)的建立和挖掘算法的發(fā)現(xiàn)。為了得到新的圖像模式的發(fā)掘算法,還有一系列其它相關的研究主題需要解決。例如,為了使發(fā)現(xiàn)的圖像模式有意義,它們必須對用戶可視。這個可以解釋為下列的主題:(1)圖像模式的表達:如何將上下文信息,空間信息和重要的圖像特征包含在表達機制中;(2)圖像特征的選擇:哪個才是重要的圖像特征被用于圖像處理過程,這樣發(fā)現(xiàn)的模式是有可視意義的;(3)圖像模式可視化問題:在視覺豐富的環(huán)境里如何表達挖掘的模式給用戶。2圖像挖掘系統(tǒng)圖像挖掘的早期的工作集中在提出一個合適的框架來自行圖像挖掘的任務。一個包含原始圖像數(shù)據(jù)圖像數(shù)據(jù)庫不能被直接用于挖掘目的。原始圖像必須首先被處理從而產(chǎn)生對高級挖掘模型有用的信息。一個圖像挖掘系統(tǒng)經(jīng)常是復雜的,因為它需要應用多個技術的集合,從圖像檢索和索引到數(shù)據(jù)挖掘和模式識別。一個好的圖像挖掘系統(tǒng)可以為用戶提供進入圖像倉庫的有效接入,并且產(chǎn)生圖像下的知識和模式。為此目的,這樣一個系統(tǒng)通常包含下列功能:圖像存儲,圖像處理,特征提取,圖像索引和檢索,模式和知識發(fā)現(xiàn)?,F(xiàn)在兩種圖像挖掘系統(tǒng)的框架:功能驅動和信息驅動的圖像挖掘系統(tǒng)的框架?,F(xiàn)有的圖像挖掘系統(tǒng)大多數(shù)都歸在功能驅動的框架下。這些系統(tǒng)都是專門的,面向應用的,并且框架是根據(jù)模型的功能組織。例如,MihaiDatcu和KlausSeidel提出的智能衛(wèi)星挖掘系統(tǒng),Simon大學開發(fā)的MultiediaMiner,可以進行圖像集的相關規(guī)則的挖掘。功能驅動的圖像挖掘系統(tǒng)的框架的重點在組織圖像挖掘系統(tǒng)的不同元件模型的功能性。功能驅動的框架起著組織和澄清在圖像挖掘中被執(zhí)行的不同的角色和任務。例如,Zhang及其他人提議的一個信息驅動的框架,目的在于強調(diào)信息在各級的表達的作用,它被設計成層次的結構,特別重視層次中各級需要的信息。本文提出基于目標識別的圖像挖掘的框架,圖像挖掘在目標識別的基礎上實現(xiàn),期望得到目標之間及目標和背景之間的潛在關系,得到的潛在關系可以用于后續(xù)的目標識別的任務。圖像挖掘框架如圖1所示。3挖掘圖像信息除了研究合適的圖像挖掘框架,早期的圖像挖掘者已經(jīng)試圖試用已有的技術挖掘圖像信息。常用的技術包括目標識別,圖像檢索和索引,圖像分類和聚類,聯(lián)合規(guī)則的挖掘和神經(jīng)網(wǎng)絡。3.1基于特定目標的圖像模型目標識別一直是圖像處理領域中活躍的研究焦點。一個目標識別系統(tǒng)用已知的目標模型從圖像中發(fā)現(xiàn)真實的世界中的目標。這是圖像挖掘領域中的一個主要任務。自動的機器學習和有意義的信息抽取能被實現(xiàn)僅僅在某些目標已經(jīng)被機器識別的情況下。已知目標的模型通常由人工輸入作為先驗知識。最近,JeremyS.DeBonet,以在一組或一個圖像中定位一個特別的已知目標為目的,設計了一個系統(tǒng),它將一幅圖像處理為一組“特征圖像”。MichealC.Burl及其他人采用了一個通過學習技術自動產(chǎn)生識別器的技術,這個領域的專家只是通過一組標簽例子隱含地獲得。StephenGibson以及其它人探索在幾個圖像中發(fā)現(xiàn)通用模式的可能性,這是圖像挖掘的重要部分。StephenGibson提出并檢驗了一個基于FFT地馬賽克優(yōu)化算法,結果顯示該算法在所有的圖像中工作良好。3.2圖像檢索和檢索系統(tǒng)圖像挖掘需要圖像根據(jù)某些規(guī)定的需要進行檢索。檢索的復雜性有不同三個等級:(1)等級1根據(jù)圖像元素的基本的特征如顏色,紋理或空間位置進行圖像檢索。這樣的詢問的例子如“檢索在圖像角落的上部,長并且薄的紅色目標”和“檢索包含藍色星星在圓環(huán)中的圖像”。(2)等級2根據(jù)派生的和邏輯的特征,比如一個給定類型,單個的目標或人,進行檢索。例如“檢索有圓桌的圖像”和“檢索有Jimmy的圖像”。(3)等級3根據(jù)抽象特征,包括大量的高級別的關于目標或場景描述的意義和目的的推理,進行檢索。例如我們可以有這樣的查詢“檢索一場足球賽的圖像”和“檢索表達快樂的圖像”。圖像描述通常由人工產(chǎn)生,并在圖像處理階段中分配給每個圖像。但要經(jīng)受:“詞匯問題”和沒有尺度的障礙。早在1990年,因為大尺度圖像倉庫的出現(xiàn),這兩個障礙因為人工注解技術而越來越尖銳。于是基于圖像內(nèi)容檢索的提出,來克服這個困難。在基于圖像內(nèi)容的檢索中有三個基本的基礎,即,可視信息抽取,圖像索引和檢索系統(tǒng)應用。很多技術一直在這個方向發(fā)展,也一直在建造很多用于研究和商用的圖像檢索系統(tǒng)。在商用系統(tǒng)領域,基于內(nèi)容的圖像檢索系統(tǒng),IBM的QBIC系統(tǒng)可能是最著名的。它提供檢索,根據(jù)顏色,紋理或形狀和關鍵字的任意組合。Virage是另一個著名的商用系統(tǒng)。它作為一系列的獨立模型使用,系統(tǒng)的開發(fā)者可以將它們建立到自己的程序中。Excalibur利用公司在模式識別的技術,提供多種圖像索引和匹配技術。3.3用索引機制進行相似的檢索圖像數(shù)據(jù)的檢索需要圖像挖掘系統(tǒng)具有快速有效的機制。傳統(tǒng)數(shù)據(jù)庫如關系數(shù)據(jù)庫執(zhí)行索引用第一個或第二個關鍵字?,F(xiàn)在,大多數(shù)圖像檢索的檢索系統(tǒng)是基于相似性的檢索。在這種情況下,索引必須在相似空間執(zhí)行。其它的索引機制重點在特別的圖像特征。文獻提出來一個有效的顏色索引機制進行基于相似性檢索,搜索時間隨數(shù)據(jù)庫的大小對數(shù)增長。文獻提出一個多維R-樹索引,稱作嵌套R-樹,可以有效并高效地檢索形狀。隨著圖像索引技術的增加。文獻給出來顏色-空間索引技術的性能評估,它可以作為選擇合適技術的指導并設計新技術。3.4圖像挖掘中聚類技術圖像分類和圖像聚類分別是有監(jiān)督和無監(jiān)督的圖像分類。在有監(jiān)督的分類中,提供一組已經(jīng)預分類了的有標簽的圖像,問題是給無標簽的新圖像貼上合適的標簽。通常,這些給定標簽的圖像用于分類描述的機器學習,它依次用于標志新圖像。圖像聚類的問題是在沒有先驗知識的情況下,根據(jù)圖像內(nèi)容對給定的一組無標簽的圖像分群。圖像挖掘中進行分類和聚類的基本目的是從和圖像有關的圖像群標簽中獲得用戶感興趣的內(nèi)容信息。根據(jù)內(nèi)容對圖像進行智能分類是從大型圖像組中挖掘有價值信息的重要方法。圖像挖掘中的分類模塊稱為分類器。文獻提出基于低維可視化的特征將圖像分群到語義意義的類別?,F(xiàn)在有兩種主要的分類器:參數(shù)分類器和非參數(shù)分類器。圖像聚類通常在挖掘過程的早期進行。已經(jīng)被注意到的特征有顏色,紋理和形狀。通常,它們中的任一一個都可以單獨或結合使用?,F(xiàn)在已經(jīng)有大量的聚類技術:層次聚類算法,基于部分的算法,混和-分解和方法搜尋算法,最近鄰聚類,模糊聚類和進化聚類方法。一旦圖像被聚類,領域專家就需要檢查每個群的圖像,根據(jù)群的指示標注抽象概念。EdwardChang及其他人用聚類技術檢測在Web上拷貝的未被授權的圖像。文獻在模式識別后續(xù)的監(jiān)督分類的預處理階段用聚類。Lundervold及其他人描述了一個基于分割的聚類算法和人工標注技術來識別人頭部的材料的類,在五個不同的圖像通道得到(五維的特征矢量)。3.5關聯(lián)規(guī)則挖掘關聯(lián)規(guī)則是從X-→Y的隱含規(guī)則,這里X,YCI,并且,X∧Y=Φ。I是一組目標,并且被當作一條。D是一組數(shù)據(jù)案例。X被稱為規(guī)則的原因,Y被稱為規(guī)則的結果。一組目標,加上規(guī)則的原因和結果,被稱為目標組。如果數(shù)據(jù)案例D中有s%包含X和Y,那么認為規(guī)則X-→Y的支持率為S。如果數(shù)據(jù)案例D有C%既支持X也支持Y,那么認為規(guī)則X→Y的置信度為C。關聯(lián)規(guī)則挖掘產(chǎn)生規(guī)則,其支持率和置信度均大于用戶設定的支持度和置信度的最小門限。一個典型的關聯(lián)規(guī)則挖掘算法工作兩步。第一步發(fā)現(xiàn)所有的大于最小支持度約束的大的目標組。第二步從大的目標組中產(chǎn)生滿足最小置信度的規(guī)則。關聯(lián)規(guī)則挖掘是一個用于數(shù)據(jù)挖掘領域的典型的方法,它用于揭示大型數(shù)據(jù)庫興趣趨勢,模式和規(guī)則?,F(xiàn)在,關聯(lián)規(guī)則的挖掘已經(jīng)用于大型的圖像數(shù)據(jù)庫。有兩個主要的方法。第一個方法是獨自從大量的圖像挖掘,第二個方法是從包括文字和數(shù)字的圖像中挖掘。C.Ordonez以及其它人提出了一個用于執(zhí)行圖像內(nèi)容關聯(lián)挖掘的圖像挖掘的斑點算法。SimonFraser大學提出的被稱為MultimediaMiner的原型中一個主要的模塊就是MM-關聯(lián)器,它用三維的可視化明確的表達關聯(lián)。另外一個應用,VasileiosM.以及其它人用關聯(lián)規(guī)則發(fā)現(xiàn)結構(建筑)和人腦功能之間的關聯(lián)。提出來一個用于圖像數(shù)據(jù)庫中的被稱作BRA的系統(tǒng)。盡管現(xiàn)在的圖像關聯(lián)規(guī)則挖掘方法和在數(shù)據(jù)挖掘的其它領域相比還遠不成熟和完美,但它打開了一個非常有前途的研究方向和圖像關聯(lián)規(guī)則挖掘進步的巨大的空間。3.6別和趨勢預測領域有好的表現(xiàn)神經(jīng)網(wǎng)絡是一個由簡單的處理單元構成的大的并行分布式處理器,其中的每一個處理單元都有自然的存儲經(jīng)驗知識和使知識可用的傾向。神經(jīng)網(wǎng)絡具有容錯性能,并且在模式識別和趨勢預測領域有好的表現(xiàn)。在知識有限的情況下,人工神經(jīng)網(wǎng)絡算法經(jīng)常用于構造數(shù)據(jù)模型。盡管對于神經(jīng)網(wǎng)絡及其應用有很多研究工作,在圖像挖掘領域它是新的。將神經(jīng)網(wǎng)絡用于圖像挖掘的一個顯著的研究工作是人工神經(jīng)網(wǎng)絡(ANN),由G.G.Gardner以及其它人提出,它可以提供專門地自動操作地方法用于圖像分析的基礎。一組挖掘工具,基于模糊ARTMAP的神經(jīng)網(wǎng)絡,提供一個直覺的方法
溫馨提示
- 1. 本站所有資源如無特殊說明,都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請下載最新的WinRAR軟件解壓。
- 2. 本站的文檔不包含任何第三方提供的附件圖紙等,如果需要附件,請聯(lián)系上傳者。文件的所有權益歸上傳用戶所有。
- 3. 本站RAR壓縮包中若帶圖紙,網(wǎng)頁內(nèi)容里面會有圖紙預覽,若沒有圖紙預覽就沒有圖紙。
- 4. 未經(jīng)權益所有人同意不得將文件中的內(nèi)容挪作商業(yè)或盈利用途。
- 5. 人人文庫網(wǎng)僅提供信息存儲空間,僅對用戶上傳內(nèi)容的表現(xiàn)方式做保護處理,對用戶上傳分享的文檔內(nèi)容本身不做任何修改或編輯,并不能對任何下載內(nèi)容負責。
- 6. 下載文件中如有侵權或不適當內(nèi)容,請與我們聯(lián)系,我們立即糾正。
- 7. 本站不保證下載資源的準確性、安全性和完整性, 同時也不承擔用戶因使用這些下載資源對自己和他人造成任何形式的傷害或損失。
最新文檔
- 2024年度跨境電商平臺區(qū)域代理合同范本3篇
- 2024年生物醫(yī)藥企業(yè)股權收購合同匯編3篇
- 淘寶找建筑課程設計
- 專題03 閱讀理解之推理判斷題(練習)(解析版)
- 煉鋼廠部門崗位職責說明書
- 機電工程施工組織設計
- (一)高標準農(nóng)田施工方案
- 油條配方課程設計
- 糖果罐子手工課程設計
- 算法課程設計總結
- 2024年中國陶瓷碗盆市場調(diào)查研究報告
- ISO 56001-2024《創(chuàng)新管理體系-要求》專業(yè)解讀與應用實踐指導材料之22:“8運行-8.1運行策劃和控制”(雷澤佳編制-2025B0)
- 2024-2030年中國硅肥行業(yè)規(guī)模分析及投資前景研究報告
- 電網(wǎng)行業(yè)工作匯報模板22
- 2024-2025學年一年級數(shù)學上冊期末樂考非紙筆測試題(二 )(蘇教版2024秋)
- 2024秋期國家開放大學??啤陡叩葦?shù)學基礎》一平臺在線形考(形考任務一至四)試題及答案
- HSE應急預案(完整版)
- 2024-2024年江蘇省普通高中學業(yè)水平測試物理試卷(含答案)
- 如何高效學習學習通超星課后章節(jié)答案期末考試題庫2023年
- HCCDP 云遷移認證理論題庫
- 臺大公開課--《紅樓夢》筆記剖析
評論
0/150
提交評論