版權(quán)說明:本文檔由用戶提供并上傳,收益歸屬內(nèi)容提供方,若內(nèi)容存在侵權(quán),請進行舉報或認領(lǐng)
文檔簡介
1、2022/9/31/605.3 尺度不變特征變換匹配算法 Scale Invariant Feature Transform (SIFT)第5章 視覺圖像特征信息提取2022/9/32SIFT簡介SIFT算法實現(xiàn)細節(jié)提綱SIFT算法的應(yīng)用領(lǐng)域SIFT算法的擴展與改進2022/9/33SIFT簡介 傳統(tǒng)的特征提取方法 成像匹配的核心問題是將同一目標(biāo)在不同時間、不同分辨率、不同光照、不同位姿情況下所成的像相對應(yīng)。傳統(tǒng)的匹配算法往往是直接提取角點或邊緣,對環(huán)境的適應(yīng)能力較差,急需提出一種魯棒性強、能夠適應(yīng)不同光照、不同位姿等情況下能夠有效識別目標(biāo)的方法。2022/9/35SIFT簡介 將一幅圖像映射
2、(變換)為一個局部特征向量集;特征向量具有平移、縮放、旋轉(zhuǎn)不變性,同時對光照變化、仿射及投影變換也有一定不變性。Original image courtesy of David Lowe2022/9/36SIFT簡介 SIFT算法特點 SIFT特征是圖像的局部特征,其對旋轉(zhuǎn)、尺度縮放、亮度變化保持不變性,對視角變化、仿射變換、噪聲也保持一定程度的穩(wěn)定性。 獨特性(Distinctiveness)好,信息量豐富,適用于在海量特征數(shù)據(jù)庫中進行快速、準(zhǔn)確的匹配。 多量性,即使少數(shù)的幾個物體也可以產(chǎn)生大量SIFT特征向量。 經(jīng)過優(yōu)化的SIFT算法可滿足一定的速度需求。 可擴展性,可以很方便的與其他形式
3、的特征向量進行聯(lián)合。 2022/9/37 目標(biāo)的自身狀態(tài)、場景所處的環(huán)境和成像器材的成像特性等因素影響圖像配準(zhǔn)/目標(biāo)識別跟蹤的性能。而SIFT算法在一定程度上可解決: 目標(biāo)的旋轉(zhuǎn)、縮放、平移(RST) 圖像仿射/投影變換(視點viewpoint) 光照影響(illumination) 目標(biāo)遮擋(occlusion) 雜物場景(clutter) 噪聲 SIFT算法可以解決的問題SIFT簡介Back2022/9/38SIFT算法實現(xiàn)細節(jié) SIFT算法實現(xiàn)步驟簡述SIFT算法的實質(zhì)可以歸為在不同尺度空間上查找特征點(關(guān)鍵點)的問題。SIFT算法實現(xiàn)物體識別主要有三大工序,1、提取關(guān)鍵點;2、對關(guān)鍵點
4、附加詳細的信息(局部特征)也就是所謂的描述器;3、通過兩方特征點(附帶上特征向量的關(guān)鍵點)的兩兩比較找出相互匹配的若干對特征點,也就建立了景物間的對應(yīng)關(guān)系。 2022/9/310所謂關(guān)鍵點,就是在不同尺度空間的圖像下檢測出的具有方向信息的局部極值點。根據(jù)歸納,我們可以看出特征點具有的三個特征: 尺度 方向 大小關(guān)鍵點檢測的相關(guān)概念1. 哪些點是SIFT中要查找的關(guān)鍵點(特征點)? 這些點是一些十分突出的點不會因光照條件的改變而消失,比如角點、邊緣點、暗區(qū)域的亮點以及亮區(qū)域的暗點,既然兩幅圖像中有相同的景物,那么使用某種方法分別提取各自的穩(wěn)定點,這些點之間會有相互對應(yīng)的匹配點。 2022/9/3
5、12 根據(jù)文獻Scale-space theory: A basic tool for analysing structures at different scales我們可知,高斯核是唯一可以產(chǎn)生多尺度空間的核,一個圖像的尺度空間,L(x,y,) ,定義為原始圖像I(x,y)與一個可變尺度的2維高斯函數(shù)G(x,y,) 卷積運算。 關(guān)鍵點檢測高斯函數(shù)尺度是自然存在的,不是人為創(chuàng)造的!高斯卷積只是表現(xiàn)尺度空間的一種形式關(guān)鍵點檢測的相關(guān)概念2022/9/314關(guān)鍵點檢測r為模糊半徑, 在減小圖像尺寸的場合經(jīng)常使用高斯模糊。在進行欠采樣的時,通常在采樣之前對圖像進行低通濾波處理。這樣就可以保證在采樣
6、圖像中不會出現(xiàn)虛假的高頻信息。 關(guān)鍵點檢測的相關(guān)概念2022/9/315在實際應(yīng)用中,在計算高斯函數(shù)的離散近似時,在大概3距離之外的像素都可以看作不起作用,這些像素的計算也就可以忽略。通常,圖像處理程序只需要計算關(guān)鍵點檢測高斯模板大小的選擇0.000000670.000022920.000191170.000387710.000191170.000022920.000000670.000022920.000786330.006559650.013303730.006559650.000786330.000022920.000191170.006559650.054721570.11098164
7、0.054721570.006559650.000191170.000387710.013303730.110981640.225083520.110981640.013303730.000387710.000191170.006559650.054721570.110981640.054721570.006559650.000191170.000022920.000786330.006559650.013303730.006559650.000786330.000022920.000000670.000022920.000191170.000387710.000191170.00002292
8、0.00000067高斯模板關(guān)鍵點檢測的相關(guān)概念2022/9/316高斯模糊具有圓對稱性。高斯模糊具有線性可分的性質(zhì),也可以在二維圖像上對兩個獨立的一維空間分別進行計算。這樣可以大大減少了運算的次數(shù)。 對一幅圖像進行多次連續(xù)高斯模糊的效果與一次更大的高斯模糊可以產(chǎn)生同樣的效果,大的高斯模糊的半徑是所用多個高斯模糊半徑平方和的平方根。例如,使用半徑分別為 6 和 8 的兩次高斯模糊變換得到的效果等同于一次半徑為 10 的高斯模糊效果, 根據(jù)這個關(guān)系,使用多個連續(xù)較小的高斯模糊處理不會比單個高斯較大處理時間要少。 高斯模糊的性質(zhì)關(guān)鍵點檢測關(guān)鍵點檢測的相關(guān)概念2022/9/317 關(guān)鍵點檢測DOG通
9、過研究Lowe教授的論文發(fā)現(xiàn),所有特征點的檢測都是基于了尺度不變的特性,特征點的檢測占據(jù)了論文的大部分的篇章,具有十分重要的意義!Lindeberg在文獻Scale-space theory: A basic tool for analysing structures at different scales指出尺度規(guī)范化的LoG算子具有真正的尺度不變性。LoG算子即(Laplacion of Gaussian),可以由高斯函數(shù)梯度算子GOG構(gòu)建尺度規(guī)范化的GoG算子尺度規(guī)范化的LoG算子2022/9/318LOG算子與高斯核函數(shù)的關(guān)系通過推導(dǎo)可以看出,LOG算子與高斯核函數(shù)的差有直接關(guān)系,由此
10、引入一種新的算子DOG(Difference of Gaussians),即高斯差分算子。關(guān)鍵點檢測DOG2022/9/320DoG高斯差分金字塔對應(yīng)DOG算子,我們要構(gòu)建DOG金字塔我們可以通過高斯差分圖像看出圖像上的像素值變化情況。(如果沒有變化,也就沒有特征。特征必須是變化盡可能多的點。)DOG圖像描繪的是目標(biāo)的輪廓。關(guān)鍵點檢測DOG2022/9/321關(guān)鍵點檢測DOG2022/9/323DoG局部極值檢測 關(guān)鍵點精確定位 為了提高關(guān)鍵點的穩(wěn)定性,需要對尺度空間DoG函數(shù)進行曲線擬合。利用DoG函數(shù)在尺度空間的Taylor展開式:其極值點 由于DoG值對噪聲和邊緣較敏感,因此,在上面Do
11、G尺度空間中檢測到局部極值點還要經(jīng)過進一步的檢驗才能精確定位為特征點。2022/9/324DoG局部極值檢測 去除邊緣響應(yīng) 僅僅去除低對比度的極值點對于極值點的穩(wěn)定性是遠遠不夠的。DoG函數(shù)在圖像邊緣有較強的邊緣響應(yīng),因此我們還需要排除邊緣響應(yīng)。 DoG函數(shù)的(欠佳的)峰值點在橫跨邊緣的方向有較大的主曲率,而在垂直的方向有較小的主曲率。主曲率可以通過計算在該點位置尺度的22的Hessian矩陣得到,導(dǎo)數(shù)由采樣點相鄰差來估計:表示DOG金字塔中某一尺度的圖像x方向求導(dǎo)兩次2022/9/326關(guān)鍵點方向分配 通過尺度不變性求極值點,可以使其具有縮放不變的性質(zhì),利用關(guān)鍵點鄰域像素的梯度方向分布特性,
12、我們可以為每個關(guān)鍵點指定方向參數(shù),從而使描述子對圖像的旋轉(zhuǎn)具有不變性。 像素點的梯度表示梯度幅值:梯度方向:我們通過求每個極值點的梯度來為極值點賦予方向。2022/9/327關(guān)鍵點方向分配 方向直方圖的生成 確定關(guān)鍵點的方向采用梯度直方圖統(tǒng)計法,統(tǒng)計以關(guān)鍵點為原點,一定區(qū)域內(nèi)的圖像像素點對關(guān)鍵點方向生成所作的貢獻。2022/9/328關(guān)鍵點方向分配 關(guān)鍵點主方向:極值點周圍區(qū)域梯度直方圖的主峰值即特征點的主方向 關(guān)鍵點輔方向:在梯度方向直方圖中,當(dāng)存在另一個相當(dāng)于主峰值 80%能量的峰值時,則將這個方向認為是該關(guān)鍵點的輔方向。 這可以增強匹配的魯棒性,Lowe的論文指出大概有15%關(guān)鍵點具有多
13、方向,但這些點對匹配的穩(wěn)定性至為關(guān)鍵。 關(guān)鍵點的主方向與輔方向2022/9/330關(guān)鍵點描述 描述的目的 描述的思路 通過對關(guān)鍵點周圍圖像區(qū)域分塊,計算塊內(nèi)梯度直方圖,生成具有獨特性的向量,這個向量是該區(qū)域圖像信息的一種抽象,具有唯一性。 描述的目的是在關(guān)鍵點計算后,用一組向量將這個關(guān)鍵點描述出來,這個描述子不但包括關(guān)鍵點,也包括關(guān)鍵點周圍對其有貢獻的像素點。用來作為目標(biāo)匹配的依據(jù),也可使關(guān)鍵點具有更多的不變特性,如光照變化、3D視點變化等。2022/9/331關(guān)鍵點描述 下圖是一個SIFT描述子示例。其中描述子由228維向量表征,也即是22個8方向的方向直方圖組成。左圖的種子點由88單元組成
14、。每一個小格都代表了特征點鄰域所在的尺度空間的一個像素,箭頭方向代表了像素梯度方向,箭頭長度代表該像素的幅值。然后在44的窗口內(nèi)計算8個方向的梯度方向直方圖。繪制每個梯度方向的累加可形成一個種子點,如右圖所示:一個特征點由4個種子點的信息所組成。2022/9/332關(guān)鍵點描述 Lowe實驗結(jié)果表明:描述子采用448128維向量表征,綜合效果最優(yōu)(不變性與獨特性)。2022/9/333關(guān)鍵點匹配 分別對模板圖(參考圖,reference image)和實時圖(觀測圖,observation image)建立關(guān)鍵點描述子集合。目標(biāo)的識別是通過兩點集內(nèi)關(guān)鍵點描述子的比對來完成。具有128維的關(guān)鍵點描
15、述子的相似性度量采用歐式距離。2022/9/334關(guān)鍵點匹配原圖像目標(biāo)圖像窮舉匹配2022/9/335 模板圖中關(guān)鍵點描述子: 實時圖中關(guān)鍵點描述子: 任意兩描述子相似性度量: 要得到配對的關(guān)鍵點描述子, 需滿足:關(guān)鍵點匹配2022/9/336關(guān)鍵點匹配Back2022/9/337SIFT算法的應(yīng)用 SIFT算法目前在軍事、工業(yè)和民用方面都得到了不同程度的應(yīng)用,其應(yīng)用已經(jīng)滲透了很多領(lǐng)域,典型的應(yīng)用如下: 物體識別 機器人定位與導(dǎo)航 圖像拼接 三維建模 手勢識別 視頻跟蹤 筆記鑒定 指紋與人臉識別 犯罪現(xiàn)場特征提取 2022/9/338SIFT算法的應(yīng)用 物體識別2022/9/339SIFT算法
16、的應(yīng)用 圖像拼接2022/9/340 三維建模SIFT算法的應(yīng)用2022/9/341SIFT算法的應(yīng)用 手勢識別目前,手勢識別已應(yīng)用于手機等設(shè)備上。2022/9/342 筆記鑒定SIFT算法的應(yīng)用2022/9/343 來自網(wǎng)友的創(chuàng)意周正龍的老虎SIFT算法的應(yīng)用圖1 周正龍的華南虎照片與年畫上的華南虎照片12點匹配圖2 周正龍的華南虎照片與真實的華南虎照片0點匹配Back2022/9/344SIFT算法的擴展與改進 SIFT在圖像的不變特征提取方面擁有無與倫比的優(yōu)勢,但其并不是完美的,仍然存在著實時性不高、有時特征點較少、對邊緣模糊的目標(biāo)無法準(zhǔn)確提取特征點等缺陷。自從1999年,SIFT算法問
17、世以來,人們從未停止對它的優(yōu)化和改進。2022/9/345SIFT算法的擴展與改進 PCA-SIFTPCA(Principal Component Analysis),即主成分分析,是一種數(shù)據(jù)降維技術(shù)。由Y.ke 2004年提出。通過降維技術(shù),可有效化簡SIFT算子的128維描述子。2022/9/346CSIFT(Colored scale invariant feature transform )彩色尺度特征不變變換,可以針對彩色圖像進行圖像的不變特征提取。由 Farag 2006年提出。SIFT算法的擴展與改進 CSIFT2022/9/347SIFT算法的擴展與改進 SURFSURF(SU
18、RF Speeded Up Robust Features),聲稱是SIFT算法的增強版,SURF算法的計算量小,運算速度快,提取的特征點幾乎與SIFT相同,由Bay 2006年提出。SIFTSURF特征點檢測用不同尺度的圖片與高斯函數(shù)做卷積用不同大小的box filter與原始圖像(integral image)做卷積,易于并行方向特征點鄰接矩形區(qū)域內(nèi),利用梯度直方圖計算特征點鄰接圓域內(nèi),計算x、y方向上的Haar小波響應(yīng)描述符生成20*20(單位為pixel)區(qū)域劃分為4*4(或2*2)的子區(qū)域,每個子域計算8bin直方圖20*20(單位為sigma)區(qū)域劃分為4*4子域,每個子域計算5*5個采樣點的Haar小波響應(yīng),記錄dx,dy,|dx|,|dy|。2022/9/348SIFT算法的擴展與改進methodTimeScaleRotation
溫馨提示
- 1. 本站所有資源如無特殊說明,都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請下載最新的WinRAR軟件解壓。
- 2. 本站的文檔不包含任何第三方提供的附件圖紙等,如果需要附件,請聯(lián)系上傳者。文件的所有權(quán)益歸上傳用戶所有。
- 3. 本站RAR壓縮包中若帶圖紙,網(wǎng)頁內(nèi)容里面會有圖紙預(yù)覽,若沒有圖紙預(yù)覽就沒有圖紙。
- 4. 未經(jīng)權(quán)益所有人同意不得將文件中的內(nèi)容挪作商業(yè)或盈利用途。
- 5. 人人文庫網(wǎng)僅提供信息存儲空間,僅對用戶上傳內(nèi)容的表現(xiàn)方式做保護處理,對用戶上傳分享的文檔內(nèi)容本身不做任何修改或編輯,并不能對任何下載內(nèi)容負責(zé)。
- 6. 下載文件中如有侵權(quán)或不適當(dāng)內(nèi)容,請與我們聯(lián)系,我們立即糾正。
- 7. 本站不保證下載資源的準(zhǔn)確性、安全性和完整性, 同時也不承擔(dān)用戶因使用這些下載資源對自己和他人造成任何形式的傷害或損失。
最新文檔
- 管井房電纜改造合同
- 廣告導(dǎo)演聘用合同
- 合同標(biāo)準(zhǔn)質(zhì)量范文
- 犬耳螨的診斷與治療
- 2024正規(guī)廠房租賃合同書
- 煤礦安全規(guī)程
- 2024設(shè)備改造的合同范本
- 2024專賣店申請加盟合同模板
- 2024家庭裝修全包合同
- 專題06課文理解與填空-2022-2023學(xué)年四年級語文上冊期末復(fù)習(xí)知識點精講精練(部編版)
- 上海市市轄區(qū)(2024年-2025年小學(xué)四年級語文)部編版期末考試(下學(xué)期)試卷及答案
- 認識梯形(課件)四年級上冊人教版
- 企業(yè)級SaaS軟件服務(wù)合同
- 【期中考后反思】《反躬自省,砥礪奮進》-2022-2023學(xué)年初中主題班會課件
- 2019新教材人教版生物必修1教材課后習(xí)題答案
- 2024年中國白酒行業(yè)數(shù)字化轉(zhuǎn)型研究報告-36氪-202409
- 《學(xué)校主人公:3 校園廣播站》教學(xué)設(shè)計-2024-2025學(xué)年五年級上冊綜合實踐活動滬科黔科版
- 外傷急救包扎技術(shù)說課課件
- 人教版(2024新版)七年級上冊英語全冊語法知識點講義
- 全國青島版信息技術(shù)七年級下冊專題一第8課三、《高級統(tǒng)計-數(shù)據(jù)透視表》教學(xué)設(shè)計
- 內(nèi)分泌科品管圈成果匯報提高糖尿病患者健康教育知曉率
評論
0/150
提交評論