版權(quán)說明:本文檔由用戶提供并上傳,收益歸屬內(nèi)容提供方,若內(nèi)容存在侵權(quán),請(qǐng)進(jìn)行舉報(bào)或認(rèn)領(lǐng)
文檔簡(jiǎn)介
的極值點(diǎn)提供了最穩(wěn)定的特征
返回高斯金字塔的原理解析SIFT演講文稿+結(jié)合源代碼共29頁(yè),您現(xiàn)在瀏覽的是第1頁(yè)!去除邊界響應(yīng)原理角點(diǎn):在任何方向上像素值的變化很大的點(diǎn)角點(diǎn)的確定方法(Moravec算子):0:將要判斷的點(diǎn)置于一個(gè)3*3或5*5的圖像塊的中心,如下圖用紅色的線環(huán)繞的圖像塊。1:將紅色的框朝8個(gè)方向移動(dòng)一格,得到藍(lán)色的框(下圖為向右上角移動(dòng))。2:將紅色的框和藍(lán)色的框的相同坐標(biāo)值的點(diǎn)的像素值相減,并求平方和,可以得到8個(gè)值。3:將8個(gè)值中的最小的值作為角點(diǎn)像素的變化值。SIFT演講文稿+結(jié)合源代碼共29頁(yè),您現(xiàn)在瀏覽的是第2頁(yè)!角點(diǎn)像素值表:求出每一個(gè)像素點(diǎn)的角點(diǎn)像素變化值,在局部圖像塊中,該值最大的點(diǎn)為角點(diǎn)。邊界上未被噪聲影響邊界上被噪聲影響SIFT演講文稿+結(jié)合源代碼共29頁(yè),您現(xiàn)在瀏覽的是第3頁(yè)!Harris算子將Moravec
算子做了兩個(gè)推廣:1:用像素的變化梯度代替像素值相減并引入高斯窗函數(shù)。2:推廣出了一個(gè)公式這樣可以計(jì)算任意方向上的像素值變化,而不在是8個(gè)固定的方向。SIFT演講文稿+結(jié)合源代碼共29頁(yè),您現(xiàn)在瀏覽的是第4頁(yè)!SIFT算法分析SIFT演講文稿+結(jié)合源代碼共29頁(yè),您現(xiàn)在瀏覽的是第5頁(yè)!doublesforthenextoctaveK=2(1/intvls),intlvs+3imagesforeachoctave2k2σ2kσ2σKσσ2k2σ2kσ2σKσσ2kσ2σkσσ2kσ2σkσσ高斯金字塔的原理解析SIFT演講文稿+結(jié)合源代碼共29頁(yè),您現(xiàn)在瀏覽的是第6頁(yè)!第二步尋找差分金字塔上的極值點(diǎn)SIFT演講文稿+結(jié)合源代碼共29頁(yè),您現(xiàn)在瀏覽的是第7頁(yè)!步驟1:進(jìn)行像素的預(yù)篩選凡是像素值的絕對(duì)值小于(0.5*contr_thr/intvls)的點(diǎn)排除,程序中contr_thr=0.04,intvls=3.SIFT演講文稿+結(jié)合源代碼共29頁(yè),您現(xiàn)在瀏覽的是第8頁(yè)!步驟3:對(duì)極值點(diǎn)進(jìn)行泰勒展開,將它的坐標(biāo)和尺度進(jìn)行精確定位假設(shè)極值點(diǎn)的坐標(biāo)為X=(x,y,intvl),此時(shí)這三個(gè)方向上的坐標(biāo)都為整數(shù)根據(jù)泰勒公式可以計(jì)算出以極值點(diǎn)為原點(diǎn)相對(duì)于極值點(diǎn)在行,列以及層數(shù)上的偏移量,X_P=(x_p,y_p,intvl_p).定位準(zhǔn)則:1)如果三個(gè)方向上的偏移量都小于0.5,則認(rèn)為該點(diǎn)就是極值點(diǎn)。此時(shí)可以結(jié)束對(duì)這個(gè)極值點(diǎn)的分析,保存該點(diǎn)的偏移信息,然后分析該極值點(diǎn)的像素值是否滿足要求。2)如果某一方向上的偏移量大于等于0.5,如假設(shè)x_p>=0.5,則采取下述方式進(jìn)行處理:先將x_p四舍五入得到一個(gè)整數(shù)intx,然后將intx與x相加得到一個(gè)新的極值點(diǎn)X_N=(x+intx,y,intvl),如果點(diǎn)X_N沒有進(jìn)入預(yù)先排除的區(qū)域則對(duì)這個(gè)點(diǎn)進(jìn)行泰勒展開(否則該點(diǎn)被放棄,然后分析下一個(gè)極值點(diǎn)),直到找到一個(gè)點(diǎn)的偏移滿足在三個(gè)方向上都小于0.5為止,然后記下點(diǎn)X_N及其偏移值,此時(shí)極值點(diǎn)為X_N。但是這個(gè)重新確定極值點(diǎn)并重新定位的操作只能循環(huán)5次。若超過5次仍無法滿足1)的要求,這該極值點(diǎn)被放棄,然后分析下一個(gè)點(diǎn)。利用公式確定精確定位后的極值點(diǎn)的像素值,進(jìn)行對(duì)比度的檢測(cè)。若像素值滿足大于contr_thr/intvls(程序中為0.04/3),則該點(diǎn)才能最終確定為極值點(diǎn)。SIFT演講文稿+結(jié)合源代碼共29頁(yè),您現(xiàn)在瀏覽的是第9頁(yè)!沒有進(jìn)行任何處理的關(guān)鍵點(diǎn)SIFT演講文稿+結(jié)合源代碼共29頁(yè),您現(xiàn)在瀏覽的是第10頁(yè)!去除邊界相應(yīng)的點(diǎn)SIFT演講文稿+結(jié)合源代碼共29頁(yè),您現(xiàn)在瀏覽的是第11頁(yè)!計(jì)算公式:scl_octv=sigma*pow(2.0,intvl/intvls),式中:scl_octv為關(guān)鍵點(diǎn)的尺度,intvl為關(guān)鍵點(diǎn)在高斯差分金字塔中所處于的層數(shù),程序中sigma=1.6,intvls=32k2σ2kσ2σKσσ2k2σ2kσ2σKσσ2kσ2σkσσ2kσ2σkσσdoublesforthenextoctaveK=2(1/intvls),intlvs+3imagesforeachoctaveSIFT演講文稿+結(jié)合源代碼共29頁(yè),您現(xiàn)在瀏覽的是第12頁(yè)!步驟1:計(jì)算梯度方向直方圖計(jì)算梯度方向直方圖的范圍為以關(guān)鍵點(diǎn)為原點(diǎn),偏移為rad的正方形區(qū)域,rad=四舍五入(3*1.5*scl_octv)梯度加權(quán)系數(shù)w的確定:w=exp(-(i*i+j*j)/exp_denom),i,j為像素點(diǎn)在以關(guān)鍵點(diǎn)為原點(diǎn)的坐標(biāo)系中所處的坐標(biāo)值,范圍為(-rad,rad);exp_denom=2.0*(1.5*scl_octv)*(1.5*scl_octv)每個(gè)像素點(diǎn)的梯度值都必須乘以該點(diǎn)所對(duì)應(yīng)的高斯權(quán),這樣才能得到最終的梯度值。然后根據(jù)計(jì)算出的梯度方向確定該點(diǎn)處于梯度方向直方圖的哪個(gè)bin,并將處于該bin內(nèi)的所有點(diǎn)的加權(quán)后的梯度相加。程序中bin為8個(gè)。SIFT演講文稿+結(jié)合源代碼共29頁(yè),您現(xiàn)在瀏覽的是第13頁(yè)!步驟4:確定關(guān)鍵點(diǎn)的主方向用插值的方法確定主方向在8個(gè)bin中所處的亞位置bin_f。bin_f=i+interp_hist_peak(hist[l],hist[i],hist[r]),hist[l],hist[i],hist[r]為在8個(gè)bin中處于位置l,i,r的直方圖的高度。hist[l],hist[i],hist[r]必須滿足式子hist[i]>hist[l]&&hist[i]>hist[r]&&hist[i]>=0.8*max,而且這三個(gè)直方圖必須挨在一起才有能求主方向。插值算法:#defineinterp_hist_peak(l,c,r)(0.5*((l)-(r))/((l)-2.0*(c)+(r)))利用插值算出主方向在8個(gè)bin中所處的亞位置bin_f,就可以算出主方向了同一個(gè)點(diǎn)可以有多個(gè)主方向,此時(shí)相當(dāng)于在這個(gè)位置有多個(gè)關(guān)鍵點(diǎn)SIFT演講文稿+結(jié)合源代碼共29頁(yè),您現(xiàn)在瀏覽的是第14頁(yè)!步驟1:確定每一組梯度方向直方圖占據(jù)的圖像寬度,以及描述字計(jì)算所需要的圖像寬度每一組梯度方向直方圖占據(jù)的圖像寬度hist_width=1.5*scl_octv描述字計(jì)算所需要的圖像寬度radius=hist_width*sqrt(2)*(d+1.0)*0.5+0.5SIFT演講文稿+結(jié)合源代碼共29頁(yè),您現(xiàn)在瀏覽的是第15頁(yè)!步驟3:利用插值法將一個(gè)點(diǎn)的梯度分配到多組梯度方向直方圖中的多個(gè)bin,即分配到hist[rbin][cbin][obin]對(duì)梯度方向直方圖組的列進(jìn)行插值得到hist[r]對(duì)梯度方向直方圖組的列進(jìn)行插值得到hist[r][c]對(duì)梯度方向直方圖組的行進(jìn)行插值hist[r][c][o]SIFT演講文稿+結(jié)合源代碼共29頁(yè),您現(xiàn)在瀏覽的是第16頁(yè)!由于像素點(diǎn)的變化值與矩陣M有關(guān),因此可以用矩陣M的特征值來判斷某個(gè)點(diǎn)是否是角點(diǎn)。k=(0.04,0.06)之間的數(shù)返回SIFT演講文稿+結(jié)合源代碼共29頁(yè),您現(xiàn)在瀏覽的是第17頁(yè)!步構(gòu)建高斯金字塔以及高斯差分金字塔SIFT演講文稿+結(jié)合源代碼共29頁(yè),您現(xiàn)在瀏覽的是第18頁(yè)!說明:原始圖像的尺度sigma_pre可以認(rèn)為是0.5,如果原始圖像在構(gòu)建高斯金字塔之前它的尺寸加倍,則加倍后的原始圖像的尺度為2*0.5。加倍的方式采用的是立方插值法。高斯金字塔第0組第0層的尺度為sigma=1.6,它是由原始圖像經(jīng)過高斯模糊后得到的,高斯模糊函數(shù)的高斯核sigma_diff*sigma_diff=sigma*sigma-sigma_pre*sigma_pre.依照這個(gè)原理可以計(jì)算出產(chǎn)生其它幾層圖像所需要的高斯核函數(shù)。金字塔的組數(shù)由下面的式子確定:octvs=log(min(長(zhǎng),寬))/log(2)-2.下一組高斯金字塔的第0層圖像由前一組高斯金字塔中尺度為2sigma的圖像經(jīng)過最鄰近插值得到。采用的是降采樣。高斯差分金字塔由高斯金字塔上的相鄰兩幅圖像直接相減得到。SIFT演講文稿+結(jié)合源代碼共29頁(yè),您現(xiàn)在瀏覽的是第19頁(yè)!說明:極值點(diǎn)尋找的范圍:差分金字塔中的第0層和最上面的一層排除中間的差分圖像中,像素的橫坐標(biāo)或者縱坐標(biāo)中任一個(gè)值與圖像邊界值之間的差值小于5的點(diǎn)排除返回SIFT演講文稿+結(jié)合源代碼共29頁(yè),您現(xiàn)在瀏覽的是第20頁(yè)!步驟2:定位極值點(diǎn)的坐標(biāo)和所在的尺度每一個(gè)采樣點(diǎn)要和它所有的相鄰點(diǎn)比較,看其是否比它的圖像域和尺度域的相鄰點(diǎn)大或者小。如上圖所示,中間的檢測(cè)點(diǎn)和它同尺度的8個(gè)相鄰點(diǎn)和上下相鄰尺度對(duì)應(yīng)的9×2個(gè)點(diǎn)共26個(gè)點(diǎn)比較,以確保在尺度空間和二維圖像空間都檢測(cè)到極值點(diǎn)。SIFT演講文稿+結(jié)合源代碼共29頁(yè),您現(xiàn)在瀏覽的是第21頁(yè)!步驟4:去除邊界影響點(diǎn)
計(jì)算極值點(diǎn)處的Hessian矩陣H。如果點(diǎn)滿足則該點(diǎn)保留,否則該點(diǎn)將會(huì)被排除。
為最大特征值,為最小的特征值,在程序中r=10.SIFT演講文稿+結(jié)合源代碼共29頁(yè),您現(xiàn)在瀏覽的是第22頁(yè)!去除了低對(duì)比度之后的點(diǎn)SIFT演講文稿+結(jié)合源代碼共29頁(yè),您現(xiàn)在瀏覽的是第23頁(yè)!第三步計(jì)算關(guān)鍵的尺度SIFT演講文稿+結(jié)合源代碼共29頁(yè),您現(xiàn)在瀏覽的是第24頁(yè)!第四步計(jì)算關(guān)鍵點(diǎn)的主方向SIFT演講文稿+結(jié)合源代碼共29頁(yè),您現(xiàn)在瀏覽的是第25頁(yè)!步驟2:對(duì)得到的梯度方向直方圖進(jìn)行高斯平滑程序中使用的高斯平滑矩陣為(0.25,0.5,0.25)步驟3:找出梯度方向直方圖的8個(gè)bin的峰值maxSIFT演講文稿+結(jié)合源代碼共29頁(yè),您現(xiàn)在瀏覽的是第26頁(yè)!第五步計(jì)算描述字SIFT演講文稿+結(jié)合源代碼共29頁(yè),您現(xiàn)在瀏覽的是第27頁(yè)!步驟2:確定哪一些點(diǎn)在旋轉(zhuǎn)關(guān)鍵點(diǎn)的梯度方向后處于描述字計(jì)算的范圍
并計(jì)算其梯度建立以關(guān)鍵點(diǎn)為原點(diǎn)的坐標(biāo)系對(duì)橫縱坐標(biāo)都處于(-radius,radius)范圍內(nèi)的點(diǎn)計(jì)算它們?cè)谛D(zhuǎn)關(guān)鍵點(diǎn)的梯度方向后的坐標(biāo),計(jì)算式子為:c_rot=(j*cos_t-i*sin_t)r_rot=(j*sin_t+i*cos_t)利用式子c_rot=c_rot/hist_width;r_rot=r_rot/hist_width;來計(jì)算該像素點(diǎn)在梯度方向直方圖數(shù)組中的坐標(biāo)(仍將關(guān)鍵點(diǎn)作為原點(diǎn))利用式子rbin=r_rot+d/2-0.5;cbin=c_rot+d/2-0.5;進(jìn)行坐標(biāo)變換,將梯度方向直方圖數(shù)組的左上角定為原點(diǎn),重新計(jì)算該像素點(diǎn)在梯度方向直方圖數(shù)組中的坐標(biāo)若rbin>-1.0&&rbin<d&&cbin>-1.0&&cbin<d;成立,則說明該點(diǎn)在描述字計(jì)算的范圍內(nèi),對(duì)于旋轉(zhuǎn)以后處于描述字計(jì)算范圍內(nèi)的點(diǎn),以它在旋轉(zhuǎn)以前的圖像中的坐標(biāo)來計(jì)算其梯度,但是,高斯權(quán)是以旋轉(zhuǎn)以后在梯度方向直方圖數(shù)組中的的坐標(biāo)來計(jì)算的:w=exp(-(c_rot*c_rot+r_rot*r_rot)/exp_denom);exp_denom=d*d*0.5;在程序中d=4,表示有4*4個(gè)梯度方向直方圖對(duì)于梯度的方向要減去旋轉(zhuǎn)的方向,然后計(jì)算出在梯度方向直方圖中的bin值obin。最終可以得到該梯度的坐標(biāo)為hist[rbin][cbin][obin]SIFT演講文稿+結(jié)合源代碼共29頁(yè),您現(xiàn)在瀏覽的是第28頁(yè)!步驟4:對(duì)得到的128個(gè)梯度值進(jìn)行處理將用三位數(shù)組存儲(chǔ)的梯度轉(zhuǎn)換
溫馨提示
- 1. 本站所有資源如無特殊說明,都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請(qǐng)下載最新的WinRAR軟件解壓。
- 2. 本站的文檔不包含任何第三方提供的附件圖紙等,如果需要附件,請(qǐng)聯(lián)系上傳者。文件的所有權(quán)益歸上傳用戶所有。
- 3. 本站RAR壓縮包中若帶圖紙,網(wǎng)頁(yè)內(nèi)容里面會(huì)有圖紙預(yù)覽,若沒有圖紙預(yù)覽就沒有圖紙。
- 4. 未經(jīng)權(quán)益所有人同意不得將文件中的內(nèi)容挪作商業(yè)或盈利用途。
- 5. 人人文庫(kù)網(wǎng)僅提供信息存儲(chǔ)空間,僅對(duì)用戶上傳內(nèi)容的表現(xiàn)方式做保護(hù)處理,對(duì)用戶上傳分享的文檔內(nèi)容本身不做任何修改或編輯,并不能對(duì)任何下載內(nèi)容負(fù)責(zé)。
- 6. 下載文件中如有侵權(quán)或不適當(dāng)內(nèi)容,請(qǐng)與我們聯(lián)系,我們立即糾正。
- 7. 本站不保證下載資源的準(zhǔn)確性、安全性和完整性, 同時(shí)也不承擔(dān)用戶因使用這些下載資源對(duì)自己和他人造成任何形式的傷害或損失。
最新文檔
- 買賣風(fēng)機(jī)設(shè)備合同(2024年修訂)
- 二零二五年湖南事業(yè)單位專業(yè)技術(shù)崗位聘用合同書3篇
- 水資源課課程設(shè)計(jì)
- 2024版企業(yè)生產(chǎn)技術(shù)合作協(xié)議一
- 2023-2029年中國(guó)成品油管道運(yùn)輸行業(yè)發(fā)展監(jiān)測(cè)及投資前景展望報(bào)告
- 2025年數(shù)學(xué)圓規(guī)套裝項(xiàng)目可行性研究報(bào)告
- 2025年中國(guó)外包物流行業(yè)市場(chǎng)深度分析及投資策略咨詢報(bào)告
- 中國(guó)工程建筑軟件行業(yè)競(jìng)爭(zhēng)格局分析及投資規(guī)劃研究報(bào)告
- 2024資產(chǎn)證券化融資居間服務(wù)合同
- 磁漆項(xiàng)目立項(xiàng)申請(qǐng)報(bào)告
- 移印工作業(yè)指導(dǎo)書
- 樂高基礎(chǔ)篇樂高積木和搭建種類專題培訓(xùn)課件
- 低血糖的觀察和護(hù)理課件
- 事故形成的冰山理論
- 溶解度曲線教學(xué)設(shè)計(jì)
- 硅膠產(chǎn)品工藝流程圖
- 醫(yī)院各科室規(guī)章制度匯編
- 土地翻耕施工組織方案
- 三級(jí)配電箱電路圖(共2頁(yè))
- 學(xué)校中層干部量化考核表
- 風(fēng)電風(fēng)機(jī)吊裝作業(yè)安全檢查表
評(píng)論
0/150
提交評(píng)論