版權(quán)說明:本文檔由用戶提供并上傳,收益歸屬內(nèi)容提供方,若內(nèi)容存在侵權(quán),請進(jìn)行舉報或認(rèn)領(lǐng)
文檔簡介
第11章主動輪廓與跟蹤運動11.1主動輪廓模型11.2彈性形狀模型11.3高斯混合模型 11.3.1高斯混合模型分布特征 11.3.2高斯混合模型的參數(shù)極大似然估計 11.3.3隨機(jī)梯度算法 11.3.4EM算法11.4跟蹤運行特征 11.4.1基于高斯混合模型的背景建模 11.4.2基于核函數(shù)的跟蹤第11章主動輪廓與跟蹤運動11.5基于視覺的運動特征提取與描述 11.5.1運動形狀描述 11.5.2運動形狀檢測11.1主動輪廓模型主動輪廓也稱蛇模型(activecontourorsnakes)是與特征提取完全不同的方法。主動輪廓是將目標(biāo)特征,即待提取特征包圍起來的一組點。類似于用一個氣球找出形狀:氣球放在形狀外部,將形狀包圍在內(nèi)。然后把氣球中的空氣放出,使它慢慢變小,當(dāng)氣球停止縮小時,即找出了形狀,此時氣球與形狀完全擬合。通過這種方式,主動輪廓對一組點進(jìn)行排列,將目標(biāo)形狀包圍在內(nèi)以便對其進(jìn)行描述。11.1主動輪廓模型在目標(biāo)特征的外部設(shè)置一個初始輪廓,然后對其進(jìn)行演變并將目標(biāo)特征包圍在內(nèi)。主動輪廓模型采用能量最小化方法進(jìn)行處理。目標(biāo)特征是能量泛函的最小值。該能量泛函不只包含邊界信息,還包括控制輪廓伸縮和彎曲的特性。通過這種方式蛇模型表示其自身特性(比如彎曲和拉伸能力)與圖像特性(比如邊緣強(qiáng)度)之間的一種折中。因此,能量泛函是輪廓內(nèi)部能量
、約束能量
以及圖像能量
的相加函數(shù),它們是組成蛇模型
的一組點,即蛇模型中所有點的x和y坐標(biāo)。假設(shè)
是蛇模型的正規(guī)化長度,那么能量泛函是該蛇模型的所有函數(shù)的積分。因此,能量泛函
為(11-1)11.1主動輪廓模型上式中,
,
和
分別是輪廓點的x和y坐標(biāo),
,內(nèi)部能量
決定蛇模型的自然變化,從而決定蛇模型所有點的排列;圖像能量
引導(dǎo)蛇模型選擇低層次特征(如邊緣點);約束能量
給出高層次信息以控制蛇模型的演變。蛇模型的目標(biāo)就是通過式(11-1)的最小化來進(jìn)行求解。新的蛇模型輪廓是指那些比初始點能量更低并與目標(biāo)特征匹配更好的點,蛇模型就是從這些初始點演變而來的。通過這種方式,選擇一組點
滿足式(11-2)
(11-2)11.1主動輪廓模型能量泛函
表示為蛇模型函數(shù)以及圖像的形式。根據(jù)各自所選的權(quán)重系數(shù),這些函數(shù)構(gòu)成蛇模型能量。通過這種方式,曲線內(nèi)部能量
定義為輪廓周圍一階和二階導(dǎo)數(shù)的加權(quán)和,如式(11-3)所示。
(11-3)一階微分
表示由伸縮而產(chǎn)生的彈性能量,由于該微分的值越大意味著這個輪廓區(qū)域內(nèi)的變化率越大。二階微分
表示因彎曲而產(chǎn)生的能量,即曲率能量。由于受點間隔影響,使用權(quán)值
控制彈性能量貢獻(xiàn);受點變動影響,使用權(quán)值
控制曲率能量貢獻(xiàn)。α和β的取值決定蛇模型最終形狀。α取低值表示點的間隔變化幅度大,而取高值則表明蛇模型得到均勻分隔的輪廓點。β取低值意味著曲率不是最小值,并且輪廓在其邊界上形成角點,而取高值表示預(yù)先設(shè)定蛇模型為光滑的輪廓。上述情形是輪廓自身的特性,它只是蛇模型自身特征與圖像檢測特征之間的部分折中。11.1主動輪廓模型圖像能量
引導(dǎo)蛇模型提取低層次特征,比如亮度或邊緣數(shù)據(jù),目的是選取具有最小貢獻(xiàn)的特征。式(11-1)表明線、邊緣和端點可以作用于能量函數(shù),這些能量分別標(biāo)記為
,
和
,并且分別通過權(quán)重系數(shù)
,和
來控制。因此,圖像能量如式(11-4)所示。
(11-4)線能量可以設(shè)為特定點的圖像亮度。如果黑色比白色取值低,那么將暗特征提取為蛇模型。改變
的符號可以將蛇模變成較亮的特征。邊緣能量
利用邊緣檢測算子來計算,比如Sobel邊緣檢測算子輸出的強(qiáng)度。端點能量包括層次圖像輪廊的曲率,但是很少用到。最常用的是邊緣能量。11.2彈性形狀模型分析形狀的方法主要關(guān)注的是圖像數(shù)據(jù)的匹配。通常關(guān)注一個模型(即一個可以變形的模板或可以演變的形狀)與單幅圖像之間的匹配。主動輪廓是彈性的,但其演變實質(zhì)上受局部曲率或邊緣強(qiáng)度等局部特性的限制。那些泛函所賦予的參數(shù)值或可能范圍可以通過學(xué)習(xí)所應(yīng)用的同類圖像數(shù)據(jù)庫進(jìn)行多方面測試,或根據(jù)經(jīng)驗進(jìn)行選取。一個與此完全不同的方法是,考慮圖像庫中是否包含該形狀的所有可能變化,比如外觀或姿勢,圖像庫可以形成一個該形狀可能變化的模型。因此,如果把該模型作為一個整體約束條件,同時引導(dǎo)與最可能形狀的匹配,那么可以得到一個可變形方法,通過對形狀的可能變化進(jìn)行統(tǒng)計來實現(xiàn)。上述方法稱為彈性模板,利用從訓(xùn)練數(shù)據(jù)樣例形成的整體形狀約束。11.2彈性形狀模型其中的主要新方法稱為主動形狀建模。該方法實質(zhì)上是由點組成的形狀模型:這些點的變化稱為點分布模型。所選地標(biāo)點在訓(xùn)練圖像中進(jìn)行標(biāo)記,這組訓(xùn)練圖像旨在得到形狀的所有可能變化。每個點描述邊界上的一個特定點,因此其順序在標(biāo)記過程中非常重要。這些樣點的選擇包括曲率高的位置(如眼睛角點)或弧長頂點,這樣的地方對比度比較高(如眼瞼上方)。對這些點的位置所產(chǎn)生的形狀變化進(jìn)行統(tǒng)計,可以描述形狀的外觀。實例應(yīng)用包括在圖像中找出人臉(如:自動人臉識別中的人臉檢測)。臉部可以獲得不同模型的唯一部位是虹膜上的圓圈,除非分辨率非常高,否則該部位區(qū)域非常小。臉部的其余部分由一些未知的形狀組成,而這些形狀隨臉部表情的變化而變化。由此可見,由于我們得到一組形狀和一個固定的相互關(guān)系,它們非常適合于將形狀與分布結(jié)合在一起的方法,不過有些細(xì)節(jié)可能發(fā)生變化。這些細(xì)節(jié)變化正是主動形狀模型所要得到的。11.2彈性形狀模型如果選擇的點非常多而且要用到很多訓(xùn)練圖像,那么這樣處理數(shù)據(jù)量非常大,即將有大量的點要處理,主成分分析可以將數(shù)據(jù)壓縮成最重要項。主成分分析是一個非常成熟的數(shù)學(xué)工具。實質(zhì)上,它對坐標(biāo)系進(jìn)行了旋轉(zhuǎn)以便得到最大辨別能力:如果從兩個不同的點觀察一個事物,或許無法看到,但是如果從其中一個點進(jìn)行觀察,則可以看得非常清楚。此處要做的是:旋轉(zhuǎn)坐標(biāo)系以便從一堆雜亂的數(shù)據(jù)找出最重要的變化。已知N個訓(xùn)練樣本的集合,每個樣本為n個點的集合,對于第i個訓(xùn)練樣本xi,有(11-5)11.2彈性形狀模型式中,xki表示第i個訓(xùn)練樣本中的第k個變量。如果將其應(yīng)用于形狀,每個元素取每個點的兩個坐標(biāo)。然后,對整個訓(xùn)練樣本集合計算平均值,如式(11-6)所示。(11-6)于是根據(jù)平均值計算每個樣本的偏差(11-7)這個差值說明每個樣本與某點均值的距離。
協(xié)方差矩陣S表示所有差值與均值之間的距離,如式(11-8)所示。(11-8)11.2彈性形狀模型該協(xié)方差矩陣的主成分分許顯示這些樣本數(shù)量,即其形狀可能發(fā)生多少變化。事實上,形狀的任何一個樣例都可以近似為(11-9)式中,
表示第t個特征矢量矩陣,
表示相對應(yīng)的權(quán)值失量,其中每個權(quán)值控制一個特征矢量的貢獻(xiàn)。w的不同值給出不同的模型或形狀。如假設(shè)這些變化在一個設(shè)定的范圍內(nèi),新的模型或形狀將與基礎(chǔ)(平均)形狀類似。這是因為變化模式是由(單位)特征矢量來表示的,如(11-10)式中,表示特征值,特征矢量具有正交性,因而(11-11)11.2彈性形狀模型而且這些特征值是有序的,因而
。式中,最大特征值對應(yīng)數(shù)據(jù)中的最重要變化模式。訓(xùn)練數(shù)據(jù)中的變化部分對應(yīng)每個特征矢量,與相應(yīng)的特征值成正比。由此可見,一組數(shù)量有限的特征值和特征矢量可以用來包括大部分?jǐn)?shù)據(jù)。其余特征值和特征矢量對應(yīng)數(shù)據(jù)中那些幾乎不出現(xiàn)的變化模式(如高頻率部分對圖像的貢獻(xiàn),主要根據(jù)低頻率分量對圖像進(jìn)行重構(gòu),同圖像編碼)。需要注意的是,為了對應(yīng)用于新形狀的訓(xùn)練集中貼有地標(biāo)標(biāo)記的點的統(tǒng)計進(jìn)行檢查,需要對這些點進(jìn)行排序,從而得到確定的程序。11.2彈性形狀模型應(yīng)用過程(如找出被建模形狀的實例)是利用迭代方法使模型和圖像中相匹配點不斷增多。這可以通過檢測模型點周圍區(qū)域以確定最佳近鄰匹配來實現(xiàn)。該方法對數(shù)據(jù)的最佳擬合模型計算適當(dāng)?shù)钠揭?、縮放、旋轉(zhuǎn)和特征矢量。不斷重復(fù)以上處理直到模型對數(shù)據(jù)收斂,這時參數(shù)幾乎沒有變化。由于只改變形狀以便更好地擬合數(shù)據(jù),并且形狀受所期望的形狀外觀控制,所以這種模型被稱為主動形狀模型。將主動形狀模型應(yīng)用于找出臉部特征。該方法可以利用由粗到細(xì)的方式進(jìn)行處理,即以低分辨率開始處理(使其快速進(jìn)行),逐漸提高分辨率直到處理結(jié)果沒有改進(jìn),即最終收斂。很顯然,這樣的方法不受特殊情形或背景中的其他特征所誤導(dǎo)。它可以用來注冊(自動找出人臉)或自動人臉識別(找出或描述人臉的特征)。該方法無法處理太粗劣的初始化,其初始位置并不需要非??拷四槨?1.2彈性形狀模型主動形狀模型(ActiveShapeModel,ASM)已經(jīng)應(yīng)用于人險識別、醫(yī)學(xué)圖像分析,以及工業(yè)檢查。相似理論被用來開發(fā)一種與紋理相關(guān)的新方法,稱為主動外觀模型(ActiveAppearancemodel,AAM)。主動外觀模型也是將形狀表示為一組地標(biāo)點,并利用一組訓(xùn)練數(shù)據(jù)確定形狀變化的可能范圍。一個主要區(qū)別在于AAM顯然包括紋理,并通過重復(fù)搜索處理對紋理進(jìn)行匹配來更新模型參數(shù),使地標(biāo)點向圖像點靠近。ASM和AAM的實質(zhì)區(qū)別包括:●ASM利用的是點局部的紋理信息,而AAM利用的是整個區(qū)域的紋理信息。●ASM想要得到模型點與相應(yīng)圖像點之間的最小距離,而AAM想要得到合成模型與目標(biāo)圖像之間的最小距離。●ASM在當(dāng)前點附近,尤其在垂直于邊界的輪廓上進(jìn)行搜索,而AAM只考慮當(dāng)前位置的圖像。11.2彈性形狀模型研究表明,雖然ASM比AAM實現(xiàn)更快,但是AAM需要的地標(biāo)點更少,而且收斂得到更好的效果,尤其以紋理的形式。我們期待彈性形狀建模方面的這些方法得到進(jìn)一步的發(fā)展。近來的研究關(guān)注的是處理遮擋的能力,改變?nèi)S(3D)朝向或姿勢時都會出現(xiàn)遮擋。11.3.1高斯混合模型分布特征如果一個類中的模式分布在不同的聚類中,通過一個高斯模型去近似類條件分布是不合適的。比如說,圖11-1a所示的情形,通過一個高斯模型去近似單峰模型分布,其結(jié)果是準(zhǔn)確的估計。但是如圖11-1b所示,如果用一個高斯模型去近似多峰模型分布,即使在訓(xùn)練樣本足夠多的情況下,其表現(xiàn)依舊會很差。定義高斯混合模型為:(11-12)高斯混合模型很適合這樣的多峰模型分布。這里,
表示一個期望為
和方差協(xié)方差矩陣為
的高斯模型:(11-13)11.3.1高斯混合模型分布特征圖11-1高斯模型的極大似然估計11.3.1高斯混合模型分布特征所以,高斯混合模型是m個高斯模型根據(jù)
加權(quán)線性組合而成。高斯混合模型的參數(shù)為:
高斯混合模型
如果要成為一個概率密度函數(shù),就應(yīng)該滿足下面的條件:
同時
需要滿足:(11-14)如圖11-2所示的高斯混合模型的例子,通過多個高斯模型的線性組合,高斯混合模型能夠表示一個多峰模型分布。11.3.1高斯混合模型分布特征 a)每個高斯分量b)高斯混合模型圖11-2高斯混合模型11.3.1高斯混合模型分布特征mu=[12;-3-5];sigma=cat(3,[20;0.5],[10;01]);p=ones(1,2)/2;obj=gmdistribution(mu,sigma,p);ezsurf(@(x,y)pdf(obj,[xy]),[-1010],[-1010])
#Python調(diào)用MATLAB的m文件,高斯混合模型importmatlabimportmatlab.engine#importnumpyasnpeng=matlab.engine.start_matlab()eng.gmdistribution(nargout=0)input()#使圖像保持
圖11-3高斯混合模型的Python和Matla程序11.3.1高斯混合模型分布特征圖11-4高斯混合模型三維圖11.3.2高斯混合模型的參數(shù)極大似然估計高斯混合模型的參數(shù)可以用極大似然進(jìn)行估計,似然公式為:(11-15)并且極大似然估計找到使其最大化的參數(shù)。當(dāng)上述高斯混合模型的似然被最大化時,應(yīng)該滿足等式(11-16)的約束:(11-16)由于以上約束,的最大值不能通過簡單的對似然求導(dǎo)并令導(dǎo)數(shù)等于0來得到。這里
被重新參數(shù)化為:(11-17)11.3.2高斯混合模型的參數(shù)極大似然估計其中
自動滿足等式(11-14)的約束,它可以被學(xué)習(xí)得到。對于
最大似然解滿足下面似然等式:(11-18)其中:表示d-維零向量,
表示d*d零矩陣。把等式(11-17)代入等式(11-15)中,對數(shù)似然被表示為:(11-19)11.3.2高斯混合模型的參數(shù)極大似然估計對上述的對數(shù)似然求關(guān)于
的偏導(dǎo),得:(11-20)其中
被定義為
11.3.2高斯混合模型的參數(shù)極大似然估計同理,對上述的對數(shù)似然求關(guān)于
和
的偏導(dǎo),可得:(11-21)(11-22)11.3.2高斯混合模型的參數(shù)極大似然估計令上述導(dǎo)數(shù)為零,最大似然解
,和滿足(11-23)11.3.2高斯混合模型的參數(shù)極大似然估計其中
是樣本
的第組成部分的決定因素(responsibility):
(11-24)上述似然等式中的變量用很混亂和復(fù)雜的方式被定義和使用,目前還沒有比較有效的方法能解決這個問題。下面,介紹了兩種方法來找到數(shù)值解:一個是梯度方法,一個是算法。11.3.3隨機(jī)梯度算法梯度方法是一種比較通用和簡單的優(yōu)化方法,如圖11-5所示,它通過不停的迭代更新參數(shù)的方法來使得目標(biāo)函數(shù)的梯度升高或者降低(在最小化的情況下)。如圖11-6所示,詳細(xì)描述了梯度上升算法執(zhí)行過程。在寬松的假設(shè)條件下,梯度上升的解能保證是局部最優(yōu)的,就好比一個局部山峰的峰頂,任何局部參數(shù)的更新,目標(biāo)值也不會增加。梯度方法的一種隨機(jī)變種是,隨機(jī)選擇一個樣本,然后根據(jù)這個被選擇的樣本更新參數(shù)來上升梯度。這種隨機(jī)方法被稱作隨機(jī)梯度算法,該算法也能找到局部最優(yōu)解。注意(隨機(jī))梯度方法不僅要給出全局最優(yōu)解而且還要給出一個局部最優(yōu)解,如圖11-5所示。此外,算法的性能依賴于步長的選擇,且步長的大小在實際使用中很難選擇。如果步長設(shè)置較大,那么梯度在剛開始的時候上升很快,但是可能會翻過最高點,如圖11-7a所示。另一方面,如果步長設(shè)置減少,那么雖然能夠找到最高點,但是在剛開始11.3.3隨機(jī)梯度算法的時候梯度上升的速度會很慢,如圖11-7b所示。為了克服這個問題,我們開始把步長設(shè)置較大,隨后慢慢減少步長,這是比較有效果的,這就是模擬退火。但是,在實際使用的時候,初始步長的選擇和步長的下降因子是不能直接確定的。為了減輕只能找到一個局部最優(yōu)解的問題,實際上,設(shè)置不同的初始值多次運行梯度算法,根據(jù)最好的解來選擇一個初始值是很有用的。圖11-5梯度下降原理圖11.3.3隨機(jī)梯度算法圖11-6梯度下降法給解
以適當(dāng)?shù)某踔?。對于選定的初值,計算出對數(shù)似然
的梯度:3.采用梯度上升的方式,對參數(shù)進(jìn)行更新:4.重復(fù)上述
步計算,直到解
達(dá)到收斂精度為止。11.3.3隨機(jī)梯度算法 a)太大 b)太小圖11-7梯度下降過程步長設(shè)置11.3.4EM算法在梯度方法中調(diào)整步長的困難能夠被算法克服.算法是在當(dāng)輸入僅僅部分可觀察的情況下為了得到極大似然估計解而發(fā)展出來的。高斯混合模型的極大似然估計實際上也能被視為從不完全的數(shù)據(jù)中學(xué)習(xí)而來,并且EM算法能給出一種有效的方式來得到一個局部最優(yōu)解。如圖11-8描述的一樣,EM算法是由E步和M步兩部分組成。11.3.4EM算法對參數(shù)
進(jìn)行初始化。
步:根據(jù)當(dāng)前的參數(shù)
,可以計算出后驗概率
:
步:從當(dāng)前的后驗概率
,對參數(shù)
進(jìn)行更新:重復(fù)上述2-3步的計算。
圖11-8EM算法11.3.4EM算法
E步和M步解釋如下:
E步:當(dāng)解為時,似然
的下界的等號能被取得:(11-25)注意:下界
需要通過不可觀察的變量來計算期望得到,這也是為什么把這一步叫做(expectation)步。
M步:使下界
最大的可得:(11-26)如圖11-9所示,通過E步和M步的迭代,對數(shù)似然的值增加了(準(zhǔn)確說是對數(shù)似然是單調(diào)不減的)。11.3.4EM算法E步的下界是基于
不等式得到的:對于
,有(11-27)對于m=2,如圖11-10所示,通過對數(shù)函數(shù)的凸性,我們可以很直觀的理解式(11-27),
不等式被簡化為:(11-28)11.3.4EM算法11.3.4EM算法對數(shù)似然
可以使用式(11-24)
來表達(dá):(11-29)把公式(11-29)中的
和
不等式(11-27)聯(lián)系起來,對數(shù)似然
的下界
可以表示為:(11-30)11.3.4EM算法當(dāng)
時,式(11-30)等號成立,由式(11-24)得下界
為:(11-31)使下界
最大的在M步中應(yīng)該滿足:(11-32)11.3.4EM算法根據(jù)最大
可得:
(11-33)上述解釋說明對數(shù)似然通過E步和M步迭代的時候是單調(diào)不減的。此外,EM算法被證明是可以找到一個局部最優(yōu)解的。11.4.1基于高斯混合模型的背景建模為了快速和準(zhǔn)確地提取背景,當(dāng)圖像中人物的衣服與背景類似、陰影的效果與fragmentary形態(tài)等檢測時所出現(xiàn)的現(xiàn)象。通過對一系列圖像進(jìn)行處理來估計背景圖像,即對每一幅新圖像更新得到一個估計,如式(11-34)所示。(11-34)假定
,α為學(xué)習(xí)因子(
)。通過這種方式,一部分新圖像被添加到背景圖像中。這樣,只需要恢復(fù)單一的背景圖像。通過這個過程,他們走入或者走出,都會被檢測到。但如果一個人準(zhǔn)備走進(jìn)一個場景然后停下來,他們將不會被檢測到(學(xué)習(xí)因子所指的時刻),因為當(dāng)他們停止時,將變?yōu)楸尘暗囊徊糠?。因此,實際上人物確實有可能與背景混合。當(dāng)新的物體出現(xiàn)在圖像中時,它們可以被標(biāo)記為背景(這種情況下它們被添加到背景圖像中)或者前景(此時,對背景圖像沒有貢獻(xiàn))。使用高斯混合模型對背景進(jìn)行建模,將運動對象從背景中分離出來11.4.1基于高斯混合模型的背景建模將背景建模為一個系統(tǒng)時,每個像素均有一個概率分布。許多運動的圖像,因為有很多一致的背景,其概率分布會出現(xiàn)峰值,背景模型將會出現(xiàn)多個因子。因此,我們可以將其建模為混合概率分布。如圖11-13所示,圖11-13(a)是單一的高斯分布的情況,圖11-13(b)顯示了3個高斯分布(點線),概率分布是它們加在一起(實線)。很明顯,由多個分布得到的分布具有更好的建模復(fù)雜背景的能力。11.4.1基于高斯混合模型的背景建模(a)單一的(高斯)分布
(b)多個分布圖11-13高斯和混合高斯分布11.4.1基于高斯混合模型的背景建模單變量x的中心高斯分布g是均值和標(biāo)準(zhǔn)偏差的函數(shù):(11-35)對于d維,多元高斯分布(multi-variateGaussiandistribution)G標(biāo)記為(11-36)其中,為一般矩陣,d是多維x中變量的數(shù)目,是變量的均值,是d*d的協(xié)方差矩陣。給定一個假設(shè):協(xié)方差矩陣縮減為一個對角陣(假設(shè)變量獨立,那些反映相關(guān)性的反對角線元素為0),此時多元高斯模型簡化為11.4.1基于高斯混合模型的背景建模(11-37)將k個高斯多元分布加起來為(11-38)其中,
是第j個分布的權(quán)值或者重要度。如果像素與任何的背景分布匹配,那么認(rèn)為它是背景像素。背景模型是從B分布形成的,它按照排序滿足:(11-39)其中,閾值T的值控制背景模型的分布數(shù)量。減少T值則增加分布能夠形成部分背景模型的機(jī)會。11.4.1基于高斯混合模型的背景建模通過使用權(quán)值與方差的比率(
),將分布進(jìn)行排序。選擇具有高權(quán)值和小方差的分布。如果像素與前景分布匹配,或者不與背景分布匹配,則認(rèn)為該像素是一個前景像素,屬于運動目標(biāo)。對于權(quán)值
,首先它們被設(shè)置為一個低的值,而每個分布的方差
則設(shè)置為一個大的值。然后,進(jìn)行像素比較,并且在第一次迭代時像素不與任何分布匹配,因此變?yōu)橐粋€新的分布。在第二次和后續(xù)的迭代時,更新第k個分布的權(quán)值(其中,
是它的先前的值)為(11-40)11.4.1基于高斯混合模型的背景建模其中,α控制學(xué)習(xí)率,即該方法適應(yīng)背景數(shù)據(jù)變化的速度。對于匹配的分布,
。對于其余的分布,
。在該過程后,權(quán)值被歸一化。然后,對于匹配的分布,更新均值
和方差
的值為(11-41)(11-42)其中(11-43)式(11-39)-式(11-43)中參數(shù)和T性能分析。首先,學(xué)習(xí)率α,它控制適應(yīng)背景時迭代的次數(shù)。其次,閾值T,
,并且T值越大,它對于多模背景的適應(yīng)能力越強(qiáng)。最后,每個混合的高斯分布的數(shù)量,以及選擇的初始方差值。很自然地,高斯分布的個數(shù)少,對于計算量來說具有吸引力。11.4.1基于高斯混合模型的背景建模但是,復(fù)雜的背景需要較多的高斯分布個數(shù)。如果初始方差過大,當(dāng)運動對象的顏色與背景類似時,這會增加它被標(biāo)記為背景的機(jī)會。直到方差的估計收斂時。并且,方差值大,它要求更多的迭代??紤]到這種方法受到歡迎,自然出現(xiàn)了一些方法,對它的性能進(jìn)行改進(jìn)。一種明顯的變化是采用不同的顏色空間:使用色調(diào)、飽和度、值/強(qiáng)度(HIS/HSV),而不是RGB顏色模型,受陰影的影響較小。11.4.2基于核函數(shù)的跟蹤背景建模可以簡化物體跟蹤,如果不需要對背景做任何特殊處理,將會更有價值。由于現(xiàn)在的視頻序列的幀率都很高,所以都能滿足相鄰兩幀間變化很小。在滿足了這個要求的基礎(chǔ)上,可以完成基于梯度的物體定位和跟蹤。基于核函數(shù)的跟蹤是一種非常高效的實時跟蹤方法,該方法基于如下過程:使用一個各向同性核函數(shù)來對物體在空間上施加一個掩膜,然后施加一個平滑相似函數(shù),這樣就將跟蹤問題簡化為在其前一幀的臨近位置搜索最大相似度的問題,以下為基于核函數(shù)的物體跟蹤。11.4.2基于核函數(shù)的跟蹤首先,必須事先確定想要跟蹤的目標(biāo)特性,比如,從圖像數(shù)據(jù)中估計出一個概率密度函數(shù)q。對于真實環(huán)境下的視頻跟蹤,一般情況都是彩色的,所以通常利用顏置于局部坐標(biāo)系的中心,然后當(dāng)前幀的目標(biāo)候選置于y處。目標(biāo)候選的特征描述可以使用一個概率密度函數(shù)
來刻畫,它是從當(dāng)前圖像幀數(shù)據(jù)中估計出來的。為了使計算更高效,采用離散化的概率密函數(shù),用m個區(qū)間的直方圖表示。因此,目標(biāo)模型
和目標(biāo)候選
概率密度函數(shù)定義如下:(11-44)(11-45)11.4.2基于核函數(shù)的跟蹤其中
;是和之間的相似度函數(shù)(11-46)對于一個跟蹤任務(wù),相似度函數(shù)與在前一幀已經(jīng)確定了位置的目標(biāo)出現(xiàn)在當(dāng)前幀的位置y處的可能性相符。因此,對于待分析的幀序列,
的局部最優(yōu)值就對應(yīng)著目標(biāo)在當(dāng)前幀出現(xiàn)的位置。目標(biāo)模型(targetmodel)從一個橢圓形的區(qū)域中導(dǎo)出,這個橢圓形區(qū)域首先被規(guī)范化到一個單位圓中來去除目標(biāo)尺度的影響,包括n個像素的目標(biāo)區(qū)域由規(guī)范化后的像素坐標(biāo)表示;規(guī)范化使用單位圓的中心作為原點。然后使用一個單調(diào)遞減的凸核函數(shù)K和一個輪廓函數(shù)k(x)來記錄目標(biāo)區(qū)域
滿足
(11-47)11.4.2基于核函數(shù)的跟蹤C(jī)omaniciu等人推薦使用Epanechnikov核函數(shù)。在處的每一個目標(biāo)模型像素必須與其在量化后的特征空間上的一個索引
相關(guān)聯(lián),其索引函數(shù)是
。特征
的概率通過如下方式計算(11-48)其中是Kroneckerdelta函數(shù)(
for ;
其他),C是一個規(guī)范化常量(11-49)11.4.2基于核函數(shù)的跟蹤在當(dāng)前幀以y為中心的目標(biāo)候選(targetcandidate)用規(guī)范化的像素位置集合
,
來表示,其中h表示具有與目標(biāo)模型相同輪廊函數(shù)k(x)的核函數(shù)K的帶寬。規(guī)范化過程是從包含目標(biāo)模型的幀中繼承來的。帶寬定義了目標(biāo)候選的尺度,因此也決定了當(dāng)前幀在定位過程中需要分析的像素數(shù)目。特征
的概率
是(11-50)其中規(guī)范化常量為(11-51)11.4.2基于核函數(shù)的跟蹤由于Ch不依賴于y,所以對于給定的核函數(shù)和帶寬,它可以被事先計算出來。式(11-46)的相似度函數(shù)繼承了所用核函數(shù)K的特性。選用一個平滑可微的核函數(shù)并利用爬山法來優(yōu)化相似度函數(shù)。很明顯,相似度函數(shù)是對目標(biāo)和每個候選之間距離的一個度量指標(biāo)。這兩個分布之間的距離
可以通過巴氏(Bhattacharyya)系數(shù)評估p和q之間的相似度來估計(11-52)其中(11-53)11.4.2基于核函數(shù)的跟蹤為了在當(dāng)前幀找到目標(biāo)最可能的位置,將式
溫馨提示
- 1. 本站所有資源如無特殊說明,都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請下載最新的WinRAR軟件解壓。
- 2. 本站的文檔不包含任何第三方提供的附件圖紙等,如果需要附件,請聯(lián)系上傳者。文件的所有權(quán)益歸上傳用戶所有。
- 3. 本站RAR壓縮包中若帶圖紙,網(wǎng)頁內(nèi)容里面會有圖紙預(yù)覽,若沒有圖紙預(yù)覽就沒有圖紙。
- 4. 未經(jīng)權(quán)益所有人同意不得將文件中的內(nèi)容挪作商業(yè)或盈利用途。
- 5. 人人文庫網(wǎng)僅提供信息存儲空間,僅對用戶上傳內(nèi)容的表現(xiàn)方式做保護(hù)處理,對用戶上傳分享的文檔內(nèi)容本身不做任何修改或編輯,并不能對任何下載內(nèi)容負(fù)責(zé)。
- 6. 下載文件中如有侵權(quán)或不適當(dāng)內(nèi)容,請與我們聯(lián)系,我們立即糾正。
- 7. 本站不保證下載資源的準(zhǔn)確性、安全性和完整性, 同時也不承擔(dān)用戶因使用這些下載資源對自己和他人造成任何形式的傷害或損失。
最新文檔
- 疫苗接種率提升策略-洞察分析
- 樣條方法在機(jī)器學(xué)習(xí)中的優(yōu)化問題探討-洞察分析
- 藝術(shù)表演中的智能照明與舞臺設(shè)計-洞察分析
- 氧氣傳感器改進(jìn)-洞察分析
- 太陽能光伏發(fā)電成本分析-洞察分析
- 合作承諾意向書(13篇)
- 藝術(shù)品市場的波動與趨勢-洞察分析
- 醫(yī)院支援采集核酸個人工作總結(jié)(8篇)
- 響應(yīng)面法優(yōu)化工藝條件-洞察分析
- 亞硝酸鈉臨床應(yīng)用研究-洞察分析
- 抖音快手短視頻創(chuàng)業(yè)項目融資商業(yè)策劃書
- 滬教版英語八年級上冊知識點歸納匯總
- 裝飾裝修工程售后服務(wù)具體措施
- 軟件設(shè)計說明書通用模板
- 酒店治安安全培訓(xùn)
- 糖皮質(zhì)激素類藥物臨床應(yīng)用指導(dǎo)原則(2023年)
- 我的家鄉(xiāng)-東營
- 世界的海陸分布、世界的地形復(fù)習(xí)提綱
- SMT電子物料損耗率標(biāo)準(zhǔn) 貼片物料損耗標(biāo)準(zhǔn)
- NFPA-2010 固定式氣溶膠滅火系統(tǒng)標(biāo)準(zhǔn)(譯文)
- 釣魚郵件專項安全意識隨堂測試
評論
0/150
提交評論