版權說明:本文檔由用戶提供并上傳,收益歸屬內容提供方,若內容存在侵權,請進行舉報或認領
文檔簡介
1、課程論文步態(tài)識別學號:12426009班級:通信122姓名:楚舒琦目錄摘要3一、 背景介紹4二、 相關研究4三、 主題(算法)53.1基于線圖模型的動態(tài)特征提取63.2基于整體的靜態(tài)特征提取83.3識別8四、 實驗9五、 結果討論11六、 總結12七、 應用前景12八、 技術難點及解決途徑138.1技術難點148.2解決途徑15九、 參考文獻15摘要步態(tài)識別是一種新興的生物特征識別技術,旨在通過人們走路的姿態(tài)進行身份識別,與其他的生物識別技術相比,步態(tài)識別具有非接觸遠距離和不容易偽裝的優(yōu)點。在智能視頻監(jiān)控領域,比面像識別更具優(yōu)勢。對步態(tài)識別的優(yōu)缺點以及步態(tài)識別所涉及到的運動分割、特征提取與選擇
2、、模式識別算法進行了綜述,并對步態(tài)識別中存在的問題與未來的研究方向進行了討論。關鍵詞:生物特征識別;步態(tài)識別;特征提取;運動分割;動態(tài)時間規(guī)正1、 背景介紹步態(tài)是指人們行走時的方式,這是一種復雜的行為特征。罪犯或許會給自己化裝,不讓自己身上的哪怕一根毛發(fā)掉在作案現(xiàn)場,但有樣東西他們是很難控制的,這就是走路的姿勢。英國南安普敦大學電子與計算機系的馬克·尼克松教授的研究顯示,人人都有截然不同的走路姿勢,因為人們在肌肉的力量、肌腱和骨骼長度、骨骼密度、視覺的靈敏程度、協(xié)調能力、經歷、體重、重心、肌肉或骨骼受損的程度、生理條件以及個人走路的"風格"上都存在細微差異。對一個
3、人來說,要偽裝走路姿勢非常困難,不管罪犯是否帶著面具自然地走向銀行出納員還是從犯罪現(xiàn)場逃跑,他們的步態(tài)就可以讓他們露出馬腳。人類自身很善于進行步態(tài)識別,在一定距離之外都有經驗能夠根據(jù)人的步態(tài)辨別出熟悉的人。步態(tài)識別的輸入是一段行走的視頻圖像序列,因此其數(shù)據(jù)采集與面像識別類似,具有非侵犯性和可接受性。但是,由于序列圖像的數(shù)據(jù)量較大,因此步態(tài)識別的計算復雜性比較高,處理起來也比較困難。盡管生物力學中對于步態(tài)進行了大量的研究工作,基于步態(tài)的身份鑒別的研究工作卻是剛剛開始。步態(tài)識別主要提取的特征是人體每個關節(jié)的運動。到目前為止,還沒有商業(yè)化的基于步態(tài)的身份鑒別系統(tǒng)。2、 相關研究 信息融合:感知融合是
4、人類感知外部世界的本能之一。人類可以非常自然地運用這一能力把來自人體各個感知器官眼耳鼻四肢的信息圖像聲音氣味觸覺組合起來并使用先驗知識去估計理解和識別周圍的環(huán)境以及正在發(fā)生的事情。融合理論正是對人類這一本能的模仿旨在利用計算機技術對按時序獲得的多源觀測信息在一定準則下加以自動分析綜合以完成所需的決策和估計任務而進行的信息處理過程。信息融合的基本原理就像人腦綜合處理信息一樣充分利用多源信息通過對這些多源的觀測信息的合理支配和使用把多源信息在空間或時間上的冗余或互補依據(jù)某種準則來進行組合以獲得被測對象的一致性解釋或描述。按照信息抽象的個層次可將信息融合分為3級(像素級融合特征級融合和決策級融合)。
5、l 像素級融合是在采集到的原始數(shù)據(jù)上進行的融合是原始測報未經預處理之前就進行的綜合和分析是最低層次的融合。l 特征級融合屬于中間層次它先對原始信息進行特征提取然后對特征信息進行關聯(lián)處理和綜合分析最終用于目標識別。一般來說提取的特征信息應該是這一目標的充分表示量并且去除了一定的冗余信息。其優(yōu)點是實現(xiàn)了可觀的信息壓縮有利于實時的目標識別。特征級融合算法的一般流程如圖1所示。 圖1特征級融合算法一般流程l 決策級融合是一種高層次融合。先將多源傳感信息對目標屬性進行獨立決策。再對各自得到的決策結果進行融合以獲得整體一致的決策。其優(yōu)點是具有很強的容錯性和很好的開放性。并且處理時間較短)難點在于分類特征組
6、合與表達的機理難以量化和統(tǒng)一圖2給出了決策級融合算法的一般流程。決策級融合必須從具體決策的實際需求出發(fā)。充分利用特征級融合所提取的測量對象的各類特征信息。采用適當?shù)娜诤霞夹g來實現(xiàn)。常用的方法包括k/n準則、Bayes準則和Dempster-Shafer理論等。 圖2決策級融合算法一般流程3、 主題(算法) 信息融合在其他生物特征識別領域已經取得了很好的效果。也為步態(tài)識別性能的進一步提高提供了可能的方法。在步態(tài)識別領域中。常采用特征級融合和決策級融合兩類方法。融合的特征包括不同類的步態(tài)特征(多特征融合)、步態(tài)特征和其他生物特征(多模態(tài)特征融合)以及不同角度攝像機拍攝的步態(tài)特征(多視角融合)等。在
7、決策級融合中。通常假設各個特征之間具備統(tǒng)計獨立性。則各個分類器得到的匹配分值可用Bayes理論D-S證據(jù)理論、表決法、聚類分析、模板法、模糊集合論、神經網(wǎng)絡、熵法等進行合并。通常使用的合并規(guī)則有加法規(guī)則、乘法規(guī)則、最大規(guī)則、最小規(guī)則、中值規(guī)則和多數(shù)投票規(guī)則等。 為了進一步研究融合理論在步態(tài)識別中的應用。我們提出一種基于線圖模型和靜態(tài)特征的步態(tài)識別算法、靜態(tài)特征主要用于反映人體目標的全貌。例如形體高度胖瘦等。線圖模型主要用于反映人體目標的運動特點。如行走過程中主要關節(jié)點位置的變化(肢體間角度的變化等、本文分別研究了使用特征級和決策級融合加法規(guī)則和乘法規(guī)則理論進行步態(tài)識別的方法、算法流程如圖3圖4
8、所示。 在視頻序列分析中。首先要將運動目標從背景圖像中分割出來、通過背景減除二值化及陰影消除后。可以得到步態(tài)序列中每幀圖像的單連通人體運動區(qū)域、為了去除圖像中存在的大量冗余信息并減小計算量。進一步使用圖像模板化技術將目標縮放到固定大小的圖像模板中(見圖6(a)步態(tài)的靜態(tài)和動態(tài)特征都是從二值化側影的目標模板中提取的。 圖3特征級融合策略流程圖 圖4決策級融合策略流程圖3.1基于線圖模型的動態(tài)特征提取 首先抽取出二值側影圖像的骨架信息。然后根據(jù)該骨架信息和解剖學知識共同得到各個關節(jié)點的位置及相互間形成的角度。最后使用這些位置和角度信息形成步態(tài)的動態(tài)特征、算法的具體步驟如下:步驟1利用圖像處理技術中
9、的中軸變換方法提取二值側影圖像的骨架圖、它是一種可逆變換。既能壓縮圖像信息。又能由中軸及其數(shù)值恢復原圖像、提取方法如下:1) D表示原圖區(qū)域中像素點的集合(D)表示其內邊界(D)表示其外邊界,S(D)表示區(qū)域D及其8連通區(qū)域內的所有像素點、令.2) 一步細化之后得到的結果區(qū)域如下: (1)3) 如果,終止迭代,跳轉到第4)步.否則,令,并跳轉到第2)步。4) 即為所求區(qū)域的骨架像素的集合。步驟2根據(jù)解剖學中人體各部分肢體占身高的比例關系。來提取人體的關節(jié)點位置、即對人體骨架進行掃描。掃描線與人體骨架的交叉點即為關節(jié)點的位置、這樣可以得到人體的8個關節(jié)點:連接這8個關節(jié)點,得到人體的骨骼化模型,
10、圖5示出簡化的人體比例關系。 圖5簡化的人體比例關系圖步驟3進一步計算出骨骼化模型中各部分肢體所形成的角度、這里取肢體與豎直線的角度)這7個角度分別包括。,人體骨架及骨骼化模型、以及肢體夾角示意圖如圖6所示。令和分別為肢體兩端的關節(jié)點所在位置、則肢體夾角計算如下: (2) 圖6人體骨架及骨骼化模型步驟4確定步態(tài)參數(shù))通過上述討論,可以看出在骨骼化模型中一共有23維參數(shù)特征,關節(jié)點位置2*8=16維,肢體角度7維。關節(jié)點位置中的x值通常是固定不變的、為了簡化運算、可以將其去除、留下關節(jié)點的y值信息及肢體角度信息共同構成15維參數(shù)特征的步態(tài)模式)進一步、為了消除空間尺度不同帶來的影響、需要將這些參
11、數(shù)特征歸一化到區(qū)間/2,3/2中。3.2基于整體的靜態(tài)特征提取 側影的寬度和高度信息是決定目標形狀的兩個重要因素,寬度代表了運動目標的胖瘦程度、高度則代表了運動目標的身高)身高和胖瘦是人類視覺系統(tǒng)進行身份識別的主要依據(jù)之一、但是這兩個參數(shù)常常隨著攝像機拍攝距離的變化而變化)例如、同樣焦距下、一個高個子目標由于拍攝距離較遠會顯得比近處的矮個子目標還要矮小)寬度所代表的胖瘦信息也是如此)因此、它們都不可以單獨作為形體特征來進行步態(tài)識別)為了消除這種誤差、本文算法采用了側影的伸長度作為基于整體的形態(tài)特征、即: (3)式中W代表側影的寬度,H代表側影的高度。 然而,伸長度中的除法運算常常會消除掉一些有
12、用的信息、例如一個拍攝距離較遠的又高又胖的人可能會和一個拍攝距離較近的又矮又瘦的人擁有同樣的伸長度、因此單獨使用伸長度很難將目標區(qū)分開來)為了克服上述缺點、又引入了空間度特征: (4)空間度代表了二值側影目標中前景像素的數(shù)目。同樣、兩種靜態(tài)參數(shù)特征也需要進行幅度上的歸一化運算。3.3識別 本算法采用K近鄰分類器進行模式分類)由于步態(tài)數(shù)據(jù)具有周期性)循環(huán)性的特征、因此相似性度量采用基于周期的方法、具體步驟如下:1)令訓練序列為,測試序列為和分別表示兩序列的幀數(shù),表示第i個序列中的第j個特征矢量。2)對任意一個序列計算出它的步態(tài)周期n(n<N)是它的幀數(shù),并將其分成N/n個子序列.其中,第k
13、個子序列可表示為。3)對于測試集中的第K個子序列和訓練集中任意以L為起始幀的子序列、計算它們之間的距離: (4)4)得到整個測試序列和訓練序列之間的相似度: (5)式中K=m/。l為訓練樣本序列中和測試樣本子序列進行比較的起始幀l=0,1,.,n-。相似度Sim的值越大,說明兩個序列越相似。4、 實驗 我們分別對僅基于整體形狀特征的算法)僅基于動態(tài)模型特征的算法)特征級融合算法以及運用了加法和乘法規(guī)則的決策級融合算法進行了實驗和比較(見圖7-圖10)實驗數(shù)據(jù)采用了來自于卡耐基梅隆大學的CMU數(shù)據(jù)庫。該數(shù)據(jù)庫包含25人、每人6個視角4種走路姿勢??熳?慢走)上坡和抱球共24個序列,每個序列340
14、幀左右、重點測試了步速對算法的性能影響。 算法評價采用CMS和ROS曲線。為了便于進行評價(需要將數(shù)據(jù)庫中每個樣本序列按照步態(tài)周期拆分為若干子序列、每個快步走序列大約包含8個步態(tài)周期(每個慢步走序列大約包含7個步態(tài)周期)(再為每人隨機抽取一個步態(tài)周期作為測試集(其余步態(tài)周期序列作為訓練集(來進行步態(tài)識別。另外(為了測試算法對行走速度的敏感性(本文分別以快步走和慢步走數(shù)據(jù)互為訓練和識別樣本、未拆分序列)進行了實驗。算法識別率采用5階CMS結果的平均值。實驗結果如表1所列實驗編號訓練樣本測試樣本基于形狀特性基于模型特征特征級融合算法決策級融合算法加法規(guī)則乘法規(guī)則125個快走步態(tài)周期剩余快走步態(tài)周期
15、82.7427682.0684.887.31225個慢走步態(tài)周期剩余慢走步態(tài)周期72.66476.13484.6782.6783.6325個快走序列25個慢走序列39.279.282.483.276425個慢走序列25個快走序列33.667.271.266.448.8 圖7實驗1,(CMU數(shù)據(jù)庫,Train:fast;Test:fast)的識別校驗性能曲線 圖8實驗2(CMU數(shù)據(jù)庫,Train:slow;Test:slow)的識別校驗性能曲線 圖9實驗3(CMU數(shù)據(jù)庫,Train:fast;Test:slow)的識別校驗性能曲線 圖10實驗4(CMU數(shù)據(jù)庫,Train:slow;Test:fa
16、st)的識別校驗性能曲線5、 結果討論1) 融合算法確實比單一特征算法的識別率有所提高。2) 對于相同步速的實驗來說(使用決策級融合算法結果更好(而且乘法規(guī)則明顯優(yōu)于加法規(guī)則。3) 對于不同步速的實驗(僅基于形狀的步態(tài)特征識別率下降最多(基于模型的算法識別率變化不大(可見形狀特征對步速變化不具有魯棒性。4) 特征級融合算法在步速變化的實驗中得到了最好的識別結果(說明決策級融合算法性能的提高更容易受特征算法識別結果的影響。6、 總結 步態(tài)識別的標準數(shù)據(jù)庫以及算法統(tǒng)一評價準則還沒有制定。目前的數(shù)據(jù)庫規(guī)模較小且不夠全面。一種步態(tài)識別方法在不同數(shù)據(jù)庫上的識別結果可能會不同,使用不同評價標準對每種算法進
17、行評價所得到的評價結果也是不同的,也不具有可比性?;谧陨頂?shù)據(jù)量大、計算復雜的特點,不可能將所有步態(tài)識別算法在每個數(shù)據(jù)庫上進行測試。所以,如何客觀評估步態(tài)識別算法的性能,是步態(tài)識別的研究難點,也是亟需解決的問題。 影響步態(tài)識別正確率的因素很多,如何采取相應的措施克服各種因素的影響,以達到期望的性能仍是研究的難點。 擁擠狀態(tài)下,運動目標的自遮擋以及目標之間的互遮擋問題難于處理??梢杂媒y(tǒng)計的方法從已有圖像信息中進行人體姿勢、位置等的估計和預測。另外,利用多攝像機多視角跟蹤拍攝來解決遮擋問題的方法也是很有潛力的一種方法。 隨著對步態(tài)識別中融合技術更深入的研究,如何選擇性能互補的特征、如何優(yōu)化具有冗余
18、信息的特征、如何采用不同層次的融合策略來提升算法性能也亟需進一步研究。7、 應用前景 隨著我們逐漸邁入數(shù)字時代,基于步態(tài)特征的身份識別技術愈加顯示出它的價值。對于諸如軍事基地、停車場、機場、高檔社區(qū)等重要場所,出于管理和安全的需要,人們必須知道該區(qū)域內發(fā)生的事件,并有效準確地識別人、快速檢測威脅并且提供不同人員的進入權限級別,于是采用某種特定方法來監(jiān)視該場景。特別是場景中的人,人臉、指紋和虹膜等生理特征識別不再適用,而步態(tài)識別作為有效的行為特征,不需要任何交互性接觸就可以實現(xiàn)遠距離情況下的身份識別。美國國防高級研究計劃署(DARPA)資助的遠距離身份識別HID(Human I-dentific
19、ation at a Distance)計劃,其任務就是開發(fā)多模式、大范圍的視覺監(jiān)控技術以實現(xiàn)遠距離條件下的檢測、分類和識別,從而增強國防、民用等場合免受恐怖襲擊的自動保護能力。美國五角大樓也正在擬定采用步態(tài)識別技術進行反恐。美國9·11恐怖襲擊以后,人們已經意識到安全的脆弱性,目前各國都高度重視這樣一個問題,即如何對國家重要安全部門和敏感場所進行全天候、自動、實時的遠距離監(jiān)控和身份識別。而基于步態(tài)特征的身份識別技術就是解決這一問題的有效手段之一。雖然目前步態(tài)識別技術的效果還不盡如人意,系統(tǒng)的準確率不夠高,而且成本較高,但這項技術有著美好的應用前景。預計5年后,步態(tài)識別機將實現(xiàn)商品化
20、。屆時,世界各國均可享受到這一新型識別技術的好處,在各國機場及其他重要場所的出入口安裝這種機器,結成一張無形的反恐巨網(wǎng),增強人類社會的安全度,構筑一個和諧、安全的人類家園。 在臨床工作中,對人體行走方式進行客觀記錄并對步行功能進行系統(tǒng)評價,是康復評定的重要組成部分。現(xiàn)實中有很多疾病會引起步態(tài)變化,即產生走路姿態(tài)異常。為此可通過對步行規(guī)律的研究,分析人體骨骼、關節(jié)的三維空間定位以及生物力學特性,準確評價人體各部位在運動過程中的動態(tài)變化,從而揭示步態(tài)異常的病理原因。步態(tài)評價也是神經病學、風濕病學、矯形學和康復醫(yī)學在日常臨床實踐中的重要方面。對患有神經系統(tǒng)或骨骼肌肉系統(tǒng)疾病而可能影響行走能力的患者需
21、要進行步態(tài)分析,以評估患者是否存在異常步態(tài)以及步態(tài)異常的性質和程度,從而為分析異常步態(tài)原因和矯正異常步態(tài)、制定治療方案提供必要的依據(jù)。通過步態(tài)分析還可以理解步態(tài)異常的基本過程和機制,從而對力、關節(jié)角度和肌肉活動進行詳細分析,進而進行相關的醫(yī)學研究。 另外,步態(tài)識別問題是人的運動分析的一個子問題,因而步態(tài)識別問題的研究成果有可能擴展應用于解決計算機視覺領域里的其他問題,如區(qū)分不同的運動(走路、跑步、打網(wǎng)球的擊球動作)、手語的解釋等。8、 技術難點及解決途徑 步態(tài)識別是計算機視覺和模式識別領域內一個非常新的研究方向,近10年來,研究者在這方面取得了許多成績,但是要設計并實現(xiàn)一個實用性強的步態(tài)識別系
22、統(tǒng)非常復雜并且困難。由于人的行走姿勢受各種因素的影響,在不同環(huán)境條件下行走姿勢有或多或少的變化,因此步態(tài)識別的計算較復雜,識別的準確度還不夠高。目前該系統(tǒng)的準確率在80。90。,準確性低于第一代身份識別技術。 許多客觀因素的存在,給步態(tài)的最終識別帶來了困難,如何更準確地識別步態(tài)特征,是步態(tài)識別領域面臨的難題。然而,醫(yī)學研究所確定的特征,或者因為特征本身沒有可重復性,或者由于觀察角度的限制和自遮擋問題,并不適于基于計算機視覺的系統(tǒng)去提取。從計算的角度來看,從低質量和沒有標記的視頻序列中對運動物體進行跟蹤和分割的算法的不精確性導致了所提取特征的不可靠性,而由攝像機深度和角度不同造成的透視的影響使特
23、征提取工作變得十分繁重。8.1技術難點 復雜背景的干擾:運動目標的有效檢測對于目標識別、跟蹤和行為理解等后期的處理是非常重要的。步態(tài)序列圖像是一個復雜、具有非常高維數(shù)的視覺模式,圖像獲取過程中的不確定性,使得步態(tài)識別過程必然會受到各種外界因素的干擾,從而使得復雜背景圖像中的目標檢測非常困難。如何消除復雜背景的影響,準確提取運動人體的目標特征,成為步態(tài)特征提取以及后續(xù)處理的關鍵。 識別算法問題:目前已有幾種常用的模式分類器應用于步態(tài)識別,但是尚且處于實驗研究階段,沒有一種完美無缺的算法。常見的方法有最近鄰(Nearest-neighbor,NN)分類、人工神經網(wǎng)絡(Ar-tificial neu
24、ral network,ANN)及隱馬爾可夫模型(Hidden markov model,HMM)等,這些方法有許多弱點。其中最近鄰分類器是根據(jù)歐幾里得距離對已知向量和待識別量進行比對,該方法沒有深入挖掘數(shù)據(jù)內部包含的變化信息,即:哪種數(shù)據(jù)變化屬于同一個體內部變化信息引起的,哪種變化是由于不同個體之間的差別造成的。其次,最近鄰分類技術對于權重大小的分配具有不可靠性,這在步態(tài)識別以及數(shù)據(jù)融合中是非常重要的因素。對步態(tài)數(shù)據(jù)進行簡單的融合也會嚴重影響步態(tài)識別率。而人工神經網(wǎng)絡和隱馬爾可夫模型的理論基礎是經典統(tǒng)計學,采用的是樣本數(shù)目趨于無窮大時的漸進理論。然而在步態(tài)識別的實際研究中,樣本數(shù)目往往有限,故這些在理論上有顯著長處的分類方法在實際應用中卻可能不盡人意。另外,由于這些算法本身存在的問題,就會出現(xiàn)隨著樣本數(shù)的增多,識別率會有所下降。這是因為,樣本數(shù)量越大,出錯的機會就越多;根據(jù)步態(tài)識別的特征來看,樣本數(shù)的增加導致特征空間出現(xiàn)擁擠現(xiàn)象,個體之間的差別就會縮小。如何解決這個問題,一直困擾著許多研究者。 環(huán)境因素干擾:影響步態(tài)識別的外界因素也很多。Laszlo等認為地面狀況影響一個人走路的平衡性,從而對步態(tài)識別會產生影響。Murray等認為受傷尤其是腿部的傷害會嚴重影響一個人的步態(tài)。von Tscharner等證實赤腳與鞋子類型均會
溫馨提示
- 1. 本站所有資源如無特殊說明,都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請下載最新的WinRAR軟件解壓。
- 2. 本站的文檔不包含任何第三方提供的附件圖紙等,如果需要附件,請聯(lián)系上傳者。文件的所有權益歸上傳用戶所有。
- 3. 本站RAR壓縮包中若帶圖紙,網(wǎng)頁內容里面會有圖紙預覽,若沒有圖紙預覽就沒有圖紙。
- 4. 未經權益所有人同意不得將文件中的內容挪作商業(yè)或盈利用途。
- 5. 人人文庫網(wǎng)僅提供信息存儲空間,僅對用戶上傳內容的表現(xiàn)方式做保護處理,對用戶上傳分享的文檔內容本身不做任何修改或編輯,并不能對任何下載內容負責。
- 6. 下載文件中如有侵權或不適當內容,請與我們聯(lián)系,我們立即糾正。
- 7. 本站不保證下載資源的準確性、安全性和完整性, 同時也不承擔用戶因使用這些下載資源對自己和他人造成任何形式的傷害或損失。
最新文檔
- 前臺文員對外聯(lián)絡的注意事項計劃
- 網(wǎng)絡安全應急處置工作預案
- 名人-人物介紹
- 產業(yè)組織理論練習題
- 外研版高中英語必修5模塊四知識點
- 社區(qū)護理甲在線作業(yè)至14章
- 檔案管理培訓資料
- 教育資源共享聯(lián)盟工作總結
- Excel信息技術教案
- 護理員頭部護理培訓
- GB/T 16935.1-2023低壓供電系統(tǒng)內設備的絕緣配合第1部分:原理、要求和試驗
- 工廠倉庫管理方法范本
- GB/T 43005-2023給水用連續(xù)玻纖帶纏繞增強聚乙烯復合管
- 醫(yī)院公共衛(wèi)生科制度職責
- 2023學年完整公開課版盤古開天地
- 2023年福建省三明市七年級上學期數(shù)學期中試卷附答案
- 小學道德與法治三年級上冊第三單元《安全護我成長》第8課《安全記心上》說課稿
- 300MW鍋爐專業(yè)檢修規(guī)程
- 探索跨學科背景下的科技教育創(chuàng)新與探索
- 活性炭材料在電池中的應用研究報告
- 餐飲服務員等級劃分標準
評論
0/150
提交評論