[碩士論文精品]圖像的運動目標(biāo)檢測與跟蹤算法研究

上傳人：漫*** IP屬地：貴州上傳時間：2018-04-06 格式：PDF 頁數(shù)：73 大?。?.05MB 積分：0 舉報 版權(quán)申訴

已閱讀5頁，還剩68頁未讀，繼續(xù)免費閱讀

[碩士論文精品]圖像的運動目標(biāo)檢測與跟蹤算法研究.pdf 免費下載

版權(quán)說明：本文檔由用戶提供并上傳，收益歸屬內(nèi)容提供方，若內(nèi)容存在侵權(quán)，請進行舉報或認(rèn)領(lǐng)

文檔簡介

大連理工大學(xué)碩士學(xué)位論文摘要視頻監(jiān)控系統(tǒng)以其直觀、方便、信息內(nèi)容豐富而成為現(xiàn)代安防系統(tǒng)發(fā)展的主流，被廣泛應(yīng)用于國防建設(shè)、交通管制、智能保安等需要實時監(jiān)控的場所?，F(xiàn)有的大多數(shù)視頻監(jiān)控系統(tǒng)仍依賴于監(jiān)控人員的現(xiàn)場操作，造成了人力資源的浪費，也影響了整個工作系統(tǒng)的效率。因此，研究智能視頻監(jiān)控系統(tǒng)中的關(guān)鍵技術(shù)并提高智能視頻監(jiān)控系統(tǒng)的性能具有重要的意義。運動目標(biāo)檢測與跟蹤是視頻監(jiān)控系統(tǒng)中一個重要組成部分，對計算機視覺的其他研究領(lǐng)域有著重要的推動作用。因此如何實現(xiàn)對運動目標(biāo)實時、穩(wěn)定和有效地檢測與跟蹤，是一個需要關(guān)注和研究的重要問題。本文在目前該領(lǐng)域研究成果的基礎(chǔ)上，系統(tǒng)研究了智能視頻監(jiān)控中人體目標(biāo)的檢測，分割和跟蹤方面的理論和方法。在運動目標(biāo)檢測算法中，詳細(xì)介紹了幾種常用的目標(biāo)前景檢測方法，并對它們的檢測性能進行了評價。在運動人體目標(biāo)的定位與分割方面，以人體的頭部研究為出發(fā)點，針對人體頭部運動信息的輪廓近似圓形的特征，結(jié)合FREEMAN鏈碼和RANSAC算法，進行多圓檢測來實現(xiàn)多目標(biāo)頭部的定位，進而較快地確定人體目標(biāo)的準(zhǔn)確位置。在目標(biāo)跟蹤算法中，針對目前MEANSHIIT跟蹤算法存在的問題，本文提出了采用目標(biāo)的顏色信息、紋理信息和運動信息的改進KALMAN和MEANSHIFT跟蹤算法，跟蹤效果得到較大改進。針對單個目標(biāo)運動時姿勢的顯著變化，本文在機器學(xué)習(xí)理論知識的基礎(chǔ)上，提出了一種基于RGB直方圖特征、LBP直方圖特征和PPBTF直方圖特征的半監(jiān)督學(xué)習(xí)對單目標(biāo)進行跟蹤的方法，使跟蹤效果更具魯棒性。算一T波濾M蹤跟NM位定部頭測檢標(biāo)目耐法詞鍵關(guān)基于視頻圖像的運動目標(biāo)檢測與跟蹤算法研究RESEARCHONMOVINGOBJECTDETECTIONANDTRACKINGALGORITHMSBASEDONVIDEOIMAGEABSTRACTVIDEOSURVEILLANCESYSTEMVSSISTHEMAINTRENDOFMODEMDEFENCESYSTEMBECAUSEOFITSVISIBILITY，CONVENIENCEANDABUNDANCEINCONTENTANDHASBEENWIDELYUSEDINMANYFIELDSWHEREAREALTIMESURVEILLANCEISNEEDED,SUCHASNATIONALDEFENSE,TRA銜CCONTROL，THEINTELLIGENTPUBLICSECURITYANDSOONNOWADAYS，VSSSTILLDEPENDSONMANUALOPERATION,WHICHWASTESRESOURCESANDAFFECTSTHEEFFICIENCY，SOSTUDYINGTHETYPICALALGORITHMSUSEDINVIDEOSURVEILLANCEANDDESIGNINGANINTELLIGENTVIDEOSURVEILLANCESYSTEMISVERYIMPORTANTMOVINGOBJECTDETECTIONANDTRACKINGAREIMPORTANTPARTSOFVIDEOMONITORSYSTEMANDPLAYIMPORTANTROLESTOOTHERTOPICSPROGRESSINCOMPUTERVISIONSOHOWTODETECTANDTRACKOBJECTSTEADILY，REALTIMELYANDEFFECTIVELY，BECOMESANIMPORTANTPROBLEMTHATNEEDSTOBEPAIDATTENTIONANDRESEARCHEDNEPAPERSTUDIEDTHEKEYTECHNOLOGIESOFTHEFIELDBASEDONTHECURRENTRESEARCHACHIEVEMENTSANDMAINLYSTUDIEDABOUTTHETECHNOLOGIESONHUMANOBJECTDETECTION，SEGMENTATIONANDTRACKINGDURINGOBJECTDETECTION，SEVERALOBJECTFOREGROUNDDETECTIONALGORITHMSWIDELYUSEDALEINTRODUCED，ANDTHEIRPERFORMANCESAREANALYZEDDURINGOBJEETLOCALIZATIONANDSEGMENTATION,DUETOHEADCONTOURSSIMILARTOCIRCLESSEENFROMTHEVIDEOSEQUENCESCAPTUREDFROMVERTICALANGULARCAMERA,THEPAPERCOMBINESFREEMANCHAINCODEANDRANDOMSAMPLECONSENSUSRANSACALGORITHMTOESTIMATECIRCLEPARAMETERSANDTHENLOCALIZESTHEHUMANOBJECTQUICKLYANDACCURATELYDURINGOBJECTTRACKING，INTHELIGHTOFCURRENTMEANSHIFTTRACKINGALGORITHMSDRAWBACKS，KALMANFILTERANDMEANSHIFTTRACKINGALGORITHMINTEGRATINGWITHCOLOR,TEXTUREANDMOTIONINFORMATIONISPROPOSEDANDITSTRACKINGPERFORMANCEHASBEENIMPROVEDTHANBEFOREAIMINGATTHEPOSTURESSIGNIFICANTCHANGEOFASINGLEOBJECT,ANOVELTRACKINGALGORTHIMBASED011RGBHISTOGRAMFEATURE，LBPLOCALBINARYPATTERNHISTOGRAMFEATUREANDPPB邗PIXELPATTERNBASEDTEXTUREFEATUREHISTOGRAMFEATURE，USINGTHESEMISUPERVISEDLEARNINGISPROPOSEDONTHEBASISOFMACHINELEARNINGTHEORYKEYWORDSMOVINGOBJECTDETECTION；HEADLOCALIZATION；MEANSHIFTTRACKING；KALMANFILTER；TRITRACKINGALGORITHM大連理工大學(xué)學(xué)位論文獨創(chuàng)性聲明作者鄭重聲明所呈交的學(xué)位論文，是本人在導(dǎo)師的指導(dǎo)下進行研究工作所取得的成果。盡我所知，除文中已經(jīng)注明引用內(nèi)容和致謝的地方外，本論文不包含其他個人或集體已經(jīng)發(fā)表的研究成果，也不包含其他已申請學(xué)位或其他用途使用過的成果。與我一同工作的同志對本研究所做的貢獻均已在論文中做了明確的說明并表示了謝意。若有不實之處，本人愿意承擔(dān)相關(guān)法律責(zé)任。學(xué)位論文題目墓壬翅絲圖焦曲量盈魚筮絲巡當(dāng)望籃鰱盛作者簽名整趟煎日期塑年墾月日大連理工大學(xué)碩士研究生學(xué)位論文大連理工大學(xué)學(xué)位論文版權(quán)使用授權(quán)書本人完全了解學(xué)校有關(guān)學(xué)位論文知識產(chǎn)權(quán)的規(guī)定，在校攻讀學(xué)位期間論文工作的知識產(chǎn)權(quán)屬于大連理工大學(xué)，允許論文被查閱和借閱。學(xué)校有權(quán)保留論文并向國家有關(guān)部門或機構(gòu)送交論文的復(fù)印件和電子版，可以將本學(xué)位論文的全部或部分內(nèi)容編入有關(guān)數(shù)據(jù)庫進行檢索，可以采用影印、縮印、或掃描等復(fù)制手段保存和匯編本學(xué)位論文。學(xué)位論文題目差孟猢凰壤魚墾麴冒塹幽塹壁啦墮班密作者簽名毯趲日期型墮年L月日鋤獬斗斗嗍旦年上月一日大連理工大學(xué)碩士學(xué)位論文1緒論11引言隨著視頻分析技術(shù)及人工智能技術(shù)的發(fā)展，從圖像處理與模式識別發(fā)展起來的計算機視覺在近三十年得到了突飛猛進的發(fā)展。盡管目前計算機視覺的理論發(fā)展仍然不夠成熟，但已經(jīng)得到了廣泛的應(yīng)用，在智能視頻監(jiān)控系統(tǒng)、機器人視覺導(dǎo)航、醫(yī)學(xué)輔導(dǎo)診斷、工業(yè)機器人視覺系統(tǒng)、地圖繪制，物理的三維重建與識別、智能人機接口等領(lǐng)域得到廣泛的發(fā)展，其中智能化的視頻監(jiān)控系統(tǒng)是近年來計算機視覺領(lǐng)域的一個備受關(guān)注的前沿課題。從圖像處理與模式識別發(fā)展起來的計算機視覺研究方向主要是如何利用二維投影圖像恢復(fù)三維景物世界。計算機視覺使用的理論方法主要是基于幾何、概率、運動學(xué)與三維重構(gòu)的視覺計算理論，它的理論基礎(chǔ)包括射影幾何學(xué)、剛體運動力學(xué)、概率與隨機過程、圖像處理、人工智能等。計算機視覺要達到的最終目的是實現(xiàn)計算機對三維景物世界的理解，即實現(xiàn)人類視覺系統(tǒng)的某些功能。視頻圖像是對客觀事物形象、生動的描述，是直觀而具體的信息表達形式，是人類最重要的信息載體。人類主要通過視覺感知外界信息，據(jù)統(tǒng)計，人類對外界信息的感知有80以上是通過視覺得到的。在今天的信息社會，隨著網(wǎng)絡(luò)、通信和微電子技術(shù)的快速發(fā)展和人民物質(zhì)生活水平的提高，視頻監(jiān)控以其直觀方便和內(nèi)容豐富等特點日益受到人們的青睞，監(jiān)控產(chǎn)品也正經(jīng)歷著從最初的模擬化走向數(shù)字化、網(wǎng)絡(luò)化、智能化的革命。視頻監(jiān)控是實施安全監(jiān)控的重要技術(shù)手段，它是計算機視覺領(lǐng)域一個新興的應(yīng)用方向和備受關(guān)注的前沿課題。它涉及信號與視頻處理、通信和計算機視覺等多個學(xué)科的研究領(lǐng)域。視頻通信、處理和理解是視頻監(jiān)測技術(shù)的三大核心技術(shù)。盡管成像設(shè)備、視頻壓縮、通信以及數(shù)據(jù)存儲等方面的技術(shù)發(fā)展迅速并且日趨成熟，監(jiān)控系統(tǒng)功能日益強大，但是視頻內(nèi)容的分析和理解工作目前仍然主要依靠人工完成，工作量繁重，因此計算機視覺和應(yīng)用研究者提出新一代監(jiān)控一視頻監(jiān)控的概念【L】，監(jiān)控在不需要人為干預(yù)情況下，利用計算機視覺和視頻分析的方法對攝像機拍攝的圖像序列進行自動分析，實現(xiàn)對動態(tài)場景中目標(biāo)的定位、識別和跟蹤，并在此基礎(chǔ)上分析和判斷目標(biāo)的行為，從而既能完成日常管理又能在異常情況發(fā)生時及時做出反應(yīng)。計算機視頻監(jiān)控系統(tǒng)不僅符合信息產(chǎn)業(yè)的未來發(fā)展趨勢，而且代表了監(jiān)控行業(yè)的未來發(fā)展方向，蘊含著巨大的商機和經(jīng)濟效益，受到了學(xué)術(shù)界、產(chǎn)業(yè)界和管理部門的高度重視。基于視頻圖像的運動目標(biāo)檢測與跟蹤算法研究12視頻監(jiān)控相關(guān)研究計算機視頻監(jiān)控是指通過攝像頭采集監(jiān)控區(qū)域的圖像，然后將視頻信號通過相應(yīng)的傳輸網(wǎng)絡(luò)同軸電纜、光纖、無線或以太網(wǎng)等，傳到指定的監(jiān)控中心或是監(jiān)控點，進行存儲、顯示、分析。具體分析過程是利用計算機視覺和圖像處理方法對圖像序列進行運動檢測、運動目標(biāo)分類、運動目標(biāo)跟蹤以及監(jiān)視場景中目標(biāo)行為的理解與描述。運動檢測、目標(biāo)分類和目標(biāo)跟蹤屬于視覺中的低級處理部分，行為理解與描述則屬于視覺中的高級處理部分。運動檢測、目標(biāo)分類與跟蹤是視頻監(jiān)控中研究最多的三個問題，而行為理解與描述則是近年被廣泛關(guān)注的研究熱點。它是指對人的運動模式進行分析和識別，并用自然語言等加以描述。下面對視頻監(jiān)控系統(tǒng)有關(guān)發(fā)展?fàn)顩r及主要理論做簡要概述。121國內(nèi)外研究現(xiàn)狀智能視頻監(jiān)控是多學(xué)科交叉的前沿研究領(lǐng)域，并且具有廣泛的應(yīng)用前景和龐大的市場需求，有很多科研人員、科研機構(gòu)及企業(yè)單位多年來從事這方面的研究、開發(fā)，并且取得了很多優(yōu)秀的成果。1997年，美國國防高級研究項目署DARPA設(shè)立了以卡內(nèi)基梅隆大學(xué)為首聯(lián)合十幾家高等院校和研究機構(gòu)參加的視頻監(jiān)控重大項目VSAMVIDEOSURVEILLANCEANDMONITORINGT2,列，主要研究對戰(zhàn)場及普通民用場景進行監(jiān)控的自動視頻理解技術(shù)。2000年，DARPA又資助了MDOJUMANIDENTIFICATIONATADISTANCE遠距離人臉識別項目；由STEVEJMAYBANK和譚鐵牛組織的IEEE視覺監(jiān)控專題討論會S，IEEEINTERNATIONALWORKSHOPONVISUALSURVEILLANCE也已經(jīng)成功地舉辦了三屆，收錄了大量視覺監(jiān)控領(lǐng)域內(nèi)的最新研究成果。佛羅里達中央大學(xué)UNIVERSITYOFCEN打ALFLORIDA的KNIGHT智能監(jiān)控系統(tǒng)13,4利用計算機視覺技術(shù)能檢測出監(jiān)視區(qū)域目標(biāo)的變化，并能標(biāo)注重要事件和描述人的行為，系統(tǒng)對光照變化有較好的魯棒性。英國雷丁大學(xué)【5】已開展了對車輛和行人的跟蹤及其交互作用識別的相關(guān)研究。計算機視覺領(lǐng)域中的權(quán)威期刊“國際計算機視覺期刊0JCV，INTERNATIONALJOURNALOFCOMPUTERVISION和“IEEE模式分析和機器智能匯刊”PAMI，IEEETRANSACTIONONPATTEMANALYSISANDMACHINEINTELLIGENCE相繼在2000年6月和2000年8月出版了關(guān)于視覺監(jiān)控的?？ARYLAND大學(xué)的實時視覺監(jiān)控系統(tǒng)W461不僅能夠定位人和分割出人的身體部分，而且通過建立外觀模型來實現(xiàn)多人的跟蹤，可以檢測和跟蹤室外環(huán)境中的人并對他們之間簡單的交互進行監(jiān)控。IBM的智能監(jiān)控系統(tǒng)【7】不僅能夠自動監(jiān)視某個現(xiàn)場，還能夠監(jiān)視數(shù)據(jù)，執(zhí)行基于事件的檢索，通過標(biāo)準(zhǔn)的網(wǎng)絡(luò)設(shè)施進行實時報警，并且能提取出某項活動的長期的統(tǒng)計模型。一2一大連理工大學(xué)碩士學(xué)位論文國內(nèi)有一些視頻監(jiān)控方面的產(chǎn)品，如黃金眼、行者貓王等，應(yīng)用于交通控制，監(jiān)獄管理等方面。另外，國內(nèi)產(chǎn)品還有數(shù)字硬盤錄像系統(tǒng)DVG，將監(jiān)控區(qū)域內(nèi)有運動對象出現(xiàn)的情況錄制下來，以備查詢，該系統(tǒng)只是簡單的檢測出有無運動對象，而沒有對運動對象做任何分析。由于國內(nèi)的研究起步較晚，技術(shù)還不夠完善，開發(fā)出的產(chǎn)品距離智能化還有一定差距，在實際的應(yīng)用中，受到很多限制，還有待于進一步的完善。122主要任務(wù)人運動的視覺分析主要是針對包含人的運動圖像序列進行分析處理，它通常涉及到運動檢測、目標(biāo)分類、人的跟蹤及行為理解與描述幾個過程，其一般性處理框架如圖11所示。其中，運動檢測、目標(biāo)分類、人體跟蹤屬于視覺中的低級和中級處理部分LOWLEVELANDINTERMEDIATE1EVELVISION，而行為理解和描述則屬于高級處理HIGH1EVELVISION釓當(dāng)然，它們之間也可能存在交叉。下面從幾個方面對視頻處理主要任務(wù)進行探討。圖11人運動分析的一般處理框架FIG11GENERALFRAMEWORKOFHUMANMOTIONANALYSIS1運動目標(biāo)檢測基于視頻圖像的運動目標(biāo)檢測與跟蹤算法研究運動檢測是指從視頻流中提取出目標(biāo)，一般是確定目標(biāo)的區(qū)域或顏色等。它必須從連續(xù)的視頻流或圖像序列中提取目標(biāo)。目標(biāo)檢測的目的是從序列圖像中將感興趣的區(qū)域一般為運動目標(biāo)區(qū)域從背景圖像中抽取出來。運動區(qū)域的有效分割對于目標(biāo)分類、跟蹤和行為理解等后期處理是非常重要的，因為以后的處理過程僅僅考慮圖像中對應(yīng)于運動區(qū)域的像素。然而，由于背景動態(tài)變化，如天氣、光照、影子及混亂干擾等的影響，使得運動檢測成為一項相當(dāng)困難的工作。目前幾種常用的方法有背景減除【51、時間差分I1,12、光流【13】、擴展的EM算法、能量運動檢測、基于數(shù)學(xué)形態(tài)學(xué)的場景變化檢測等。其中背景減除和時間差分均屬于求差法，即都采用當(dāng)前圖像與參考圖像進行相減的方法來完成運動目標(biāo)的檢測。2運動目標(biāo)分類目標(biāo)分類的目的是識別運動目標(biāo)所屬的類別，不同的運動區(qū)域可能對應(yīng)于不同的運動目標(biāo)，比如交通道路上監(jiān)控攝像機所捕捉的序列中可能包含行人、車輛及其他諸如飛鳥、流云、搖動的樹枝等運動物體，為了便于進一步對行人進行跟蹤和行為分析，運動目標(biāo)的正確分類是完全必要的。目前的分類方法主要有基于形狀信息的分類、基于運動特征的分類以及時間共生矩陣進行分層分類的方法等。3運動目標(biāo)跟蹤目標(biāo)跟蹤是計算機視覺領(lǐng)域中一個極具挑戰(zhàn)性的課題，除視頻監(jiān)控外，其還被廣泛地應(yīng)用在人機交互、視頻壓縮、醫(yī)學(xué)圖像處理等領(lǐng)域中。所謂運動目標(biāo)跟蹤則指對目標(biāo)進行連續(xù)的跟蹤以確定其運動軌跡。它等價于在連續(xù)的圖像幀間創(chuàng)建基于位置、速度、形狀、紋理、色彩等有關(guān)特征的對應(yīng)匹配問題。目標(biāo)跟蹤的關(guān)鍵在于得到圖像檢測中提取的靜態(tài)目標(biāo)與被跟蹤運動目標(biāo)的對應(yīng)關(guān)系。從運動檢測得到的一般是人的投影，要進行跟蹤首先要給需要跟蹤的對象建立一個模型。對象模型可以是整個人體，這時候形狀、顏色、位置、速度、步態(tài)等都是可以利用的信息；也可以是人體的一部分如上臂、頭部或手掌等，這時需要對這些部分單獨進行建模。之后，將運動檢測到的投影匹配到這個模型上去。一旦匹配工作完成，那么就得到了最終有用的人體的信息了。常用的數(shù)學(xué)工具有卡爾曼濾波【14CKALMANFILTERING、CONDENSATION算、法【U】及動態(tài)貝葉斯網(wǎng)絡(luò)【16】等。4行為識別與理解運動檢測、目標(biāo)分類與人的跟蹤是人運動分析中研究較多的三個問題，而人的行為理解與描述是近年來被廣泛關(guān)注的研究熱點。人體行為識別與理解是指對人的行為模式進行分析和識別，并用自然語音加以描述，這種技術(shù)包含從視頻序列中抽取相關(guān)的視覺信息并用一種合適的方法進行表達，然后解釋這些視覺信息以實現(xiàn)識別和學(xué)習(xí)人的行大連理工大學(xué)碩士學(xué)位論文為。通常，人體行為識別是在成功實現(xiàn)圖像序列中的人體檢測和跟蹤、完成特征提取的基礎(chǔ)上進行的，屬于更高一層的視覺任務(wù)，是當(dāng)前計算機視覺研究領(lǐng)域備受關(guān)注并最具挑戰(zhàn)的研究方向之一。從模式識別的角度來看，行為識別可以看作為一個基于時變特征數(shù)據(jù)之上的分類問題，在獲取人體目標(biāo)的特征數(shù)據(jù)后，識別也就成為一個將未知類型數(shù)據(jù)序列與已知運動數(shù)據(jù)序列相匹配的過程。目前人行為識別的研究主要有頭部運動、手勢識別、下肢運動等，方法主要有模板匹配方法與狀態(tài)空間方法兩種。采用模板匹配技術(shù)的行為識別方法首先將圖像序列轉(zhuǎn)換為一組靜態(tài)形狀模式，然后在識別過程中和預(yù)先存儲的行為標(biāo)本相比較?；跔顟B(tài)空間模型方法是定義每個靜態(tài)姿勢作為一個狀態(tài)，這些狀態(tài)之間通過某種概率聯(lián)系起來。任何運動序列可以看作為這些靜態(tài)姿勢的不同狀態(tài)之間的一次遍歷過程，在這些遍歷期間計算聯(lián)合概率，其最大值被選擇作為分類行為的標(biāo)準(zhǔn)。目前，狀態(tài)空間模型已經(jīng)被廣泛地應(yīng)用于時間序列的預(yù)測、估計和檢測。123技術(shù)難點智能視頻源于計算機視覺技術(shù)，其技術(shù)實現(xiàn)主要存在于以下幾個方面問題1視頻監(jiān)控系統(tǒng)的魯棒性要求很高，即要求自動、連續(xù)工作。而從實際情況來看，視頻監(jiān)控系統(tǒng)的應(yīng)用環(huán)境往往相當(dāng)復(fù)雜，環(huán)境的不斷變化給計算機視覺技術(shù)應(yīng)用帶來了更高的要求。2由于運動目標(biāo)的多樣性，如何對多種目標(biāo)進行運動分析、分類甄別，尤其是對非剛性目標(biāo)的運動分析尚存在一定難度。3對于大范圍的視頻監(jiān)控需要大量的攝像機協(xié)同工作，在多臺攝像機之間對運動目標(biāo)進行連續(xù)一致的視覺分析現(xiàn)在實現(xiàn)起來十分困難。4如何建立有效的視頻數(shù)據(jù)庫，實現(xiàn)視頻監(jiān)控系統(tǒng)中海量視頻信息的存儲、檢索和查詢，目前還處于研究起步階段。以上這些問題表明，視頻監(jiān)控系統(tǒng)的智能化還有相當(dāng)長的路要走。124應(yīng)用現(xiàn)狀與發(fā)展趨勢視頻監(jiān)控系統(tǒng)是多媒體技術(shù)、計算機網(wǎng)絡(luò)、工業(yè)控制和人工智能等技術(shù)的綜合運用的產(chǎn)物，它正向著音視頻的數(shù)字化、系統(tǒng)的網(wǎng)絡(luò)化和管理的智能化方向不斷發(fā)展。從視頻監(jiān)控技術(shù)的發(fā)展歷程來看，視頻監(jiān)控系統(tǒng)在過去的二十多年里大致經(jīng)歷了三代。第一代模擬視頻監(jiān)控系統(tǒng)，第二代數(shù)字視頻監(jiān)控系統(tǒng)，第三代分布式視頻監(jiān)控系統(tǒng)【17】?；谝曨l圖像的運動目標(biāo)檢測與跟蹤算法研究第一代視頻監(jiān)控系統(tǒng)是以模擬信號、圖像的處理和傳輸為基礎(chǔ)的，多路模擬攝像機產(chǎn)生的模擬信號通過同軸電纜傳輸?shù)奖O(jiān)控室，然后通過預(yù)置好的順序輪流顯示，監(jiān)控人員通過監(jiān)視器來判斷監(jiān)視場景的情況。第二代監(jiān)控系統(tǒng)主要依賴于混合模數(shù)或全數(shù)字的視頻傳輸和處理方法，采用H263，MPEG等多媒體數(shù)字壓縮技術(shù)將視頻圖像完全數(shù)字化，節(jié)省了帶寬資源。在視頻監(jiān)控中可以利用視頻分析算法，讓監(jiān)控者只注意感興趣的事物從而實現(xiàn)自動報警。第三代監(jiān)控系統(tǒng)利用低價位高性能的計算機網(wǎng)絡(luò)、移動網(wǎng)絡(luò)和固定的多媒體通信網(wǎng)絡(luò)傳輸監(jiān)控信號。視頻信號在前端進行自動分析處理，然后將有價值的信息通過無線或有線網(wǎng)絡(luò)傳輸?shù)奖O(jiān)控中心，實現(xiàn)自動視頻監(jiān)控。第三代的研究熱點主要放在魯棒性的圖像傳輸，彩色圖像的處理，基于事件的和基于模式的序列圖像的理解上，目前對這些技術(shù)的應(yīng)用已經(jīng)獲得了很多有價值的結(jié)果。與此同時，由于無線和有線的多媒體數(shù)字通信的發(fā)展，特別是隨著超寬帶網(wǎng)絡(luò)的接入，第三代監(jiān)控系統(tǒng)將在不同的領(lǐng)域中大范圍使用。隨著人運動分析研究和其它相關(guān)技術(shù)的發(fā)展，下述幾個方面已經(jīng)成為未來智能視頻監(jiān)控的發(fā)展趨勢1音頻與視覺相結(jié)合的多模態(tài)接口人的相互交流主要是依據(jù)語言，過去的許多工作是語音理解，但語音識別受距離和環(huán)境噪聲的限制，尤其在機場等高噪聲環(huán)境，將會嚴(yán)重影響語音識別的性能。人的可視化描述與語音解釋一樣重要，研究者們正逐漸將語音與視覺信息集成起來以產(chǎn)生更加自然的高級接口。目前音頻和視頻的信號處理相對獨立，如何更好地集成音頻和視頻信息用于多模態(tài)用戶接口是一個嚴(yán)峻的挑戰(zhàn)。2人的運動分析與生物特征識別相結(jié)合在智能房間的門禁系統(tǒng)、軍事安全基地的視覺監(jiān)控系統(tǒng)、高級人機交互等應(yīng)用中，人的運動分析與生物特征識別相結(jié)合的研究日益顯得重要。在人機交互中不僅需要機器知道人是否存在、人的位置和行為，而且還需要利用特征識別技術(shù)來識別與其交流的人是誰。遠距離的身份識別已經(jīng)越來越重要，比如，2000年，DARPA贊助的重大項目一MHIDHUMANIDENTIFICATIONATADISTANCE計劃。由于人的步態(tài)具有易于感知、非侵犯性、難于偽裝等優(yōu)點，近年來已引起了計算機視覺研究者濃厚的研究興趣。3人的運動分析向行為理解與描述高層處理的轉(zhuǎn)變?nèi)说男袨槔斫馐切枰鸶叨茸⒁獠⑶沂亲罹咛魬?zhàn)的研究方向，因為觀察人的最終目標(biāo)就是分析和理解人的個人行為、人與人之間及人與其它目標(biāo)的交互行為等。目前人的運動理解還是集中于人的跟蹤、標(biāo)準(zhǔn)姿勢識別、簡單行為識別等問題，如人的一組最通常的行為跑、蹲、站、跳、爬、指等的定義和分類。近年來利用機器學(xué)習(xí)工具構(gòu)建大連理工大學(xué)碩士學(xué)位論文人行為的統(tǒng)計模型的研究有了一定的進展，但行為識別仍舊處于初級階段，連續(xù)特征的典型匹配過程中常引入人運動模型的簡化約束條件來減少歧義性，而這些限制與一般的圖像條件卻是不吻合的，因此行為理解的難點仍是在于特征選擇和機器學(xué)習(xí)。另外，如何借助于先進的視覺算法和人工智能等領(lǐng)域的成果，將現(xiàn)有的簡單的行為識別與語義理解推廣到更為復(fù)雜場景下的自然語言描述，是將計算機視覺低、中層次的處理推向高層抽象思維的關(guān)鍵問題。13本文的主要工作與章節(jié)安排131本文的主要工作本文要研究的問題是如何從視頻圖像序列中提取出運動目標(biāo)，并對其進行跟蹤處理。視頻監(jiān)控根據(jù)攝像頭的放置位置，大致分為兩類一類是攝像頭隨運動目標(biāo)移動，運動對象始終保持在圖像的中心位置；另一類是攝像頭固定只對視場內(nèi)的對象進行監(jiān)控和跟蹤。根據(jù)攝像頭的數(shù)目可分為多攝像頭協(xié)同監(jiān)控和單攝像頭監(jiān)控。本文要研究的是垂直固定單攝像頭的情況，這是多攝像頭協(xié)同監(jiān)控的基礎(chǔ)。本文主要對運動區(qū)域的檢測、運動人體目標(biāo)的分割定位和運動人體目標(biāo)的跟蹤這三個方面進行了研究。本文工作內(nèi)容及創(chuàng)新點簡要介紹如下1運動目標(biāo)檢測深入研究了當(dāng)前各種目標(biāo)檢測算法，詳細(xì)介紹了幀間差分法、基于梯度建模前景提取法以及利用幀間二階差分SODP與邊緣檢測相結(jié)合進行運動目標(biāo)分割方法的基本原理，并進行了相關(guān)的實驗性能分析。在幀間差分法的基礎(chǔ)上，本文采用了一種基于均值統(tǒng)計的自適應(yīng)閾值方法來進行運動區(qū)域分割【18】，較好地把人體的運動區(qū)域提取出來。2運動目標(biāo)定位以人體頭部為出發(fā)點對人體目標(biāo)的定位進行了研究，在攝像頭的角度為垂直的條件下，根據(jù)提取出的頭部運動信息輪廓具有近圓形這一關(guān)鍵特征，本文采用FREEMAN鏈碼和RANSAC算法相結(jié)合的方法，進行人體頭部的檢測識別，較快地完成了多目標(biāo)的定位。3多目標(biāo)跟蹤研究了MEANSHIFT算法的基本原理，介紹了MEANSHIFT算法在目標(biāo)跟蹤中的應(yīng)用。結(jié)合當(dāng)前MEANSHIFT跟蹤算法的優(yōu)點，針對目標(biāo)顏色相似與快速運動目標(biāo)之間可能跟蹤失敗的情況，本文提出了一種融合目標(biāo)顏色信息、紋理信息和運動信息KALMAN濾波等特征的目標(biāo)跟蹤方法，較好的完成了對人體目標(biāo)的跟蹤處理。4單目標(biāo)跟蹤對機器學(xué)習(xí)的發(fā)展進行了論述，對機器學(xué)習(xí)中的半監(jiān)督學(xué)習(xí)進行了探討，然后介紹了一種新的描述目標(biāo)特征的PPBTF特征，對支持向量機給予了研究。針對目前跟蹤算法建立模型描述目標(biāo)的缺陷，利用半監(jiān)督學(xué)習(xí)理論，提出了一種新的基于視頻圖像的運動目標(biāo)檢測與跟蹤算法研究TRITRACKING單目標(biāo)跟蹤算法，較好地解決了當(dāng)運動目標(biāo)外觀顯著變化時跟蹤失敗的問題。132論文章節(jié)安排本論文分為五章，各章內(nèi)容安排如下第一章為緒論，闡述了智能視頻監(jiān)控的研究意義和國內(nèi)外研究現(xiàn)狀，討論了計算機智能視頻監(jiān)控的主要任務(wù)、技術(shù)難點和應(yīng)用現(xiàn)狀及未來發(fā)展趨勢，最后給出本文的主要工作和論文結(jié)構(gòu)。第二章對計算機智能視頻監(jiān)控中運動目標(biāo)檢測關(guān)鍵技術(shù)進行了研究。介紹了幀間差分法、基于梯度建模前景提取法以及利用幀間二階差分SODP與邊緣檢測相結(jié)合進行運動目標(biāo)分割方法的基本原理，并進行了相關(guān)的實驗性能分析。本文在幀間差分法的基礎(chǔ)上，采用了基于均值統(tǒng)計的自適應(yīng)閾值方法【L引，從而判斷出人體目標(biāo)的運動區(qū)域。第三章針對計算機智能視頻監(jiān)控中主要任務(wù)之一目標(biāo)定位進行了研究。介紹了頭部檢測時采用的FREEMAN鏈碼和RANSAC算法，結(jié)合兩者對運動區(qū)域內(nèi)人體目標(biāo)頭部進行定位。第四章引入了描述運動目標(biāo)的紋理特征，介紹了預(yù)測運動目標(biāo)軌跡的KALMAN濾波器，給出了MEANSHIFT理論及其在跟蹤中的應(yīng)用，然后提出了一種融合目標(biāo)顏色信息、紋理信息和運動信息的改進的KALMAN和MEANSHIR跟蹤算法，實現(xiàn)對運動EL標(biāo)的良好跟蹤。第五章分析了傳統(tǒng)跟蹤算法的現(xiàn)狀，介紹了機器學(xué)習(xí)理論，針對建立模型進行跟蹤的不足之處，本文利用機器學(xué)習(xí)的方法，提出了一種半監(jiān)督學(xué)習(xí)跟蹤算法一一TRIQRACKING跟蹤算法，對姿勢顯著變化的單個目標(biāo)進行魯棒性跟蹤，并對提出的算法做了大量實驗，同時給出了定性的分析。最后對本論文進行了總結(jié)，指出了不足之處，并對今后工作進行了展望。大連理工大學(xué)碩士學(xué)位論文2運動目標(biāo)檢測技術(shù)研究21引言運動目標(biāo)檢測是應(yīng)用視覺研究領(lǐng)域的一個重要課題，在軍事和工業(yè)等領(lǐng)域如軍事目標(biāo)跟蹤、交通自動導(dǎo)航、視頻信號傳輸和機器人視覺等領(lǐng)域應(yīng)用廣泛。目前，視頻信號的智能化處理需求日益增加，正確地從視頻流中提取運動目標(biāo)、判斷運動方向是許多智能視頻系統(tǒng)的基礎(chǔ)部分。運動目標(biāo)檢測是智能視頻監(jiān)控系統(tǒng)中非常關(guān)鍵的一步，它的目的就是提取監(jiān)控場景中的運動目標(biāo)，為運動物體的識別跟蹤提供必備條件。它的基本任務(wù)是從圖像序列中檢測出運動信息，簡化圖像處理過程，得到所需的運動矢量，從而能夠識別與跟蹤物體。然而由于天氣、光照、影子及混亂干擾等的影響，使得運動檢測成為一項相當(dāng)困難的工作。根據(jù)視頻序列圖像中攝像機和場景之間是否運動將目標(biāo)的運動劃分為四種模式1攝像機靜LE目標(biāo)靜止。這是靜態(tài)場景，對其處理方法就是靜態(tài)圖像中的處理方法。2攝像機靜止目標(biāo)運動。這是一類非常重要的動態(tài)場景，對其處理一般包括運動目標(biāo)檢測、目標(biāo)特性估計等，主要用于預(yù)警、監(jiān)視、目標(biāo)跟蹤等場合。3攝像機運動目標(biāo)靜止。這主要用于機器人視覺導(dǎo)航、電子地圖的自動生成以及三維場景理解等。4攝像機運動目標(biāo)運動，這是運動目標(biāo)的檢測和跟蹤最復(fù)雜的一種情況，但也最普通的情況。目前關(guān)于這方面的研究還比較少，理論還沒有成熟。本文的目標(biāo)檢測算法研究是在垂直固定攝像頭的前提下，綜合考慮了室內(nèi)和室外的監(jiān)控算法，在下面的章節(jié)中將對常用的前景檢測方法進行介紹并給出實際的檢測結(jié)果和性能分析。22靜態(tài)背景下的運動目標(biāo)檢測221基于背景建模的方法基于背景建模的方法是目前運動目標(biāo)檢測中最常用的一種方法，它的基本思想是輸入圖像與背景圖像進行比較，通過判定灰度等特征的變化，或用直方圖等統(tǒng)計信息的變化來判斷異常情況的發(fā)生和分割運動目標(biāo)。簡單常用的方式為直接抽取視頻序列中某一幅圖像，或計算多幅圖像的平均值作為背景。它一般能夠提供最完全的特征數(shù)據(jù)，而對于動態(tài)場景的變化，如光照和外來無關(guān)事件的干擾等特別敏感，最簡單的背景模型是基于視頻圖像的運動目標(biāo)檢測與跟蹤算法研究時間平均圖像，這種方法有一些問題并且需要在沒有前景物體時的一段訓(xùn)練周期。訓(xùn)練周期后背景物體的運動或是訓(xùn)練過程中前景物體將會認(rèn)為是用舊的前景物體。此外，這種方法還不能處理場景中的梯度的亮度變化。大部分研究人員目前都致力于開發(fā)不同的背景模型和自適應(yīng)算法，以期減少動態(tài)場景變化對于運動分割的影響。HARITAOGLUSL等利用最小、最大強度值和最大時間差分值為場景中每個像素進行統(tǒng)計建模，并且進行周期性的背景更新；MCKENNAB9等利用像素色彩和梯度信息相結(jié)合的自適應(yīng)背景模型來解決影子和不可靠色彩線索對于分割的影響；KARMANN與BRANDT201和KILGER211采用基于卡爾曼濾波KALMANFILTERING的自適應(yīng)背景模型以適應(yīng)天氣和光照的時間變化；STAUFFER與GRIM0N22利用自適應(yīng)的混合高斯背景模型即對每個像素利用混合高斯分布建模，并且利用在線估計來更新模型，從而可靠地處理了光照變化、背景混亂運動的干擾等影響。A背景差分法背景差法首先對背景建立模型，選取背景中的一幅或幾幅圖像的平均作為背景圖像，然后把以后的序列圖像和背景圖像相減，進行背景消除。若所得到的像素值大于某一閾值，則判定監(jiān)視場景中有運動物體，從而得到運動目標(biāo)。用公式表示如下DLX，Y，力一吃墨力I21FDDF覡，Y，D，、，22【U口Q式中觀是背景幀差圖；既是背景的亮度分量；，表示幀數(shù)BL，2，；G為閾值。B背景模型的建立按照所處理背景的自身特性，背景模型可分為單模態(tài)和多模態(tài)兩種。前者在每個背景點上的顏色分布比較集中，可以用單體概率分布模型來描述即只有一個模態(tài)，后者的分布則比較分散，需要多個分布模型來共同描述具有多個模態(tài)。最常用的描述背景點顏色分布的概率分布是高斯分布正態(tài)分布，下面就單模態(tài)和多模態(tài)兩種情況下的背景模型分別加以說明和討論。以下用刁X，來表示均值為、協(xié)方差為的高斯分布的概率密度函數(shù)。1單高斯分布背景模型單高斯分布背景模型適用于單模態(tài)背景情形，它為每個圖象點的顏色分布建立了高斯分布表示的模型RX，其中下標(biāo)T表示時間。設(shè)圖象點的當(dāng)前顏色度量為置，若RTX，鸕中“乙這里耳為概率閾值，則該點被判定為前景點，否則為背景點這時又稱為置與RX，鸕一，相匹配。在實際應(yīng)用中，可以用等價的閾值替代概率閾值。大連理工大學(xué)碩士學(xué)位論文如記匾五IT,，以Q表示均方差，則常根據(jù)4Q的取值設(shè)置前景檢測閾值T如設(shè)410,T，則該點被判定為前景點，否則為背景點。單高斯更新快慢的常數(shù)稱為更新率口，則該點高斯分布參數(shù)的更新可表示為肛1一口以L口五23砰1一口I口五一鸕12。242多高斯分布背景模型多模態(tài)背景的情形則需要多個分布來共同描述一個圖像點上的顏色分布。STAUFFER等提出了一種自適應(yīng)混合高斯模型，對每個圖像點采用了多個高斯的混合表示。設(shè)用來描述每個點顏色分布的高斯分布共有K個，分別記為OX,4U，IL，2，K。各高斯分布分別具有不同的權(quán)值Q。J哆，1，它們總是按照權(quán)值從高到低的次序排序。在檢測前景點時，按照權(quán)值從大到小的次序?qū)⒅门c各高斯分布逐一匹配，若沒有表示背景分布的高斯分布與置匹配，則判定該點為前景點，否則為背景點。多高斯分布背景模型的更新較為復(fù)雜，因為它不但要更新高斯分布自身的參數(shù)，還要更新各分布的權(quán)重等。若檢測時沒有找到任何高斯分布與其匹配，則將權(quán)值最小的一個高斯分布取出，并引入一個新的均值為當(dāng)前值的高斯分布，賦予較小的權(quán)值和較大的方差，然后對所有高斯分布重新進行權(quán)值歸一化處理。若第M個高斯分布與之匹配，則對第F個高斯分布的權(quán)值更新如下I1一歷L，IM吼511_歷其它25其中是另一個表示背景更新快慢的常數(shù)權(quán)值更新率。以上公式表明只有與五匹配的高斯分布的權(quán)值才得到提高，其他分布的權(quán)值都被降低。另外，未匹配的高斯分布的均值和均方差盯保持不變，相匹配的高斯分布的參數(shù)也按照式23和式24進行更新。在更新完高斯分布的參數(shù)和各分布權(quán)值后，還要對各個分布重新進行排序。222基于光流場的方法光流【231是空間運動物體對觀測面上的像素點運動產(chǎn)生的瞬時速度場，包含了物體表面結(jié)構(gòu)和動態(tài)行為的重要信息，一般情況下，光流有相機運動、場景中目標(biāo)運動、或是兩者的共同運動產(chǎn)生。光流的計算方法大致可分為三類基于匹配的、頻域的或梯度的方法。1基于匹配的光流計算方法包括基于特征和基于區(qū)域的兩種。基于特征的方法不基于視頻圖像的運動目標(biāo)檢測與跟蹤算法研究斷地對目標(biāo)主要特征進行定位和跟蹤，對大目標(biāo)的運動和亮度變化具有魯棒性。存在的問題是光流通常很稀疏，而且特征提取和精確匹配也非常困難?；趨^(qū)域的方法先對類似的區(qū)域進行定位，然后通過相似區(qū)域的位移計算流量。這種方法在視頻編碼中得到廣泛的應(yīng)用，然而計算的光流仍不稠密。2基于頻域的方法利用速度可調(diào)的濾波組輸出頻域或相位信息。雖然能獲得很高精度的初始光流估計，但往往涉及復(fù)雜的計算。另外，進行可靠評價也非常困難。3基于梯度的方法利用圖像序列的時空微分計算2D速度場光流。由于計算簡單和較好的實驗結(jié)果，基于梯度的方法得到了廣泛研究。雖然很多基于梯度的光流估計方法取得了較好的效果，但是在計算光流時涉及到可調(diào)參數(shù)的人工選取、可靠性評價因子的選擇困難，以及預(yù)處理對光流計算結(jié)果的影響，在應(yīng)用光流對目標(biāo)進行實時監(jiān)測與自動跟蹤時仍然存在很多問題。總的說來，光流法的優(yōu)點是能夠檢測獨立運動的對象，不需要預(yù)先知道場景的任何信息，并且可用于攝像機運動的情況，但是由于噪聲、多光源、陰影、透明性和遮擋性等原因，使得計算出的光流場分布不是十分可靠和精確；而且多數(shù)光流法計算復(fù)雜、耗時多，除非有特殊的硬件支持，否則很難實現(xiàn)實時檢測洲。日本大阪大學(xué)的RYUZOOKADA瞄】等人對此方法作了深入的研究，并已研制出比較成熟的系統(tǒng)。借助于多個數(shù)字信號處理器，這些系統(tǒng)都實現(xiàn)了實時目標(biāo)檢測和跟蹤，處理速度可以達到15幀S。223基于時間差分的方法時間差分方法是將前后兩幀或三幀圖像相減，將差值大于某一閾值的部分判為運動對象。例如LIPTON【LLJ等利用兩幀差分方法從實際視頻圖像中檢測出運動目標(biāo)，進而用于目標(biāo)的分類與跟蹤；一個改進的方法是利用三幀差分代替兩幀差分，如VSAME2,3】開發(fā)了一種自適應(yīng)背景減除與三幀差分相結(jié)合的混合算法，它能夠快速有效地從背景中檢測出運動目標(biāo)。時域差分法的優(yōu)點是魯棒性較好，能夠適應(yīng)各種動態(tài)環(huán)境，其缺點是只能提取出邊界點，不能提取出對象的完整區(qū)域。另外，當(dāng)運動對象速度緩慢時，則可能檢測不到，而運動速度較快時，將把部分背景也檢測為運動對象。23常用檢測方法及其性能分析分析圖像序列，對運動目標(biāo)進行檢測是圖像處理系統(tǒng)的重要內(nèi)容，通過運動檢測，可以得到目標(biāo)在視頻圖像中的位置、方向、大小等信息。如何有效快速地檢測出運動目標(biāo)，是其他后續(xù)目標(biāo)分類和目標(biāo)跟蹤的基礎(chǔ)，因此，運動檢測對后續(xù)目標(biāo)跟蹤的正確完成具有極其重要的作用。本文對常用的相鄰幀間差方法、基于梯度建模提取前景法和利大連理工大學(xué)碩士學(xué)位論文用幀間二階差分SODP與邊緣檢測相結(jié)合進行運動目標(biāo)分割方法進行了詳細(xì)介紹，并利用相關(guān)視頻圖像對幾種方法進行了性能分析比較。231相鄰幀間差方法相鄰幀差法又稱為圖像序列差分法、幀間差法，當(dāng)監(jiān)控場景中出現(xiàn)運動目標(biāo)時，幀與幀圖像之間會出現(xiàn)比較明顯的差別，兩幀相減，得到兩幀圖像亮度差的絕對值，判斷它是否大于閾值來分析視頻或圖像序列的運動特性，確定圖像序列中有無運動的目標(biāo)，對圖像序列逐幀進行差分，相當(dāng)于對圖像序列進行時域上的高通濾波。當(dāng)前有很多研究者在幀間差上進行了改進21，這里本文從最基本的相鄰幀差法進行介紹和分析。其表達公式如下GI，F(xiàn)。以J，戶K“Y一?！癥L26一1盞GT,_LX,Y口丘熙卜1O，12判斷該圓參數(shù)C與其他圓參數(shù)CC，巴，C。I的相似度。若與其它圓相似，C不為新出現(xiàn)的圓參數(shù)，若幣相似E為新圓，加入C，重復(fù)2、3進基于視頻圖像的運動目標(biāo)檢測與跟蹤算法研究行下一曲線段厶。檢測。若進行最B乘法不能使擬合的圓參數(shù)與從厶1FS功計算的圓參數(shù)配準(zhǔn)，則仍從厶1IS刀開始，重復(fù)2、3。4若IN，則當(dāng)前區(qū)域冠內(nèi)圓檢測結(jié)束，同時保存單元集C。對當(dāng)前圖像中運動區(qū)域窗口序列形中所有其它區(qū)域的邊緣圖像重復(fù)1、2、3步操作進行處理。5若當(dāng)前圖像中所有投影區(qū)域檢測結(jié)束，輸出單元集C中所有的圓參數(shù)，同時進行下一幀圖像的處理，重復(fù)15操作。35實驗結(jié)果與分析本文對不同光照和場合下的圖像序列進行了測試，結(jié)果表明該方法在人體遮擋較嚴(yán)重的情況下，若目標(biāo)的頭部沒有被其他運動目標(biāo)長時間的遮擋，可以準(zhǔn)確的對頭部進行檢測識別。351檢測結(jié)果在實驗中，視頻圖像序列中各個參數(shù)取值分別為K30，三22，以70，P倒L，圖34為四組視頻圖像序列的頭部圓檢測定位結(jié)果，藍框為初步檢測到的運動區(qū)域，紅色的圓代表在藍框運動區(qū)域內(nèi)檢測到的頭部位置和大小。大連理工大學(xué)碩士學(xué)位論文視顫1983視頻卜I462視頻卜1572桃額2126FI罔34頭部定位結(jié)果FIG34TILERESU虹OFHEADLOCALIZATION352實驗分析本文在PC機24G，256M上進行丁實驗，對不同視頻圖像FLO000幀進行了測試，結(jié)果表明該算法對身體運動邊緣的T擾有一定的抑制作用，具有較高的檢測速度和正確率。當(dāng)人體的頭部尺寸相對較小時，檢測和定位的速度能達到每秒18幀，可以達基于視額圖像的運動目標(biāo)檢測與跟蹤算法研究到實時的效果，由十RANSAC算法本身參數(shù)較多現(xiàn)在參數(shù)基本依據(jù)大量實驗來定參數(shù)不能白適應(yīng)化，這是將來研究的個力向。叫毒劐罔35誤檢情況示意圖FIG35LLLMTRATIONOFEORDETECTION當(dāng)人體其他部分的運動邊緣輪廓較清晰且近似圓形時，如肩膀與頭部輪廓具有很大的相似性時，人體的肩部被誤判為頭部，會造成了誤檢如圖35A所示當(dāng)頭部顏色信息與周|背景較相似時，幀問差會失去頭部輪廓，造成漏檢，如圖35B1。為了減小這種誤檢率的發(fā)生，可以對圖像采取別的處理辦法消除干擾，同時加入別的特征提取H標(biāo)頭部，這也是本文令后的努力方向。36小結(jié)運動11標(biāo)的定位與分割足計算機智能視頻監(jiān)控的一個基礎(chǔ)環(huán)節(jié)，也是計算機視覺的一個主要部分和研究熱點。本章在對FREEMAN鏈碼和RANSAC算法理論知識研究的基礎(chǔ)上，針對每個運動區(qū)域內(nèi)人體頭部運動信息的邊緣輪廓具有近圓形圓弧的關(guān)鍵特征，采用丁融臺鏈碼和RANSAC算法的J種頭部檢測定位方法。該算法能較快速的對多個人體頭部進行定位，從而較好地定位M多人體目標(biāo)，達到了比較好的檢測效果。大連理工大學(xué)碩士學(xué)位論文4KAIMAN濾波器和MEANSHIFT相關(guān)理論及其在跟蹤中的應(yīng)用41引言運動目標(biāo)跟蹤是近期視覺領(lǐng)域內(nèi)一個備受關(guān)注的課題，它是在視頻圖像序列的每一幀圖像中確定出我們感興趣的運動目標(biāo)的位置，來實現(xiàn)目標(biāo)的跟蹤。在機器視覺研究領(lǐng)域里，隨著技術(shù)不斷發(fā)展，自動目標(biāo)跟蹤越來越受到研究者的重視，具有廣闊的應(yīng)用前景。運動目標(biāo)的跟蹤在醫(yī)學(xué)研究、視頻監(jiān)控、交通流量觀測監(jiān)控等很多領(lǐng)域都有重要的實用價值。跟蹤的難點在于如何快速而準(zhǔn)確的在每一幀圖像中實現(xiàn)目標(biāo)定位。目標(biāo)跟蹤技術(shù)在二戰(zhàn)之前就已經(jīng)在軍事上得到應(yīng)用，1937年世界上出現(xiàn)第一部跟蹤雷達站SCR28。之后，隨著科技的進步，各種跟蹤系統(tǒng)的相繼出現(xiàn)與不斷完善，跟蹤理論和方法在各國學(xué)者的努力下也獲得了很大的發(fā)展。1955年WAX提出了多目標(biāo)跟蹤的基本概念，目標(biāo)跟蹤研究有了一定的發(fā)展。但直到70年代，卡爾曼濾波理論【4L】被成功地應(yīng)用在目標(biāo)跟蹤領(lǐng)域【42】之后，目標(biāo)跟蹤技術(shù)才真正引起人們的普遍關(guān)注和極大興趣。近二十年來，研究學(xué)者在此領(lǐng)域進行了大量的研究，同時隨著其它新技術(shù)的出現(xiàn)，比如擴展卡爾曼濾波EXTENDEDKALMANFILTER、粒子濾波PARTICLEFILTER、均值遷移MEANSHILL、多模型、多速率處理等技術(shù)，結(jié)合這些技術(shù)提出了許多方法，取得了長足的進步。就跟蹤的方法而言，目標(biāo)的跟蹤主要包括基于運動MOTIONBASED和基于模型MODELBASED這兩種方法。美國卡內(nèi)基一梅隆大學(xué)研究開發(fā)的“實時視頻中動目標(biāo)識別分類與跟蹤系統(tǒng)”MOVINGTARGETCLASSIFICATIONANDTRACKINGFROMREALTIMEVIDEO就采用了基于模型和運動相結(jié)合的方法對視頻中的目標(biāo)實時監(jiān)控與跟蹤，并識別兩種目標(biāo)人和汽車【431。本章的研究內(nèi)容是典型視頻監(jiān)控系統(tǒng)中的多運動目標(biāo)跟蹤，是建立在第三章的多人體目標(biāo)定位基礎(chǔ)上完成的，首先對描述運動目標(biāo)的紋理特征進行了介紹，然后重點對MEANSHIFT理論及其在跟蹤中的應(yīng)用進行了論述，最后給出了一種融合目標(biāo)顏色、紋理和運動信息的改進的KALMAN和MEANSHIFT跟蹤方法。在現(xiàn)有的目標(biāo)跟蹤方法中，有一種算法建立在魯棒統(tǒng)計與概率分析基礎(chǔ)之上的MEANSHIFT算法。這種算法通過非參數(shù)估計，沿著圖像梯度方向查找運動目標(biāo)的概率分布，從而在視頻圖像中跟蹤目標(biāo)。該算法要選擇上一次確定的目標(biāo)位置結(jié)果作為當(dāng)前幀圖像中目標(biāo)的初始位置，本文就利用本算法來實現(xiàn)對運動目標(biāo)的跟蹤?；谝曨l圖像的運動目標(biāo)檢測與跟蹤算法研究42紋理特征局部二進制模式LBPLOCALBINARYPATTERN是近年來提出的一種基于灰度圖像有效的紋理描述方法，它是通過比較圖像中每個像素與其鄰域內(nèi)像素灰度值的大小，并利用二進制模式表示的比較結(jié)果來描述圖像的紋理。近年來LBP紋理在人臉識別、表情識別以及背景建模等計算機視覺應(yīng)用領(lǐng)域中表現(xiàn)出良好的性能，但在運動目標(biāo)跟蹤方面的應(yīng)用剛剛起步，QUANG等洲提出了利用圖像灰度值和LBP對單色熱度視頻進行跟蹤的算法，對單色的視頻圖像序列達到較好跟蹤效果。王永忠等【451提出基于LBP紋理特征的紅外成像目標(biāo)跟蹤方法，將LBP紋理特征集成到核跟蹤方法中，構(gòu)造目標(biāo)及候選目標(biāo)的特征模型，利用MEANSHIFT方法實現(xiàn)基于紋理特征的紅外成像目標(biāo)的跟蹤。寧紀(jì)鋒和吳成柯提出用LBP；紋理模型中表示邊界和角的5種基本模式表示目標(biāo)，并將之成功嵌入MEANSHIFT算法進行目標(biāo)跟蹤。紋理特征不僅能充分表達圖像的紋理，而且算法具有復(fù)雜度低、計算速度快和一定程度上不受光照變化的影響等良好特性，越來越受到目標(biāo)跟蹤研究領(lǐng)域研究者的重視。421基本局部二進制模式LBP算子是由OJALA等人于1996年提出的M，最初被稱為基本的LBP算子。對圖像中的每個像素，通過計算以其為中心的33鄰域內(nèi)各像素和中心像素的大小關(guān)系，把像素的灰度值轉(zhuǎn)化為一個八位二進制序列。對，處灰度值為Q的像素，它的LBP值為8腳五GAJA，X2H41JLAJ為XJ八鄰域像素集中索引為J，1，2，8的像素灰度值，GAJQ是一個函數(shù)定義為ILI7R口，一Q0G巳一島210D如M洫42大連理工大學(xué)碩士學(xué)位論文進制垮弼為，I1010011H閼踟羝2LL圖41基本LBP算子FIG41BASICLBPOPERATOR具體計算過程如圖41所示，對于圖像的任意一點厶，其LBP特征計算為，以露為中心，取與厶相鄰的8個點，按照順時針的方向記為而，五，易；以厶點的象素值為閾值，如果五點的象素值小于厶，則五被二值化為0，否則為L；將序列看成一個8位二進制數(shù)，將該二進制數(shù)轉(zhuǎn)化為十進制就可得到厶點處LBP算子的值。422擴展局部二進制模模式基本的LBP算子只局限在33的鄰域內(nèi)，對于較大圖像大尺度的結(jié)構(gòu)不能很好的提取需要的紋理特征，因此研究者們對LBP算子進行了擴展【48】。新的LBP算子三碑?？梢杂嬎悴煌霃洁徲虼笮『筒煌袼攸c數(shù)的特征值，其中P表示周圍像素點個數(shù)，R表示鄰域半徑，同時把原來的方形鄰域擴展到了圓

人人文庫> 全部分類> 畢業(yè)設(shè)計 > 畢業(yè)論文

溫馨提示

1. 本站所有資源如無特殊說明，都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請下載最新的WinRAR軟件解壓。
2. 本站的文檔不包含任何第三方提供的附件圖紙等，如果需要附件，請聯(lián)系上傳者。文件的所有權(quán)益歸上傳用戶所有。
3. 本站RAR壓縮包中若帶圖紙，網(wǎng)頁內(nèi)容里面會有圖紙預(yù)覽，若沒有圖紙預(yù)覽就沒有圖紙。
4. 未經(jīng)權(quán)益所有人同意不得將文件中的內(nèi)容挪作商業(yè)或盈利用途。
5. 人人文庫網(wǎng)僅提供信息存儲空間，僅對用戶上傳內(nèi)容的表現(xiàn)方式做保護處理，對用戶上傳分享的文檔內(nèi)容本身不做任何修改或編輯，并不能對任何下載內(nèi)容負(fù)責(zé)。
6. 下載文件中如有侵權(quán)或不適當(dāng)內(nèi)容，請與我們聯(lián)系，我們立即糾正。
7. 本站不保證下載資源的準(zhǔn)確性、安全性和完整性, 同時也不承擔(dān)用戶因使用這些下載資源對自己和他人造成任何形式的傷害或損失。

[碩士論文精品]圖像的運動目標(biāo)檢測與跟蹤算法研究

文檔簡介

溫馨提示

最新文檔

評論

[碩士論文精品]圖像的運動目標(biāo)檢測與跟蹤算法研究

文檔簡介

溫馨提示

最新文檔

評論

相關(guān)文檔