視頻中的行人檢測(新)_第1頁
視頻中的行人檢測(新)_第2頁
視頻中的行人檢測(新)_第3頁
視頻中的行人檢測(新)_第4頁
視頻中的行人檢測(新)_第5頁
已閱讀5頁,還剩18頁未讀, 繼續(xù)免費閱讀

下載本文檔

版權(quán)說明:本文檔由用戶提供并上傳,收益歸屬內(nèi)容提供方,若內(nèi)容存在侵權(quán),請進(jìn)行舉報或認(rèn)領(lǐng)

文檔簡介

1、山東建筑大學(xué)課 程 設(shè) 計 說 明 書題 目: 視頻監(jiān)控中行人的檢測課 程: 數(shù)字圖像處理課程設(shè)計院 (部): 信息與電氣工程學(xué)院專 業(yè): 電子信息工程班 級: 電信111學(xué)生姓名: 學(xué) 號: 指導(dǎo)教師: 完成日期: 山東建筑大學(xué)課程設(shè)計說明書目 錄摘 要II一、緒論11.1 研究背景與意義11.2 智能視頻監(jiān)控概述21.2.1 智能視頻監(jiān)控的發(fā)展21.2.2 智能視頻監(jiān)控的研究內(nèi)容31.3 行人檢測與跟蹤31.3.1 行人檢測31.3.2 行人跟蹤4二、設(shè)計原理52.1 圖像處理基礎(chǔ)52.1.1 顏色空間52.1.2 圖像預(yù)處理72.1.3 形態(tài)學(xué)方法72.2 運動目標(biāo)檢測方法82.2.1

2、背景差分法82.2.2光流法92.2.3邊緣檢測方法102.4 本章小結(jié)10三、設(shè)計內(nèi)容113.1背景減法運動目標(biāo)檢測113.2閾值的選取113.3形態(tài)學(xué)濾波123.4設(shè)計方案流程圖14四、實驗結(jié)果分析及總結(jié)164.1試驗結(jié)果164.2實驗結(jié)果分析16五、參考文獻(xiàn)17致謝18附錄19摘 要智能視頻監(jiān)控是計算機視覺領(lǐng)域新興的研究方向,它通過對攝像機拍攝的視頻圖像序列進(jìn)行自動分析來對被監(jiān)控場景中的事物變化進(jìn)行定位、跟蹤和識別,并以此對相關(guān)目標(biāo)的行為進(jìn)行分析和判別,在實現(xiàn)了日常管理工作的同時又能對目標(biāo)的異常行為做出及時反應(yīng)。行人目標(biāo)檢測與跟蹤算法是智能視頻監(jiān)控系統(tǒng)中的核心問題,研究相關(guān)算法對于提高智

3、能視頻監(jiān)控系統(tǒng)的性能具有重要的意義。本文在熟悉和掌握了有關(guān)數(shù)字圖像處理原理和技術(shù)的基礎(chǔ)上,分析對比了常用的目標(biāo)檢測和跟蹤方法,針對不同條件下的行人目標(biāo)檢測和跟蹤進(jìn)行了研究。本文完成的主要研究工作是對監(jiān)控視頻中行人目標(biāo)的檢測,為以后的行人跟蹤和行人行為的分析打下基礎(chǔ)。本設(shè)計以Matlab為平臺,利用背景減法,和形態(tài)學(xué)濾波的方法檢測視頻中的行人。實驗結(jié)果表明,本模塊能夠檢測一般靜態(tài)背景條件下的行人目標(biāo),滿足了實際應(yīng)用的初步要求。關(guān)鍵詞:視頻監(jiān)控、行人檢測、背景減法、形態(tài)學(xué)濾波II一、緒論1.1 研究背景與意義近年來,計算機視覺領(lǐng)域飛速發(fā)展。俗話說:“百聞不如一見”,人類從外界獲得的信息中80是通過

4、視覺得到的,所以人類渴望讓機器(如計算機)擁有視覺并自動對看到的行為進(jìn)行分析。隨著這一領(lǐng)域的不斷進(jìn)步,人們開始把研究成果運用到民生安全、醫(yī)療診斷、文檔分析、天文氣象、制造業(yè)等方面,逐步形成智能視頻監(jiān)控、人體運動分析、神經(jīng)生物學(xué)、高級感知接口等熱門研究課題。智能視頻監(jiān)控的核心內(nèi)容是智能識別算法,包括運動檢測、目標(biāo)分類、目標(biāo)跟蹤、行為分析四部分。對行人快速而準(zhǔn)確的檢測和跟蹤屬于智能視頻監(jiān)控系統(tǒng)的前端工作,會直接影響后續(xù)工作以至整個系統(tǒng)的性能。具體來說,它是指在一段視頻圖像序列中自動的檢測出用戶感興趣的目標(biāo),并且在后續(xù)的序列中持續(xù)對該目標(biāo)進(jìn)行定位的過程。智能視頻監(jiān)控中的行人檢測和跟蹤技術(shù)可應(yīng)用到眾多

5、領(lǐng)域:(1)智能交通:隨著城市化陣容的擴(kuò)大,提高交通系統(tǒng)的智能化運作、管理等能力已經(jīng)變成管理人員的重要任務(wù),同時,也給計算機視覺、人工智能等研究領(lǐng)域提供了一個重大發(fā)展機遇。我們可采用智能算法自動對監(jiān)控視頻中的車輛進(jìn)行檢測和跟蹤,并根據(jù)需要計算車輛行駛速度、車輛位置信息等,從而及時對交通道路上的違章行為或交通事故進(jìn)行自動檢測并報警。(2)民用監(jiān)控16J:主要針對于銀行、公園、居民區(qū)、廣場、大型購物超市、儲物倉庫等高安全要求的場合地點。在民生安全、民生監(jiān)控等方面使用行人的檢測和跟蹤技術(shù)實時地檢測行人,并后續(xù)分析大規(guī)模搶劫、聚集、盜竊等異常行為。因為行人是很多監(jiān)控場景中的主要目標(biāo),所以對行人的檢測和

6、跟蹤得到了研究人員的密切關(guān)注。(3)智能家庭:主要針對私人家庭中,借助行人檢測、跟蹤、面部識別等技術(shù),自動感知家庭區(qū)域中人體的存在,繼而分析檢測到的目標(biāo)行為。當(dāng)家中有老人不小心摔倒或發(fā)生其他意外時,系統(tǒng)能自動撥打已經(jīng)存入的電話號碼通知家人及時施救;或者當(dāng)家人外出時有外人突然闖入,系統(tǒng)能自動報警通知相關(guān)人員采取措施。綜上,智能視頻監(jiān)控系統(tǒng)憑借其強大的智能性、全天候性,不僅減少了監(jiān)控人員的勞動量,而且提高了危險時報警的速度和準(zhǔn)確度,正被逐步應(yīng)用于交通、園區(qū)、商場、酒店、銀行、儲物倉庫等高安全要求的場合地點。而視頻中行人的檢測則是只能視頻監(jiān)控的基礎(chǔ),本文主要論述靜止背景下行人目標(biāo)的檢測。1.2 智能

7、視頻監(jiān)控概述1.2.1 智能視頻監(jiān)控的發(fā)展智能視頻監(jiān)控是在傳統(tǒng)的視頻監(jiān)控基礎(chǔ)上發(fā)展起來的。傳統(tǒng)的視頻監(jiān)控自投入應(yīng)用已有數(shù)十年,其發(fā)展經(jīng)歷了三個時代。第一代:模擬時代。上個世紀(jì)末以前,初始的視頻監(jiān)控以模擬式磁帶錄像機為代表。此時的視頻監(jiān)控存儲量大,信息檢索和查詢相對困難。第二代:數(shù)字時代。進(jìn)入 21 世紀(jì)后,隨著數(shù)字視頻壓縮編碼技術(shù)的產(chǎn)生和發(fā)展,數(shù)字式視頻錄像機投入使用。數(shù)字化存儲極大增強了對視頻信息的處理效率,事后的信息檢索也變得相對簡單。第三代:網(wǎng)絡(luò)時代。從 2004 年開始,隨著網(wǎng)絡(luò)帶寬的提高和成本的降低、硬盤容量的加大和中心存儲成本的降低,以及各種實用視頻處理技術(shù)的出現(xiàn),視頻監(jiān)控步入了全

8、數(shù)字化的網(wǎng)絡(luò)時代,DVR 系統(tǒng)進(jìn)一步發(fā)展為網(wǎng)絡(luò)數(shù)字視頻錄像機,實現(xiàn)了視頻信息的數(shù)字化網(wǎng)絡(luò)傳播。更進(jìn)一步,發(fā)展成為了網(wǎng)絡(luò)化視頻監(jiān)控系統(tǒng),又稱 IP 監(jiān)控系統(tǒng)。網(wǎng)絡(luò)化視頻監(jiān)控系統(tǒng)基于 TCP/IP 協(xié)議,采用開放式架構(gòu),其視頻信息從攝像機或網(wǎng)絡(luò)視頻服務(wù)器下來就直接進(jìn)入網(wǎng)絡(luò),以數(shù)字視頻的壓縮、傳輸、存儲和播放為基礎(chǔ),通過強大的平臺軟件實施管理。視頻監(jiān)控系統(tǒng)在系統(tǒng)功能和設(shè)備性能上得到了很大的提高,但是仍然受到了一些固有因素的限制,整個系統(tǒng)在安全性和實用性方面難以滿足人們不斷提高的要求。具體的制約因素如下:(1)人類自身的弱點。很多情況下,由于生理上的弱點,人們經(jīng)常無法覺察安全威脅,從而產(chǎn)生了漏報的現(xiàn)象

9、。(2)監(jiān)控時間。大多數(shù)視頻監(jiān)控系統(tǒng)難以按照 1:1 的比例來配置監(jiān)控攝像機和視頻顯示裝置,尤其是在機場、港灣等大型的視頻監(jiān)控系統(tǒng)中,各個監(jiān)控點很難都處于監(jiān)控之下。(3)誤報和漏報。這是視頻監(jiān)控系統(tǒng)中最常見的兩大問題,誤報會浪費人力物力,漏報可能會導(dǎo)致非常危險的后果發(fā)生。這兩種情況都會大大降低人們的信任,進(jìn)而降低監(jiān)控系統(tǒng)的應(yīng)用價值。(4)數(shù)據(jù)分析困難。傳統(tǒng)的視頻監(jiān)控系統(tǒng)缺乏智能因素,錄像數(shù)據(jù)無法被有效地分類存儲,更毋論其他的智能處理,因此數(shù)據(jù)分析工作要耗費相當(dāng)多的時間。而經(jīng)常發(fā)生的誤報漏報現(xiàn)象也造成了無用數(shù)據(jù)的進(jìn)一步增加,帶來更大的困難。(5)響應(yīng)時間長。對于安全威脅的響應(yīng)速度直接關(guān)系到一個安

10、全系統(tǒng)的整體性能。傳統(tǒng)的視頻監(jiān)控系統(tǒng)通常由人來對威脅做出響應(yīng)和處理,而實際處理問題時,往往同時涉及到多個功能部分,需要多個相關(guān)部門的協(xié)調(diào)配合,共同處理,因而對響應(yīng)時間有了更高的要求。為了解決上述導(dǎo)致視頻監(jiān)控系統(tǒng)效率低下的問題,人們把計算機視覺的相關(guān)技術(shù)引入視頻監(jiān)控中,從而發(fā)展起新型的視頻監(jiān)控技術(shù)智能視頻監(jiān)控,也稱自動視頻監(jiān)控,在視頻監(jiān)控系統(tǒng)中處于核心地位,對于整個系統(tǒng)的效率提高具有重要意義。1.2.2 智能視頻監(jiān)控的研究內(nèi)容智能視頻監(jiān)控的研究內(nèi)容包括運動目標(biāo)檢測、運動目標(biāo)跟蹤以及對監(jiān)視場景中目標(biāo)行為的理解與描述,目標(biāo)檢測、目標(biāo)分類、目標(biāo)識別是視頻處理中的基礎(chǔ)部分,而行為分析和理解則屬于更高級的

11、處理分析部分。運動檢測、目標(biāo)分類和目標(biāo)跟蹤是研究者們關(guān)心最多的三個基本問題;而行為分析與理解因為跟應(yīng)用直接相關(guān),所以近些年成為被廣泛關(guān)注的熱點問題。1.3 行人檢測與跟蹤視頻監(jiān)控場景中行人是監(jiān)控的主要對象,因此對行人的檢測和跟蹤是一個至關(guān)重要的問題,這屬于智能視頻監(jiān)控系統(tǒng)的底層工作,其性能好壞將直接影響后續(xù)工作乃至整個系統(tǒng)的性能。1.3.1 行人檢測行人檢測就是把視頻圖像中的行人目標(biāo)從背景中分割出來并精確定位。基于視覺的行人檢測目前仍舊是計算機視覺領(lǐng)域的一個公認(rèn)的難題。原因在于:行人同背景混合在一起,行人可能走,也有可能站著或者不可預(yù)測地改變運動方向;行人所處的背景非常復(fù)雜,特別是當(dāng)視覺系統(tǒng)基

12、于運動云臺上的攝像系統(tǒng)時,背景的突然改變不可避免。到目前為止,一些人體檢測系統(tǒng)在某些約束環(huán)境中被證明能有效地檢測行人,從而鼓舞了研究人員開展進(jìn)一步的研究工作。行人的衣著、運動姿態(tài)、光照存在著很大的差異,并且存在背景復(fù)雜、遮擋和其它運動物體的干擾,這些因素是行人檢測要解決的重點問題。1.3.2 行人跟蹤行人跟蹤監(jiān)視人體在視頻中的空間和時間變化,包括人體的出現(xiàn)、位置變化、大小信息、形狀等,在連續(xù)幀上匹配目標(biāo)區(qū)域,求解時間上的對應(yīng)問題?;谝曈X的人體跟蹤一般從人體檢測開始,而且在后繼的視頻序列中需要不斷地檢測人體以校驗跟蹤和維持跟蹤連續(xù)進(jìn)行,它是人體的姿態(tài)估計和活動識別的基礎(chǔ)。跟蹤過程根據(jù)應(yīng)用場景中

13、的目標(biāo)數(shù)目分為單目標(biāo)和多目標(biāo)。場景中目標(biāo)數(shù)目的不同,跟蹤的難易程度不同,所采用的技術(shù)也不同。二、設(shè)計原理智能視頻監(jiān)控中的行人檢測與跟蹤方法涉及到很多研究領(lǐng)域,如數(shù)字圖像處理、計算機視覺、信息融合、模式識別與人工智能等。為了后續(xù)各章內(nèi)容的展開,本章系統(tǒng)地介紹相關(guān)的一些預(yù)備知識和常用的目標(biāo)檢測與跟蹤方法。2.1 圖像處理基礎(chǔ)數(shù)字圖像處理涉及的領(lǐng)域相當(dāng)廣泛,其各種理論算法、技術(shù)應(yīng)用更是不勝枚舉。篇幅起見,本節(jié)僅簡要介紹相關(guān)的顏色空間、圖像預(yù)處理和形態(tài)學(xué)方法等內(nèi)容。2.1.1 顏色空間顏色空間也稱彩色模型,又稱彩色空間或彩色系統(tǒng),它的用途是在某些標(biāo)準(zhǔn)下用通??山邮艿姆绞綄Σ噬右哉f明。本質(zhì)上,彩色模型

14、是坐標(biāo)系統(tǒng)和子空間的闡述,位于系統(tǒng)的每種顏色都由單個點表示。顏色空間從提出到現(xiàn)在已經(jīng)有上百種,大部分只是局部的改變或?qū)S糜谀骋活I(lǐng)域,現(xiàn)在采用的大多數(shù)顏色模型都是面向硬件或面向應(yīng)用的。數(shù)字圖像處理中常用的是 RGB、HSI和 HSV模型。(1)RGB 彩色模型RGB 彩色模型是工業(yè)界最為常見的顏色模型,它也是人們最為熟悉常見的顏色模型。它以紅、綠、藍(lán)為原色,建立三維直角坐標(biāo)系,通過混合各個原色以產(chǎn)生各種復(fù)合色彩。通過對紅、綠、藍(lán)三種顏色施加變化以及疊加可以得到各種顏色。RGB 即是代表紅、綠、藍(lán)三種色彩組成的顏色空間,這一顏色空間幾乎包括人類能感知的所有顏色,因而應(yīng)用最為廣泛。RGB 顏色空間的

15、設(shè)計是以顏色發(fā)光為原理的,簡單理解其顏色混合方式就好像有紅、綠、藍(lán)三盞不同顏色的彩燈,當(dāng)三盞燈的光相互混合的時候,其色彩相混,而亮度等于三者總和,也即滿足加法混合。知道其原理后,在很多圖像處理軟件中進(jìn)行的 RGB 顏色設(shè)定就很容易理解了。圖 2-1 形象地顯示了 RGB 顏色空間。圖 21 RGB顏色空間(2)HSV 模型RGB 和 CMY 彩色模型對硬件實現(xiàn)很理想,另外它同人眼對紅、綠、藍(lán)三原色的強烈感覺相匹配,但是這一模型不能很好地解釋實際的顏色。觀察一個彩色物體時,人們用色調(diào)、色飽和度和強度來描述它,相比較而言,HSV 顏色模型是面向用戶的,該模型對應(yīng)于圓柱坐標(biāo)系的一個圓錐形子集。色調(diào)

16、H:與光波的波長有關(guān),它表示人的感官對不同顏色的感受,如紅色、綠色、藍(lán)色等,它也可表示一定范圍的顏色,如暖色、冷色等。飽和度 S:表示顏色的純度,純光譜色是完全飽和的,加入白光會稀釋飽和度。飽和度越大,顏色看起來就會越鮮艷,反之亦然。強度 V:對應(yīng)成像亮度和圖像灰度,是顏色的明亮程度。HSV 顏色空間如圖 2-2 所示,其空間模型為一個圓錐。圓錐的頂面對應(yīng)的強度 V 為 1,代表最亮的顏色。繞 V 軸的旋轉(zhuǎn)角代表色彩 H,紅、黃、藍(lán)分別對應(yīng)于 0、120、240。在這一顏色模型中,每一種顏色和其補色相差 180。由圓心向圓周移動時,飽和度 S 的取值從 0 變化到 1。由于 HSV 顏色模型所

17、代表的顏色域是屬于 CIE 色度圖的一個子集,所以其最大飽和度的顏色的純度值并不到 100。在下方的圓錐頂點處,V 為 0,H 和 S 無定義,代表黑色。圓錐頂面中心處 S 為 0,V 為 1,H 無定義,代表白色,從該點到頂點代表亮度漸暗的白色,即不同灰度的白色。所有 V、 S 都為 1 的顏色都是純色。圖 22 HSV 彩色空間HSV 顏色模型類似畫家配色時采用的方法。而畫家常通過改變色深和色濃來從純色中得到各種色調(diào)的顏色。具體做法為:在純色中加入黑色可以改變色深,加入白色可以改變色濃,同時加入一定比例的黑色、白色即可得到某種色調(diào)的顏色。(3)顏色空間變換顏色空間變換可以分為從 RGB 到

18、 HSV 轉(zhuǎn)換以及從 HSV 到 RGB 的轉(zhuǎn)換兩種。從 RGB 到 HSV 轉(zhuǎn)換時,設(shè)(r,g,b)分別是一個顏色的紅、綠和藍(lán)坐標(biāo),它們的值是 0 到 1 之間的實數(shù)。設(shè) max 等價于 r,g 和 b 中的最大者。設(shè) min 等于這些值中的最小者。要找到在 HSL 空間中的(h,s,v)值,這里的 h0,360)是角度的色相角,而 s,v0,1是飽和度和亮度。2.1.2 圖像預(yù)處理常用的圖像預(yù)處理過程都涉及到一些濾波的方法。由于圖像在拍攝過程中往往會由傳感器引入噪聲,因此需要在目標(biāo)分割前對圖像進(jìn)行預(yù)處理,來減除噪聲的干擾,增強目標(biāo)提取的效果。通常可采用低通濾波的方法來消除噪聲。低通濾波既可

19、在頻域進(jìn)行也可在時域進(jìn)行。常見的頻域低通濾波器有巴特沃茲低通濾波器和高斯低通濾波器。常見的空域低通濾波器主要有均值濾波器、加權(quán)均值濾波器和中值濾波器。2.1.3 形態(tài)學(xué)方法形態(tài)學(xué)原本代表的是生物學(xué)的一個學(xué)科,在這里介紹的是數(shù)學(xué)形態(tài)學(xué)。作為一種圖像處理工具,它被用于對圖像區(qū)域進(jìn)行處理,以提取對于表示和描述有用的圖像分量。下面要介紹的是圖像處理中常用到的膨脹和腐蝕,以及開操作和閉操作。2.2 運動目標(biāo)檢測方法運動目標(biāo)檢測是指將運動區(qū)域從視頻圖像中分割出來。運動目標(biāo)檢測從視頻圖像序列中檢測出運動目標(biāo),減小圖像處理計算量,得到所需的目標(biāo)信息,為后續(xù)的識別和跟蹤奠定基礎(chǔ)。由于運動目標(biāo)的正確檢測與否將直接

20、影響后續(xù)的目標(biāo)跟蹤與分類效果,所以它也成為智能視頻監(jiān)控系統(tǒng)相關(guān)技術(shù)中深受關(guān)注的研究重點。運動目標(biāo)檢測過程包括運動目標(biāo)檢測的預(yù)處理和運動目標(biāo)的分割兩大步。目前常用的運動目標(biāo)檢測方法有四種:背景差分法,光流法,邊緣檢測法等。2.2.1 背景差分法背景差分法簡單易于實現(xiàn),屬于最受青睞的運動目標(biāo)檢測方法之一。它的基本思想是采用一定方法獲取視頻中背景圖片并進(jìn)行背景更新,然后通過當(dāng)前幀與背景做差得到所加載視頻中的前景目標(biāo),具體步驟如圖2-3所示。圖 23 背景差分算法框圖該算法包括讀取視頻、圖像預(yù)處理、提取背景、背景差分、二值化和獲取前景圖片六部分組成。視頻采集包括攝像器材的選擇、光源的選擇等:圖像預(yù)處理

21、是按照獲取的視頻參數(shù),進(jìn)行圖像增強、濾波等操作來提高采集的視頻質(zhì)量;是否能提取完整、清晰的背景是該算法成敗的關(guān)鍵,目前背景建模的方法很多,常用的有非線性中值濾波法、線性卡爾曼濾波法、幀間差分法、高斯混合模型等,但因一天中環(huán)境光照的變化、背景的多態(tài)性、運動目標(biāo)自身的投影等原因,一般建模后的背景并非十分干凈清晰,這也是目前研究中的一個難點。背景差分是用當(dāng)前幀減去背景來獲取視頻中的運動目標(biāo),定義為視頻中第k幀圖片,B為背景圖片,E為差分獲取的前景圖片,即背景差分為: (公式2-1) (公式2-2) 為了增強算法的抗噪聲性,我們設(shè)置一個合適閾值對前景圖片進(jìn)行二值化處理,即:其中,為二值化后獲取的最終前

22、景圖片,后續(xù)的邊緣檢測、行人識別和跟蹤等操作均是對該圖像進(jìn)行處理。綜述所述,該方法具有較好實時性,也能提取出較完整的背景圖片,但對背景的依賴性太強,這使得在背景變化較大的場景中,該方法準(zhǔn)確性很低、近乎失效,而且該缺點是背景差分法本身的局限性,很難找到較好的改善方法。2.2.2光流法物體運動時其表面像素點的亮度也隨之運動,在視頻圖像中表現(xiàn)為光流,對應(yīng)圖像中產(chǎn)生的瞬時速度場就是光流場。從光流中可以獲得物體形狀結(jié)構(gòu)和運動狀態(tài)信息。通常情況下,鏡頭運動、目標(biāo)運動或二者的共同運動都會產(chǎn)生光流。光流的常用計算方法有兩種:基于梯度的方法和基于匹配的方法。(1)基于梯度的方法梯度可以用于光流計算,由于其更為簡

23、單的計算過程和相對較好的實驗結(jié)果,這類方法得到了廣泛的應(yīng)用。但由于受到可調(diào)參數(shù)、可靠性評價因子和預(yù)處理方法等因素的影響,在應(yīng)用光流對目標(biāo)進(jìn)行檢測與自動跟蹤時仍存在很多問題。(2)基于匹配的方法這類方法主要采用基于區(qū)域的和基于特征的兩種匹配方法?;谔卣鞯钠ヅ浞椒ㄐ枰粩嗟孬@取目標(biāo)特征對其進(jìn)行檢測和跟蹤,對較大目標(biāo)的運動和亮度變化比較敏感,但是得到的光流往往很稀疏,而且目標(biāo)的特征提取與匹配也有相當(dāng)難度;基于區(qū)域的匹配方法需要先定位相似區(qū)域的位置,然后通過相似區(qū)域和初始區(qū)域的比較來計算光流,基于區(qū)域的方法在網(wǎng)絡(luò)視頻傳輸編碼中得到了大量運用,但其計算中的光流仍然稀疏。光流法能夠獨立檢測運動目標(biāo),而不

24、需要場景的預(yù)設(shè)信息,并且能夠檢測動態(tài)場景下的運動情況。由于存在噪聲干擾、光源分布、光照陰影、物體遮擋等因素,計算得到光流場分布的準(zhǔn)確性易受影響;并且光流法的計算過程相對復(fù)雜、耗時更長,如果沒有專業(yè)硬件支持加速,則難以實現(xiàn)實時的檢測。2.2.3邊緣檢測方法圖像的邊緣為圖像中灰度發(fā)生急劇變化的區(qū)域,邊界分為階躍狀和屋頂狀兩種類型。圖像的邊緣一般對應(yīng)一階導(dǎo)數(shù)較大,二階導(dǎo)數(shù)為零的點。常用到的邊緣檢測方法有 Robert 算子、Sobel 算子、Laplace 算子等。與相鄰幀差法和背景差分法比較,邊緣檢測方法有利于鄰近運動目標(biāo)的區(qū)分和運動目標(biāo)特征的提取,對背景噪聲的魯棒性很大,但其運算復(fù)雜度也相對較大

25、。運動圖像邊緣的檢測可以通過時間和空間上的差分來獲得,空間上的差分可以使用已有的各種邊緣檢測算法,時間上的差分可以通過計算連續(xù)幀的差來獲得,也可以通過計算當(dāng)前圖像與背景圖像的差分圖像,然后求其邊緣來計算。2.4 本章小結(jié)運動目標(biāo)檢測是智能視頻監(jiān)控的關(guān)鍵步驟,其運動跟蹤同樣要以運動目標(biāo)檢測為基礎(chǔ)。本章首先介紹了圖像處理相關(guān)的基礎(chǔ)知識,包括顏色空間、圖像預(yù)處理和形態(tài)學(xué)方法等;然后重點介紹了包括背景差分、光流法和邊緣檢測等的運動檢測方法,以及基于特征、基于模型、和基于主動輪廓等的運動檢測方法。本設(shè)計主要用背景差分的方法檢測視頻中的行人。三、設(shè)計內(nèi)容3.1背景減法運動目標(biāo)檢測背景差分算法的實質(zhì)是:實時

26、輸入的場景圖像與背景圖像進(jìn)行差分,可以較準(zhǔn)確的分割出運動目標(biāo)。但是背景差分算法也有其天然的缺陷,隨著時間的推移,場景的光線、樹葉的遮擋、或者運動物體滯留都會很大程度的破壞已經(jīng)建立好的背景圖像。為了解決這些問題,最好的方法便是使用背景建模和背景更新算法來彌補。前面已經(jīng)討論過相關(guān)問題,因此,本文假設(shè)背景處于理想情況下進(jìn)行背景差分算法的研究。設(shè)(x, y)是二維數(shù)字圖像的平面坐標(biāo),基于背景減法的二值化數(shù)學(xué)描述為: (公式2-3) (公式2-4) 表示圖像序列中當(dāng)前幀的灰度圖像,表示當(dāng)前幀背景的灰度圖像,表示相減后的二值化結(jié)果,表示對應(yīng)的相減后灰度圖像的閾值,選取固定閾值=15,基于背景減法的MATL

27、AB仿真。3.2閾值的選取分割閾值的選取雖看似簡單,但直接影響目標(biāo)的分割效果,閾值增大,雖然可以一定量的減少環(huán)境對效果的影響,但同時也會將差分結(jié)果中變化不明顯的區(qū)域作為前景被忽略掉;閾值減小,效果卻又恰恰相反。前面提到的相關(guān)算法中,閾值的選取都是采用的靜態(tài)固定閾值。這種閾值的選取方法在實際運用中是不可取的,因為在視頻監(jiān)控應(yīng)用中,監(jiān)控者不可能隨時對監(jiān)控質(zhì)量做出評估并相應(yīng)的修改閾值。所以,研究人員提出了許多閾值的選取方法。但是到目前為止還不存在一種通用的方法,也不存在一個判斷分割是否成功的客觀標(biāo)準(zhǔn)。閾值法可以分為全局閾值法和局部閾值法兩種。全局閾值法是指在在整幅圖像范圍內(nèi)用同一閾值來進(jìn)行二值化處理

28、的方法;局部閾值法是當(dāng)圖像中的敏感度不均勻,以慢斜率變化時,將圖像分割成幾個子塊。如果在每個子塊中可以找到最佳閾值,就稱這樣的閾值確定方法為局部閾值法。基本步驟如下:(1)選擇一個 的初始估計值(2)用分割圖像。這樣做會生成兩組像素:由所有灰度值大于的像素組成,而由所有灰度值小于或等于的像素組成。(3)對區(qū)域和中的所有像素計算平均灰度值 和。(4)按下式計算新的閾值。 (公式3-1)(5)重復(fù)步驟(2)到(4),直到逐次迭代所得到的值之差小于預(yù)先定義的參數(shù)。當(dāng)背景和對象在圖像中占據(jù)的面積相近時,好的的初始值就是圖像的平均灰度值。如果對象與背景所占的面積不相近時,則其中一個像素組合會在直方圖中占

29、主要地位,平均灰度值就不是好的初始選擇。此時,更合適的初值是諸如灰度值的中間值一類的初值。對車輛檢測進(jìn)行仿真時,由于車輛與背景面積相差較大,選用的初值就是最大灰度和最小灰度和的一半。進(jìn)行閾值計算時還應(yīng)注意迭代速度和精度的矛盾。在本設(shè)計中為了簡單采取全局閾值的方法進(jìn)行二值化。3.3形態(tài)學(xué)濾波由于刮風(fēng)、氣流等原因,背景中部分物體小幅度晃動;光線的變化等不確定因素,會使得視頻圖像產(chǎn)生大量噪聲,當(dāng)差值圖像二值化后,仍然有很多無用的噪聲斑點。因此,需要采用數(shù)學(xué)形態(tài)學(xué)方法,對分割后的二值圖像進(jìn)行形態(tài)學(xué)濾波。數(shù)學(xué)形態(tài)學(xué)的主要用途是獲取物體拓?fù)浜徒Y(jié)構(gòu)信息。它通過物體和機構(gòu)元素相互作用的某些運算,得到物體更本質(zhì)

30、的形態(tài)。其基本思想是:利用一個成為結(jié)構(gòu)元素的“探針”收集圖像信息。這種基于探測的思想與人的視覺特點有類似之處:總是關(guān)注一些感興趣的物體或者結(jié)構(gòu),并有意識地尋找圖像中的這些結(jié)構(gòu)。數(shù)字形態(tài)學(xué)在本文所涉及到的圖像處理中,主要作用包括利用形態(tài)學(xué)的基本運算,對圖像進(jìn)行觀察和處理,從而達(dá)到改善圖像質(zhì)量的目的。形態(tài)學(xué)的基本運算包括:腐蝕、膨脹、開和閉運算。用這些算子及其組合來進(jìn)行圖像形狀和結(jié)構(gòu)的分析及處理,包括圖像分割、特征提取、邊界檢測、圖像濾波、圖像增強與恢復(fù)等方面的工作。形態(tài)學(xué)一般以二值圖像為處理對象,但也可以用在某些灰度圖像的應(yīng)用中。(1)結(jié)構(gòu)元素結(jié)構(gòu)元素被形象的稱為刷子或探針,是膨脹和腐蝕操作中最

31、基本的組成部分。它用于測試輸入圖像,通常比待處理圖像小得多。本文使用55的結(jié)構(gòu)元素,經(jīng)開運算處理后,可提取出移動物體。二維結(jié)構(gòu)元素由一個數(shù)值為0或1矩陣組成。結(jié)構(gòu)元素的原點指定了圖像中需要處理的像素范圍,結(jié)構(gòu)元素數(shù)值為1的點決定結(jié)構(gòu)元素的領(lǐng)域像素在腐蝕或膨脹操作是需要參與計算。(2)腐蝕和膨脹腐蝕和膨脹是許多形態(tài)學(xué)算法的基礎(chǔ)。腐蝕操作會去掉物體的邊緣點,細(xì)小物體所有的點都會被認(rèn)為是邊緣點,因此會整個被刪去。再做膨脹時,留下來的大物體會變回原來的大小,而被刪除的小物體則永遠(yuǎn)消失了。膨脹操作會使物體的邊界向外擴(kuò)張,如果物體內(nèi)部存在小空洞的話,經(jīng)過膨脹操作這些洞將被補上,因而不再是邊界了。再進(jìn)行腐蝕

32、操作時,外部邊界將變回原來的樣子,而這些內(nèi)部空洞則永遠(yuǎn)消失了。通常設(shè)為圖像矩陣,為結(jié)構(gòu)元素矩陣,數(shù)學(xué)形態(tài)學(xué)運算時,用對進(jìn)行操作。實際上,結(jié)構(gòu)元素本身也是一個圖像矩陣。這里對每個結(jié)構(gòu)元素矩陣B指定一個原點。X被B腐蝕的定義為: (公式3-2)這個公式說明,使用B對X進(jìn)行腐蝕是所有B中包含于A中的點的集合用x移。圖3-1顯示了實際上的腐蝕運算,左邊是被處理的圖象X(二值圖象,針對的是黑點),中間是結(jié)構(gòu)元素B,那個標(biāo)有origin的點是中心點,即當(dāng)前處理元素的位置,右邊是腐蝕后的結(jié)果。可以看出,它仍在原來X的范圍內(nèi),且比X包含的點要少,就象X被腐蝕掉了一層。圖 31 腐蝕運算X被B膨脹的定義為: (

33、公式3-3)這個公式表示用B膨脹X的過程是,相對B做關(guān)于中心像素的映射,在將其映射平移x,這里X與B映像的交集不為空集。圖3-2顯示了實際上的膨脹運算,左邊是被處理的圖象X(二值圖象,針對的是黑點),中間是結(jié)構(gòu)元素B,右邊是膨脹后的結(jié)果??梢钥闯?,它包括X的所有范圍,就象X膨脹了一圈似的。圖 32 膨脹運算(3)開啟和閉合開啟就是相對圖像進(jìn)行腐蝕,然后膨脹其結(jié)果。閉合就是先對圖像進(jìn)行膨脹,然后腐蝕其結(jié)果。開啟一般使對象的輪廓變得光滑,斷開狹窄的間斷和消除細(xì)的突出物。閉合同樣使輪廓線變得光滑,但是開啟相反的是,它通常消除狹窄的間斷和長細(xì)的鴻溝,消除小的孔洞,并填補輪廓線中的斷裂開啟。使用結(jié)構(gòu)元素

34、B對集合X進(jìn)行開啟操作,表示為,定義為 : (公式3-4)使用結(jié)構(gòu)元素B對集合X進(jìn)行閉合操作,表示為,定義為: (公式3-5)3.4設(shè)計方案流程圖本文著重研究了利用背景減法進(jìn)行目標(biāo)檢測在Matlab中的實現(xiàn)方法。利用Matlab圖像處理功能來實現(xiàn)經(jīng)典的圖像處理方法,簡化了算法,達(dá)到了運動行人檢測目標(biāo)的預(yù)期效果。其具體流程圖如下圖4-1:圖3-3檢測過程 本文著重研究了利用背景減法進(jìn)行目標(biāo)檢測在Matlab中的實現(xiàn)方法。利用Matlab圖像處理功能來實現(xiàn)經(jīng)典的圖像處理方法,簡化了算法,達(dá)到了檢測目標(biāo)的預(yù)期效果,為后面的目標(biāo)跟蹤、目標(biāo)分類等奠定了基礎(chǔ)。本文經(jīng)過如圖3-3所示的流程能夠達(dá)到如圖4-1

35、所示的效果。四、實驗結(jié)果分析及總結(jié)4.1試驗結(jié)果如圖4-1圖4-1行人檢測結(jié)果4.2實驗結(jié)果分析通過上圖分析可得通過背景減法二值化后可得到如圖4-1(b)的圖。圖中有很多噪聲,通過形態(tài)學(xué)濾波后得到如(c)。從圖中可以清楚分辨出行人,并且濾波后可以明顯的將噪聲濾除。五、參考文獻(xiàn)1 孔曉東智能視頻監(jiān)控技術(shù)研究D上海:上海交通大學(xué),2008.2 虹數(shù)字圖像處理基礎(chǔ)M北京:科學(xué)出版社,2005.3 Gavrila D. The visual analysis cf human movemalt: A surveyJ.Compurer Vision and Image Understanding, 1999, 73(1):822984 常好麗運動行人檢測與跟蹤方法研究D 陜西:西北工業(yè)大學(xué),2006.5 常好麗,史忠科基于單目視覺的運動行人檢測與跟蹤方法J交通運輸工程學(xué)報,2006.6 何東健,耿楠,張義寬編著,數(shù)字圖像處理M西安:西安電子科技大學(xué)出版社,2008.57 岡薩雷斯數(shù)字圖像處理(MATLAB)中文版M北京:電子工業(yè)出版社,20078 劉志敏,揚杰,施鵬飛數(shù)學(xué)形態(tài)學(xué)的圖像分割算法D計算機工程與科學(xué),1998,20 (4):219 章毓晉圖像分割

溫馨提示

  • 1. 本站所有資源如無特殊說明,都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請下載最新的WinRAR軟件解壓。
  • 2. 本站的文檔不包含任何第三方提供的附件圖紙等,如果需要附件,請聯(lián)系上傳者。文件的所有權(quán)益歸上傳用戶所有。
  • 3. 本站RAR壓縮包中若帶圖紙,網(wǎng)頁內(nèi)容里面會有圖紙預(yù)覽,若沒有圖紙預(yù)覽就沒有圖紙。
  • 4. 未經(jīng)權(quán)益所有人同意不得將文件中的內(nèi)容挪作商業(yè)或盈利用途。
  • 5. 人人文庫網(wǎng)僅提供信息存儲空間,僅對用戶上傳內(nèi)容的表現(xiàn)方式做保護(hù)處理,對用戶上傳分享的文檔內(nèi)容本身不做任何修改或編輯,并不能對任何下載內(nèi)容負(fù)責(zé)。
  • 6. 下載文件中如有侵權(quán)或不適當(dāng)內(nèi)容,請與我們聯(lián)系,我們立即糾正。
  • 7. 本站不保證下載資源的準(zhǔn)確性、安全性和完整性, 同時也不承擔(dān)用戶因使用這些下載資源對自己和他人造成任何形式的傷害或損失。

評論

0/150

提交評論