最新環(huán)境感知技術介紹(基于無人駕駛汽車技術)_第1頁
最新環(huán)境感知技術介紹(基于無人駕駛汽車技術)_第2頁
最新環(huán)境感知技術介紹(基于無人駕駛汽車技術)_第3頁
最新環(huán)境感知技術介紹(基于無人駕駛汽車技術)_第4頁
最新環(huán)境感知技術介紹(基于無人駕駛汽車技術)_第5頁
已閱讀5頁,還剩82頁未讀 繼續(xù)免費閱讀

下載本文檔

版權說明:本文檔由用戶提供并上傳,收益歸屬內容提供方,若內容存在侵權,請進行舉報或認領

文檔簡介

1、 l當前,從陸地到天空,從海洋到宇宙,人們正在開發(fā)各種各樣的智能化載運工具為人類的文明發(fā)展服務。l實現(xiàn)地面車輛的智能化乃至無人駕駛是車輛工程領域追求的最高目標。l智能車輛研究在很多領域能夠體現(xiàn)一個國家的科學技術水平和綜合國力。l中國應該在智能車輛研究領域對世界有所發(fā)明、有所貢獻。l車輛工程學科領域的全體師生員工應該努力成為我國智能車輛研究的主力軍。l基于自身和外部信息,能夠確認當前位置、規(guī)劃目標 路線、控制自身按規(guī)劃路線行駛、安全準時到達目的 地的機動車輛。l自身具有駕駛員的部份、全部或尚不具備的駕駛行為 能力的機動車輛。 1. 能夠確認自身的當前位置,根據(jù)行駛目標及途中情況,能夠確認自身的當

2、前位置,根據(jù)行駛目標及途中情況, 規(guī)劃、修改行車路線。規(guī)劃、修改行車路線。2. 能夠可靠識別行車路線,并可通過自動轉向控制使自能夠可靠識別行車路線,并可通過自動轉向控制使自 身按規(guī)定路線準確穩(wěn)定行駛。身按規(guī)定路線準確穩(wěn)定行駛。 3. 行駛過程中,能夠可靠實現(xiàn)車速調節(jié)、車距保持、換行駛過程中,能夠可靠實現(xiàn)車速調節(jié)、車距保持、換道、超車等各種必要基本操作。道、超車等各種必要基本操作。4. 能夠確保行駛安全,按時到達目的地能夠確保行駛安全,按時到達目的地5. 能夠適應不同的行駛環(huán)境。能夠適應不同的行駛環(huán)境。1. 減少交通事故減少交通事故 智能車輛是解決因駕駛員人為因素引起的道路交通安全問題的根本途徑

3、。2. 提高運輸效率提高運輸效率 智能車輛能縮短行車間距,增加道路容量,防止交通堵塞,提高平均車速,改善燃油經濟性,減少環(huán)境污染。3. 完成特殊作業(yè)完成特殊作業(yè) 智能車輛能夠在易燃、易爆、有毒、搶險、宇航等危險環(huán)境下替代駕駛員完成特殊作業(yè)。4. 國防軍事應用國防軍事應用 智能車輛在偵查、演習、排雷、防化、作戰(zhàn)、反恐等軍事領域有著潛在的廣泛應用前景 。1. 車輛自檢監(jiān)控系統(tǒng)車輛自檢監(jiān)控系統(tǒng) 該系統(tǒng)通過實時獲取和處理車輛狀況傳感器的輸入信息如電壓、電流、溫度、壓力、油耗、轉向、制動、加速、停車、排放等,診斷車輛駕駛是否處于危險狀態(tài)或具有潛在的危險,并將診斷結果信息提供給駕駛員或車輛自動控制系統(tǒng),以

4、便為做出正確的車輛控制決策提供依據(jù)。2. 車輛行駛環(huán)境信息獲取系統(tǒng)車輛行駛環(huán)境信息獲取系統(tǒng) 該系統(tǒng)基于車輛自身傳感信息獲取系統(tǒng)、通用技術平臺和通信信息系統(tǒng),獲取車輛外部周邊物體狀態(tài)、公路狀態(tài)、天氣、車流、電子地圖、停車場等信息,并將這些信息提供給駕駛員或車輛自動控制系統(tǒng)。3. 車道狀態(tài)數(shù)據(jù)處理系統(tǒng)車道狀態(tài)數(shù)據(jù)處理系統(tǒng) 該過程對所輸入的各種車載及道路傳感器的數(shù)據(jù)進行有效處理,為車輛控制過程提供車輛所在車道、車輛在車道上的位置、車輛與車道的距離偏差及方位偏差等信息。4. 車輛輔助駕駛接口系統(tǒng)車輛輔助駕駛接口系統(tǒng) 該系統(tǒng)提供了駕駛員可以用于啟動、監(jiān)視和終止車輛自動控制操作的接口。該接口可接收駕駛員控

5、制請求、車輛行駛環(huán)境、車輛自檢、車輛控制狀態(tài)反饋等信息,對車輛控制方式作出選擇,并將選擇結果提供給車輛控制過程或需要此信息的其它過程。5. 車輛控制系統(tǒng)車輛控制系統(tǒng) 該系統(tǒng)系統(tǒng)提供各種水平的車輛控制功能。它通過接收車輛控制方式選擇、車輛自檢、車輛自身及周邊車輛行駛狀態(tài)、車輛行駛環(huán)境等信息,為實現(xiàn)車道跟蹤、車距保持、換道、巡航、定位停車等功能提供各種必要的基本操作。 6. 智能車輛系統(tǒng)構成示意圖智能車輛系統(tǒng)構成示意圖 l 環(huán)境感知技術(Environment Perception)l 路徑規(guī)劃技術(Path Plan) l 導航控制技術(Navigation Control)l 避障防撞技術(O

6、bstacle Detection & Avoidance)l 信息通訊技術(Information Communication) l 乘員安保技術(Passenger Safety) l 人機交互技術(Human-machine Communication) l 狀態(tài)監(jiān)測技術(Condition Monitoring) l 調度管理技術(Accommodating & Management) l通過性:基于自身行駛性能和共識規(guī)則,能實時、可靠、 準確識別并規(guī)劃出可保證規(guī)范、安全、迅速到達目的地 的行駛路徑;l安全性:在行駛過程中,能夠實時、準確識別出行駛路 徑周邊對行駛安全可

7、能存在安全隱患的物體,為自身采 取必要操作以避免發(fā)生交通安全事故;l經濟性:為提高車輛高效、經濟地行駛提供參考依據(jù);l平順性:為車輛平順行駛提供參考依據(jù);l行駛路徑:對于結構化道路而言,包括行車線、道路邊緣、道路隔離物、惡劣路況的識別。對于非結構化道路而言,包括車輛欲行駛前方路面環(huán)境狀況的識別和可行駛路徑的確認;l周邊物體:包括車輛、行人、地面上可能影響車輛通過性、安全性的其它各種移動或靜止物體的識別;各種交通標志的識別;l駕駛狀態(tài):包括駕駛員駕駛精神狀態(tài)、車輛自身行駛狀態(tài)的識別;l駕駛環(huán)境:包括路面狀況、道路交通擁堵情況、天氣狀況的識別。1. 視覺傳感視覺傳感:基于機器視覺獲取車輛周邊環(huán)境兩

8、維或三維 圖像信息,通過圖像分析識別技術對行駛環(huán)境進行感知。車載單目視覺運動物體檢測車載單目視覺運動物體檢測l優(yōu)點:優(yōu)點:信息量豐富、實時性好、體積小 、能耗低。l缺點:缺點:易受光照環(huán)境影響、三維信息測量精度較低。車載雙目立體視覺越野環(huán)境感知車載雙目立體視覺越野環(huán)境感知2. 激光傳感:激光傳感:基于激光雷達獲取車輛周邊環(huán)境兩維或三維 距離信息,通過距離分析識別技術對行駛環(huán)境進行感知。車載線掃描激光雷達檢測前方障礙物車載線掃描激光雷達檢測前方障礙物車載三維激光雷達環(huán)境感知車載三維激光雷達環(huán)境感知l優(yōu)點:優(yōu)點:能夠直接獲取物體三維距離信息、測量精度高、 對光照環(huán)境變化不敏感。l缺點:缺點:無法感

9、知無距離差異的平面內目標信息、體積 較 大、價格昂貴、不便于車載集成。3. 微波傳感:微波傳感:基于微波雷達獲取車輛周邊環(huán)境兩維或三維 距離信息,通過距離分析識別技術對行駛環(huán)境進行感知。l優(yōu)點:優(yōu)點:能夠以較高精度直接獲取物體三維距離信息、對 光照環(huán)境變化不敏感、實時性好、體積較小。l缺點:缺點:無法感知無距離差異的平面內目標信息、國外成 熟產品對我國禁運而難以獲得。4. 通訊傳感:通訊傳感:基于無線、網(wǎng)絡等近、遠程通訊技術獲取車 輛行駛周邊環(huán)境信息。l優(yōu)點:優(yōu)點:能夠獲取其它傳感手段難以實現(xiàn)的宏觀行駛環(huán)境 信息、可實現(xiàn)車輛間信息共享、對環(huán)境干擾不敏 感。l缺點:缺點:可用于車輛自主導航控制的

10、信息不夠直接、實時 性不高、無法感知周邊車輛外其它物體信息。5. 融合傳感融合傳感:運用多種不同傳感手段獲取車輛周邊環(huán)境多 種不同形式信息,通過多信息融合對行駛環(huán)境進行感知。l優(yōu)點:優(yōu)點:能夠獲取豐富的周邊環(huán)境信息、具有優(yōu)良的環(huán)境 適應能力、為安全快速自主導航提供可靠保障。l缺點:缺點:感知系統(tǒng)過于復雜、難于集成、造價昂貴、實用 性差。 一套完整的視覺系統(tǒng)通常包括CCD、鏡頭、圖像卡、計算機等,系統(tǒng)構成如下圖所示。景物景物鏡頭鏡頭CCD計算機計算機圖像卡圖像卡計算機視覺系統(tǒng)構成計算機視覺系統(tǒng)構成構成計算機視覺系統(tǒng)的主要部件構成計算機視覺系統(tǒng)的主要部件l鏡頭經過聚焦將目標景物根據(jù)小孔成像原理投射

11、到CCD電荷耦合靶面器件上;x0EAGFHDCOyB智能車輛視覺成像原理示意圖智能車輛視覺成像原理示意圖lCCD電荷耦合靶面由多個陣列式光電耦合元件構成,其能根據(jù)光照強弱產生不同強度的電流,然后電流被轉換為當量電壓;l圖像采集卡能夠逐行逐列地將每個光電耦合元件產生的電壓模擬信號經過A/D 轉換將其轉換成數(shù)字信號并傳輸給計算機;CCD光電耦合元件及圖像采集卡光電耦合元件及圖像采集卡l計算機通過應用軟件生成目標景物的數(shù)字圖像,正是由于景物圖像的數(shù)字化,才使得計算機能夠進行各種圖像處理、分析和識別。目標景物的數(shù)字圖像目標景物的數(shù)字圖像 l像素點:像素點:每個光電耦合元件產生的電壓信號經過A/D 轉換

12、將其轉換成數(shù)字信號形成一個像素,由于光電耦合元件按行列依次排列,其信號的數(shù)字轉換也按相同順序依次進行,轉換結果數(shù)據(jù)被計算機按兩維數(shù)組(x,y ) 形式加以存儲,數(shù)組下標值 x 代表該像素所在行位置, y 代表該像素所在列位置 ,因此一對數(shù)組(x,y )對應一個像素點 ;l灰度值灰度值:景物明暗程度經光電耦合元件產生電壓模擬信號并經過A/D 轉換生成當量數(shù)字信號,通常CCD采用的是 8 bit A/D轉換,因此各像素點明暗程度分為0 - 225 共 256個等級,0 代表該像素點最暗,255 代表該像素點最 亮,因此像素點(x ,y ) 的具體數(shù)值大小也稱為該像素點 的灰度值或灰度級;像素點及灰

13、度值概念示意圖像素點及灰度值概念示意圖l分辨率:分辨率:顯然,CCD電荷耦合靶面光電耦合元件構成的行列多少直接影響對景物成像的精細程度,通常將光電耦合元件構成的行列多少稱為其成像分辨率。對相應的數(shù)字圖像而言,圖像分辨率體現(xiàn)為在兩維數(shù)組(x ,y )的大小。 例如,1024(H)1024(V)CCD的分辨率顯然要高于512(H)584(V) CCD的分辨率。高分辨率CCD雖然可以獲取更為精細的圖像,但由于像素點的大量增加,也會嚴重降低圖像處理的實時性。對于智能車輛環(huán)境感知而言,通常640(H)480(V)的分辨率已能滿足要求。l幀頻:幀頻:CCD 在1s時間內連續(xù)獲取數(shù)字圖像的幀數(shù),其直接表示出

14、 CCD 獲取圖像的速度 , 是影響視覺環(huán)境感知動態(tài)響應能力的主要因素 。高速 CCD 能夠有效提高圖像處理實時性,但其價格較高。對于能車輛環(huán)境感知應用而言,通常30-100幀/秒速度的CCD性價比較高。l物理光圈:物理光圈:光圈機構設置在鏡頭上,通過手動或電動控制其開閉程度,進而控制外界光照投射到CCD電荷耦合鏡面的強度大小,顯然光圈設定的大小直接影響景物成像的明暗程度。鏡頭上設置的機械式光圈可稱之為物理光圈。通常物理光圈參數(shù)在1-16 之間,該值越小,代表光圈開度越大,通常稱之為大光圈,反之亦然。因此當景物光照很強時,應選擇數(shù)值大的小光圈;當景物光照很暗時,應選擇數(shù)值小的大光圈。光圈選擇應

15、有利于增強目標與背景的灰度對比度。光圈適中光圈適中 光圈過大光圈過大 光圈過小光圈過小l電子光圈:電子光圈:在CCD內部,通過電路可以控制外界光照投射到CCD電荷耦合鏡面的時間長短,進而達到光照強度大小的控制目的,通常也稱其為電子快門。電子光圈參數(shù)需經過程序設定調節(jié)。電子光圈對于變光照條件下實現(xiàn)在線實時視覺環(huán)境感知具有重要應用價值。需要提及的是,電子光圈的大小影響CCD圖像獲取速度。物理光圈相同、外界光照不同時電子光圈調節(jié)效果物理光圈相同、外界光照不同時電子光圈調節(jié)效果l焦距:焦距:焦距是指鏡頭景物聚焦點到成像平面即透鏡中心 的距離 ,通常用 f 表示,單位為mm ,如8mm 、12mm、16

16、mm、25mm等。焦距長短與景物成像大小成正比,對 同一物體 ,焦距越長,其成像越大,焦距越短,成像越小 。 鏡頭焦距與視場角成反比 ,焦距越長 ,視場角越 小,焦距越短,視場角越大。鏡頭通常標有焦距值 ,此 外,許多CCD 用鏡頭也具有通過手動微調焦距的功能。不同焦距功能示意圖不同焦距功能示意圖l視場角:視場角:視場角決定CCD成像視野范圍,其大小與鏡頭焦距和CCD成像靶面尺寸大小有關,如前圖所示。通常成像靶面為長寬比為4 : 3的矩形 ,所以可用該矩形對角 線長度為底邊 、鏡頭焦距為高組成一等腰三角形,計算其頂角就是視場角,如前圖所示。如果分別用矩形的兩個邊計算該角,則有水平視場角和垂直視

17、場角之分。鏡頭焦距和視場角是一一對應的,而且是相互矛盾的。焦距小,則視場角大,視野范圍大,但距離遠的物體成像不清晰;反之,焦距大,則視場角小,視野范圍小,但距離遠的物體成像清晰。因此,應根據(jù)環(huán)境感知目標具體情況進行折中估算選擇合適焦距和視場角的鏡頭。l俯仰角:俯仰角:智能車輛視覺系統(tǒng)性能除與前面所述各內部參數(shù)相關外,還與其在車輛上安裝的俯仰角度、離地高度及相對車體位置等外部參數(shù)有關。俯仰角不僅使目標圖像產生透視畸變,且影響視覺視野。俯仰角越大、圖像透視畸變越嚴重,視野越小;反之亦然,如下圖所示。視野梯形區(qū)路面 鏡頭俯仰角EABFGIDCO CCD 車輛 前進方向俯仰角產生透視畸變示意圖俯仰角產

18、生透視畸變示意圖 實際車道線狀態(tài)實際車道線狀態(tài) 象平面中車道線狀態(tài)象平面中車道線狀態(tài) 透視畸變使物體成像產生形變,有時需要通過比較繁瑣的重建方法才能恢復目標真實形態(tài),往往會降低識別目標的實時性,如下圖所示。l安裝高度:安裝高度:智能車輛為保證行駛安全,需要對前方路面環(huán)境預前識別,這意味著視覺的視野中心與車輛應具有一定距離,通常將其稱為預瞄距離。智能車輛視覺系統(tǒng)的預瞄距離與行駛速度。車速越高,所需的預瞄距離越遠,車速與預瞄距離之間的關系: Dpreview=V(m/s)(1.2 1.4)(s) 當車速100 km/h時,約需40-80米。顯然、視覺系統(tǒng)安裝俯仰角和安裝高度影響預瞄距離。在俯仰角相

19、同時,安裝高度越高,視野范圍越大,預瞄距離越遠。另外,安裝高度越高,圖像因車體振動引起的失真越嚴重,常常給圖像識別帶來困難。l有效視野:有效視野:對一特定CCD,其分辨率是固定不變的。但如其安裝俯仰角、高度不同,其成像視野會不同,則所獲取圖像對同一景物分辨的精細程度也不同,該種描述真實景物精確程度的分辨能力可稱為其實際分辨率。具體而言,實際分辨率是指實際景物空間中的每單位長度對應圖像中的像素點個數(shù)。視野范圍越大,實際分辨率越低。有時,實際分辨率并不是越高越好,實際分辨率越高,對噪聲的敏感性也越強。因此,實際分辨率的選擇要根據(jù)實際情況經試驗加以確定。以下圖為例,左圖實際分辨率遠高于右圖,但對于道

20、路邊界識別而言,右圖像有利于識別道路邊界,左圖像卻易導致誤識別。究其原因,道路邊界是宏觀、大視野內道路特征。當視野較小時,道路自然邊界特征反而不明顯,易受其它非邊界信息干擾而產生誤檢。“高高”分辨率道路圖像分辨率道路圖像“低低”分辨率道路圖像分辨率道路圖像l顏色:顏色:CCD圖像有黑白和彩色之分。黑白CCD圖像各像素點僅反映成像景物的明暗即灰度特征,而彩色CCD圖像各像素點則能反映成像景物的紅、綠、藍三色強度信息。對智能車輛環(huán)境感知而言,在某些特定環(huán)境下,利用彩色圖像有利于目標物體的感知識別,如下圖所示。利用唇色特征識別說話狀態(tài)利用唇色特征識別說話狀態(tài) 利用植物顏色特征識別路徑利用植物顏色特征

21、識別路徑 對于智能車輛視覺環(huán)境感知而言,圖像獲取應通過合理選擇和確定前章所述各種視覺系統(tǒng)內外部參數(shù),以便為目標圖像的有效可靠感知辨識提供有利條件。由于有些參數(shù)在一些性能上的相互制約性,針對不同環(huán)境景物,相關參數(shù)的確定并沒有統(tǒng)一的的標準,通常需要經過試驗或依賴已有經驗,但應遵循以下幾點共性原則:l所獲取圖像中的被辨識目標應盡可能清晰、直觀;l盡可能提高被辨識目標與整幅圖像像素點的比例;l圖像應盡可能增強被辨識目標與背景的灰度反差;l圖像獲取速度應能滿足車輛控制的動態(tài)響應能力;馬路邊界反差不強馬路邊界反差不強 石塊邊界反差不強石塊邊界反差不強 比較理想比較理想 汽車像素過少汽車像素過少 眼部像素過

22、少眼部像素過少 比較理想比較理想車輛尾部結構模糊車輛尾部結構模糊 直線產生彎曲失真直線產生彎曲失真 比較理想比較理想 為了實現(xiàn)對視覺圖像中的目標進行有效、準確識別,通常需要對圖像進行預處理。圖像預處理包括圖像去噪、邊緣增強、灰度拉伸、圖像分割、形態(tài)學處理等。預處理技術應用是否正確,在很大程度上影響圖像識別效果。1. 圖像去噪(圖像去噪(Noise reduction) 圖像在生成和傳輸過程中,受輸入轉換器件及周圍環(huán)境影響,常含有各種各樣的噪聲。為盡可能減少噪聲干擾,常需要對圖像先進行去噪處理。圖像噪聲濾除可在空間域對圖像像素灰度值直接進行平滑運算處理,算法比較簡單,實時性好,常用的方法有圖像平

23、均法、鄰域平均法、自適應平滑濾波、高斯濾波和中值濾波等。 中值濾波屬于一種非線性處理技術,濾波器選取一個含有奇數(shù)個像素點的移動窗口,在圖象上從左到右、從上到下逐行移動,用窗口內各像素點的灰度均值取代窗口的中心像素點的灰度值,從而完成整幅圖像的中值濾波。中值濾波的數(shù)學表達式如下,其中Sf(x, y)為當前像素點f(x, y)的鄰域。 例如,若一個3*3窗口內的各像 素點的灰度值為 10 ,10,10,10,20, 10,10,10,10, 它們的灰度均值是 11 , 中心像素點原灰度值為20, 濾波后則變成11 。 中值濾波可 以有效平滑單脈沖噪聲 , 而對 其它圖 形 則能保持其原有形狀。),

24、(),(yxfSmedianyxf階梯形信號輸入階梯形信號輸入漸變形信號輸入漸變形信號輸入單脈沖信號輸入單脈沖信號輸入三脈沖信號輸入三脈沖信號輸入中值濾波中值濾波輸入圖像輸入圖像 原原 始始 圖圖 象象 經過平滑濾波后的圖像經過平滑濾波后的圖像2. 邊緣增強(邊緣增強(Edge enhancement) 由于許多景物具有明顯的的邊緣特征,因此在處理該類圖像時,常常希望能突出其邊緣信息,由此產生了各種邊緣增強圖像預處理算法。常用的邊緣增強算子有Robert 算子、Sobel算子、Prewitt 算子等。以比較經典的 Sobel 算子為例,其算法的本質是采用了一階差分算子 ,離散 Sobel算子定

25、義為下式: 梯度值大小可通過下式得到:) 1, 1(), 1(2) 1, 1() 1, 1(), 1(2) 1, 1(),() 1, 1() 1,(2) 1, 1() 1, 1() 1,(2) 1, 1(),(yxfyxfyxfyxfyxfyxfyxfyxfyxfyxfyxfyxfyxfyxfyx22),(ffyxGyx 梯度方向是在灰度值變化最大的方向上,計算公式為: Sobel 算子的本質是反映了相鄰或相距一定距離的像素點的灰度差異特征。以車道線圖像為例,路面像素點的灰度值比較接近 ,經過 Sobel 算子 ,這種接近程度轉化成近似零的很小值。車道線邊界與道路其它部分應該具有一定灰度差異,

26、經 Sobel 算子處理,這種差異被放大強化 ,使邊界特征更為明顯,從而有利于排除噪聲干擾,實現(xiàn)車道線的有效、可靠識別。換言之,只有當像素點灰度值具有階越或近似階越變化趨勢時 ,Sobel 算子才具有實際應用意義。 ),(),(tanyxfyxfxy 原原 始始 圖圖 象象 Sobel 算子邊緣增強效果算子邊緣增強效果3. 對比度增強(對比度增強(Gray ratio enlargement) 在一些數(shù)字圖像中,感興趣目標的灰度特征值變化范圍很小,與背景灰度值難以區(qū)分。通過擴展感興趣目標灰度特征的對比度,可以提高目標識別準確性,該種圖像預處理方法稱為對比度增強,也稱為灰度拉伸。對比度增強常采用

27、直方圖錐形拉伸算法。 灰度直方圖是灰度值的函數(shù),其橫坐標表示像素的灰度級別,縱坐標是該灰度級出現(xiàn)的概率即像素點個數(shù)。直方圖錐形拉伸算法的基本思想是將圖像直方圖均勻的灰度軸按灰度分布不均勻插值,即在灰度分布高的區(qū)域插值較多,灰度分布低的區(qū)域插值較少,然后對插值后的灰度軸按插值點均勻化,從而實現(xiàn)直方圖非均勻拉伸。由于大多數(shù)圖像的直方圖呈單峰或多峰狀,這樣在直方圖峰值處拉伸幅度會比其它區(qū)域大,拉伸幅度分布呈錐形,因此稱為直方圖錐形拉伸,如下圖所示。 拉伸后圖像的直方圖拉伸后圖像的直方圖 插值后圖像直方圖插值后圖像直方圖 原圖像直方圖原圖像直方圖 P(t)P(t) t t t t P(t)P(t) t

28、 tP(t) 如果一幅圖像灰度整體較暗或較亮而導致目標難以分割,可以采用灰度拉伸功能來改善圖像品質,如以下應用案例。 原始圖像原始圖像 對比度增強后圖像對比度增強后圖像 例如前左圖,整體灰度值較高,即灰度值較高的像素點較多,它們分布在一個較窄的灰度級范圍內。例如,圖像中車道線和附近路面灰度很接近,假設車道線灰度值為245 255之間,而附近路面灰度值在235 245之間,這樣我們很難確定出一個合適的閾值將車道線和路面有效分離。因為,在灰度值間隔為10的區(qū)間內有很多車道線與附近路面像素點,稍有不慎,就有可能誤分很多點。為此,可將按灰度值10間隔內分布的點分散到例如 40 的間隔內,比如將245-

29、255間隔內的像素點變?yōu)?215-255 區(qū)間分布,這相當于把原區(qū)間各像素點灰度值進行范圍擴展即進行拉伸。同樣 235-24 5區(qū)間各像素點灰度值拉伸至 175-215 區(qū)間。由于分布區(qū)間擴大,當選擇閾值分割時,會大大減少閾值選擇不夠精確時誤分割點的數(shù)量,提高分割的準確性。例如,原車道線上灰度值為 245的像素點為100個,如果采用 246 閾值分割,這100個點將被誤認為是路面?;叶壤旌螅叶葹?215 的點可能會減少到25個,這時采用 216 分割閾值,則誤分點數(shù)會大為降低。4. 圖像分割(圖像分割(Image segmentation)l圖像分割:圖像分割:在視覺環(huán)境感知中,圖像處理的

30、根本目的是將感興趣的目標與背景有效分割 ,從而實現(xiàn)目標物體辨識。因此,圖像分割是圖像理解與分析的基礎 。圖像分割方法有很多種 ,如灰度閾值法、邊緣檢測法、像素分類法、神經網(wǎng)絡法、模糊集合法等 ?;谠趫D像中同一種性質物體具有相同或相似的灰度概率最大原理 ,因此可采用灰度級的差別來分割圖像中的各個物體 ,這類分割方法稱為閾值法。利用閾值對圖像進行分割時 ,關鍵是找到能將物體和背景有效分割的閾值 。閾值法計算簡單,運算效率高,在圖像分割中被廣泛應用。l二值化:二值化:通過閾值分割,可將圖像二值化。二值化后圖像各像素只有兩個灰度級(0,1)。 圖像二值化能去除一些無用信息,進一步突出目標特征,有利于

31、目標的辨識。 原圖原圖 110 閾值閾值 150 閾值閾值 190 閾值閾值 230 閾值閾值 250 閾值閾值 設圖象灰度級 G (0, 1, 2, ), 二值化可表示為: 選擇不同的閾值 t ,將會產生不同的二值化圖象。tyxfbtyxbyxft),(),(f),(10若若l固定全局閾值:固定全局閾值:當背景與目標灰度相差較大但各自比較均勻時 ,設定一合適的全局固定閾值即可獲得滿意分割效果。 原始圖像原始圖像 分割后二值化圖像分割后二值化圖像l動態(tài)全局閾值:動態(tài)全局閾值:通常,圖像背景與目標的各自灰度值并不一定均勻恒定 ,且它們間的灰度反差強度對整個圖像而言也不一定固定不變 ,因此采用固定

32、全局閾值在圖像中某一區(qū)域分割效果可能良好 ,但在其它區(qū)域分割效果不一定理想。另外,對于多變環(huán)境下的動態(tài)圖像處理來說 ,這些不確定性可能會變得更為明顯。顯然 ,對智能車輛視覺環(huán)境感知,由于光照、背景的多變性,即使是識別跟蹤同一目標 ,也不可能始終采用一個固定不變的全局閾值實現(xiàn)目標與背景的有效分割 ,必須考慮采用合適動態(tài)閾值自動在線選取算法 ,才能提高其自主導航環(huán)境感知的魯棒性。全局自動閾值選取方法主要有 :直方圖法、類間方差法、矩不變法、最佳熵法、極小誤差法等 。在諸多該類算法的應用過程中, 應注意每種算法都并非盡善盡美,它們均各自具有其局限性,應用前只有通過實際工況應用試驗才能確認所選算法的合

33、理性。原始圖像原始圖像 圖像灰度直方圖圖像灰度直方圖a. 直方圖法:直方圖法: 下面左圖是一幅在亮度不均勻但相對較暗的背景上存在有很亮物體的圖像,右圖是表示其灰度分布特征的直方圖。 從上面的直方圖中可以看出,接近最高灰度值255的像素點個數(shù)和接近次高灰度值150的像素點個數(shù)形成了圖像像素點分布的兩個峰值,兩峰間谷底處的灰度值約為240。 對前述案例,顯然用灰度值 240 即可將目標與背景有效分離。因此,采用直方圖法分割的關鍵是設法在直方圖中找到兩峰值間的谷底所對應的灰度值做為圖像分割的閾值。從統(tǒng)計學的角度出發(fā),目標和背景各自的灰度物理特性接近且相應的像素點個數(shù)在圖像中的分布概率應該最高,因此形

34、成直方圖中的兩個峰值點,即不屬于目標也不屬于背景的像素點其分布概率應最低,理論上應為零。因此,直方圖法常以概率密度分布函數(shù)作為分析工具。 在實際應用中,由于圖像的復雜性,圖像的直方圖常會出現(xiàn)多峰多谷現(xiàn)象,這給該方法的應用帶來一定局限性。因為不恰當?shù)墓鹊渍J定,可能造成要么將目標點歸為背景,要么將背景點認定為目標。由于分割閾值選取不當,其結果必然是要么損失掉有用的部分目標信息,要么在目標信息中增加了有害的噪聲。因此,當出現(xiàn)多峰多谷現(xiàn)象時,通常要采取分段插值和濾波等方法進行必要的數(shù)據(jù)處理以保證分割閾值獲取的有效性。暗背景目標亮多峰多谷直方圖閾值法示意圖多峰多谷直方圖閾值法示意圖原始圖像原始圖像 直方

35、圖法分割結果直方圖法分割結果b. 類間方差法:類間方差法: 通常,圖像中同類物體像素點灰度特性差異不大,但不同類物體間灰度差異則比較明顯。方差是灰度分布均勻性的一種度量,方差值越大,說明構成圖像的兩部分差別越大,當部分目標錯分為背景或部分背景錯分為目標,都會導致兩部分差別變小。如果將各種不同閾值分割后形成的背景和目標方差差值進行比較,顯然該值最大的分割是錯分概率最小的分割,該方差即為類間最大方差。 一維最大類間方差分割法具有較好的實時性,在圖像質量較好和背景變化比較穩(wěn)定的情況下,采用該種方法通常都會取得較令人滿意的分割效果。具體而言,如果圖像基于其直方圖的灰度分為1-L 級,在1-L級間選擇一

36、分割閾值K,這樣目標圖像各像素點的灰度級為 C0 = K -L級 ,背景圖像各像素點的灰度級為C11-K。在各個灰度級內 ,分別計算目標和背景灰度方差并求取二者差值。然后,求取方差差值的最大值 ,則對應該最大值的灰度級K即可作為目標和背景分割的最佳閾值 K* 。 相關各計算公式如下:= =220011BTT p iinN 01KiiPiK 111LiiKP ik 010KiiPi 111LiKiPi 20010KiiPi 21111Li KiP i1LiinN 類間方差法是建立在圖像僅有明 、 暗兩類構成基礎之上,因此該方法除應考慮方差因素外 ,還應考慮目標和背景的產生概率即目標與背景在整幅圖

37、像中所占比例 ,并應將其作為加權系數(shù) 。為此 ,可考慮采用多次迭代分割方法,即首先將圖像的最暗區(qū)域分割掉 , 然后在剩余的區(qū)域進行二次分割 ,直到完全分割出目標 ,比較每次的分割的閾值選擇函數(shù) ,其值最大的分割即為最佳的分割。式中, 為灰度值的像素數(shù); 為圖像總像素數(shù); 為灰度值概率; 、 、 分別為目標和背景概率; 、 、 分別為目標、背景、圖像的灰度均值; 、 、 分別為目標、背景、圖像的方差; 為閾值選擇函數(shù); 為類間方差; K*為最終獲取的最佳分割閾值。2*20110BkGkGkArgMaxArgMax p iBinN0101T01T最大類間方差圖像分割效果圖最大類間方差圖像分割效果圖

38、原始圖像原始圖像c. 最大熵法:最大熵法: 熵是信息能量的一種度量形式。對于圖像而言,其熵值可以體現(xiàn)灰度分布狀態(tài)。最大熵圖像分割方法主要是通過計算包含灰度信息的最大熵值,標記所對應的灰度值,將之作為圖像分割的最佳全局閾值。對于給定的圖像,設 T 為分割閾值,則目標和背景的灰度分布概率為:1,2, 1 ,0, )(255,2, 1, )(10255TiippTTTiippTibTio 則目標區(qū)域和背景區(qū)域的一維熵分別可用下式定義:1, 2 , 1 , 0),/ )(lg()/ )()(255, 2, 1,),/ )(lg()/ )()(TipippipTHTTTipippipTHbbibooio

39、 整幅圖像的一維熵定義為: )()()(tHtHtHbot 使得 最大時的 T 值 ,就是根據(jù)一維熵最大化原理求取得到的全局分割閾值?;陟刈畲蠡淼膱D像分割算法的根本出發(fā)點是使圖像中目標和背景分布的信息量最大。采用該方法不需要先驗知識,對于非理想雙峰直方圖圖像也可以進行有效分割。)(tHT原始圖像原始圖像最大熵圖像分割效果圖最大熵圖像分割效果圖d. Fisher準則法準則法: 在模式識別理論中, Fisher 評價函數(shù)是類別分離程度的良好判據(jù),因此可以考慮將 Fisher 評價函數(shù)引入到圖像分割中。 Fisher 準則函數(shù)的基本數(shù)學表達式如下:2221221)(mmYJ 上式表述的基本含義

40、是:對于兩類物體,如果表征其物理特征的參數(shù)均值差越大,但其各自的方差都很小時,所定義的 Fisher 準則函數(shù)J(Y)有最大值 。對于圖像分割而言,我們可以按照不同灰度等級人為將圖像分割成目標和背景兩類子圖像,分別計算子圖像的灰度均值和方差,并進而按上式求取準則函數(shù)值。當計算遍歷了所規(guī)定的各灰度級后,使得該函數(shù)值最大的那個灰度級值即可作為最佳全局分割閾值。具體計算公式如下:Gtititihtitihti1212202121)(1/)()()(/)()(tiiht0)()(Gtititiihttiiht1201)(1/()()()(/)()()()(1)()()()(1)()()(2221221

41、tttttttttJ)(max0tJArgtGt原始圖像原始圖像最大熵圖像分割效果圖最大熵圖像分割效果圖5. 形態(tài)學處理形態(tài)學處理: 形態(tài)學用集合論方法定量描述幾何結構,最基本的形態(tài)學運算有:膨脹、腐蝕、開運算、閉運算。膨脹和腐蝕運算常被應用于分割后圖像的進一步處理,以便為下一步目標的特征和識別創(chuàng)造更為有利的條件。l 圖像膨脹:圖像膨脹:膨脹運算就是將目標周 圍背景點合并 到自身中。如果兩個目標物體之間距離比較近,那么膨脹可能會使這兩個物體連通在一起。膨脹對填補圖像分割后邊緣的不連續(xù)和物體中的空穴有很好的效果。其具體運算過程為:假設有一個圖像結構元素 S 中共包括三個點,即S1(0,0)、S2

42、(1,0)、S3 (0,1) ,如下圖所示。對已有圖像X作膨脹運算的實質是將X中的每一個點擴大為Sx。下圖顯示出 X 被 S1、S2和S3平移結果 ,其中XS1和X重合 ,XS2 相當于X向右平移一個單位,XS3 相當于X向上平移一個單位。將 XS1 、XS2、XS3 “重疊合并” 在一起可得到一幅新的圖像 ,該過程就是X 被 S 膨脹的過程。膨脹前圖像膨脹前圖像膨脹后圖像膨脹后圖像膨脹后圖像中物體的輪廓和噪聲被放大,有時影響目標識別定位,這時可進行形態(tài)學腐蝕處理。腐蝕可以把小于結構元素的物體去除,這樣選取不同大小的結構元素,就可以去掉不同大小的物體。如果兩個物體之間有細小的連通,那么當結構元

43、素足夠大時,腐蝕運算可以將兩個物體分開。和膨脹運算相反,腐蝕可看作是將圖像 X 中每一個與結構元素S全等的子集Sx收縮為點x。腐蝕前圖像腐蝕前圖像 腐蝕后圖像腐蝕后圖像 為了實現(xiàn)對視覺圖像中的目標進行有效、準確識別,通常需要對目標典型特征進行提取,以便為目標的識別提供必要依據(jù)。就特征提取而言,首先是要確定目標具有何種典型圖像信息特征,這通?;谙闰炛R,另外就是采用何種方法能夠獲取相應的典型特征。1. 特征類別(特征類別(Feature types) 各種物體間存在差異且能過被識別區(qū)分,主要是它們具有各自不同的典型特征。對于智能車輛環(huán)境感知需要識別的物體,通常形狀、面積、體積、顏色、運動狀態(tài)、

44、對稱性、表面粗糙度、聲光反射性、穿透性等常是被提取的典型特征。(b)(b)l 形狀特征:形狀特征:物體的形狀通??捎善溥吘夁M行描繪。對于變形不大的兩維圖像,物體主體邊緣可能具有線形、弧形、矩形、圓形、梯形、三角形等各種不同特征。車道線直線特征車道線直線特征 馬路邊緣直線特征馬路邊緣直線特征 車輛后部邊緣直線特征車輛后部邊緣直線特征車輛尾部矩形特征車輛尾部矩形特征 汽車車牌矩形特征汽車車牌矩形特征 石塊矩形特征石塊矩形特征彎道線曲線特征彎道線曲線特征 土路邊界曲線特征土路邊界曲線特征 土坑邊界曲線特征土坑邊界曲線特征標示牌圓形特征標示牌圓形特征汽車尾燈圓形特征汽車尾燈圓形特征人臉橢圓形特征人臉橢圓形特征尾燈車牌對稱性尾燈車牌對稱性 車輛尾部邊緣對稱性車輛尾部邊緣對稱性 臉部器官對稱性臉部器官對稱性l 對稱特征:對稱特征:有些物體具有對稱性特征,這種對稱性可能表現(xiàn)形式不同,但可作為對目標進行識別的一種有效手段。pplprl 平行特征:平行特征:有些物體邊界具有平行特征,這種特性有時可作為對目標進行有效識別的一種判據(jù)。目標邊緣的平行特征目標邊緣的平行特征l 面積特征:面積特征:根據(jù)分割圖像中可能存在多個目標現(xiàn)象,有時可根據(jù)面積約束條件,有效減少其它疑似目標的干

溫馨提示

  • 1. 本站所有資源如無特殊說明,都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請下載最新的WinRAR軟件解壓。
  • 2. 本站的文檔不包含任何第三方提供的附件圖紙等,如果需要附件,請聯(lián)系上傳者。文件的所有權益歸上傳用戶所有。
  • 3. 本站RAR壓縮包中若帶圖紙,網(wǎng)頁內容里面會有圖紙預覽,若沒有圖紙預覽就沒有圖紙。
  • 4. 未經權益所有人同意不得將文件中的內容挪作商業(yè)或盈利用途。
  • 5. 人人文庫網(wǎng)僅提供信息存儲空間,僅對用戶上傳內容的表現(xiàn)方式做保護處理,對用戶上傳分享的文檔內容本身不做任何修改或編輯,并不能對任何下載內容負責。
  • 6. 下載文件中如有侵權或不適當內容,請與我們聯(lián)系,我們立即糾正。
  • 7. 本站不保證下載資源的準確性、安全性和完整性, 同時也不承擔用戶因使用這些下載資源對自己和他人造成任何形式的傷害或損失。

評論

0/150

提交評論