版權說明:本文檔由用戶提供并上傳,收益歸屬內(nèi)容提供方,若內(nèi)容存在侵權,請進行舉報或認領
文檔簡介
1、數(shù)字圖像處理問題:人為什么能分辨出見過一次的東西?眼睛是生物體上十分神奇的器官,人類的眼睛可分辨約一千萬顏色。他可以感知光線,是人們獲得外界信息最主要的途徑;同時,眼睛包括含心理意識在內(nèi)的豐富信息。一、人眼構造人眼是人身體中最重要的感覺器官,人獲取的信息90%以上通過眼睛來獲取。人眼的構造決定了人眼成像的原理,同時決定了人眼的特性。人眼相當于一架攝像機或照相機,但在構造方面有別于攝像機和照相機。人眼的成像系統(tǒng)是由角膜、晶狀體、前房、后房和玻璃體組成。角膜一一直徑為11mm的透明膜,鑲嵌于鞏膜前面圓孔內(nèi),其中央部的曲率半徑為8mm,周邊部比較平坦。晶狀體一一形似雙凸鏡的透明組織,由小帶纖維懸掛于
2、瞳孔后面,睫狀肌收縮時小帶松弛,晶狀體依靠其本身的彈性而變厚,前后表面的曲度增加,整體屈光度增加,利用看清近處物體,稱為調(diào)節(jié)。在角膜和水晶體之間為虹膜,中間開有一個可以自動控制大小的孔,讓適當?shù)墓饩€進來,稱為瞳孔。前方、后房前房為角膜后面、虹膜和晶狀體前面的孔隙,充滿著房水。后房為位于虹膜后面、睫狀體、晶狀體周邊部之間的孔隙,也充滿著房水。房水的主要功能是維持眼內(nèi)壓,并維持晶狀體的代謝。玻璃體一一一透明膠樣組織,充填于視網(wǎng)膜內(nèi)的空間。占眼球4/5的容積。具有保護視網(wǎng)膜、緩沖震動功能。視網(wǎng)膜一一是接近黑的深紅色,反光很弱,其上面布滿感光細胞。正對眼球中心有一個直徑約為2mm的黃色區(qū)域,稱為黃斑,
3、黃斑中心有一小凹,稱為中央凹,面積為1平方毫米。視網(wǎng)膜上面有兩種感光細胞,一種叫做視錐細胞,另一種叫做視桿細胞。視錐細胞是像一個玉米的錐形,尖向外,只對較強的光敏感,至少有分別感覺紅、藍、綠三種顏色的視錐細胞存在,因此能夠感知顏色。視桿細胞只有一種,因此沒有顏色感覺,但靈敏度非常高,可以看到非常暗的物體。視錐細胞在黃斑里面非常集中,尤其是在中央凹里面最為集中,是產(chǎn)生最清晰視覺的地方。視桿細胞恰好在黃斑里面最少,除此之外分布的比較均勻,距離中心1020度的范圍內(nèi)相對集中些。在比較暗的情況下,視錐細胞就不再起作用了,只能是分布廣而相對稀疏的視桿細胞起作用,一次人眼的分辨能力大大下降。中心黃斑部分視
4、力下降到0.05,反而不如黃斑以外,非黃斑區(qū)域視力基本不變,最好視力在黃斑附近,大約偏離中心15度左右,為0.1,這時的視力,稱為暗視覺。但由于視桿細胞只有一種,因此是分辨不出物體顏色的,因此我們觀察星云時,看不出顏色。二、人眼的視覺特征人眼的視覺系統(tǒng)是世界上最好的圖像處理系統(tǒng),但它遠遠不是完美的。人眼的視覺系統(tǒng)對圖像的認知是非均勻的和非線性的,并不是對圖像中的任何變化都能感知。例如圖像系數(shù)的量化誤差引起的圖像變化在一定范圍內(nèi)是不能為人眼所覺察的。因此,如果編碼方案能利用人眼視覺系統(tǒng)的一些特點,是可以得到高壓縮比的。對人眼視覺特性的深入研究及由此而建立的各種數(shù)學模型,一直是各種圖像數(shù)字壓縮算法
5、的基礎。人眼對380780納米內(nèi)不同波長的光具有不同的敏感程度,稱為人眼的視敏特性。衡量描述人眼視敏特性的物理量為視敏函數(shù)和相對視敏函數(shù)。1.1視敏函數(shù)在相同亮度感覺的條件下,不同波長上光輻射功率的倒數(shù)可以用來衡量人眼對各波長光明亮感覺的敏感程度。稱為視敏函數(shù)K(入)=1/pr(入)。1.2相對視敏函數(shù)實驗表明,人眼對波長為555納米的光最敏感,因此把任意波長的光的視敏函數(shù)與最大視敏函數(shù)值K(555)相比的比值稱為相對視敏函數(shù)懇一幽)_耳妙)疋(河)耳。2.1對比靈敏度人眼對亮度光強變化的響應是非線性的,通常把人眼主觀上剛剛可辨別亮度差別所需的最小光強差值稱為亮度的可見度閾值。也就是說,當光強
6、I增大時,在一定幅度內(nèi)感覺不出,必須變化到一定值I+AI時,人眼才能感覺到亮度有變化,AI/I一般也稱為對比靈敏度。因此恢復圖像的誤差如果低于對比靈敏度,即不會被人眼察覺。此外,高頻部分在相同的靈敏度閾值下,色差信號Y-R空間頻率只有亮度Y的一半,色差信號Y-B空間頻率只有亮度Y的1/4。人眼對于運動圖像的對比靈敏度與時間軸上信息的變化速度有關,隨著時間軸變化頻率的增加,人眼所能感受到的圖像信息的誤差閾值呈上升趨勢,視覺上的這種動態(tài)對比靈敏度特性表現(xiàn)為圖像序列之間相互掩蓋效應??梢姸乳撝岛脱谏w效應對圖像編碼量化器的設計有重要作用,利用這一視覺特性,在圖像的邊緣可以容忍較大的量化誤差,因而可使量
7、化級減少,從而降低數(shù)字碼率。2.2分辨率當空間平面上兩個黑點相互靠攏到一定程度時,離開黑點一定距離的觀察者就無法區(qū)分它們,這意味著人眼分辨景物細節(jié)的能力是有限的,這個極限值就是分辨率。研究表明人眼的分辨率有如下一些特點:當照度太強、太弱時或當背景亮度太強時,人眼分辨率降低。當視覺目標運動速度加快時,人眼分辨率降低。人眼對彩色細節(jié)的分辨率比對亮度細節(jié)的分辨率要差,如果黑白分辨率為1,則黑紅為0.4,綠藍為0.19。2.3馬赫效應當亮度發(fā)生躍變時,會有一種邊緣增強的感覺,視覺上會感到亮側更亮,暗側更暗。馬赫效應會導致局部閾值效應,即在邊緣的亮側,靠近邊緣像素的誤差感知閾值比遠離邊緣閾值高34倍,可
8、以認為邊緣掩蓋了其鄰近像素,因此對靠近邊緣的像素編碼誤差可以大一些。三、視覺感知對時間頻率的感知時間頻率即畫面隨時間變化的快慢。Kelly.D.H用亮度按時間正弦變化的條紋做實驗,亮度Yt)=B(1+mcos2nft)。改變m,測試不同時間頻率f下的對比敏感度。實驗表明時間頻率響應還和平均亮度有關。在一般室內(nèi)光強下,人眼對時間頻率的響應近似一個帶通濾波器。對1520Hz信號最敏感,有很強閃爍感(flick),大于75Hz響應為0,閃爍感消失。剛到達閃爍感消失的頻率叫做臨界融合頻率(CFF)。在較暗的環(huán)境下,呈低通特性,且CFF會降低,這時對5Hz信號最敏感,大于25Hz閃爍基本消失。電影院環(huán)境
9、很暗,放映機的刷新率為24Hz也不感到閃爍,這樣可以減少膠卷用量和機器的轉速。而電腦顯示器亮度較大,需要75Hz閃爍感才消失。閃爍消失后,亮度感知等于亮度時間平均值(塔魯伯法則)。這種低通特性,也可以解析為視覺暫留特性,即當影像消失/變化時,大腦的影像不會立刻消失,而是保留一個短暫時間。生活中常感受到的動態(tài)模糊,運動殘像也和這個有關。有很多電子產(chǎn)品設計利用了這一現(xiàn)象,例如LED數(shù)碼管的動態(tài)掃描,LED旋轉字幕等。對運動物體感知觀察一個運動物體,眼球會自動跟隨其運動,這種現(xiàn)象叫隨從運動(eyepursuitmovement)。這時眼球和物體的相對速度會降低,我們能更清晰地辨認物體。例如觀看球類比
10、賽(如棒球),盡管棒球的運動速度很快,由于隨從運動,我們?nèi)詨蚩吹玫角虻拇蟾艠幼?但會有運動模糊)。如果我們把眼睛跟著風扇轉動方向轉動,會發(fā)現(xiàn)對扇葉細節(jié)看得較清楚。眼球隨從最大速度為45度/秒,因此我們不可能看清楚一顆子彈飛行。空間頻率即影像在空間中的變化速度。用亮度呈空間正弦變化的條紋做測試,亮度Y(x,y)=B(1+mcos2nfx),給定條紋頻率f為一固定值(看作是寬度),改變振幅m(看作對比度),測試分辨能力。顯然m越大分辨越清楚,測試不同條件下(不同cpd)可分辨的最少m值,定義1/mmin為對比敏感度(contrastsensitivity)。定義人眼的對空間感覺的角度頻率:卬d:c
11、ycle/degree,表示眼球每轉動一度掃過的黑白條紋周期數(shù)。對給定的條紋,這個值與人眼到顯示屏的距離有關,對于同樣大小的屏幕,離開越遠,cpd越大。通常人眼對空間的感覺相當于一個帶通濾波器。最敏感在25個cpd,空間截止頻率為30cpd。比如我們看油畫和電視機屏幕時,當距離離開一定遠,cpd增大,人的眼睛就分辨不了象素點細節(jié),便感覺不到顆粒感了。當人觀察一個靜止影像時,眼球不會靜止一處(精神病人除外),通常停留在一處幾百毫秒完成取像后,移到別處取像,如此持續(xù)不斷。這種運動稱為跳躍性運動(saccadiceyemovement)。研究表明跳躍性運動可以增大對比敏感度,但敏感度峰值卻減少。四、
12、模式識別人們在觀察事物或現(xiàn)象的時候,常常要尋找它與其他事物或現(xiàn)象的不同之處,并根據(jù)一定的目的把各個相似的但又不完全相同的事物或現(xiàn)象組成一類。字符識別就是一個典型的例子。例如數(shù)字“4”可以有各種寫法,但都屬于同一類別。更為重要的是,即使對于某種寫法的“4”,以前雖未見過,也能把它分到“4”所屬的這一類別。人腦的這種思維能力就構成了“模式”的概念。在上述例子中,模式和集合的概念是分未弄的,只要認識這個集合中的有限數(shù)量的事物或現(xiàn)象,就可以識別屬于這個集合的任意多的事物或現(xiàn)象。為了強調(diào)從一些個別的事物或現(xiàn)象推斷出事物或現(xiàn)象的總體,我們把這樣一些個別的事物或現(xiàn)象叫作各個模式。模式識別研究主要集中在兩方面
13、,一是研究生物體(包括人)是如何感知對象的,屬于認識科學的范疇,二是在給定的任務下,如何用計算機實現(xiàn)模式識別的理論和方法。前者是生理學家、心理學家、生物學家和神經(jīng)生理學家的研究內(nèi)容,后者通過數(shù)學家、信息學專家和計算機科學工作者近幾十年來的努力,已經(jīng)取得了系統(tǒng)的研究成果80年代初(1982,1984,1985),陳霖提出視覺拓撲理論(visualtopologicaltheory)。該理論認為,在視覺處理的早期階段,人的視覺系統(tǒng)首先檢測圖形的拓撲性質;它對圖形的大范圍拓撲性質敏感,而對圖形的局部幾何性質不敏感。圖形的拓撲性質(topologicalproperties):指在拓撲變換下圖形保持不變的性質和關系,如連通性(connectedness)、封閉性(closedness)、洞(hole),都是典型的拓撲性質,而大小、角度、平行性等幾何性質則不是拓撲性質。按照人們的直覺經(jīng)驗,圓盤、三角形和正方形是明顯不同的圖形;但按拓撲學的觀點,由于它們都是實心圖形,因而在拓撲
溫馨提示
- 1. 本站所有資源如無特殊說明,都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請下載最新的WinRAR軟件解壓。
- 2. 本站的文檔不包含任何第三方提供的附件圖紙等,如果需要附件,請聯(lián)系上傳者。文件的所有權益歸上傳用戶所有。
- 3. 本站RAR壓縮包中若帶圖紙,網(wǎng)頁內(nèi)容里面會有圖紙預覽,若沒有圖紙預覽就沒有圖紙。
- 4. 未經(jīng)權益所有人同意不得將文件中的內(nèi)容挪作商業(yè)或盈利用途。
- 5. 人人文庫網(wǎng)僅提供信息存儲空間,僅對用戶上傳內(nèi)容的表現(xiàn)方式做保護處理,對用戶上傳分享的文檔內(nèi)容本身不做任何修改或編輯,并不能對任何下載內(nèi)容負責。
- 6. 下載文件中如有侵權或不適當內(nèi)容,請與我們聯(lián)系,我們立即糾正。
- 7. 本站不保證下載資源的準確性、安全性和完整性, 同時也不承擔用戶因使用這些下載資源對自己和他人造成任何形式的傷害或損失。
最新文檔
- 病毒模型制作研究報告
- 病人輸液測試儀課程設計
- 璧山餐廳鋁扣板施工方案
- 班組績效考核方案
- 班級閱讀課程設計
- 班級植物擺放課程設計
- 班級德育課程設計
- 2024年環(huán)磷酰胺原料藥項目規(guī)劃申請報告模板
- 2024年建筑鋼材:螺紋鋼項目立項申請報告
- 玻璃破損賠償方案
- 廣東省廣州市四校2024-2025學年九年級上學期11月期中化學試題(含答案)
- 浙江省杭州市2023-2024學年高二上學期期末學業(yè)水平測試政治試題 含解析
- 科技公司研發(fā)項目風險防控制度
- 2024年全國企業(yè)員工全面質量管理知識競賽活動題庫(完整)
- 【課件】Unit+4+Section+B+1a-1d+課件人教版英語七年級上冊
- 海南省申論真題2022年(C類行政執(zhí)法)
- 大數(shù)據(jù)行業(yè)分析報告
- (5篇)國開2024年秋形策大作業(yè):中華民族現(xiàn)代文明有哪些鮮明特質?建設中華民族現(xiàn)代文明的路徑是什么
- 錯牙合畸形的早期矯治(口腔正畸學課件)
- 江蘇省徐州市沛縣第五中學2024-2025學年九年級上學期11月期中考試數(shù)學試題
- 2024年中國酶免試劑市場調(diào)查研究報告
評論
0/150
提交評論