版權說明:本文檔由用戶提供并上傳,收益歸屬內(nèi)容提供方,若內(nèi)容存在侵權,請進行舉報或認領
文檔簡介
2023/2/61數(shù)字圖像處理信息與通信工程學院張洪剛zhhg@Alittlebitaboutme張洪剛
單位:北郵模式識別實驗室
職務職稱:博士生導師,副教授,網(wǎng)絡搜索教研中心主任IEEE高級會員工作經(jīng)歷
2007.7-2008.7卡耐基梅隆大學計算機科學學院
訪問學者
2005.6-現(xiàn)在
北京郵電大學信息與通信工程學院
副教授
2003.3-2005.6北京郵電大學信息工程學院
講師科研經(jīng)歷:基于認知的圖像不變特征提取,國家自然基金項目,2012-2016,項目負責人,項目編號:61175011;層次化海量圖像型垃圾郵件過濾體系中的關鍵問題研究,2012-2016,項目主研人,項目編號:61171193;論文發(fā)表論文包括SCIENCE,TPAMI,MVA,Neurocomputing等雜志及AAAI會議論文30多篇。2023/2/62北郵人十大知乎2023/2/63北郵是如何一步一步成為互聯(lián)網(wǎng)之王的?微軟、百度、阿里巴巴、搜狗、360、Yahoo排第一谷歌1、清華大學2、北京郵電大學兩項百度最高獎-圖像識別2023/2/642023/2/65一.什么是圖像?光學圖像LenaIKONOS衛(wèi)星光學圖像423mile高16000miles/h1m分辨率EP-3,海南陵水,01-4-4大腦斷層圖像
SIR-CSARL/r-L/g-C/bHH-HV-HVpolar沙漠中的長城April10,199425kmx75km圖1-1示例2023/2/66圖像:對客觀存在的物體的某種屬性的描述。 光學圖像: 波長0.38-0.8um
其他波段圖像: 伽瑪射線:0.003-0.03nm X射線:0.03-3nm
紫外線:3-300nm
紅外線:0.8-300um
微波:0.3-100cm
聲波圖: 如B超 其他: 由感興趣的物理量轉(zhuǎn)換而成,如密度分布圖。使用圖像的通常是人,人約有80%的信息由視覺獲得。
土星偽彩圖像,由3張拍攝于1998年的影像所合成的,顯示出這顆具有可愛光環(huán)的行星所反射的紅外線光。Onepictureisworthmorethanathousandwords.(一圖勝千言)2023/2/68圖像分類圖像數(shù)學函數(shù)連續(xù)函數(shù)離散函數(shù)可見圖像圖片照片圖畫不可見物理圖像2023/2/69二.什么是圖像處理?圖像處理就是對圖像信息進行加工處理,以滿足人的視覺心理和實際應用的要求。
例子:調(diào)整了亮度和對比度2023/2/610數(shù)字圖像處理的幾個基本目的圖像處理(增強、復原、編碼和壓縮)圖像輸入圖像輸出以人為最終的信息接收者,其主要目的是改善圖像的質(zhì)量。(a)2023/2/611圖像預處理(增強、復原)圖像分割特征提取圖像分類圖像輸入符號輸出(b)另一類圖像處理以機器為對象,目的是使機器或計算機能自動識別目標,稱為圖像識別。2023/2/612
Messi2023/2/613基本概念數(shù)字化過程掃描、采樣、量化構成了數(shù)字化過程。對比度灰度反差的大小灰度分辨率指值的單位幅度上包含的灰度級數(shù)2023/2/614數(shù)字圖像顯示2023/2/615數(shù)字圖像表示(續(xù))數(shù)字圖像老鼠老鼠的鼻子2023/2/616
941001041191251361431531571581031041069810311914115515916010913613612395781171491551601101301441491297897151161158109137178167119781011851881611001431671348785134216209172104123166161155160205229218181125131172179180208238237228200131148172175188228239238228206161169162163193228230237220199圖像灰度表示數(shù)字矩陣數(shù)字圖像的矩陣表示2023/2/617數(shù)字圖像灰度表示f(x,y)灰度:R=G=B2023/2/618灰度圖像紅綠藍彩色圖像彩色圖像2023/2/619數(shù)字圖像的分辨率5122561286432GMN
5125122562561281286464323216162023/2/6202023/2/621數(shù)字圖像灰度分辨率2563282圖像灰度級2561286432168422023/2/622數(shù)字圖像的基本特點(1)處理的大多是二維信息,信息量大。
256x256黑白圖像 64K byte 512x512 彩色圖像 768Kbyte 25Frame/s電視圖像約20M byte(2) 數(shù)字圖像傳輸占用的頻帶較寬。 語音 4KHz
電視圖像 5.6MHz
對圖像的壓縮提出了要求。2023/2/623(3) 有很多數(shù)字圖像中象素間的相關性較大,冗余比較多,有利于壓縮。從左圖中可以看到:有大塊的區(qū)域的灰度值是相差不大的。2023/2/624(4) 對三維景物圖像的理解一個視角的二維圖像通常是不夠的。(5) 數(shù)字圖像處理后的圖像很多情況下是給人觀察和評價的,因此受人的因素影響較大。正面還是側(cè)面?2023/2/625歷史追溯(1)20世紀20年代:最早的應用之一是報紙業(yè)Bartlane電纜圖片傳輸系統(tǒng);通過海底電纜將圖像從倫敦傳往紐約;為了使用電纜傳輸,圖像需要首先編碼,并在接收端通過電報打印機進行重構。早期的數(shù)字圖像2023/2/626歷史追溯(2)20世紀20年代中期到末期:改進Bartlane系統(tǒng)后,圖像質(zhì)量得到了提高打印過程采用了新的光學還原技術增加了圖像的灰度等級改進后的數(shù)字圖像早期15級色調(diào)的數(shù)字圖像2023/2/627歷史追溯(3)20世紀60年代:由于信息技術的快速發(fā)展,出現(xiàn)了一批數(shù)字圖像處理1964:“旅行者7號”
拍攝的圖像通過計
算機進行處理并提
高了圖像質(zhì)量;此技術也在阿波
羅載人登月飛行
等空間探測器中
得到應用。由“旅行者7號”登陸前拍攝的圖像2023/2/628歷史追溯(4)20世紀70年代:數(shù)字圖像處理開始應用于醫(yī)學領域1979:GodfreyN.Hounsfield先生以及AllanM.Cormack教授由于發(fā)明了“斷層(CT)技術”,共同獲得了諾貝爾醫(yī)學獎,其背后的思想是計算機軸向斷層技術(Computerised
Axial
Tomography(CAT))歷史追溯(5)20世紀70年代末:隨著人工智能的興起和發(fā)展,開始計算機視覺的研究,由2D圖象中獲取3D空間信息20世紀80年代至今:數(shù)字圖像處理技術呈爆炸性發(fā)展,如今已在大量領域擔負著大量的工作:圖像增強/恢復藝術級效果醫(yī)學可視化工業(yè)檢驗法律執(zhí)行人機交互2023/2/631數(shù)字圖像處理的內(nèi)容包括圖像變換、圖像編碼、圖像增強、圖像恢復、圖像分割、圖像的理解和識別。2023/2/632數(shù)字圖像處理主要研究的內(nèi)容圖像變換:
如付立葉變換、沃爾什變換、離散余弦變換(DCT)等間接處理技術,將空間域的處理轉(zhuǎn)換為變換域處理,不僅可減少計算量,而且可獲得更有效的處理。目前小波變換在時域和頻域中都具有良好的局部化特性,它在圖像處理中也有著廣泛而有效的應用。2023/2/633圖像編碼壓縮:
圖像編碼壓縮技術可減少描述圖像的數(shù)據(jù)量(即比特數(shù)),以便節(jié)省圖像傳輸、處理時間和減少存儲器容量。壓縮可以在不失真前提下獲得,也可以在允許的失真條件下進行。編碼是壓技縮技術中最重要的方法,它在圖像處理技術中是發(fā)展最早且比較成熟的技術。2023/2/6348x8的DCT變換,64個系數(shù)中只保留6個低頻分量。2023/2/635圖像增強和復原:目的是提高圖像的質(zhì)量,如去除噪聲,提高清晰度等。圖像增強不考慮圖像降質(zhì)的原因,突出圖像中所感興趣的部分。如強化圖像高頻分量,可使圖像中物體輪廓清晰,細節(jié)明顯;如強調(diào)低頻分量可減少圖像中噪聲影響。圖像復原要求對圖像降質(zhì)的原因有一定的了解,建立“降質(zhì)模型”,再采用某種方法,恢復或重建原來的圖像。2023/2/636圖像增強/group/dipr2023/2/637運動模糊圖像恢復圖像圖像恢復(1)2023/2/638數(shù)字圖像處理中的關鍵技術之一。將圖像中有意義的特征部分提取出來,其有意義的特征有圖像中物體的邊緣、區(qū)域等,進一步進行圖像識別、分析和理解的基礎。圖像分割:2023/2/639圖像的分割圖像識別模式識別:使計算機模仿人的感知能力,從感知數(shù)據(jù)中提取信息(判別物體和行為)的過程。數(shù)據(jù)獲取模式分割模式識別姚明ROCKETS11概念DatadrivenModelbased圖像檢索2023/2/642數(shù)字圖像處理應用圖像的降噪(除噪)2023/2/643在安檢系統(tǒng)中的偽彩色圖像增強數(shù)字圖像處理應用2023/2/644PS圖像處理與識別應用3DPS2023/2/645視頻監(jiān)控--世界上超級大數(shù)據(jù)生成器
圖像處理與識別應用2023/2/646人機交互
BaiduE
溫馨提示
- 1. 本站所有資源如無特殊說明,都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請下載最新的WinRAR軟件解壓。
- 2. 本站的文檔不包含任何第三方提供的附件圖紙等,如果需要附件,請聯(lián)系上傳者。文件的所有權益歸上傳用戶所有。
- 3. 本站RAR壓縮包中若帶圖紙,網(wǎng)頁內(nèi)容里面會有圖紙預覽,若沒有圖紙預覽就沒有圖紙。
- 4. 未經(jīng)權益所有人同意不得將文件中的內(nèi)容挪作商業(yè)或盈利用途。
- 5. 人人文庫網(wǎng)僅提供信息存儲空間,僅對用戶上傳內(nèi)容的表現(xiàn)方式做保護處理,對用戶上傳分享的文檔內(nèi)容本身不做任何修改或編輯,并不能對任何下載內(nèi)容負責。
- 6. 下載文件中如有侵權或不適當內(nèi)容,請與我們聯(lián)系,我們立即糾正。
- 7. 本站不保證下載資源的準確性、安全性和完整性, 同時也不承擔用戶因使用這些下載資源對自己和他人造成任何形式的傷害或損失。
最新文檔
- 中國大理石磨邊機行業(yè)市場現(xiàn)狀分析及競爭格局與投資發(fā)展研究報告(2024-2030版)
- 中國呼吸系統(tǒng)和肺部疾病藥物應用領域分析及發(fā)展前景規(guī)劃研究報告(2024-2030版)
- 中國醫(yī)藥箱行業(yè)市場現(xiàn)狀分析及競爭格局與投資發(fā)展研究報告(2024-2030版)
- 中國全乳脂冰淇淋行業(yè)消費狀況與營銷趨勢預測研究報告(2024-2030版)
- 中國二酚行業(yè)需求態(tài)勢及應用前景預測研究報告(2024-2030版)
- 2024-2030年麥克風架行業(yè)市場現(xiàn)狀供需分析及投資評估規(guī)劃分析研究報告
- 2024-2030年高速模具電磨市場發(fā)展現(xiàn)狀分析及行業(yè)投資戰(zhàn)略研究報告
- 上海市浦東新區(qū)川沙中學2025屆高三上物理期中綜合測試試題含解析
- 2025屆廣州協(xié)和中學物理高二第一學期期末綜合測試試題含解析
- 2025屆云南省麗江市古城二中物理高二上期中學業(yè)水平測試試題含解析
- 小學生如何在公園展現(xiàn)文明禮儀
- 2024年中煤集團招聘筆試參考題庫含答案解析
- 理想信念教育課件
- 9《古代科技-耀我中華》改變世界的四大發(fā)明-(課件)部編版道德與法治五年級上冊-
- 部編高中語文必修上冊《師說》課件34張
- 地理信息科學專業(yè)職業(yè)生涯規(guī)劃書
- 企業(yè)家案例分析課件
- 職業(yè)生涯規(guī)劃-醫(yī)生職業(yè)說明
- 學而思小學奧數(shù)知識體系
- 教育科學研究方法的教案
- 輸精管吻合術后護理查房
評論
0/150
提交評論