版權(quán)說明:本文檔由用戶提供并上傳,收益歸屬內(nèi)容提供方,若內(nèi)容存在侵權(quán),請進行舉報或認領
文檔簡介
2數(shù)字圖像處理概述2數(shù)字圖像處理概述12.1數(shù)字圖像處理及其特點2.1.1數(shù)字圖像與數(shù)字圖像處理1.數(shù)字圖像用計算機進行圖像處理的前提是圖像必須以數(shù)字格式存儲,我們把以數(shù)字格式存放的圖像稱之為數(shù)字圖像。常見的各種照片、圖片、海報、廣告畫等均屬模擬圖像,要將模擬圖像數(shù)字化后生成數(shù)字圖像,需要利用數(shù)字化設備。目前,將模擬圖像數(shù)字化的主要設備是掃描儀,將視頻畫面數(shù)字化的設備有圖像采集卡。當然,也可以利用數(shù)碼照相機直接拍攝以數(shù)字格式存放的數(shù)字圖像。模擬圖像經(jīng)掃描儀進行數(shù)字化或由數(shù)碼照相機拍攝的自然景物圖像,在計算機中均是以數(shù)字格式存儲的。既然是數(shù)字,計算機當然可以方便地進行各種處理,以達到視覺效果和特殊效果。
2.1數(shù)字圖像處理及其特點2.1.1數(shù)字圖像與數(shù)字圖像處2
在計算機中,圖像被分割成圖2-1所示的像素(Pixel),各像素的灰度值用整數(shù)表示。一幅M×N個像素的數(shù)字圖像,其像素灰度值可以用M行、N列的矩陣G表示:
(2-1)在計算機中,圖像被分割成圖2-1所示的像素(3圖2-1數(shù)字圖像圖2-1數(shù)字圖像4
2.數(shù)字圖像處理
1)數(shù)字圖像處理數(shù)字計算機最擅長的莫過于處理各種數(shù)據(jù),數(shù)字化后的圖像可以看成是存儲在計算機中的有序數(shù)據(jù),當然可以通過計算機對數(shù)字圖像進行處理。我們把利用計算機對圖像進行去除噪聲、增強、復原、分割、提取特征等的理論、方法和技術(shù)稱為數(shù)字圖像處理(DigitalImageProcessing)。一般,圖像處理是用計算機和實時硬件實現(xiàn)的,因此也稱之為計算機圖像處理(ComputerImageProcessing)。
2.數(shù)字圖像處理5
在日常生活中,圖像處理已經(jīng)得到廣泛應用。例如,電腦人像藝術(shù),電視中的特殊效果,自動售貨機鈔票的識別,郵政編碼的自動識別和利用指紋、虹膜、面部等特征的身份識別等。在醫(yī)學領域,很早以前就采用X射線透視、顯微鏡照片等來診斷疾病。現(xiàn)在,計算機圖像處理已成為疾病診斷的重要手段,用一般攝影方法不能獲取的身體內(nèi)部的狀況,也能由特殊的圖像處理裝置獲取,最具有代表性的就是X射線CT(ComputedTomograph,計算機斷層攝像)。
在日常生活中,圖像處理已經(jīng)得到廣泛應用。例如6
2)數(shù)字圖像處理的重要意義數(shù)字圖像處理的產(chǎn)生和迅速發(fā)展主要受如下三個方面的影響。一是計算機的發(fā)展。早期的計算機無論在計算速度或存儲容量方面,難于滿足對龐大圖像數(shù)據(jù)進行實時處理的要求。隨著計算機硬件技術(shù)及數(shù)字化技術(shù)的發(fā)展,計算機、內(nèi)存及外圍設備的價格急劇下降,而其性能卻有了大幅度的提高。過去只能用大型計算機完成的龐大處理,現(xiàn)在,在個人計算機(PC機)上也能夠輕而易舉地實現(xiàn)。二是數(shù)學的發(fā)展,特別是離散數(shù)學理論的創(chuàng)立和完善,為數(shù)字圖像處理奠定了理論基礎。
2)數(shù)字圖像處理的重要意義7三是軍事、醫(yī)學和工業(yè)等方面應用需求的不斷增長。自20世紀20年代,圖像處理首次應用于改善倫敦和紐約之間海底電纜發(fā)送的圖片質(zhì)量以來,經(jīng)過幾十年的研究與發(fā)展,數(shù)字圖像處理的理論和方法進一步完善,應用范圍更加廣闊,已經(jīng)成為一門新興的學科,并在向更高級的方向發(fā)展。如在景物理解和計算機視覺(機器視覺)方面,圖像處理已由二維處理發(fā)展到三維理解或解釋。近幾年來,隨著計算機和各個相關領域研究的迅速發(fā)展,科學計算可視化、多媒體技術(shù)等研究和應用的興起,數(shù)字圖像處理從一個專門領域的學科,變成了一種新型的科學研究和人機界面的工具。三是軍事、醫(yī)學和工業(yè)等方面應用需求的不斷增長82.1.2數(shù)字圖像處理的特點數(shù)字圖像處理是利用計算機的計算,實現(xiàn)與光學系統(tǒng)模擬處理相同效果的過程。數(shù)字圖像處理具有如下特點:(1)處理精度高,再現(xiàn)性好。利用計算機進行圖像處理,其實質(zhì)是對圖像數(shù)據(jù)進行各種運算。由于計算機技術(shù)的飛速發(fā)展,計算精度和計算的正確性勿庸置疑;另外,對同一圖像用相同的方法處理多次,也可得到完全相同的效果,具有良好的再現(xiàn)性。(2)處理的多樣性。由于圖像處理是通過運行程序進行的,因此,設計不同的圖像處理程序,可以實現(xiàn)各種不同的處理目的。
2.1.2數(shù)字圖像處理的特點9(3)圖像數(shù)據(jù)量龐大。圖像中包含有豐富的信息,可以通過圖像處理技術(shù)獲取圖像中包含的有用的信息,但是,數(shù)字圖像的數(shù)據(jù)量巨大。一幅數(shù)字圖像是由圖像矩陣中的像素(Pixel)組成的,通常每個像素用紅、綠、藍三種顏色表示,每種顏色用8bit表示灰度級。則一幅1024×1024不經(jīng)壓縮的真彩色圖像,數(shù)據(jù)量達3MB。X射線照片一般用64~256Kb的數(shù)據(jù)量,一幅遙感圖像為30Mb。如此龐大的數(shù)據(jù)量給存儲、傳輸和處理都帶來巨大的困難。如果精度及分辨率再提高,所需處理時間將大幅度增加。
(3)圖像數(shù)據(jù)量龐大。圖像中包含有豐富的信息,可10(4)處理費時。由于圖像數(shù)據(jù)量大,因此處理比較費時。特別是處理結(jié)果與中心像素鄰域有關的處理過程花費時間更多。(5)圖像處理技術(shù)綜合性強。數(shù)字圖像處理涉及的技術(shù)領域相當廣泛,如通信技術(shù)、計算機技術(shù)、電子技術(shù)、電視技術(shù)等,當然,數(shù)學、物理學等領域更是數(shù)字圖像處理的基礎。
(4)處理費時。由于圖像數(shù)據(jù)量大,因此處理比較費112.2數(shù)字圖像處理的目的和主要內(nèi)容2.2.1數(shù)字圖像處理的目的一般而言,對圖像進行加工和分析主要有如下三方面的目的:(1)提高圖像的視感質(zhì)量,以達到賞心悅目的目的。如去除圖像中的噪聲,改變圖像的亮度、顏色,增強圖像中的某些成份、抑制某些成份,對圖像進行幾何變換等,從而改善圖像的質(zhì)量,以達到或真實的、或清晰的、或色彩豐富的、或意想不到的藝術(shù)效果。2.2數(shù)字圖像處理的目的和主要內(nèi)容2.2.1數(shù)字圖像處12(2)提取圖像中所包含的某些特征或特殊信息,以便于計算機分析,例如,常用作模式識別、計算機視覺的預處理等。這些特征包括很多方面,如頻域特性、灰度/顏色特性、邊界/區(qū)域特性、紋理特性、形狀/拓撲特性以及關系結(jié)構(gòu)等。(3)對圖像數(shù)據(jù)進行變換、編碼和壓縮,以便于圖像的存儲和傳輸。(2)提取圖像中所包含的某些特征或特殊信息,以132.2.2數(shù)字圖像處理的主要內(nèi)容
不管圖像處理是何種目的,都需要用計算機圖像處理系統(tǒng)對圖像數(shù)據(jù)進行輸入、加工和輸出,因此數(shù)字圖像處理研究的內(nèi)容主要有以下7個過程。
1.圖像獲取、表示和表現(xiàn)(ImageAcquisition,RepresentationandPresentation)該過程主要是把模擬圖像信號轉(zhuǎn)化為計算機所能接受的數(shù)字形式,以及把數(shù)字圖像顯示和表現(xiàn)出來(如打?。?。這一過程主要包括攝取圖像、光電轉(zhuǎn)換及數(shù)字化等幾個步驟。
2.2.2數(shù)字圖像處理的主要內(nèi)容14
2.圖像復原(ImageRestoration)當造成圖像退化(圖像品質(zhì)下降)的原因已知時,復原技術(shù)可以對圖像進行校正。圖像復原最關鍵的是對每種退化都需要有一個合理的模型。例如,掌握了聚焦不良成像系統(tǒng)的物理特性,便可建立復原模型,而且對獲取圖像的特定光學系統(tǒng)的直接測量也是可能的。退化模型和特定數(shù)據(jù)一起描述了圖像的退化,因此,復原技術(shù)是基于模型和數(shù)據(jù)的圖像恢復,其目的是消除退化的影響,從而產(chǎn)生一個等價于理想成像系統(tǒng)所獲得的圖像。
2.圖像復原(ImageRestora153.圖像增強(ImageEnhancement)圖像增強是對圖像質(zhì)量在一般意義上的改善。當無法知道圖像退化有關的定量信息時,可以使用圖像增強技術(shù)較為主觀地改善圖像的質(zhì)量。所以,圖像增強技術(shù)是用于改善圖像視感質(zhì)量所采取的一種方法。因為增強技術(shù)并非是針對某種退化所采取的方法,所以很難預測哪一種特定技術(shù)是最好的,只能通過試驗和分析誤差來選擇一種合適的方法。有時可能需要徹底改變圖像的視覺效果,以便突出重要特征的可觀察性,使人或計算機更易觀察或檢測。在這種情況下,可以把增強理解為增強感興趣特征的可檢測性,而非改善視感質(zhì)量。電視節(jié)目片頭或片尾處的顏色、輪廓等的變換,其目的是得到一種特殊的藝術(shù)效果,增強動感和力度。
3.圖像增強(ImageEnhancem16
4.圖像分割(ImageSegmentation)把圖像分成區(qū)域的過程就是圖像分割。圖像中通常包含多個對象,例如,一幅醫(yī)學圖像中顯示出正常的或有病變的各種器官和組織。圖像處理為達到識別和理解的目的,幾乎都必須按照一定的規(guī)則將圖像分割成區(qū)域,每個區(qū)域代表被成像的一個物體(或部分)。圖像自動分割是圖像處理中最困難的問題之一。人類視覺系統(tǒng)的優(yōu)越性,使得人類能夠?qū)⑺^察的復雜場景中的對象分開,并識別出每個物體。但對計算機來說,這卻是一個難題。目前,大部分圖像的自動分割還需要人工提供必需的信息來幫助,只有一部分領域(如印刷字符自動識別(OCR)、指紋識別等)開始使用。由于解決和分割有關的基本問題是特定領域中圖像分析實用化的關鍵一步,因此,將各種方法融合在一起并使用知識來提高處理的可靠性和有效性是圖像分割的研究熱點。4.圖像分割(ImageSegmenta17
5.圖像分析圖像處理應用的目標幾乎均涉及到圖像分析,即對圖像中的不同對象進行分割、特征提取和表示,從而有利于計算機對圖像進行分類、識別和理解。在工業(yè)產(chǎn)品零件無缺陷且正確裝配檢測中,圖像分析是對圖像中的像素轉(zhuǎn)化成一個“合格”或“不合格"的判定。在有的應用中,如醫(yī)學圖像處理,不僅要檢測出物體(如腫瘤)的存在,而且還要檢查物體的大小。
5.圖像分析18
6.圖像重建圖像重建與上述的圖像增強、圖像復原等不同。圖像增強、圖像復原的輸入是圖像,處理后輸出的結(jié)果也是圖像,而圖像重建是指從數(shù)據(jù)到圖像的處理,即輸入的是某種數(shù)據(jù),而經(jīng)過處理后得到的結(jié)果是圖像,CT就是圖像重建處理的典型應用實例。目前,圖像重建與計算機圖形學相結(jié)合,把多個二維圖像合成三維圖像,并加以光照模型和各種渲染技術(shù),能生成各種具有強烈真實感的高質(zhì)量圖像。6.圖像重建19
7.圖像壓縮編碼數(shù)字圖像的特點之一是數(shù)據(jù)量龐大。盡管現(xiàn)在有大容量的存貯器,但仍不能滿足對圖像數(shù)據(jù)(尤其是動態(tài)圖像、高分辨率圖像)處理的需要,因此在實際應用中圖像壓縮是必需的。如果數(shù)據(jù)不壓縮,則在存儲和傳輸中就需要占很大的容量和帶寬,因而增加了成本。圖像壓縮的目的就是壓縮數(shù)據(jù)量。
7.圖像壓縮編碼20圖像編碼主要是利用圖像信號的統(tǒng)計特性及人類視覺的生理學及心理學特性,對圖像信號進行高效編碼,即研究數(shù)據(jù)壓縮技術(shù),目的是在保證圖像質(zhì)量的前提下壓縮數(shù)據(jù),便于存儲和傳輸,以解決數(shù)據(jù)量大的矛盾。一般來說,圖像編碼的目的有三個:①減少數(shù)據(jù)存儲量;②降低數(shù)據(jù)率以減少傳輸帶寬;③壓縮信息量,便于特征提取,為后續(xù)識別作準備。圖像編碼主要是利用圖像信號的統(tǒng)計特性及人類視21從編碼技術(shù)發(fā)展來看,Kunt提出第一代、第二代編碼的概念。第一代編碼是以去除冗余為基礎的編碼方法,如PCM、DPCM、ΔM、亞取樣編碼法、DFT、DCT、W-H變換編碼法以及以此為基礎的混合編碼法。第二代編碼法多為20世紀80年代以后提出的,如金字塔編碼法、Fractal編碼法、小波變換編碼法、基于神經(jīng)網(wǎng)絡的編碼法、模型基編碼法等。這些編碼方法有如下特點:①充分考慮人的視覺特性;②恰當?shù)乜紤]對圖像信號的分解與表述;③采用圖像的合成與識別方案壓縮數(shù)據(jù)。從編碼技術(shù)發(fā)展來看,Kunt提出第一代、第二代222.3圖像工程與相關學科2.3.1圖像工程的內(nèi)涵
圖像工程的內(nèi)容非常豐富,根據(jù)抽象程度和研究方法等的不同,可分為圖像處理、圖像分析和圖像理解三個層次,如圖2-2所示。換句話說,圖像工程是既有聯(lián)系又有區(qū)別的圖像處理、圖像分析及圖像理解三者的有機結(jié)合,另外還包括它們的工程應用。2.3圖像工程與相關學科2.3.1圖像工程的內(nèi)涵23圖2-2圖像工程三層次示意圖
圖2-2圖像工程三層次示意圖24
2.圖像分析
圖像分析主要是對圖像中感興趣的目標進行檢測和測量,以獲得它們的客觀信息,從而建立對圖像的描述。如果說圖像處理是一個從圖像到圖像的過程,則圖像分析就是一個從圖像到數(shù)據(jù)的過程。這里的數(shù)據(jù)可以是目標特征的測量結(jié)果,或是基于測量的符號表示,它們描述了目標的特點和性質(zhì)。
2.圖像分析25
3.圖像理解
圖像理解的重點是在圖像分析的基礎上,進一步研究圖像中各目標的性質(zhì)和它們之間的相互聯(lián)系,并得出對圖像內(nèi)容含義的理解以及對原來客觀場景的解釋,從而指導決策。如果說圖像分析主要是以觀察者為中心研究客觀世界,那么圖像理解在一定程度上就是以客觀世界為中心,借助知識、經(jīng)驗等來把握整個客觀世界(包括沒有直接觀察到的事物)。
3.圖像理解26可見,圖像處理、圖像分析和圖像理解是處在三個抽象程度和數(shù)據(jù)量各有特點的不同層次上。圖像處理是比較低層的操作,它主要在圖像像素級上進行處理,處理的數(shù)據(jù)量非常大。圖像分析則進入了中層,分割和特征提取把原來以像素描述的圖像轉(zhuǎn)變成比較簡潔的非圖像形式的描述。圖像理解主要是高層操作,基本上是對從描述抽象出來的符號進行運算,其處理過程和方法與人類的思維推理有許多類似之處。可見,圖像處理、圖像分析和圖像理解是處在三個抽272.3.2相關學科和領域圖像工程是一門系統(tǒng)地研究各種圖像理論、技術(shù)和應用的交叉學科。從它的研究方法來看,它可以與數(shù)學、物理學、生理學、心理學、電子學、計算機科學等許多學科相互借鑒。從它的研究范圍來看,它與模式識別、計算機視覺、計算機圖形學等多個專業(yè)互相交叉。另外,圖像工程的研究進展與人工智能、神經(jīng)網(wǎng)絡、遺傳算法、模糊邏輯等理論和技術(shù)都有密切的聯(lián)系,它的發(fā)展應用與醫(yī)學、遙感、通信、文檔處理和工業(yè)自動化等許多領域也是密不可分的。
2.3.2相關學科和領域28圖像工程與計算機圖形學(ComputerGraphics)、模式識別(PatternRecognition)、計算機視覺(ComputerVision)等的關系如圖2-3所示。計算機圖形學研究的是用計算機技術(shù)生成圖形的理論、方法和技術(shù),即由非圖像形式的數(shù)據(jù)描述來生成逼真的圖像。它可以生成現(xiàn)實世界中已經(jīng)存在的物體的圖形,也可以生成虛構(gòu)物體的圖形,它和圖像分析的對象和輸出結(jié)果正好對調(diào)。圖像模式識別與圖像分析則比較相似,只是前者試圖把圖像分解成可用符號較抽象地描述的類別。計算機視覺主要強調(diào)用計算機實現(xiàn)人的視覺功能,要用到圖像工程三個層次的許多技術(shù),但目前的研究內(nèi)容主要與圖像理解相結(jié)合。
圖像工程與計算機圖形學(ComputerG29圖2-3圖像工程與相關學科的聯(lián)系和區(qū)別
圖2-3圖像工程與相關學科的聯(lián)系和區(qū)別302.4數(shù)字圖像處理系統(tǒng)2.4.1數(shù)字圖像處理系統(tǒng)硬件
早期的數(shù)字圖像處理系統(tǒng)為了提高處理速度、增加容量都采用大型機。隨著計算機性價比(性能價格比)日新月異的提高,以小型機為主的微型圖像處理系統(tǒng)得到發(fā)展。主機為PC機,配以圖像采集卡及顯示設備就構(gòu)成了最基本的微型圖像處理系統(tǒng)。目前,國產(chǎn)的CA540、VP32、FGCT11010N8、CA-CPE-1000、CA-CPE-3000等圖像板研制成功并已商品化。微型圖像處理系統(tǒng)成本低、應用靈活、便于推廣。特別是微型計算機的性能逐年提高,使得微型圖像處理系統(tǒng)的性能也不斷升級,加之軟件配置豐富,使其更具實用意義。
2.4數(shù)字圖像處理系統(tǒng)2.4.1數(shù)字圖像處理系統(tǒng)硬件31圖2-4圖像處理系統(tǒng)示意圖
圖2-4圖像處理系統(tǒng)示意圖321、圖像數(shù)字化設備
1)電視攝像機(VideoCamera)
電視攝像機是目前使用最廣泛的圖像獲取設備。電視攝像機的核心部件是光電轉(zhuǎn)換裝置,也稱為固態(tài)陣。目前大多數(shù)感光基元多為電荷耦合器件CCD(ChargeCoupledDevice),CCD可以將照射在其上的光信號轉(zhuǎn)換為對應的電信號。該設備小巧、速度快、成本低、靈敏度高,多作為實時圖像輸入設備應用。但灰度層次較差、非線性失真較大、有黑斑效應,在使用中需要校正。目前,CCD攝像機可達1920×1035的高分辨率,快門速度可達10-4s。1、圖像數(shù)字化設備33
2)掃描儀(Scanner)
掃描儀是將各種形式的圖像信息(如圖片、照片、膠片及文稿資料等)輸入計算機的重要工具,特點是精度和分辨率高。目前,1200DPI(DotPerInch)以上精度的掃描儀很常見。而且掃描儀的成本很低,一臺平板式掃描儀的價格在千元左右。由于掃描儀良好的精度和低廉的價格,已成為當今應用最為廣泛的圖像數(shù)字化設備。但用掃描儀獲取圖像信息速度較慢,不能實現(xiàn)實時輸入。2)掃描儀(Scanner)343)數(shù)碼照相機(DigitalCamera)
數(shù)碼照相機也叫數(shù)字相機,是一種能夠進行景物拍攝,并以數(shù)字格式存放拍攝圖像的特殊照相機。它的核心部件是CCD圖像傳感器,主流機型分辨率已在400萬像素以上。數(shù)碼照相機的感光器件也是CCD陣列。CCD可以對亮度進行分級,但并不能識別顏色。為此,數(shù)碼照相機用紅、綠和藍三個彩色濾鏡,當光線從紅、綠、藍濾鏡中穿過時,就可以得到每種色光的反應值,再通過軟件對得到的數(shù)據(jù)進行處理,從而確定每一個像素點的顏色。CCD生成的數(shù)字圖像被傳送到照相機的一塊內(nèi)部芯片上。該芯片負責把圖像轉(zhuǎn)換成相機內(nèi)部的存儲格式(通常為JPEG格式)。最后,把生成的圖像保存在存儲卡中。數(shù)碼照相機可通過USB接口與計算機相連,將拍攝的圖像下載到計算機中,以便處理或插到文檔/Web頁面中,或用彩色打印機輸出。3)數(shù)碼照相機(DigitalCamer35
4)遙感圖像獲取設備
遙感中常用的圖像獲取設備有光學攝影設備,如攝像機、多光譜像機等;紅外攝影設備,如紅外輻射計、紅外攝像儀、多通道紅外掃描儀、多光譜掃描儀(MSS);微波設備,如微波輻射計、側(cè)視雷達、真空孔徑雷達、合成孔徑雷達(SAR)。4)遙感圖像獲取設備36
2.圖像輸入卡(采集卡)
通常圖像輸入卡安裝于計算機主板擴展槽中,主要包括圖像存儲器單元、顯示查找表(LUT)單元、CCD攝像頭接口(A/D)、監(jiān)視器接口(D/A)和PC機總線接口單元。工作過程如下:攝像頭實時或準實時采集圖像數(shù)據(jù),經(jīng)A/D變換后將圖像存放在圖像存儲單元的一個或三個通道中,D/A變換電路自動將圖像顯示在監(jiān)視器上。通過主機發(fā)出指令,將某一幀圖像靜止在存儲通道中,即采集或捕獲一幀圖像,然后可對圖像進行處理或存盤。高檔卡還包括卷積濾波、FFT(快速傅立葉變換)等圖像處理專用的快速部件?,F(xiàn)在有的圖像采集卡將圖像和圖形功能合為一體,如北京大恒圖像視覺有限公司開發(fā)的VIDEO-PCI-C真彩色圖像采集卡。該卡基于PCI總線設計,它將圖像和VGA的圖形功能合為一體,可在計算機屏幕上實時顯示彩色活動圖像,其分辨率為768×576。2.圖像輸入卡(采集卡)37
3.顯示卡顯示卡是記憶和保存圖像的地方,通常,存貯的圖像要隨時顯示在顯示器上。PC機多采用800×600或1024×768個像素點。通常在圖像處理裝置中,灰度值紅(R)、綠(G)、藍(B)各占8位(bit),共計24位,可以表示1670萬種顏色,這種顯示卡稱為真彩色顯示卡。3.顯示卡38
4.計算機
圖像處理的主要特點是數(shù)據(jù)量大、運算時間長,因而對系統(tǒng)硬件配置要求較高。目前,在PC機上配置奔騰P42.4G以上CPU、512MB內(nèi)存、80G以上硬盤的計算機已屬常見,計算速度大幅度提高,可與幾年前的大型機媲美。為了加快圖像的顯示和處理速度,用于圖像處理的PC機配置應盡可能高一些。當然,有條件時最好采用圖形工作站進行圖像處理。4.計算機39
5.圖像存貯裝置
圖像數(shù)據(jù)量龐大,早期其存儲成為問題。到目前為止,除了大容量磁盤可供存儲圖像數(shù)據(jù)之外,MO、CD、DVD等光學存儲裝置以及SAN、NAS等網(wǎng)絡存儲系統(tǒng),為存儲海量圖像數(shù)據(jù)提供了極好的支持。5.圖像存貯裝置402.4.2高速圖像處理卡
實用圖像處理系統(tǒng)分為在線處理系統(tǒng)和離線處理系統(tǒng)兩種形式。在研究中,多采用離線圖像處理系統(tǒng),主要用于開發(fā)和驗證圖像處理與分析的算法。在線圖像處理系統(tǒng)除上述設備外,還需用圖像處理專用硬件代替圖像采集卡,以構(gòu)成自動處理系統(tǒng),可以對生產(chǎn)現(xiàn)場采集的圖像進行實時處理,并對其處理結(jié)果進行監(jiān)控。2.4.2高速圖像處理卡412.4.3圖像處理系統(tǒng)軟件微型圖像處理系統(tǒng)既包含硬件設備,也需要一定的軟件環(huán)境支持。目前,圖像處理系統(tǒng)平臺多為MicrosoftWindows或X-Windows,開發(fā)的主流工具為Microsoft公司的VC++。這是因為VC++是一種具有高度綜合性能的軟件開發(fā)工具,用它開發(fā)出來的程序有著運行速度快、可移植能力強等優(yōu)點。此外,各國的科學家和研究機構(gòu)開發(fā)了不少專用的圖像處理軟件環(huán)境,下面僅對主要的幾種作一簡單介紹。
2.4.3圖像處理系統(tǒng)軟件42
1.MATLAB的圖像處理工具箱
MATLAB是由美國MathWorks公司推出的用于數(shù)值計算的有力工具,它具有相當強大的矩陣運算和操作功能,并且MATLAB圖像處理工具箱提供了豐富的圖像處理函數(shù),靈活運用這些函數(shù)幾乎可以完成所有的圖像處理工作,從而大大節(jié)省編寫低層算法代碼的時間,避免程序設計中的重復勞動,達到事半功倍的效果。但是,MATLAB強大的功能只能在安裝有MATLAB系統(tǒng)的機器上使用圖像處理工具箱中的函數(shù)或自編的m文件來實現(xiàn),實際應用極為不便,且MATLAB使用行解釋方式執(zhí)行代碼,執(zhí)行速度很慢。
1.MATLAB的圖像處理工具箱43為將MATLAB的強大功能融入各種應用程序中,通過高級語言編譯器編譯為二進制代碼已逐漸成為研究熱點。MathTools公司推出的MatCom可以把MATLAB語言翻譯成為C或C++語言,但其翻譯的代碼不夠簡捷。更直接的方法是利用MatCom提供的Matrix<LIB>C++庫實現(xiàn)MATLAB與C++的接口。為將MATLAB的強大功能融入各種應用程序中44
2.AVS和SPIDER1)AVS(ApplicationVisualizationSystem)AVS是對龐大的數(shù)據(jù)量進行可視化處理的通用系統(tǒng)之一。最初,該系統(tǒng)是為了對科學計算的結(jié)果進行可視化(ScientificVisualization)處理而開發(fā)的系統(tǒng),現(xiàn)在已經(jīng)在如下領域中廣泛使用。·醫(yī)學圖像、有限元法分析、流體力學、檢測/實驗結(jié)果的表示;·資源探索、環(huán)境科學、遙感、一般圖像處理;·量子力學、分子設計、CAD數(shù)據(jù)表示、OR分析;·金融數(shù)據(jù)分析、一般科學分析。
2.AVS和SPIDER45AVS作為應用軟件具有如下強大的功能:·數(shù)據(jù)顯示:Pointer和Clicker類型數(shù)據(jù)的可視化應用。·幾何顯示:可以進行人機對話的三維幾何數(shù)據(jù)的顯示?!D像顯示:可以進行人機對話的二維圖像的顯示。·圖形顯示:完成畫圖功能?!こ瘮?shù):圖像處理、聲音波形圖。AVS作為應用軟件具有如下強大的功能:46
2)SPIDERViewer
SPIDER(SubroutinePackageforImageDataEnhancementandRecognition)是由日本通產(chǎn)省工業(yè)技術(shù)院電子技術(shù)綜合研究所開發(fā)的圖像處理程序庫,如表2-1所示。它包含了圖像處理領域中的基本算法和實現(xiàn)方法,因此得到了很高的評價,之后又追加了基本的圖像分析算法,立體圖像、距離圖像、文本、畫面處理等領域的算法,稱之為SPIDERII,目前已經(jīng)得到了廣泛的應用。2)SPIDERViewer47第2章多媒體圖像處理課件48第2章多媒體圖像處理課件493.IUE(ImageUnderstandingEnvironment)對圖像處理和圖像理解算法優(yōu)劣的評價是非常困難的。為此,世界范圍內(nèi)的圖像工程科研人員就評價問題進行了研討,以構(gòu)建可重復利用的軟件開發(fā)環(huán)境。IUE就是以美國為主,日本和歐洲共同參加開發(fā)的圖像處理系統(tǒng)。該系統(tǒng)可以實現(xiàn)圖像理解計算模型的確立,進行嚴密的幾何學描述,能應用于各種類型的圖像,從而提高研究效率,促進技術(shù)積累和技術(shù)轉(zhuǎn)移。針對上述目標,IUE有效利用現(xiàn)有軟件,開發(fā)了運行在UNIX工作站上(SunOS、Linux)的面向?qū)ο蟮某绦?C++),并從LaTeX自動生成C++源代碼,以滿足實際需要。
3.IUE(ImageUndersta50IUE不僅提供函數(shù)庫和數(shù)據(jù)庫,為了能正確地描述有關光源、物體、傳感器等幾何學和光學的關系,還提供了類的分層結(jié)構(gòu)關系。并且也提供了坐標系和坐標變換的類,它是用矢量圖來表示的。這種類有600個,還有400個模板及類成員,可以說它是一個巨大的資源庫。IUE系統(tǒng)不單是圖像處理系統(tǒng),而且還是由輸入圖像轉(zhuǎn)換為三維場景描述的圖像理解的信息環(huán)境。在此環(huán)境中,可以處理圖像數(shù)據(jù),線段、區(qū)域、面等幾何數(shù)據(jù),以及對于認識、理解的高級處理時的知識表達、幾何數(shù)據(jù)之間關系的符號數(shù)據(jù)等。IUE不僅提供函數(shù)庫和數(shù)據(jù)庫,為了能正確地描512.5數(shù)字圖像處理的應用數(shù)字圖像處理主要應用于下面的幾個領域。1)通訊通訊包括圖像傳輸、電視電話、電視會議等,主要是進行圖像壓縮甚至理解基礎上的壓縮。2)宇宙探測由于太空技術(shù)的發(fā)展,需要用數(shù)字圖像處理技術(shù)處理大量的星體照片。
2.5數(shù)字圖像處理的應用數(shù)字圖像處理主要應52
3)遙感
航空遙感和衛(wèi)星遙感圖像需要用數(shù)字技術(shù)加工處理,并提取有用的信息。主要用于地形地質(zhì),礦藏探查,森林、水利、海洋、農(nóng)業(yè)等資源調(diào)查,自然災害預測預報,環(huán)境污染監(jiān)測,氣象衛(wèi)星云圖處理以及地面軍事目標的識別。
3)遙感534)生物醫(yī)學領域中的應用圖像處理在醫(yī)學界的應用非常廣泛,無論是臨床診斷還是病理研究都大量采用圖像處理技術(shù)。它的直觀、無創(chuàng)傷、安全方便等優(yōu)點備受青睞。圖像處理首先應用于細胞分類、染色體分類和放射圖像等。70年代數(shù)字圖像處理在醫(yī)學上的應用有了重大突破,1972年X射線斷層掃描CT得到實用;1977年白血球自動分類儀問世;1980實現(xiàn)了CT的立體重建。有人認為計算機圖像處理在醫(yī)學上應用最成功的例子就是X射線CT,其中主要研制者Hounsfeld(英)和Commack(美)獲得了1979年的諾貝爾生理醫(yī)學獎。4)生物醫(yī)學領域中的應用545)工業(yè)生產(chǎn)中的應用在生產(chǎn)線中對產(chǎn)品及部件進行無損檢測是圖像處理技術(shù)的重要應用領域。該領域的應用從70年代起取得了迅速的發(fā)展,主要有產(chǎn)品質(zhì)量檢測、生產(chǎn)過程的自動控制、CAD/CAM等。在產(chǎn)品質(zhì)量檢測方面,如食品、水果質(zhì)量檢查,無損探傷,焊縫質(zhì)量或表面缺陷。又如,金屬材料的成分和結(jié)構(gòu)分析,紡織品質(zhì)量檢查,光測彈性力學中應力條紋的分析等。在電子工業(yè)中,可以用來檢驗印刷電路板的質(zhì)量、監(jiān)測零件部件的裝配等。在工業(yè)自動控制中,主要使用機器視覺系統(tǒng)對生產(chǎn)過程進行監(jiān)視和控制,如港口的監(jiān)測調(diào)度、交通管理、流水生產(chǎn)線的自動控制等。在計算機輔助設計和輔助制造方面,已獲得越來越廣泛的應用,并和基于圖形學的模具、機械零件、服裝、印染花型CAD結(jié)合。目前二維圖紙自動輸入和理解,根據(jù)3D實物建立CAD模型等越來越引起重視。
5)工業(yè)生產(chǎn)中的應用556)軍事、公安等方面的應用
軍事目標的偵察、制導和警戒系統(tǒng)、自動滅火器的控制及反偽裝;公安部門的現(xiàn)場照片、指紋、手跡、印章、人像等的處理和辨識;歷史文字和圖片檔案的修復和管理等。
7)機器人視覺
機器視覺作為智能機器人的重要感覺器官,主要進行三維景物理解和識別,是目前處于研究之中的開放課題。機器視覺主要用于軍事偵察、危險環(huán)境的自主機器人,郵政、醫(yī)院和家庭服務的智能機器人,裝配線工件識別、定位,太空機器人的自動操作等。6)軍事、公安等方面的應用568)視頻和多媒體系統(tǒng)目前,電視制作系統(tǒng)廣泛使用的圖像處理、變換、合成,多媒體系統(tǒng)中靜止圖像和動態(tài)圖像的采集、壓縮、處理、存貯和傳輸?shù)取?)科學可視化[HTSS]圖像處理和圖形學緊密結(jié)合,形成了科學研究各個領域新型的研究工具。8)視頻和多媒體系統(tǒng)5710)電子商務在當前呼聲甚高的電子商務中,圖像處理技術(shù)也大有可為,如身份認證、產(chǎn)品防偽、水印技術(shù)等??傊?,圖像處理技術(shù)應用領域相當廣泛,已在國家安全、經(jīng)濟發(fā)展、日常生活中充當越來越重要的角色,對國計民生的作用不可低估。10)電子商務582.6數(shù)字圖像處理的發(fā)展動向(1)在進一步提高精度的同時著重解決處理速度問題。如,在航天遙感、氣象云圖處理方面,巨大的數(shù)據(jù)量和處理速度仍然是主要矛盾之一。(2)加強軟件研究、開發(fā)新的處理方法,特別要注意移植和借鑒其他學科的技術(shù)和研究成果,創(chuàng)造新的處理方法。(3)加強邊緣學科的研究工作,促進圖像處理技術(shù)的發(fā)展。如,人的視覺特性、心理學特性等的研究,如果有所突破,將對圖像處理技術(shù)的發(fā)展起到極大的促進作用。
2.6數(shù)字圖像處理的發(fā)展動向(1)在進一步提59(4)加強理論研究,逐步形成圖像處理科學自身的理論體系。(5)圖像處理領域的標準化。圖像的信息量大、數(shù)據(jù)量大,因而圖像信息的建庫、檢索和交流是一個重要的問題。就現(xiàn)有的情況看,軟件、硬件種類繁多,交流和使用極為不便,成為資源共享的嚴重障礙。應建立圖像信息庫,統(tǒng)一存放格式,建立標準子程序,統(tǒng)一檢索方法。(4)加強理論研究,逐步形成圖像處理科學自60圖像處理技術(shù)未來發(fā)展大致可歸納為:(1)圖像處理的發(fā)展將圍繞HDTV(高清晰度電視)的研制,開展實時圖像處理的理論及技術(shù)研究,向著高速、高分辨率、立體化、多媒體化、智能化和標準化方向發(fā)展。(2)圖像、圖形相結(jié)合,朝著三維成像或多維成像的方向發(fā)展。(3)硬件芯片研究。把圖像處理的眾多功能固化在芯片上,使之更便于應用。
圖像處理技術(shù)未來發(fā)展大致可歸納為:61(4)新理論與新算法研究。在圖像處理領域,近幾年來,引入了一些新的理論并提出了一些新的算法,如小波分析(Wavelet)、分形幾何(Fractal)、形態(tài)學(Morphology)、遺傳算法(GA,GeneticAlgorithms)、人工神經(jīng)網(wǎng)絡等(Artificialneuralnetworks)。這些理論及建立在其上的算法,將會成為今后圖像處理理論與技術(shù)的研究熱點。數(shù)字圖像處理經(jīng)過初創(chuàng)期、發(fā)展期、普及期及廣泛應用幾個階段,如今已是各個學科競相研究并在各個領域廣泛應用的一門科學。隨著科學技術(shù)的進步以及人類需求的不斷增長,圖像處理科學無論是在理論上還是實踐上,均會取得更大的發(fā)展。(4)新理論與新算法研究。在圖像處理領域,近幾年622數(shù)字圖像處理概述2數(shù)字圖像處理概述632.1數(shù)字圖像處理及其特點2.1.1數(shù)字圖像與數(shù)字圖像處理1.數(shù)字圖像用計算機進行圖像處理的前提是圖像必須以數(shù)字格式存儲,我們把以數(shù)字格式存放的圖像稱之為數(shù)字圖像。常見的各種照片、圖片、海報、廣告畫等均屬模擬圖像,要將模擬圖像數(shù)字化后生成數(shù)字圖像,需要利用數(shù)字化設備。目前,將模擬圖像數(shù)字化的主要設備是掃描儀,將視頻畫面數(shù)字化的設備有圖像采集卡。當然,也可以利用數(shù)碼照相機直接拍攝以數(shù)字格式存放的數(shù)字圖像。模擬圖像經(jīng)掃描儀進行數(shù)字化或由數(shù)碼照相機拍攝的自然景物圖像,在計算機中均是以數(shù)字格式存儲的。既然是數(shù)字,計算機當然可以方便地進行各種處理,以達到視覺效果和特殊效果。
2.1數(shù)字圖像處理及其特點2.1.1數(shù)字圖像與數(shù)字圖像處64
在計算機中,圖像被分割成圖2-1所示的像素(Pixel),各像素的灰度值用整數(shù)表示。一幅M×N個像素的數(shù)字圖像,其像素灰度值可以用M行、N列的矩陣G表示:
(2-1)在計算機中,圖像被分割成圖2-1所示的像素(65圖2-1數(shù)字圖像圖2-1數(shù)字圖像66
2.數(shù)字圖像處理
1)數(shù)字圖像處理數(shù)字計算機最擅長的莫過于處理各種數(shù)據(jù),數(shù)字化后的圖像可以看成是存儲在計算機中的有序數(shù)據(jù),當然可以通過計算機對數(shù)字圖像進行處理。我們把利用計算機對圖像進行去除噪聲、增強、復原、分割、提取特征等的理論、方法和技術(shù)稱為數(shù)字圖像處理(DigitalImageProcessing)。一般,圖像處理是用計算機和實時硬件實現(xiàn)的,因此也稱之為計算機圖像處理(ComputerImageProcessing)。
2.數(shù)字圖像處理67
在日常生活中,圖像處理已經(jīng)得到廣泛應用。例如,電腦人像藝術(shù),電視中的特殊效果,自動售貨機鈔票的識別,郵政編碼的自動識別和利用指紋、虹膜、面部等特征的身份識別等。在醫(yī)學領域,很早以前就采用X射線透視、顯微鏡照片等來診斷疾病?,F(xiàn)在,計算機圖像處理已成為疾病診斷的重要手段,用一般攝影方法不能獲取的身體內(nèi)部的狀況,也能由特殊的圖像處理裝置獲取,最具有代表性的就是X射線CT(ComputedTomograph,計算機斷層攝像)。
在日常生活中,圖像處理已經(jīng)得到廣泛應用。例如68
2)數(shù)字圖像處理的重要意義數(shù)字圖像處理的產(chǎn)生和迅速發(fā)展主要受如下三個方面的影響。一是計算機的發(fā)展。早期的計算機無論在計算速度或存儲容量方面,難于滿足對龐大圖像數(shù)據(jù)進行實時處理的要求。隨著計算機硬件技術(shù)及數(shù)字化技術(shù)的發(fā)展,計算機、內(nèi)存及外圍設備的價格急劇下降,而其性能卻有了大幅度的提高。過去只能用大型計算機完成的龐大處理,現(xiàn)在,在個人計算機(PC機)上也能夠輕而易舉地實現(xiàn)。二是數(shù)學的發(fā)展,特別是離散數(shù)學理論的創(chuàng)立和完善,為數(shù)字圖像處理奠定了理論基礎。
2)數(shù)字圖像處理的重要意義69三是軍事、醫(yī)學和工業(yè)等方面應用需求的不斷增長。自20世紀20年代,圖像處理首次應用于改善倫敦和紐約之間海底電纜發(fā)送的圖片質(zhì)量以來,經(jīng)過幾十年的研究與發(fā)展,數(shù)字圖像處理的理論和方法進一步完善,應用范圍更加廣闊,已經(jīng)成為一門新興的學科,并在向更高級的方向發(fā)展。如在景物理解和計算機視覺(機器視覺)方面,圖像處理已由二維處理發(fā)展到三維理解或解釋。近幾年來,隨著計算機和各個相關領域研究的迅速發(fā)展,科學計算可視化、多媒體技術(shù)等研究和應用的興起,數(shù)字圖像處理從一個專門領域的學科,變成了一種新型的科學研究和人機界面的工具。三是軍事、醫(yī)學和工業(yè)等方面應用需求的不斷增長702.1.2數(shù)字圖像處理的特點數(shù)字圖像處理是利用計算機的計算,實現(xiàn)與光學系統(tǒng)模擬處理相同效果的過程。數(shù)字圖像處理具有如下特點:(1)處理精度高,再現(xiàn)性好。利用計算機進行圖像處理,其實質(zhì)是對圖像數(shù)據(jù)進行各種運算。由于計算機技術(shù)的飛速發(fā)展,計算精度和計算的正確性勿庸置疑;另外,對同一圖像用相同的方法處理多次,也可得到完全相同的效果,具有良好的再現(xiàn)性。(2)處理的多樣性。由于圖像處理是通過運行程序進行的,因此,設計不同的圖像處理程序,可以實現(xiàn)各種不同的處理目的。
2.1.2數(shù)字圖像處理的特點71(3)圖像數(shù)據(jù)量龐大。圖像中包含有豐富的信息,可以通過圖像處理技術(shù)獲取圖像中包含的有用的信息,但是,數(shù)字圖像的數(shù)據(jù)量巨大。一幅數(shù)字圖像是由圖像矩陣中的像素(Pixel)組成的,通常每個像素用紅、綠、藍三種顏色表示,每種顏色用8bit表示灰度級。則一幅1024×1024不經(jīng)壓縮的真彩色圖像,數(shù)據(jù)量達3MB。X射線照片一般用64~256Kb的數(shù)據(jù)量,一幅遙感圖像為30Mb。如此龐大的數(shù)據(jù)量給存儲、傳輸和處理都帶來巨大的困難。如果精度及分辨率再提高,所需處理時間將大幅度增加。
(3)圖像數(shù)據(jù)量龐大。圖像中包含有豐富的信息,可72(4)處理費時。由于圖像數(shù)據(jù)量大,因此處理比較費時。特別是處理結(jié)果與中心像素鄰域有關的處理過程花費時間更多。(5)圖像處理技術(shù)綜合性強。數(shù)字圖像處理涉及的技術(shù)領域相當廣泛,如通信技術(shù)、計算機技術(shù)、電子技術(shù)、電視技術(shù)等,當然,數(shù)學、物理學等領域更是數(shù)字圖像處理的基礎。
(4)處理費時。由于圖像數(shù)據(jù)量大,因此處理比較費732.2數(shù)字圖像處理的目的和主要內(nèi)容2.2.1數(shù)字圖像處理的目的一般而言,對圖像進行加工和分析主要有如下三方面的目的:(1)提高圖像的視感質(zhì)量,以達到賞心悅目的目的。如去除圖像中的噪聲,改變圖像的亮度、顏色,增強圖像中的某些成份、抑制某些成份,對圖像進行幾何變換等,從而改善圖像的質(zhì)量,以達到或真實的、或清晰的、或色彩豐富的、或意想不到的藝術(shù)效果。2.2數(shù)字圖像處理的目的和主要內(nèi)容2.2.1數(shù)字圖像處74(2)提取圖像中所包含的某些特征或特殊信息,以便于計算機分析,例如,常用作模式識別、計算機視覺的預處理等。這些特征包括很多方面,如頻域特性、灰度/顏色特性、邊界/區(qū)域特性、紋理特性、形狀/拓撲特性以及關系結(jié)構(gòu)等。(3)對圖像數(shù)據(jù)進行變換、編碼和壓縮,以便于圖像的存儲和傳輸。(2)提取圖像中所包含的某些特征或特殊信息,以752.2.2數(shù)字圖像處理的主要內(nèi)容
不管圖像處理是何種目的,都需要用計算機圖像處理系統(tǒng)對圖像數(shù)據(jù)進行輸入、加工和輸出,因此數(shù)字圖像處理研究的內(nèi)容主要有以下7個過程。
1.圖像獲取、表示和表現(xiàn)(ImageAcquisition,RepresentationandPresentation)該過程主要是把模擬圖像信號轉(zhuǎn)化為計算機所能接受的數(shù)字形式,以及把數(shù)字圖像顯示和表現(xiàn)出來(如打?。?。這一過程主要包括攝取圖像、光電轉(zhuǎn)換及數(shù)字化等幾個步驟。
2.2.2數(shù)字圖像處理的主要內(nèi)容76
2.圖像復原(ImageRestoration)當造成圖像退化(圖像品質(zhì)下降)的原因已知時,復原技術(shù)可以對圖像進行校正。圖像復原最關鍵的是對每種退化都需要有一個合理的模型。例如,掌握了聚焦不良成像系統(tǒng)的物理特性,便可建立復原模型,而且對獲取圖像的特定光學系統(tǒng)的直接測量也是可能的。退化模型和特定數(shù)據(jù)一起描述了圖像的退化,因此,復原技術(shù)是基于模型和數(shù)據(jù)的圖像恢復,其目的是消除退化的影響,從而產(chǎn)生一個等價于理想成像系統(tǒng)所獲得的圖像。
2.圖像復原(ImageRestora773.圖像增強(ImageEnhancement)圖像增強是對圖像質(zhì)量在一般意義上的改善。當無法知道圖像退化有關的定量信息時,可以使用圖像增強技術(shù)較為主觀地改善圖像的質(zhì)量。所以,圖像增強技術(shù)是用于改善圖像視感質(zhì)量所采取的一種方法。因為增強技術(shù)并非是針對某種退化所采取的方法,所以很難預測哪一種特定技術(shù)是最好的,只能通過試驗和分析誤差來選擇一種合適的方法。有時可能需要徹底改變圖像的視覺效果,以便突出重要特征的可觀察性,使人或計算機更易觀察或檢測。在這種情況下,可以把增強理解為增強感興趣特征的可檢測性,而非改善視感質(zhì)量。電視節(jié)目片頭或片尾處的顏色、輪廓等的變換,其目的是得到一種特殊的藝術(shù)效果,增強動感和力度。
3.圖像增強(ImageEnhancem78
4.圖像分割(ImageSegmentation)把圖像分成區(qū)域的過程就是圖像分割。圖像中通常包含多個對象,例如,一幅醫(yī)學圖像中顯示出正常的或有病變的各種器官和組織。圖像處理為達到識別和理解的目的,幾乎都必須按照一定的規(guī)則將圖像分割成區(qū)域,每個區(qū)域代表被成像的一個物體(或部分)。圖像自動分割是圖像處理中最困難的問題之一。人類視覺系統(tǒng)的優(yōu)越性,使得人類能夠?qū)⑺^察的復雜場景中的對象分開,并識別出每個物體。但對計算機來說,這卻是一個難題。目前,大部分圖像的自動分割還需要人工提供必需的信息來幫助,只有一部分領域(如印刷字符自動識別(OCR)、指紋識別等)開始使用。由于解決和分割有關的基本問題是特定領域中圖像分析實用化的關鍵一步,因此,將各種方法融合在一起并使用知識來提高處理的可靠性和有效性是圖像分割的研究熱點。4.圖像分割(ImageSegmenta79
5.圖像分析圖像處理應用的目標幾乎均涉及到圖像分析,即對圖像中的不同對象進行分割、特征提取和表示,從而有利于計算機對圖像進行分類、識別和理解。在工業(yè)產(chǎn)品零件無缺陷且正確裝配檢測中,圖像分析是對圖像中的像素轉(zhuǎn)化成一個“合格”或“不合格"的判定。在有的應用中,如醫(yī)學圖像處理,不僅要檢測出物體(如腫瘤)的存在,而且還要檢查物體的大小。
5.圖像分析80
6.圖像重建圖像重建與上述的圖像增強、圖像復原等不同。圖像增強、圖像復原的輸入是圖像,處理后輸出的結(jié)果也是圖像,而圖像重建是指從數(shù)據(jù)到圖像的處理,即輸入的是某種數(shù)據(jù),而經(jīng)過處理后得到的結(jié)果是圖像,CT就是圖像重建處理的典型應用實例。目前,圖像重建與計算機圖形學相結(jié)合,把多個二維圖像合成三維圖像,并加以光照模型和各種渲染技術(shù),能生成各種具有強烈真實感的高質(zhì)量圖像。6.圖像重建81
7.圖像壓縮編碼數(shù)字圖像的特點之一是數(shù)據(jù)量龐大。盡管現(xiàn)在有大容量的存貯器,但仍不能滿足對圖像數(shù)據(jù)(尤其是動態(tài)圖像、高分辨率圖像)處理的需要,因此在實際應用中圖像壓縮是必需的。如果數(shù)據(jù)不壓縮,則在存儲和傳輸中就需要占很大的容量和帶寬,因而增加了成本。圖像壓縮的目的就是壓縮數(shù)據(jù)量。
7.圖像壓縮編碼82圖像編碼主要是利用圖像信號的統(tǒng)計特性及人類視覺的生理學及心理學特性,對圖像信號進行高效編碼,即研究數(shù)據(jù)壓縮技術(shù),目的是在保證圖像質(zhì)量的前提下壓縮數(shù)據(jù),便于存儲和傳輸,以解決數(shù)據(jù)量大的矛盾。一般來說,圖像編碼的目的有三個:①減少數(shù)據(jù)存儲量;②降低數(shù)據(jù)率以減少傳輸帶寬;③壓縮信息量,便于特征提取,為后續(xù)識別作準備。圖像編碼主要是利用圖像信號的統(tǒng)計特性及人類視83從編碼技術(shù)發(fā)展來看,Kunt提出第一代、第二代編碼的概念。第一代編碼是以去除冗余為基礎的編碼方法,如PCM、DPCM、ΔM、亞取樣編碼法、DFT、DCT、W-H變換編碼法以及以此為基礎的混合編碼法。第二代編碼法多為20世紀80年代以后提出的,如金字塔編碼法、Fractal編碼法、小波變換編碼法、基于神經(jīng)網(wǎng)絡的編碼法、模型基編碼法等。這些編碼方法有如下特點:①充分考慮人的視覺特性;②恰當?shù)乜紤]對圖像信號的分解與表述;③采用圖像的合成與識別方案壓縮數(shù)據(jù)。從編碼技術(shù)發(fā)展來看,Kunt提出第一代、第二代842.3圖像工程與相關學科2.3.1圖像工程的內(nèi)涵
圖像工程的內(nèi)容非常豐富,根據(jù)抽象程度和研究方法等的不同,可分為圖像處理、圖像分析和圖像理解三個層次,如圖2-2所示。換句話說,圖像工程是既有聯(lián)系又有區(qū)別的圖像處理、圖像分析及圖像理解三者的有機結(jié)合,另外還包括它們的工程應用。2.3圖像工程與相關學科2.3.1圖像工程的內(nèi)涵85圖2-2圖像工程三層次示意圖
圖2-2圖像工程三層次示意圖86
2.圖像分析
圖像分析主要是對圖像中感興趣的目標進行檢測和測量,以獲得它們的客觀信息,從而建立對圖像的描述。如果說圖像處理是一個從圖像到圖像的過程,則圖像分析就是一個從圖像到數(shù)據(jù)的過程。這里的數(shù)據(jù)可以是目標特征的測量結(jié)果,或是基于測量的符號表示,它們描述了目標的特點和性質(zhì)。
2.圖像分析87
3.圖像理解
圖像理解的重點是在圖像分析的基礎上,進一步研究圖像中各目標的性質(zhì)和它們之間的相互聯(lián)系,并得出對圖像內(nèi)容含義的理解以及對原來客觀場景的解釋,從而指導決策。如果說圖像分析主要是以觀察者為中心研究客觀世界,那么圖像理解在一定程度上就是以客觀世界為中心,借助知識、經(jīng)驗等來把握整個客觀世界(包括沒有直接觀察到的事物)。
3.圖像理解88可見,圖像處理、圖像分析和圖像理解是處在三個抽象程度和數(shù)據(jù)量各有特點的不同層次上。圖像處理是比較低層的操作,它主要在圖像像素級上進行處理,處理的數(shù)據(jù)量非常大。圖像分析則進入了中層,分割和特征提取把原來以像素描述的圖像轉(zhuǎn)變成比較簡潔的非圖像形式的描述。圖像理解主要是高層操作,基本上是對從描述抽象出來的符號進行運算,其處理過程和方法與人類的思維推理有許多類似之處。可見,圖像處理、圖像分析和圖像理解是處在三個抽892.3.2相關學科和領域圖像工程是一門系統(tǒng)地研究各種圖像理論、技術(shù)和應用的交叉學科。從它的研究方法來看,它可以與數(shù)學、物理學、生理學、心理學、電子學、計算機科學等許多學科相互借鑒。從它的研究范圍來看,它與模式識別、計算機視覺、計算機圖形學等多個專業(yè)互相交叉。另外,圖像工程的研究進展與人工智能、神經(jīng)網(wǎng)絡、遺傳算法、模糊邏輯等理論和技術(shù)都有密切的聯(lián)系,它的發(fā)展應用與醫(yī)學、遙感、通信、文檔處理和工業(yè)自動化等許多領域也是密不可分的。
2.3.2相關學科和領域90圖像工程與計算機圖形學(ComputerGraphics)、模式識別(PatternRecognition)、計算機視覺(ComputerVision)等的關系如圖2-3所示。計算機圖形學研究的是用計算機技術(shù)生成圖形的理論、方法和技術(shù),即由非圖像形式的數(shù)據(jù)描述來生成逼真的圖像。它可以生成現(xiàn)實世界中已經(jīng)存在的物體的圖形,也可以生成虛構(gòu)物體的圖形,它和圖像分析的對象和輸出結(jié)果正好對調(diào)。圖像模式識別與圖像分析則比較相似,只是前者試圖把圖像分解成可用符號較抽象地描述的類別。計算機視覺主要強調(diào)用計算機實現(xiàn)人的視覺功能,要用到圖像工程三個層次的許多技術(shù),但目前的研究內(nèi)容主要與圖像理解相結(jié)合。
圖像工程與計算機圖形學(ComputerG91圖2-3圖像工程與相關學科的聯(lián)系和區(qū)別
圖2-3圖像工程與相關學科的聯(lián)系和區(qū)別922.4數(shù)字圖像處理系統(tǒng)2.4.1數(shù)字圖像處理系統(tǒng)硬件
早期的數(shù)字圖像處理系統(tǒng)為了提高處理速度、增加容量都采用大型機。隨著計算機性價比(性能價格比)日新月異的提高,以小型機為主的微型圖像處理系統(tǒng)得到發(fā)展。主機為PC機,配以圖像采集卡及顯示設備就構(gòu)成了最基本的微型圖像處理系統(tǒng)。目前,國產(chǎn)的CA540、VP32、FGCT11010N8、CA-CPE-1000、CA-CPE-3000等圖像板研制成功并已商品化。微型圖像處理系統(tǒng)成本低、應用靈活、便于推廣。特別是微型計算機的性能逐年提高,使得微型圖像處理系統(tǒng)的性能也不斷升級,加之軟件配置豐富,使其更具實用意義。
2.4數(shù)字圖像處理系統(tǒng)2.4.1數(shù)字圖像處理系統(tǒng)硬件93圖2-4圖像處理系統(tǒng)示意圖
圖2-4圖像處理系統(tǒng)示意圖941、圖像數(shù)字化設備
1)電視攝像機(VideoCamera)
電視攝像機是目前使用最廣泛的圖像獲取設備。電視攝像機的核心部件是光電轉(zhuǎn)換裝置,也稱為固態(tài)陣。目前大多數(shù)感光基元多為電荷耦合器件CCD(ChargeCoupledDevice),CCD可以將照射在其上的光信號轉(zhuǎn)換為對應的電信號。該設備小巧、速度快、成本低、靈敏度高,多作為實時圖像輸入設備應用。但灰度層次較差、非線性失真較大、有黑斑效應,在使用中需要校正。目前,CCD攝像機可達1920×1035的高分辨率,快門速度可達10-4s。1、圖像數(shù)字化設備95
2)掃描儀(Scanner)
掃描儀是將各種形式的圖像信息(如圖片、照片、膠片及文稿資料等)輸入計算機的重要工具,特點是精度和分辨率高。目前,1200DPI(DotPerInch)以上精度的掃描儀很常見。而且掃描儀的成本很低,一臺平板式掃描儀的價格在千元左右。由于掃描儀良好的精度和低廉的價格,已成為當今應用最為廣泛的圖像數(shù)字化設備。但用掃描儀獲取圖像信息速度較慢,不能實現(xiàn)實時輸入。2)掃描儀(Scanner)963)數(shù)碼照相機(DigitalCamera)
數(shù)碼照相機也叫數(shù)字相機,是一種能夠進行景物拍攝,并以數(shù)字格式存放拍攝圖像的特殊照相機。它的核心部件是CCD圖像傳感器,主流機型分辨率已在400萬像素以上。數(shù)碼照相機的感光器件也是CCD陣列。CCD可以對亮度進行分級,但并不能識別顏色。為此,數(shù)碼照相機用紅、綠和藍三個彩色濾鏡,當光線從紅、綠、藍濾鏡中穿過時,就可以得到每種色光的反應值,再通過軟件對得到的數(shù)據(jù)進行處理,從而確定每一個像素點的顏色。CCD生成的數(shù)字圖像被傳送到照相機的一塊內(nèi)部芯片上。該芯片負責把圖像轉(zhuǎn)換成相機內(nèi)部的存儲格式(通常為JPEG格式)。最后,把生成的圖像保存在存儲卡中。數(shù)碼照相機可通過USB接口與計算機相連,將拍攝的圖像下載到計算機中,以便處理或插到文檔/Web頁面中,或用彩色打印機輸出。3)數(shù)碼照相機(DigitalCamer97
4)遙感圖像獲取設備
遙感中常用的圖像獲取設備有光學攝影設備,如攝像機、多光譜像機等;紅外攝影設備,如紅外輻射計、紅外攝像儀、多通道紅外掃描儀、多光譜掃描儀(MSS);微波設備,如微波輻射計、側(cè)視雷達、真空孔徑雷達、合成孔徑雷達(SAR)。4)遙感圖像獲取設備98
2.圖像輸入卡(采集卡)
通常圖像輸入卡安裝于計算機主板擴展槽中,主要包括圖像存儲器單元、顯示查找表(LUT)單元、CCD攝像頭接口(A/D)、監(jiān)視器接口(D/A)和PC機總線接口單元。工作過程如下:攝像頭實時或準實時采集圖像數(shù)據(jù),經(jīng)A/D變換后將圖像存放在圖像存儲單元的一個或三個通道中,D/A變換電路自動將圖像顯示在監(jiān)視器上。通過主機發(fā)出指令,將某一幀圖像靜止在存儲通道中,即采集或捕獲一幀圖像,然后可對圖像進行處理或存盤。高檔卡還包括卷積濾波、FFT(快速傅立葉變換)等圖像處理專用的快速部件?,F(xiàn)在有的圖像采集卡將圖像和圖形功能合為一體,如北京大恒圖像視覺有限公司開發(fā)的VIDEO-PCI-C真彩色圖像采集卡。該卡基于PCI總線設計,它將圖像和VGA的圖形功能合為一體,可在計算機屏幕上實時顯示彩色活動圖像,其分辨率為768×576。2.圖像輸入卡(采集卡)99
3.顯示卡顯示卡是記憶和保存圖像的地方,通常,存貯的圖像要隨時顯示在顯示器上。PC機多采用800×600或1024×768個像素點。通常在圖像處理裝置中,灰度值紅(R)、綠(G)、藍(B)各占8位(bit),共計24位,可以表示1670萬種顏色,這種顯示卡稱為真彩色顯示卡。3.顯示卡100
4.計算機
圖像處理的主要特點是數(shù)據(jù)量大、運算時間長,因而對系統(tǒng)硬件配置要求較高。目前,在PC機上配置奔騰P42.4G以上CPU、512MB內(nèi)存、80G以上硬盤的計算機已屬常見,計算速度大幅度提高,可與幾年前的大型機媲美。為了加快圖像的顯示和處理速度,用于圖像處理的PC機配置應盡可能高一些。當然,有條件時最好采用圖形工作站進行圖像處理。4.計算機101
5.圖像存貯裝置
圖像數(shù)據(jù)量龐大,早期其存儲成為問題。到目前為止,除了大容量磁盤可供存儲圖像數(shù)據(jù)之外,MO、CD、DVD等光學存儲裝置以及SAN、NAS等網(wǎng)絡存儲系統(tǒng),為存儲海量圖像數(shù)據(jù)提供了極好的支持。5.圖像存貯裝置1022.4.2高速圖像處理卡
實用圖像處理系統(tǒng)分為在線處理系統(tǒng)和離線處理系統(tǒng)兩種形式。在研究中,多采用離線圖像處理系統(tǒng),主要用于開發(fā)和驗證圖像處理與分析的算法。在線圖像處理系統(tǒng)除上述設備外,還需用圖像處理專用硬件代替圖像采集卡,以構(gòu)成自動處理系統(tǒng),可以對生產(chǎn)現(xiàn)場采集的圖像進行實時處理,并對其處理結(jié)果進行監(jiān)控。2.4.2高速圖像處理卡1032.4.3圖像處理系統(tǒng)軟件微型圖像處理系統(tǒng)既包含硬件設備,也需要一定的軟件環(huán)境支持。目前,圖像處理系統(tǒng)平臺多為MicrosoftWindows或X-Windows,開發(fā)的主流工具為Microsoft公司的VC++。這是因為VC++是一種具有高度綜合性能的軟件開發(fā)工具,用它開發(fā)出來的程序有著運行速度快、可移植能力強等優(yōu)點。此外,各國的科學家和研究機構(gòu)開發(fā)了不少專用的圖像處理軟件環(huán)境,下面僅對主要的幾種作一簡單介紹。
2.4.3圖像處理系統(tǒng)軟件104
1.MATLAB的圖像處理工具箱
MATLAB是由美國MathWorks公司推出的用于數(shù)值計算的有力工具,它具有相當強大的矩陣運算和操作功能,并且MATLAB圖像處理工具箱提供了豐富的圖像處理函數(shù),靈活運用這些函數(shù)幾乎可以完成所有的圖像處理工作,從而大大節(jié)省編寫低層算法代碼的時間,避免程序設計中的重復勞動,達到事半功倍的效果。但是,MATLAB強大的功能只能在安裝有MATLAB系統(tǒng)的機器上使用圖像處理工具箱中的函數(shù)或自編的m文件來實現(xiàn),實際應用極為不便,且MATLAB使用行解釋方式執(zhí)行代碼,執(zhí)行速度很慢。
1.MATLAB的圖像處理工具箱105為將MATLAB的強大功能融入各種應用程序中,通過高級語言編譯器編譯為二進制代碼已逐漸成為研究熱點。MathTools公司推出的MatCom可以把MATLAB語言翻譯成為C或C++語言,但其翻譯的代碼不夠簡捷。更直接的方法是利用MatCom提供的Matrix<LIB>C++庫實現(xiàn)MATLAB與C++的接口。為將MATLAB的強大功能融入各種應用程序中106
2.AVS和SPIDER1)AVS(ApplicationVisualizationSystem)AVS是對龐大的數(shù)據(jù)量進行可視化處理的通用系統(tǒng)之一。最初,該系統(tǒng)是為了對科學計算的結(jié)果進行可視化(ScientificVisualization)處理而開發(fā)的系統(tǒng),現(xiàn)在已經(jīng)在如下領域中廣泛使用?!めt(yī)學圖像、有限元法分析、流體力學、檢測/實驗結(jié)果的表示;·資源探索、環(huán)境科學、遙感、一般圖像處理;·量子力學、分子設計、CAD數(shù)據(jù)表示、OR分析;·金融數(shù)據(jù)分析、一般科學分析。
2.AVS和SPIDER107AVS作為應用軟件具有如下強大的功能:·數(shù)據(jù)顯示:Pointer和Clicker類型數(shù)據(jù)的可視化應用。·幾何顯示:可以進行人機對話的三維幾何數(shù)據(jù)的顯示。·圖像顯示:可以進行人機對話的二維圖像的顯示。·圖形顯示:完成畫圖功能?!こ瘮?shù):圖像處理、聲音波形圖。AVS作為應用軟件具有如下強大的功能:108
2)SPIDERViewer
SPIDER(SubroutinePackageforImageDataEnhancementandRecognition)是由日本通產(chǎn)省工業(yè)技術(shù)院電子技術(shù)綜合研究所開發(fā)的圖像處理程序庫,如表2-1所示。它包含了圖像處理領域中的基本算法和實現(xiàn)方法,因此得到了很高的評價,之后又追加了基本的圖像分析算法,立體圖像、距離圖像、文本、畫面處理等領域的算法,稱之為SPIDERII,目前已經(jīng)得到了廣泛的應用。2)SPIDERViewer109第2章多媒體圖像處理課件110第2章多媒體圖像處理課件1113.IUE(ImageUnderstandingEnvironment)對圖像處理和圖像理解算法優(yōu)劣的評價是非常困難的。為此,世界范圍內(nèi)的圖像工程科研人員就評價問題進行了研討,以構(gòu)建可重復利用的軟件開發(fā)環(huán)境。IUE就是以美國為主,日本和歐洲共同參加開發(fā)的圖像處理系統(tǒng)。該系統(tǒng)可以實現(xiàn)圖像理解計算模型的確立,進行嚴密的幾何學描述,能應用于各種類型的圖像,從而提高研究效率,促進技術(shù)積累和技術(shù)轉(zhuǎn)移。針對上述目標,IUE有效利用現(xiàn)有軟件,開發(fā)了運行在UNIX工作站上(SunOS、Linux)的面向?qū)ο蟮某绦?C++),并從LaTeX自動生成C++源代碼,以滿足實際需要。
3.IUE(ImageUndersta112IUE不僅提供函數(shù)庫和數(shù)據(jù)庫,為了能正確地描述有關光源、物體、傳感器等幾何學和光學的關系,還提供了類的分層結(jié)構(gòu)關系。并且也提供了坐標系和坐標變換的類,它是用矢量圖來表示的。這種類有600個,還有400個模板及類成員,可以說它是一個
溫馨提示
- 1. 本站所有資源如無特殊說明,都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請下載最新的WinRAR軟件解壓。
- 2. 本站的文檔不包含任何第三方提供的附件圖紙等,如果需要附件,請聯(lián)系上傳者。文件的所有權(quán)益歸上傳用戶所有。
- 3. 本站RAR壓縮包中若帶圖紙,網(wǎng)頁內(nèi)容里面會有圖紙預覽,若沒有圖紙預覽就沒有圖紙。
- 4. 未經(jīng)權(quán)益所有人同意不得將文件中的內(nèi)容挪作商業(yè)或盈利用途。
- 5. 人人文庫網(wǎng)僅提供信息存儲空間,僅對用戶上傳內(nèi)容的表現(xiàn)方式做保護處理,對用戶上傳分享的文檔內(nèi)容本身不做任何修改或編輯,并不能對任何下載內(nèi)容負責。
- 6. 下載文件中如有侵權(quán)或不適當內(nèi)容,請與我們聯(lián)系,我們立即糾正。
- 7. 本站不保證下載資源的準確性、安全性和完整性, 同時也不承擔用戶因使用這些下載資源對自己和他人造成任何形式的傷害或損失。
最新文檔
- 時尚電商的數(shù)字化之路-抓住行業(yè)趨勢提升品牌競爭力
- 干部免責創(chuàng)業(yè)協(xié)議書范文范本
- 學生厭學不愿上課協(xié)議書范文
- 新鮮生鮮配送合作協(xié)議書范文
- 電力設備捐贈協(xié)議書范文范本
- 化妝品定制協(xié)議書范文模板下載
- 工程合伙人協(xié)議書范文模板下載電子版
- 2015汽車四級修理工試題真題(答案)2
- 2020學前教育頂崗實習報告范文5篇
- 第一章小組工作發(fā)展歷史
- 2024年檔案知識競賽考試題庫300題(含答案)
- 樊登讀書會營銷策略分析
- 建設單位安全生產(chǎn)管理體系(完整版)
- 國潮風喜迎中秋節(jié)傳統(tǒng)節(jié)日介紹主題班會PPT模板
- 工程維修承諾書范本
- 蘇州大學實驗報告專用紙
- 盾構(gòu)施工管片防水材料粘貼作業(yè)指導書
- 《工作協(xié)調(diào)單》模板
- 《電動汽車》課件(PPT)
- 火力發(fā)電廠 施工圖設計計守則( 熱 機 篇)
- TRIZ效應庫課件
評論
0/150
提交評論