版權(quán)說明:本文檔由用戶提供并上傳,收益歸屬內(nèi)容提供方,若內(nèi)容存在侵權(quán),請(qǐng)進(jìn)行舉報(bào)或認(rèn)領(lǐng)
文檔簡(jiǎn)介
1、第30卷第1期吉首大學(xué)學(xué)報(bào)(自然科學(xué)版Vol.30No.12009年1月J ournal of J is ho u Uni ver s i t y (Nat ural Sci ence Editio nJ an.2009文章編號(hào):1007-2985(200901-0063-08數(shù)字圖像處理技術(shù)的現(xiàn)狀及其發(fā)展方向3陳炳權(quán)1,2,劉宏立1,孟凡斌2(1.湖南大學(xué)電氣與信息工程學(xué)院,湖南長(zhǎng)沙410082;2.吉首大學(xué)物理科學(xué)與信息工程學(xué)院,湖南吉首416000摘要:綜述了數(shù)字圖像處理技術(shù)的主要特點(diǎn)和優(yōu)點(diǎn),闡述了包括圖像采集與數(shù)字化、圖像的壓縮、圖像的增強(qiáng)與復(fù)原、圖像的分割和圖像分析等主要內(nèi)容的產(chǎn)生及
2、其發(fā)展歷程,并根據(jù)該領(lǐng)域的最新進(jìn)展,簡(jiǎn)述了數(shù)字圖像處理技術(shù)5個(gè)主要研究方面的最新熱點(diǎn),最后總結(jié)了數(shù)字圖像處理技術(shù)領(lǐng)域中面臨的主要挑戰(zhàn)和未來發(fā)展方向.關(guān)鍵詞:圖像數(shù)字化;圖像壓縮;圖像分割;圖像增強(qiáng)與恢復(fù);圖像分析;現(xiàn)狀及其發(fā)展方向中圖分類號(hào):TN911.73;TP391文獻(xiàn)標(biāo)識(shí)碼:A數(shù)字圖像處理(Digital Image Processing 將圖像信號(hào)轉(zhuǎn)換成數(shù)字信號(hào)并利用計(jì)算機(jī)對(duì)其進(jìn)行處理,起源于20世紀(jì)20年代,目前已廣泛地應(yīng)用于科學(xué)研究、工農(nóng)業(yè)生產(chǎn)、生物醫(yī)學(xué)工程、航空航天、軍事、工業(yè)檢測(cè)、機(jī)器人視覺、公安司法、軍事制導(dǎo)、文化藝術(shù)等,已成為一門引人注目、前景遠(yuǎn)大的新型學(xué)科,發(fā)揮著越來越大
3、的作用.數(shù)字圖像處理作為一門學(xué)科形成于20世紀(jì)60年代初期,早期的圖像處理的目的是改善圖像的質(zhì)量,以人為對(duì)象,以改善人的視覺效果為目的,首次獲得實(shí)際成功應(yīng)用的是美國噴氣推進(jìn)實(shí)驗(yàn)室(J PL 1,并對(duì)航天探測(cè)器徘徊者7號(hào)在1964年發(fā)回的幾千張?jiān)虑蛘掌褂昧藞D像處理技術(shù),并考慮了太陽位置和月球環(huán)境的影響,由計(jì)算機(jī)成功地繪制出月球表面地圖,隨后又對(duì)探測(cè)飛船發(fā)回的近十萬張照片進(jìn)行了更為復(fù)雜的圖像處理,以致獲得了月球的地形圖、彩色圖及全景鑲嵌圖,為人類登月創(chuàng)舉奠定了堅(jiān)實(shí)的基礎(chǔ),也推動(dòng)了數(shù)字圖像處理這門學(xué)科的誕生.數(shù)字圖像處理取得的另一個(gè)巨大成就是在醫(yī)學(xué)上獲得的成果,1972年英國EMI 公司工程師Ho
4、 usfield 發(fā)明了用于頭顱診斷的X 射線計(jì)算機(jī)斷層攝影裝置即C T(Computer Tomograph.1975年EM I 公司又成功研制出全身用的C T 裝置,獲得了人體各個(gè)部位鮮明清晰的斷層圖像.1979年這項(xiàng)無損傷診斷技術(shù)獲得了諾貝爾獎(jiǎng),說明它對(duì)人類作出了劃時(shí)代的貢獻(xiàn).2隨著圖像處理技術(shù)的深入發(fā)展,從70年代中期開始,隨著計(jì)算機(jī)技術(shù)和人工智能、思維科學(xué)研究的迅速發(fā)展,數(shù)字圖像處理向更高、更深層次發(fā)展.人們已開始研究如何用計(jì)算機(jī)系統(tǒng)解釋圖像,實(shí)現(xiàn)類似人類視覺系統(tǒng)理解外部世界.很多國家,特別是發(fā)達(dá)國家投入更多的人力、物力到這項(xiàng)研究,取得了不少重要的研究成果.其中代表性的成果是70年代
5、末MI T 的Ma rr 提出的視覺計(jì)算理論3,這個(gè)理論成為計(jì)算機(jī)視覺領(lǐng)域其后多年的主導(dǎo)思想.圖像理解雖然在理論方法研究上已取得不小的進(jìn)展,但它本身是一個(gè)比較難的研究領(lǐng)域,存在不少困難,因人類本身對(duì)自己的視覺過程還了解甚少,因此計(jì)算機(jī)視覺是一個(gè)有待人們進(jìn)一步探索的新領(lǐng)域.正因?yàn)槿绱?圖像處理理論和技術(shù)受到各界的廣泛重視,當(dāng)前圖像處理面臨的主要任務(wù)是研究新的處理方法,構(gòu)造新的處理系統(tǒng),開拓更廣泛的應(yīng)用領(lǐng)域.1數(shù)字圖像處理技術(shù)的主要特點(diǎn)、優(yōu)點(diǎn)及處理過程1.1數(shù)字圖像處理的主要特點(diǎn)(1目前數(shù)字圖像處理的信息大多是二維信息,處理信息量很大,因此對(duì)計(jì)算機(jī)的計(jì)算速度、存儲(chǔ)容量等要求較高.(23收稿日期:2
6、008-10-16基金項(xiàng)目:國家自然科學(xué)基金資助項(xiàng)目(60702076作者簡(jiǎn)介:陳炳權(quán)(1972-,男,湖南桃源人,吉首大學(xué)物理科學(xué)與信息工程學(xué)院副教授,湖南大學(xué)電氣與信息工程學(xué)院博士研究生,主要從事信號(hào)處理與智能控制研究;劉宏立(63,男,湖南常德人,湖南大學(xué)教授,博導(dǎo),主要從事高速移動(dòng)通信網(wǎng)等方面研究19-.數(shù)字圖像處理占用的頻帶較寬,與語言信息相比,占用的頻帶要大幾個(gè)數(shù)量級(jí).所以在成像、傳輸、存儲(chǔ)、處理、顯示等各個(gè)環(huán)節(jié)的實(shí)現(xiàn)上,技術(shù)難度較大,成本也高,這就對(duì)頻帶壓縮技術(shù)提出了更高的要求.(3數(shù)字圖像中各個(gè)像素是不獨(dú)立的,其相關(guān)性大.因此,圖像處理中信息壓縮的潛力很大.(4由于圖像是三維景
7、物的二維投影,一幅圖像本身不具備復(fù)現(xiàn)三維景物的全部幾何信息的能力,很顯然三維景物背后部分信息在二維圖像畫面上是反映不出來的.因此,要分析和理解三維景物必須作合適的假定或附加新的測(cè)量.在理解三維景物時(shí)需要知識(shí)導(dǎo)引,這也是人工智能中正在致力解決的知識(shí)工程問題.(5數(shù)字圖像處理后的圖像一般是給人觀察和評(píng)價(jià)的,因此受人的因素影響較大.由于人的視覺系統(tǒng)很復(fù)雜,受環(huán)境條件、視覺性能、人的情緒愛好以及知識(shí)狀況影響很大,作為圖像質(zhì)量的評(píng)價(jià)還有待進(jìn)一步深入的研究.另一方面,計(jì)算機(jī)視覺是模仿人的視覺,人的感知機(jī)理必然影響著計(jì)算機(jī)視覺的研究,這些都是心理學(xué)和神經(jīng)心理學(xué)正在著力研究的課題.1.2數(shù)字圖像處理的優(yōu)點(diǎn)(1
8、再現(xiàn)性好.數(shù)字圖像處理與模擬圖像處理的根本不同在于,它不會(huì)因圖像的存儲(chǔ)、傳輸或復(fù)制等一系列變換操作而導(dǎo)致圖像質(zhì)量的退化,只要圖像在數(shù)字化時(shí)準(zhǔn)確地表現(xiàn)了原稿,則數(shù)字圖像處理過程始終能保持圖像的再現(xiàn).(2處理精度高.按目前的技術(shù),幾乎可將一幅模擬圖像數(shù)字化為任意大小的二維數(shù)組,現(xiàn)代掃描儀可以把每個(gè)像素的灰度等級(jí)量化為16位甚至更高,這意味著圖像的數(shù)字化精度可以達(dá)到滿足任一應(yīng)用需求.(3適用面寬.圖像可以來自多種信息源,從圖像反映的客觀實(shí)體尺度看,可以小到電子顯微鏡圖像,大到航空照片、遙感圖像甚至天文望遠(yuǎn)鏡圖像.這些來自不同信息源的圖像只要被變換為數(shù)字編碼形式后,均是用二維數(shù)組表示的灰度圖像組合而成
9、,因而均可用計(jì)算機(jī)來處理.(4靈活性高.數(shù)字圖像處理不僅能完成線性運(yùn)算,而且能實(shí)現(xiàn)非線性處理,即凡是可以用數(shù)學(xué)公式或邏輯關(guān)系來表達(dá)的一切運(yùn)算均可用數(shù)字圖像處理實(shí)現(xiàn).1.3數(shù)字圖像處理過程圖1數(shù)字圖像處理流程圖由于數(shù)字圖像處理的靈活性和方便性,所以數(shù)字圖像處理已成為圖像處理的主流.常見的數(shù)字圖像處理有:圖像的采集、數(shù)字化、編碼、增強(qiáng)、恢復(fù)、變換、壓縮、存儲(chǔ)、傳輸、分析、識(shí)別、分割等,其處理流程如圖1所示.(1圖像數(shù)字化.通過取樣和量化將一個(gè)以自然形式存在的圖像變換為適合計(jì)算機(jī)處理的數(shù)字形式,圖像在計(jì)算機(jī)內(nèi)部被表示為一個(gè)數(shù)字矩陣,矩陣中每一元素稱為像素.(2圖像的編碼.編碼的目的是壓縮圖像的信息量
10、(但圖像質(zhì)量幾乎不變,以滿足傳輸和存儲(chǔ)的要求,為此,可以采用模擬處理技術(shù),再通過模-數(shù)轉(zhuǎn)換得到編碼,不過多數(shù)是采用數(shù)字編碼技術(shù),其編碼方法可以對(duì)圖像逐點(diǎn)進(jìn)行加工,也可以對(duì)圖像施加某種變換或基于區(qū)域、特征進(jìn)行編碼.(3圖像增強(qiáng).圖像增強(qiáng)目的是使圖像清晰或?qū)⑵滢D(zhuǎn)換為更適合人或機(jī)器分析的形式,常用的圖像增強(qiáng)方法有:灰度等級(jí)直方圖處理;干擾抵制;邊緣銳化;偽彩色處理.(4圖像恢復(fù).其目的是除去或減少在獲得圖像過程中因各種原因產(chǎn)生的退化,可能是光學(xué)系統(tǒng)的像差或離焦、攝像系統(tǒng)與被攝物之間的相對(duì)運(yùn)動(dòng)、電子或光學(xué)系統(tǒng)的噪聲和介于攝像系統(tǒng)與被攝像物間的大氣湍流等.(5圖像分割.將圖像劃分為一些互不重疊的區(qū)域,每
11、一區(qū)域是像素的一個(gè)連續(xù)集.通常采用把像素分入特定區(qū)域的區(qū)域法和尋求區(qū)域之間邊界的境界法.這2種方法都可以利用圖像的紋理特性實(shí)現(xiàn)圖像分割.(6圖像分析.從圖像中抽取某些有用的度量、數(shù)據(jù)或信息,其目的是得到某種數(shù)值結(jié)果.圖像分析的內(nèi)容和模式識(shí)別、人工智能的研究領(lǐng)域有交叉,但圖像分析與典型的模式識(shí)別有區(qū)別.圖像分析需要用圖像分割方法抽取出圖像的特征,然后對(duì)圖像進(jìn)行符號(hào)化的描述,這種描述不僅能對(duì)圖像中是否存在某一特定對(duì)象作出回答,還能對(duì)圖像內(nèi)容作出詳細(xì)描述.圖像處理的各個(gè)內(nèi)容是互相有聯(lián)系的.一個(gè)實(shí)用的圖像處理系統(tǒng)往往結(jié)合幾種圖像處理技術(shù)才能得到所需要的結(jié)果,圖像數(shù)字化是將一個(gè)圖像變換為適合計(jì)算機(jī)處理的
12、形式的第1步,圖像編碼可用以傳輸和存儲(chǔ)圖像.圖像增強(qiáng)和復(fù)原可以是圖像處理的最后目的,也可以是為進(jìn)一步的處理作準(zhǔn)備.通過圖像分割得出的圖像特征可以作為最后結(jié)果,也可以作為下一步圖像分析的基礎(chǔ).2數(shù)字圖像處理的主要研究進(jìn)展2.1數(shù)字圖像的采集與數(shù)字化圖像的采集是數(shù)字圖像處理的第1步,采集并不局限于對(duì)人眼視覺功能的模仿,更是對(duì)人類認(rèn)識(shí)、分析手段的拓展.在醫(yī)學(xué)、天文學(xué)、自動(dòng)字體識(shí)別、機(jī)器視覺、軍事識(shí)別、指紋自動(dòng)處理和血樣分類處理等多個(gè)方面都不同程度地運(yùn)用了圖像提取技術(shù).圖像提取技術(shù)源自于電影和視頻產(chǎn)品的發(fā)展4.其中,最具影響力的研究是由Porter 和Duff 提出的通道概念5,對(duì)圖像提取技術(shù)的離散特
13、性進(jìn)行了規(guī)范,為這一研究領(lǐng)域奠定了基礎(chǔ),使其成為圖像處理領(lǐng)域一個(gè)較獨(dú)立的重要分支.20世紀(jì)6年代,由于當(dāng)時(shí)的圖像提取技術(shù)還未成形,人們主要依賴于用拍攝技巧彌補(bǔ)后期制作的不足隨著當(dāng)時(shí)計(jì)算機(jī)應(yīng)用的發(fā)展,圖像處理技術(shù)獲得了更加廣闊的發(fā)展空間,各種各樣的處理技術(shù)和方法也相應(yīng)而生如四元組像素的提出以及B 對(duì)46吉首大學(xué)學(xué)報(bào)(自然科學(xué)版第30卷0.lin n計(jì)算機(jī)領(lǐng)域所運(yùn)用到的像素進(jìn)行的全面詮釋6.20世紀(jì)90年代初期,學(xué)者們逐漸認(rèn)識(shí)到要實(shí)現(xiàn)信息的精確提取是非常困難和費(fèi)時(shí)的,對(duì)于稍復(fù)雜的圖像或視頻,其代價(jià)十分巨大.所以學(xué)者們開始考慮借助數(shù)學(xué)和概率統(tǒng)計(jì)學(xué)的原理來尋求更優(yōu)解,而不再強(qiáng)調(diào)最優(yōu)解.圖像提取技術(shù)的發(fā)
14、展過程經(jīng)歷了以下4個(gè)發(fā)展階段:(1萌芽階段.通過拍攝時(shí)的布景實(shí)現(xiàn)提取條件.(2初期階段.以四元像素和數(shù)字化為基礎(chǔ),建立了獨(dú)立的分支學(xué)科.(3飛躍階段.以概率統(tǒng)計(jì)學(xué)原理為基礎(chǔ)的提取.(4分化階段.認(rèn)識(shí)到視頻中幀與幀之間存在相關(guān)性,產(chǎn)生了專門用于視頻提取的方案.但由于自然色彩分布的復(fù)雜性,至今沒有被廣泛認(rèn)可的模型,也沒有系統(tǒng)的、統(tǒng)一的評(píng)價(jià)標(biāo)準(zhǔn).所以說,圖像提取技術(shù)的成熟還有待時(shí)日,并依賴于其它學(xué)科及計(jì)算機(jī)硬件技術(shù)的發(fā)展.由于圖像提取涉及的學(xué)科領(lǐng)域比較廣泛,學(xué)者們對(duì)待該問題的研究角度和出發(fā)點(diǎn)各不相同,目前已有的概念和模型有:Por ter &Duff 模型5,Blinn 模型6,K nock
15、out 模型7,Ruzo n &T o ma si 模型8,Baye sia n 模型9,Poisson 模型10,Chua ng &Agar wala 模型11,Y in Li &Jian Sun 模型12,比較分析上述模型,可以發(fā)現(xiàn):Po rter &Duff 模型、Blinn 模型將圖像提取問題規(guī)范化,是后續(xù)研究的重要基礎(chǔ);Kn ocko ut 模型是對(duì)Porter &Duff 模型、Blinn 模型的有益擴(kuò)展,使之實(shí)用意義更大,在實(shí)際運(yùn)用中效率更高.雖然Ruzon &Tomasi 模型、Ba yesian 模型、Poisson 模型采用的
16、具體概率統(tǒng)計(jì)方法各異,但這些模型都是先對(duì)圖像進(jìn)行初始化,生成Trimap 前景、背景、交界區(qū)域,研究對(duì)象都是交界區(qū)域的值.13Chuang &Agar wa 2la 模型、Yin Li &Jia n Sun 模型以視頻提取為研究目的,引人了幀間信息相關(guān)性的概念,實(shí)現(xiàn)了視頻的半自動(dòng)提取.目前為止,圖像提取技術(shù)根據(jù)需求的不同出現(xiàn)了2種研究思路:一種更注重提高值的精確度,追求精確完美的效果;另一種則更注重提高提取的效率、實(shí)時(shí)性及自動(dòng)化程度.目前,圖像提取技術(shù)的研究活動(dòng)主要集中在以下5個(gè)方面:(1拍攝設(shè)備、拍攝方法及技巧;(2分割技術(shù);(3人機(jī)交互操作接口;(4面向?qū)ο蟮奶崛〖夹g(shù);(5
17、前景與背景間交界區(qū)域估計(jì)模型.2.2圖像壓縮編碼圖2圖像壓縮系統(tǒng)模型作為通信、介質(zhì)存貯、數(shù)據(jù)發(fā)送、多媒體計(jì)算機(jī)等技術(shù)的關(guān)鍵環(huán)節(jié),圖像壓縮編碼算法的研究是信息技術(shù)中最活躍的研究領(lǐng)域之一.尤其是進(jìn)入21世紀(jì)以后,電子技術(shù)和通信技術(shù)的發(fā)展使可視電話、會(huì)議電視、數(shù)字電視、高清晰度電視、多媒體計(jì)算機(jī)、信息高速公路等的生產(chǎn)和建立成為可能.在這一背景下,探索高效圖像壓縮編碼算法無疑將成為主要任務(wù)之一,對(duì)其研究也將成為國際公認(rèn)的熱點(diǎn)之一.14為了使有限的符號(hào)表達(dá)更多的信息量,圖像壓縮既非常必要,也有可能,因此產(chǎn)生了各種各樣的圖像壓縮方法.圖像壓縮編碼用盡可能少的數(shù)據(jù)表示信源發(fā)出的圖像信號(hào),以減少容納給定消息集
18、合的信號(hào)空間.通過對(duì)圖像數(shù)據(jù)的壓縮減少數(shù)據(jù)占用的存儲(chǔ)空間,從而減少傳輸圖像數(shù)據(jù)所需的時(shí)間和信道帶寬.圖2為圖像壓縮系統(tǒng)模型,圖像壓縮編碼算法的研究歷程可分為如下2個(gè)階段.(1第1代圖像壓縮編碼階段(1985年以前.圖像壓縮編碼算法的研究起源于傳統(tǒng)的數(shù)據(jù)壓縮理論,有些學(xué)者認(rèn)為始于18世紀(jì)末Sheppards 所做的“實(shí)數(shù)舍入為十進(jìn)制數(shù)”的研究,也有人認(rèn)為19世紀(jì)末研制的莫爾斯代碼是數(shù)據(jù)壓縮的第一次嘗試.1939年Dudley 研制了聲碼器,他把聲音頻譜的能量劃分為有限數(shù)目的頻帶,并且在每個(gè)頻帶內(nèi)傳輸相應(yīng)的能級(jí),因此能夠達(dá)到較高的壓縮.比較系統(tǒng)的研究始于20世紀(jì)40年代初形成的信息論,盡管當(dāng)時(shí)數(shù)字
19、計(jì)算機(jī)尚未出現(xiàn),但其研究與當(dāng)今數(shù)字計(jì)算機(jī)所使用的壓縮技術(shù)有著密切的聯(lián)系,許多算法,如Huff ma n 編碼等仍有很大的應(yīng)用價(jià)值.近年來,由于模式識(shí)別、圖像處理、計(jì)算機(jī)視覺等技術(shù)的發(fā)展,促進(jìn)了數(shù)據(jù)壓縮的研究.1997年以前基于符號(hào)頻率統(tǒng)計(jì)的Huff man 編碼具有良好的壓縮性能,一直占據(jù)重要的地位,并不斷有基于其改進(jìn)的算法提出15-16.1977年以色列科學(xué)家Jacob Ziv 和Abra 2ham Lempel 提出了不同于以往的基于字典的壓縮編碼算法LZ 77,1978年又推出了改進(jìn)算法LZ 78,把無損壓縮編碼算法的研究推向了一個(gè)全新的階段.近年來,隨著神經(jīng)網(wǎng)絡(luò)理論的興起,有人采用B
20、P 網(wǎng)進(jìn)行非線性預(yù)測(cè)的嘗試,取得了較好的效果16.自1969年在美國舉行首屆“圖像編碼會(huì)議”以來,圖像壓縮編碼算法的研究有了很大進(jìn)展,其中變換壓縮編碼16-17與量化壓縮編碼18-20是研究熱點(diǎn).(2第2代圖像壓縮編碼階段(1985年以后.為了克服第1代圖像壓縮編碼存在的壓縮比小、圖像復(fù)原質(zhì)量不理想等弱點(diǎn),1985年Kunt 等人充分利用人眼視覺特性提出了第2代圖像壓縮編碼的概念.20世紀(jì)80年代中后期,人們相繼提出了在多個(gè)分辨率下表示圖像的方案21,主要方法有子帶壓縮編碼、金字塔壓縮編碼等,利用不同類型的線性濾波器,將圖像分解到不同的頻帶中,然后對(duì)不同頻帶的系數(shù)采用不同的壓縮編碼方法.這些方
21、法均在不同程度上有如下優(yōu)點(diǎn):多分辨率的信號(hào)表示有利于圖形信號(hào)的漸進(jìn)式傳輸;不同分辨率的信號(hào)占用不同的頻帶,便于引入視覺特性.1988年,Bar nsley 和Sloan 共同提出了分形圖像編碼壓縮方案22,該方案利用圖像中固有的自相似性來構(gòu)造一個(gè)緊縮變換,并使原圖像成為該緊縮變換的吸引子,編碼時(shí)只需存儲(chǔ)變化的參數(shù),解碼時(shí)需要利用該變化對(duì)任一幅圖像不斷進(jìn)行迭代變換此方案具有思路新穎、壓縮潛力大、解碼分辨率無關(guān)性等特點(diǎn),是一種很有潛力的編碼方法3年,M 首次巧妙地將計(jì)算機(jī)視覺56第1期陳炳權(quán),等:數(shù)字圖像處理技術(shù)的現(xiàn)狀及其發(fā)展方向.2-24.1987allat領(lǐng)域內(nèi)的多尺度分析思想引入到小波變換中
22、,統(tǒng)一了在此之前的各種小波的構(gòu)造方法.之后,他又研究了小波變換的離散形式,并將相應(yīng)的算法應(yīng)用于圖像的分解與重構(gòu)中,為隨后的小波圖像壓縮編碼奠定了基礎(chǔ).進(jìn)入90年代,又取得了一系列圖像壓縮編碼研究的階段性新成果25-26.其中EZW 編碼算法27、SPI H T 編碼算法28被認(rèn)為是目前世界上比較先進(jìn)的圖像壓縮編碼算法,這2種算法均具有結(jié)構(gòu)簡(jiǎn)單、無需任何訓(xùn)練、支持多碼率、圖像復(fù)原質(zhì)量較理想等優(yōu)點(diǎn),但同時(shí)又都不同程度地存在算法時(shí)間復(fù)雜度和空間復(fù)雜度過高的弱點(diǎn).而小波變換的圖像壓縮編碼算法已成為目前圖像壓縮研究領(lǐng)域的一個(gè)主要方向.小波變換是20世紀(jì)80年代后期發(fā)展起來的一種新的信息處理方法,因其本質(zhì)
23、是多分辨分析信號(hào),在時(shí)域和頻域都具有分辨率,對(duì)高頻分量采用逐漸精細(xì)的時(shí)域或空域步長(zhǎng),可以聚焦到分析對(duì)象的任意細(xì)節(jié),對(duì)于劇烈變換的邊緣,比常規(guī)的傅里葉變換具有更好的適應(yīng)性,故特別適用于分析非平穩(wěn)信號(hào).2.3圖像增強(qiáng)與恢復(fù)圖像增強(qiáng)是按照特定的要求突出一幅圖像中的某些信息,同時(shí)削弱或去除某些不需要的信息處理方法,其主要目的是使處理后的圖像對(duì)某種特定的應(yīng)用來說,以原來圖像更適用,它是為了某種應(yīng)用目的去改善圖像質(zhì)量,使圖像更適合于人的視覺特性或機(jī)器的識(shí)別系統(tǒng).目前增強(qiáng)方法主要有直方圖修改處理、圖像平滑化處理、圖像尖銳化處理及彩色處理技術(shù)等29,由于各種圖像增強(qiáng)算法的特點(diǎn)不同,對(duì)圖像增強(qiáng)的側(cè)重點(diǎn)也不同.在
24、對(duì)圖像進(jìn)行處理之前,首先分析不同圖像增強(qiáng)方法的優(yōu)缺點(diǎn),再對(duì)具體圖像問題進(jìn)行具體分析,然后選擇幾種增強(qiáng)方法結(jié)合使用,也許就可能達(dá)到預(yù)期的增強(qiáng)效果.圖像在獲取、傳輸和存儲(chǔ)過程中由于受多種原因如模糊、失真、噪聲等的影響,會(huì)造成圖像質(zhì)量的下降,即圖像的退化.引起圖像退化的原因很多,在圖像的獲取(數(shù)字化過程和傳輸過程,如使用CCD 攝像機(jī)獲取圖像,光照程度和傳感器溫度是造成圖像退化的主要因素.圖像在傳輸過程中主要由于所用的傳輸信道的干擾受到噪聲污染,也會(huì)造成圖像質(zhì)量的下降.圖像恢復(fù)技術(shù)以獲取視覺質(zhì)量得到某種程度改善為目的,根據(jù)指定的圖像退化模型來對(duì)在某種情況下退化或降質(zhì)了的退化圖像進(jìn)行恢復(fù),以獲取到原始
25、的、未經(jīng)退化的原始圖像.圖像恢復(fù)首先要建立圖像退化/復(fù)原模型,當(dāng)不知道圖像本身的性質(zhì)時(shí),可以建立退化源的數(shù)學(xué)模型,然后施行恢復(fù)算法除去或減少退化源的影響.當(dāng)有了關(guān)于圖像本身的先驗(yàn)知識(shí)時(shí),模型以建立原始圖像的模型,然后在觀測(cè)到的退化圖像中通過檢測(cè)原始圖像而復(fù)原圖像.常見的圖像恢復(fù)模型有4種:通用圖像模型,光學(xué)系統(tǒng)模型,攝影過程模型,離散圖像恢復(fù)模型.30在成像系統(tǒng)中一個(gè)通常的缺點(diǎn)是在傳感器和顯示器系統(tǒng)中存在有害的非線性,傳感器信號(hào)的處理后修正和顯示器信號(hào)的處理前修正可以充分減少退化29.這種恢復(fù)處理實(shí)現(xiàn)起來通常相對(duì)簡(jiǎn)單,最常見的圖像恢復(fù)任務(wù)是為了補(bǔ)償圖像模糊和消除噪聲影響而進(jìn)行的空間圖像恢復(fù).3
26、0-31目前通常有以下恢復(fù)技術(shù):傳感器和顯示點(diǎn)的非線性修正,連續(xù)圖像的空間濾波恢復(fù),偽逆空間圖像恢復(fù),SVD 偽逆空間圖像恢復(fù),統(tǒng)計(jì)學(xué)估計(jì)空間圖像恢復(fù),約束圖像恢復(fù),盲目圖像恢復(fù).312.4圖像分割圖像分割是圖像處理中的一項(xiàng)關(guān)鍵技術(shù),自20世紀(jì)70年代起一直受到人們高度重視,并在醫(yī)學(xué)、工業(yè)、軍事等領(lǐng)域得到了廣泛應(yīng)用.常用的分割方法主要分為基于區(qū)域的分割方法和基于邊緣的分割方法2類.此外,隨著各學(xué)科的發(fā)展出現(xiàn)了一些結(jié)合某種特定理論的分割方法.2.4.1基于區(qū)域的分割方法這類方法的基本思想是將圖像分割成若干不重疊的區(qū)域,使各區(qū)域內(nèi)部特征的相似性大于區(qū)域間特征的相似性,各區(qū)域內(nèi)像素都滿足基于灰度、紋
27、理等特征的某種相似性準(zhǔn)則.其常見的方法:閾值法32;區(qū)域生長(zhǎng)法33;分裂合并法33.2.4.2基于邊緣的分割方法邊緣的主要表現(xiàn)為圖像局部特征的不連續(xù)性,該方法首先檢出圖像中局部特性的不連續(xù)性或突變性,然后將它們連成邊界,這些邊界把圖像分成不同的區(qū)域.傳統(tǒng)的圖像邊緣檢測(cè)方法大多可歸結(jié)為圖像高頻分量的增強(qiáng)過程,微分運(yùn)算自然成為邊緣檢測(cè)與提取的主要手段.常用的邊緣檢測(cè)算子有以下幾種:Rober t 算子、Sobel 算子、Pre 2witt 算子、Canny 算子和拉普拉斯算子.微分算子法34的優(yōu)點(diǎn)是計(jì)算簡(jiǎn)單、速度較快,缺點(diǎn)是對(duì)噪聲的干擾都比較敏感.邊界跟蹤法35的基本思想是從梯度圖中的一邊緣點(diǎn)出發(fā)
28、,依次搜索并連接相鄰邊緣點(diǎn),從而實(shí)現(xiàn)對(duì)圖像邊界的檢測(cè),先確定搜索起點(diǎn),接著采取合適的數(shù)據(jù)結(jié)構(gòu)和搜索機(jī)理,并在已發(fā)現(xiàn)的邊界點(diǎn)上確定新的邊界點(diǎn),最后按照搜索的終結(jié)準(zhǔn)則和終結(jié)條件完成邊界的跟蹤,從而實(shí)現(xiàn)邊緣的提取.圖像分割至今尚無通用的自身理論,隨著各學(xué)科的不斷發(fā)展,提出了許多新理論和新方法,于是出現(xiàn)了許多與一些特定理論、方法相結(jié)合的圖像分割技術(shù).遺傳算法36最初由美國Michiga n 大學(xué)的Holland 教授于1975年提出的,其基本思想是將問題域中的可能解視為群體的一個(gè)個(gè)體或染色體,并將每一個(gè)體編碼成符號(hào)串形式,對(duì)種群反復(fù)進(jìn)行選擇、交叉和變異操作,根據(jù)預(yù)定的目標(biāo)適應(yīng)度函數(shù)對(duì)每個(gè)個(gè)體進(jìn)行評(píng)價(jià),
29、適應(yīng)值高的染色體被選中概率較高,以全局并行搜索方式來搜索優(yōu)化群體中的最優(yōu)個(gè)體.該方法具有全局搜索能力,是一種迭代式的優(yōu)化算法,在分割圖像時(shí)常用來幫助確定最佳分割閾值.小波變換37是在傅里葉分析基礎(chǔ)上發(fā)展起來的,具有良好的時(shí)域和頻域局部化特性,而且還具有多分辨分析的特點(diǎn).基于小波分析的邊緣檢測(cè)方法37的突出優(yōu)點(diǎn)是它的多尺度性,圖像的每個(gè)尺度的小波變換都提供了一定的邊緣信息.小尺度下,圖像的邊緣細(xì)節(jié)信息豐富,邊緣定位精度較高,但易受噪聲干擾,大尺度下,邊緣穩(wěn)定,抗噪性好,但定位精度差利用小波的多尺度性可實(shí)現(xiàn)在大尺度下抑制噪聲,可靠地識(shí)別邊緣,在小尺度下精確定位S 模型3最初是由K 等人在年66吉首
30、大學(xué)學(xué)報(bào)(自然科學(xué)版第30卷.nak e 8a ss 1987第1屆計(jì)算機(jī)國際視覺會(huì)議上提出的,其基本思想是首先通過人的識(shí)別能力,在圖像中目標(biāo)邊界附近確定初始輪廓線,然后對(duì)曲線進(jìn)行能量最小化變形,使其鎖定在待分割目標(biāo)的邊界上.Sna ke 算法能夠有效地利用圖像局部與整體的信息,實(shí)現(xiàn)對(duì)邊界的準(zhǔn)確定位,具有良好的提取和跟蹤特定區(qū)域內(nèi)目標(biāo)輪廓的能力.由于圖像的千變?nèi)f化,在實(shí)際應(yīng)用中,通常將多種分割算法有效地結(jié)合在一起使用以獲得更好的分割效果.2.5圖像分析圖像分析從圖像中抽取某些有用的度量、數(shù)據(jù)或信息,目的是得到某種數(shù)值結(jié)果,它主要是提供關(guān)于被分析圖像的一種描述,既要利用模式識(shí)別技術(shù),又要利用關(guān)于
31、圖像內(nèi)容的知識(shí)庫,即人工智能中關(guān)于知識(shí)表達(dá)方面的內(nèi)容.圖像分析需要用圖像分割方法抽取出圖像的特征,然后對(duì)圖像進(jìn)行符號(hào)化的描述,這種描述不僅對(duì)圖像中是否存在某一特定對(duì)象作出回答,還要對(duì)圖像內(nèi)容作出詳細(xì)描述.圖像分割綜述已上述所述,現(xiàn)分別從描繪和紋理分析這2個(gè)方面加以闡述.2.5.1圖像描繪經(jīng)過圖像分割后,得到的是若干區(qū)域和邊界.為了有效地識(shí)別目標(biāo),必須要描述這些目標(biāo)即提供它們的有用信息和相互關(guān)系,通常有區(qū)域內(nèi)部描述、區(qū)域邊界描述和關(guān)系描述.(1區(qū)域內(nèi)部描述.(i 矩描述子.該描述子是基于帕普里斯(Papo ulis 唯一性定理.M K Hu 在1961年首先提出不變矩的概念,并將幾何矩用于圖像描
32、述.M R Tea gue 在1979年基于正交多項(xiàng)式理論提出的Z er nike 矩,從噪聲靈敏度、信息冗余度和圖像描述能力等方面來說都具有很好的性能.Y L Sheng 和L X Shen 于1994年提出了正交傅里葉梅林矩39,平子良等定義了一種新的圖像矩切比雪夫圖像矩描述圖像40,這種矩可以得到比較理想的描述效果.矩方法是一種經(jīng)典的區(qū)域形狀分析方法,但于它的計(jì)算量較大且受噪聲干擾,缺乏實(shí)用價(jià)值.(ii 拓?fù)涿枋鲎?1.帶有孔的圖形,如果把區(qū)域中的孔洞數(shù)作為拓?fù)涿枋鲎?顯然這個(gè)性質(zhì)不受伸長(zhǎng)或旋轉(zhuǎn)變換的影響.但是如果撕裂或折疊時(shí),孔洞數(shù)就要變化了,區(qū)域描述的另一種有用的拓?fù)涮匦允沁B接部分的
33、個(gè)數(shù).(iii投影與截痕.圖像在任意方向上的投影可以定義為該圖像諸像素在該方向上對(duì)應(yīng)投影之和,和投影相類似的另一種描述圖像中的對(duì)象方向特性的參數(shù)是截痕,截痕和投影有著同樣的用途.(iiii 模板匹配.41(2區(qū)域的外形邊界描述方法.(i 傅里葉描述子.當(dāng)一個(gè)區(qū)域邊界上的點(diǎn)已被確定時(shí),可以從這些點(diǎn)中提取信息.這些信息就可以用來鑒別不同區(qū)域的形狀,Kauppien 比較了各種典型形狀識(shí)別方法42,實(shí)驗(yàn)表明基于物體輪廓坐標(biāo)序列的傅里葉描述子具有最佳的形狀識(shí)別性能.通過連續(xù)型傅里葉變換代替離散傅里葉變換的計(jì)算方法,可以減少由于邊界曲線等間距離散化引起的誤差,而且可以大大減少傅里葉變換計(jì)算的工作量.43
34、(ii 小波輪廓描述子.小波變換是一一對(duì)應(yīng)的映射,所以一個(gè)給定的輪廓對(duì)應(yīng)一組唯一的描述符.小波輪廓描述符比較適合描述輪廓的基本特征并用來進(jìn)行基于輪廓的圖像檢索.從描述精度、穩(wěn)定性各方面來看,它比傅里葉描述子更為優(yōu)越.(iii霍夫變換.霍夫(Hough變換是一種線描述方法,它可以將笛卡爾坐標(biāo)空間的線變換為極坐標(biāo)空間的點(diǎn),霍夫變換使不同坐標(biāo)系中的線和點(diǎn)建立了一種對(duì)應(yīng)關(guān)系.(iiii曲線擬合.任何一個(gè)二維圖像目標(biāo)或?qū)ο蟮倪吔缍际瞧矫嬷械囊粭l曲線.對(duì)曲線擬合一個(gè)函數(shù)可用于描述該目標(biāo)的邊界(形狀.對(duì)于所擬合函數(shù),總存在一定的擬合誤差.Duda 和Har t 提出一種簡(jiǎn)單的分段線性曲線擬合方法,即重復(fù)端點(diǎn)
35、擬合方法,這種方法類似于采用分裂方法逼近多邊形邊界的技術(shù).該方法的優(yōu)點(diǎn)是計(jì)算簡(jiǎn)單,缺點(diǎn)是噪聲數(shù)據(jù)點(diǎn)將引起擬合誤差.多數(shù)情況下,擬合后的曲線只是一種近似,可借助許多方法進(jìn)行調(diào)整,以使邊界更加精確,其中利用高層知識(shí)的處理也是常用的方法.另外,Ho -K e un Song 和Eung -Kwa Kang 提出了用圓形掃描的方法來描述圖像.(3關(guān)系描述.關(guān)系描述的任務(wù)就是把被分割后的區(qū)域或部分組成為有意義的關(guān)系結(jié)構(gòu),一般是以文法概念為基礎(chǔ)的,通??煞譃榇姆ê透呔S文法,其中高維文法又包括樹文法、網(wǎng)文法、表結(jié)構(gòu)44.2.5.2紋理分析結(jié)構(gòu)法、統(tǒng)計(jì)法、頻譜法和模型法是常用的紋理研究方法.結(jié)構(gòu)法從紋理的基
36、元形態(tài)及其排布規(guī)則角度分析,適用于研究規(guī)則紋理;統(tǒng)計(jì)法從宏觀角度對(duì)紋理進(jìn)行統(tǒng)計(jì)分析,適用于隨機(jī)紋理;頻譜法利用頻域信號(hào)處理方法分析紋理的數(shù)字特征;模型法將紋理看做某種數(shù)學(xué)模型進(jìn)行分析.(1結(jié)構(gòu)法.結(jié)構(gòu)分析法從紋理圖像的結(jié)構(gòu)角度分析紋理基元形狀和排列分布特征.紋理基元存在面積、周長(zhǎng)、偏心度、方向、延伸度、歐拉數(shù)、矩、幅度、緊支性等特征.該方法通常首先確定紋理基元,然后根據(jù)句法模式識(shí)別理論,利用形式語言對(duì)紋理的排列規(guī)則進(jìn)行描述.其優(yōu)點(diǎn)是有利于對(duì)紋理構(gòu)成的理解和高層檢索使用,適合于描述人工規(guī)則紋理.對(duì)于自然紋理,由于基元本身提取困難以及基元之間的排布規(guī)則不易用確定的數(shù)學(xué)模型描述,在隨機(jī)紋理的描述方法
37、中,結(jié)構(gòu)分析法應(yīng)用不多或者常被用做輔助分析手段.(2統(tǒng)計(jì)法.多數(shù)紋理可以描述為一個(gè)隨機(jī)變量,尤其是自然紋理,從局部分析表現(xiàn)出很大的隨機(jī)性.從整體分析和統(tǒng)計(jì)意義上,紋理存在某種規(guī)律性,不同的紋理存在不同的數(shù)字特征.基于統(tǒng)計(jì)的紋理分析方法主要有矩、自相關(guān)函數(shù)、灰度共生矩陣分析等.(3頻譜法.頻譜法將空間域的紋理圖像變換到頻率域中,利用信號(hào)處理的方法,該法是建立在多尺度分析與時(shí)/頻分析基礎(chǔ)之上的紋理分析方法,目前主要有傅里葉變換、小波等.(4模型法.模型法將紋理基元分布看成某種數(shù)學(xué)模型,運(yùn)用統(tǒng)計(jì)、信號(hào)分析等理論中相應(yīng)的方法對(duì)紋理模型進(jìn)行分析,獲得一些紋理特征.常用的模型有馬爾可夫隨機(jī)場(chǎng)模型45、W
38、old 分解46、自回歸模型47、控向金字塔48小波分析、分形49等.基于模型的方法不僅可以用于表示紋理,而且可以用于合成紋理.3存在的問題和未來的方向圖像提取技術(shù)得到了越來越多學(xué)者的關(guān)注,產(chǎn)生了很多的研究成果,但是仍存在以下點(diǎn)不足和有待解決的問題(缺乏統(tǒng)一的評(píng)價(jià)標(biāo)準(zhǔn);(缺乏先驗(yàn)知識(shí)來支持系統(tǒng);(3最終提取邊界很大程度上依賴于T ;(圖像提取系統(tǒng)的計(jì)算76第1期陳炳權(quán),等:數(shù)字圖像處理技術(shù)的現(xiàn)狀及其發(fā)展方向4:12rimap 468 吉首 大學(xué) 學(xué)報(bào) (自然科學(xué)版 第 30 卷 量都比較大 . 圖像提取技術(shù)研究作為圖像處理中一個(gè)重要研究分支 ,引人大量概率統(tǒng)計(jì)理論 ,目前圖 像提 取技 術(shù)領(lǐng)域
39、的研究 依然非?;钴S . 如華盛頓大學(xué)專門 成立 了圖 形圖像 實(shí)驗(yàn) 室 ( GRAIL , , 由 SON Y 等 企業(yè) 聯(lián)合 一些 大學(xué) 也進(jìn) 行了 相關(guān) 的研 究 50 , Microsof t 在其亞洲微軟研究院 ( MRA 專門設(shè)有圖形圖 像處理 技術(shù)研 究所和交 互可視 媒體研 究組 51 , 北京大學(xué) , 浙 江大學(xué)等都相繼成立了從事數(shù)字圖 像處 理技 術(shù)研究的國家重點(diǎn)實(shí)驗(yàn)室 52 . 天津大學(xué)從研制數(shù)字電視及電影 制作設(shè)備 (如切 換臺(tái)等 的角度 ,也對(duì)圖像提取技術(shù)進(jìn)行了較 深人 的研 究. 筆者認(rèn)為 : 前景與背景 間交界區(qū) 域估計(jì)模型 仍是該領(lǐng) 域研究的一 個(gè)重點(diǎn) . 小波
40、變換圖像壓縮編碼有待解決的主要問題 : 盡管小波變換圖像壓縮 編碼算法具 有結(jié)構(gòu)簡(jiǎn) 單 , 任何訓(xùn)練 , 無需 支持 多碼率 , 壓縮比較大 , 圖象復(fù)原質(zhì)量較理想等 特點(diǎn) ,但在不同程度上 存在壓縮/ 解壓縮速 度慢 , 像復(fù)原質(zhì) 量不理想 等問題 , 圖 為了進(jìn)一步改善此算法的工作效率 ,需要解決以下 2 個(gè)主要問題 : 正交小波基的選擇問題 ;數(shù)據(jù)向量量化編碼 算法 的選 擇問 題 . 紋理的理論和應(yīng)用研究取得了豐富的成果 ,但 也有 一些與之相關(guān)的概念和理論尚未取得一致的看法 , 紋理 研究方法多從 信號(hào)處理 , 模式識(shí)別理論發(fā)展而來 ,并且處在 不斷 的發(fā) 展之中. 經(jīng)過近 90 年
41、的發(fā)展 ,特別是第 3 代數(shù)字計(jì)算機(jī)問世后 ,數(shù)字圖像處理技術(shù)出現(xiàn)了空前的發(fā)展 ,但存在一定的問題 ,具體 體現(xiàn)在以下 5 個(gè)方面 : (1 在提高精度的同時(shí)著重解決處理速度 的問 題 ,巨大的信息量和數(shù)據(jù)量和處理速度仍然是一對(duì) 主要 矛盾 ; (2 加強(qiáng)軟件的研究和開發(fā)新的處理方法 ,重點(diǎn)是移植其他學(xué)科的技術(shù) 和研究成果 ; ( 3 邊 緣學(xué)科的研 究 ( 如人的視覺 特性 , 心理學(xué)特性的研究的突破 促進(jìn)圖像處理技術(shù)的 發(fā)展 ; (4 理論研 究已逐步 形成圖像處 理科學(xué)自身 的理論體 系 ; (5 建 立圖像信息庫和標(biāo)準(zhǔn)子程序 ,統(tǒng)一存放格式和檢索 . 圖 像信息量和數(shù)據(jù)量大 ,若沒有
42、圖像處理領(lǐng) 域的標(biāo)準(zhǔn)化 ,圖 像信息的建 立, 檢索和交流將是一個(gè)極嚴(yán)重的問題 ,交流 和使 用極 不便 ,造成資源共享的嚴(yán)重障礙 . 筆者認(rèn)為 ,圖像處理技術(shù)未來發(fā)展 大致體現(xiàn)在在以下 4 個(gè)方面 :1 朝高速 , 高分辨率 , 立體化 , 多媒體 , 智能化和標(biāo)準(zhǔn)化 方向發(fā)展 . 具體表現(xiàn) : ( 1 提高硬件速度 . 這不僅 僅要提 高計(jì)算 機(jī)的速 度 ,而 且 A/ D 和 D/ A 的速度 要實(shí)時(shí) 化 ; ( 2 提 高分辨 率 . 主要是提高采集分辨率和顯示分辨率 ,其 主要 困難 是顯像管的制造和圖像圖形刷新存取速度 ; (3 立體化 . 圖像是二 維信 息 , 信息量更大的三維
43、圖像將隨意計(jì)算圖形學(xué)及虛擬現(xiàn)實(shí)技術(shù) 的發(fā)展將得 到廣泛 應(yīng)用 . ( 4 多媒 體化. 20 世 紀(jì) 90 年 代出現(xiàn) 的多媒體技術(shù) ,其關(guān)鍵技術(shù)就是圖像數(shù)據(jù)的壓縮 , 目前 數(shù)據(jù)壓縮的國際標(biāo)準(zhǔn)有 多個(gè) , 而且還在發(fā) 展 ,它 將朝著人 類接收和處 理信息最自然的方式發(fā)展 . (5 智能化 . 力爭(zhēng)使計(jì)算機(jī)識(shí)別和理解能夠按 照人的認(rèn)識(shí) 和思維方式 工作 , 能夠考慮 到主觀概率 和非邏輯思維 . (6 標(biāo)準(zhǔn)化 . 從整體上看 ,圖像處理技術(shù)目前還沒 有國 際標(biāo) 準(zhǔn). 2 圖像和圖形相結(jié)合朝著三維成像或多維成像 的方向發(fā)展 . 3 硬件芯片的開發(fā)研究. 目前結(jié)合多媒體 的研 究 ,硬件 芯片越
44、來越 多 ,如 Thomson 公司 S T13220 采用 Systolic 結(jié)構(gòu)設(shè)計(jì)了運(yùn)動(dòng)預(yù)測(cè)器 ,把圖像處理的眾多功能固化在芯片上 ,為實(shí)踐服務(wù) . 4 新理 論和新算法 的研究 . 圖像處 理科學(xué)經(jīng)過 初創(chuàng)造期 , 發(fā)展期 , 普及期和廣 泛應(yīng)用 期 , 近年來 引 入了一 些 新的理 論 并提 出了 一些 新的 算法 , 如 : Wavele t , ac tal , 2 Fr Mor phology , 遺傳算法和神經(jīng)網(wǎng)絡(luò)等 , 其中 Fractal 廣泛應(yīng)用 圖像處理 , 形處理 , 圖 紋理 分析 , 同時(shí) 還用于 物理 , 數(shù)學(xué) , 生物 , 神經(jīng) 和音樂等方面 . 參考文獻(xiàn)
45、 : 1 ANDR EWS C. Compute r Technique s in Image P rocessing M . New York :Acade mic Pre ss ,1970. 2 RA TT K. Digital Image Proce ssing M . New Yor k :John Wiley & Sons , 1978. P 3 ' O HANDL EY D A , GREEN W B. Recent Development in Digital Image Proce ssing at t he Image Processing Laborator
46、y at the Jet Prop ulsion Labo rator y J . Proc . I EEE , 1972 ,60 (7 :821 - 828. 4 FIELDIN G R. The Technique of Special Eff ects Cinematography ( Third Edition M . London: Focal/ Ha stings House ,1972. 5 POR TER T ,DU FF T. Compositing Digital Image s J . Compute r Grap hic s ( ACM ,1984 ,18 (3 :25
47、3 - 259. 6 BLINN J F. Compo siting , Part 1 : Theory J . IEEE Computer Graphics & Applica tion ,1994 ,14 (6 :78 - 82. 7 BERMAN A ,DADOU RIAN A ,VLA HOS P. Method fo r Re moving From on Image the Back Ground Surrounding a Se2 lected Object P . U. S. Patent 6 - 134 - 345 ,2000. 8 RUZON M A , TOMAS
48、I C. Alpha Estima tio n in Natural Image s A . Proceedings of t he IEEE Compute r Societ y C n2 o fe rence on Compute r Vision a nd Patter n Recognition 1 C . New Yor k :Wiley & IEEE Publishing , 2000 :18 - 25. 9 HUAN G Y Y , CURL ESS B , SAL ESIN D H , et al. A Baye sia n Approac h to Digital M
49、atting A . Procee ding of the C I EEE Computer Society C nfere nce on Co mputer Vision and Pat te rn Recognition 2 C . New York : Wile y & IEEE o Publishi ng , 2001 :264 - 271. 10 SUN J ,J IA J Y, TANG C K,e t al . Poisson Ma tting J . ACM Transactions on Graphics ,2004 ,23 ( 3 :315 - 321. 11 DU
50、 Z L ,L IN H , QIN X Y, et al. O rie nted Pois so n M atting A . IC I P 200 5 I E EE In tern atio nal Co nf erence o n Imag e Proces sin g C . New Yo rk : Wile y & IE E E Pub lis hing ,2 005 :1 1 - 1 4 . 第 1 期 陳炳權(quán) ,等 :數(shù)字 圖像 處理 技術(shù)的現(xiàn)狀及其發(fā)展方向 69 12 I Y ,SUN J ,S HUM H Y. Video Object Cut a nd Paste
51、J . ACM Tra nsac tio ns on Grap hics ,2005 ,24 (3 :595 - 600. L 13 IN S Y, S HI J Y. Fa st Natural Image Matting in Pe rceptual Colo r Space J . Computer & Gr ap hic s ,2005 ,29 :403 L 414. 14 王向陽 . 基 于小波變換的有損圖像壓縮算法研究 J . 計(jì)算機(jī)工程與應(yīng)用 , 2001 ,37 (15 :82. 15 WI TTEN I H , NEAL R , CL EAR Y J . Arithm
52、e tic Coding for Data Compressio n J . Communications of the ACM , 1987 ,30 (6 :520 - 540. 16 RABBANI M ,JONES P. Digital Image Compre ssion Tec hniques J . SP IE ,1991 (1 450 :116 - 128. 17 EPSTEIN B R , HIN GORANI R. Multispectral KL T2Wavelet Data Compre ssion for La ndsa t Ther matic Mappe r Ima
53、2 ge s J . Data Compre ssion Conf . ,1992 (13 :181 - 190 . 18 NASRABADI N M , KING R A. Image Coding Using Vector Quantization :a Review J . IEEE Tr ans. on Commun. , 1988 ,36 (8 :957 - 971. 19 GUAN L , KAMEL M. A Vector Dist ribution Model and an Ef fective Neare st Neighb or Searc h Method for Ima
54、ge Vector Quantization J . IEEE Tra ns. on Ima ge Processing ,1997 ,6 ( 12 :1 688 - 1 691. 20 RINALDO R , CAL VAGNO G. Hibir d Vecto r Quantiza tio n for Multiresolutio n Image Coding J . IEEE Trans. on Image Processing ,1997 ,6 (5 :753 - 758. 21 WOODS J W ,O ' EIL S D. Subband Coding of Image s
55、 J . IEEE Tra ns. on Aco ustic Speech and Signal Processing , N 1986 ,34 (5 :1 278 - 1 288. 22 BARNSL EY M F , SLOAN A D. A Better Way to Comp ress Ima ges J . B YTE Magazine ,1988 , 13 (1 :215. 23 JACQUIN A E. Image Coding Based on a Fr ac tal Theor y of Iter ated Contractive Image Transformations
56、J . IEEE Trans. o n Image Proce ssing ,1992 ,1 (1 :18 - 30. 24 WOHLB ER G B ,JA GER G. F ractal Coding Perfor ma nce f or Fir st2Or der Gauss2Ma rkov Model s J . Elect ro nics Let 2 ter s , 1996 ( 32 :441 - 442. 25 AN TONINI M ,BARLAUD M , MA THI EU P ,et al. Image Coding Using Wavelet Tra nsfor m J
57、 . IEEE Tra ns. on Im 2 age Proce ssi ng , 1992 ,1 (2 :205 - 220. 26 AV ERB UCH LAZAR D , ISRAEL I M. Ima ge Comp ression Using Wavelet Transfor m a nd M ultire solution Decomposi 2 tion J . IEEE Trans. on Image Proce ssing , 1992 ,5 (1 :4 - 15. 27 SHAP IRO J M. Embe dding Image C ding Using Zero tr
58、ees of Wavelet Coeff icie nts J . IEEE Tr ans. on Signal Pro 2 o cessing ,1993 ,41( 12 :3 445 - 3 462. 28 BRANCA A , TAFUR IM , A TTOL ICO G. Directionalit y Detection Inco mpo sitional Text ure s C / / Proc . of t he 13th Inter national Conf erence on Patter n Reco gnition. 1996 (15 :830 - 834. 29 BORN M , WOL F E. Principle s of Optics M . New Y rk : Pe rga mon Pre
溫馨提示
- 1. 本站所有資源如無特殊說明,都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請(qǐng)下載最新的WinRAR軟件解壓。
- 2. 本站的文檔不包含任何第三方提供的附件圖紙等,如果需要附件,請(qǐng)聯(lián)系上傳者。文件的所有權(quán)益歸上傳用戶所有。
- 3. 本站RAR壓縮包中若帶圖紙,網(wǎng)頁內(nèi)容里面會(huì)有圖紙預(yù)覽,若沒有圖紙預(yù)覽就沒有圖紙。
- 4. 未經(jīng)權(quán)益所有人同意不得將文件中的內(nèi)容挪作商業(yè)或盈利用途。
- 5. 人人文庫網(wǎng)僅提供信息存儲(chǔ)空間,僅對(duì)用戶上傳內(nèi)容的表現(xiàn)方式做保護(hù)處理,對(duì)用戶上傳分享的文檔內(nèi)容本身不做任何修改或編輯,并不能對(duì)任何下載內(nèi)容負(fù)責(zé)。
- 6. 下載文件中如有侵權(quán)或不適當(dāng)內(nèi)容,請(qǐng)與我們聯(lián)系,我們立即糾正。
- 7. 本站不保證下載資源的準(zhǔn)確性、安全性和完整性, 同時(shí)也不承擔(dān)用戶因使用這些下載資源對(duì)自己和他人造成任何形式的傷害或損失。
最新文檔
- 2025年學(xué)校后勤工作計(jì)劃年度工作計(jì)劃
- 2025年社區(qū)半年工作總結(jié)及計(jì)劃模板
- 2025年春季幼兒園園務(wù)計(jì)劃
- Unit 4 Natural Disasters Reading for writing 說課稿 -2024-2025學(xué)年人教版(2019)高中英語必修第一冊(cè)
- 物流公司獎(jiǎng)懲管理制度范文
- 2025年銷售內(nèi)勤工作計(jì)劃書范本
- 任務(wù)三 編輯工作表 說課稿 -2023-2024學(xué)年桂科版初中信息技術(shù)八年級(jí)上冊(cè)
- 2025年小學(xué)五年級(jí)班主任工作計(jì)劃例文
- 2025幼兒園個(gè)人工作計(jì)劃教師
- 2025年幼兒園中班四月份月計(jì)劃
- 《小學(xué)生良好書寫習(xí)慣培養(yǎng)的研究》中期報(bào)告
- 大學(xué)英語四級(jí)詞匯表(下載)
- 2025年四川成都市溫江區(qū)市場(chǎng)監(jiān)督管理局選聘編外專業(yè)技術(shù)人員20人歷年管理單位筆試遴選500模擬題附帶答案詳解
- 手術(shù)室發(fā)生地震應(yīng)急預(yù)案演練
- 初中數(shù)學(xué)新課程標(biāo)準(zhǔn)(2024年版)
- 高職院校專業(yè)教師數(shù)字素養(yǎng)架構(gòu)與提升路徑
- 售后服務(wù)人員培訓(xùn)資料課件
- 2024-2030年中國薯?xiàng)l行業(yè)發(fā)展趨勢(shì)及投資盈利預(yù)測(cè)報(bào)告
- 生命智能學(xué)習(xí)通超星期末考試答案章節(jié)答案2024年
- 專項(xiàng)14-因式分解-專題訓(xùn)練(50道)
- 中華傳統(tǒng)文化之戲曲瑰寶學(xué)習(xí)通超星期末考試答案章節(jié)答案2024年
評(píng)論
0/150
提交評(píng)論