(控制科學(xué)與工程專業(yè)論文)基于小波包矩特征的改進(jìn)ldb人臉識別方法及其應(yīng)用研究.pdf_第1頁
(控制科學(xué)與工程專業(yè)論文)基于小波包矩特征的改進(jìn)ldb人臉識別方法及其應(yīng)用研究.pdf_第2頁
(控制科學(xué)與工程專業(yè)論文)基于小波包矩特征的改進(jìn)ldb人臉識別方法及其應(yīng)用研究.pdf_第3頁
(控制科學(xué)與工程專業(yè)論文)基于小波包矩特征的改進(jìn)ldb人臉識別方法及其應(yīng)用研究.pdf_第4頁
(控制科學(xué)與工程專業(yè)論文)基于小波包矩特征的改進(jìn)ldb人臉識別方法及其應(yīng)用研究.pdf_第5頁
已閱讀5頁,還剩62頁未讀, 繼續(xù)免費(fèi)閱讀

(控制科學(xué)與工程專業(yè)論文)基于小波包矩特征的改進(jìn)ldb人臉識別方法及其應(yīng)用研究.pdf.pdf 免費(fèi)下載

版權(quán)說明:本文檔由用戶提供并上傳,收益歸屬內(nèi)容提供方,若內(nèi)容存在侵權(quán),請進(jìn)行舉報或認(rèn)領(lǐng)

文檔簡介

摘要 人臉識別是模式識別 圖像處理和人工智能領(lǐng)域的一個重要研究課題 它具 有廣泛的應(yīng)用背景并日益受到學(xué)術(shù)界 企業(yè)界 政府和軍事部分的高度重視 人 臉識別一般分為三個部分 預(yù)處理 人臉特征提取和分類器設(shè)計 人臉特征提取 是在低維特征空間內(nèi)對原高維空間的人臉模式進(jìn)行描述 特征提取是人臉識別的 關(guān)鍵環(huán)節(jié) 有效的人臉特征提取方法不僅能夠設(shè)計出性能比較好的分類器 而且 能夠提高識別率 但由于人臉的復(fù)雜性和多變性 在視角 光照和表情等條件變 化下人臉圖像的類內(nèi)散度遠(yuǎn)大于類間散度 導(dǎo)致很難有效地提取分類特征 因此 人臉特征提取也是人臉識別的主要難點所在 本文對傳統(tǒng)l d b 方法進(jìn)行改進(jìn) 提出了一種改進(jìn)的基于特定小波包分解系數(shù) 矩特性的人臉識別方法 本文的主要工作有以下幾個方面 1 對可分度定義進(jìn)行了改進(jìn) 傳統(tǒng)的l d b 對人臉圖像小波包分解后選擇部 分系數(shù)作為特征矢量 然而這一準(zhǔn)則的計算不滿足可分度的線性可加性 本文針 對該問題 給出了用系數(shù)對應(yīng)的平均類間距離與平均類內(nèi)距離的差作為特征系數(shù) 的差可分度定義 以確定小波包分解子帶 2 通過子帶選擇改進(jìn)識別效果 并不是所有的小波子帶和所有的小波分解系 數(shù)都有助于分類識別 因此只考慮選定子帶上的特征系數(shù)的一 二階原點矩作為 人臉特征 3 在分類識別方法上 本文提出了一種加權(quán)子帶分類特征向量距離分類法 用來取代l d b 中常用的最近鄰分類識別法 4 將本文提出的方法應(yīng)用到數(shù)字媒體信息處理系統(tǒng)研究項目中 設(shè)計并實現(xiàn) 了人臉檢測與識別模塊 并通過集成實現(xiàn)了項目所需要的功能 人臉識別研究的目標(biāo)主要有兩個 一是提高識別正確率 二是降低訓(xùn)練與識 別時間 在此基礎(chǔ)上 本文提出的這種新的人臉識別方法 既減少了計算復(fù)雜度 降低訓(xùn)練與識別時間 保證實時性 又能夠更好的描述對分類有用的人臉特征 提高識別正確率 實驗結(jié)果顯示 我們的算法具有更好的識別效果 而且訓(xùn)練和 識別的時間比原始l d b 方法分別減少了兩個數(shù)量級 關(guān)鍵詞 人臉識別 特征提取 小波包 矩特性 l d b 第i 頁 表目錄 表1人臉識別實驗方案設(shè)計因子 水平表 4 3 表2各種算法實驗結(jié)果 4 6 表3各種算法實驗相對結(jié)果 4 7 第1 i i 頁 國隨型堂撞丕太堂鯉究生瞳王堂亟 堂僮途塞 圖目錄 圖lm l a t 分解示意圖 l8 圖2m a n a t 重構(gòu)示意圖 1 8 圖3 圖像的2 層小波分解示意圖 1 9 圖4 肋 a 原圖 2 0 圖5k m 的l 層小波分解 2 0 圖6l 肌a 的2 層小波分解 2 0 圖7 由小波包組成的二元樹 2 3 圖8 計算出所有子空間的可分性 3 5 圖9 把最下層的小波包基標(biāo)上幸號 3 5 圖l o 確定最優(yōu)基 3 5 圖1 1 人臉圖像2 層小波包分解示意圖 4 0 圖1 2 選取人臉區(qū)域示意圖 4 0 圖l3o r l 圖像庫人物示意圖 4 4 圖1 4c p o e p 圖像庫 4 4 圖1 5 視頻中截取的人物圖像 4 5 圖1 6 人臉識別實驗流程圖 4 5 圖1 7 識別率圖 4 8 圖l8 誤識率圖 4 8 圖1 9 訓(xùn)練時間圖 單位 毫秒 m 4 9 圖2 0 部分訓(xùn)練時間圖 單位 毫秒 m 5 0 圖2 l 測試時間圖 單位 毫秒 l 訌 5 0 圖2 2 支持基于內(nèi)容檢索的媒體特征分析平臺體系結(jié)構(gòu)圖 5 2 圖2 3 人臉識別處理系統(tǒng)截圖 5 3 第1 v 頁 獨(dú)創(chuàng)性聲明 本人聲明所呈交的學(xué)位論文是我本人在導(dǎo)師指導(dǎo)下進(jìn)行的研究工作及取得 的研究成果 盡我所知 除了文中特別加以標(biāo)注和致謝的地方外 論文中不包含 其他人已經(jīng)發(fā)表和撰寫過的研究成果 也不包含為獲得國防科學(xué)技術(shù)大學(xué)或其它 教育機(jī)構(gòu)的學(xué)位或證書而使用過的材料 與我一同工作的同志對本研究所做的任 何貢獻(xiàn)均已在論文中作了明確的說明并表示謝意 學(xué)位論文題目 基王塵這魚熊掛征鰒這進(jìn)墜墮厶臉遲剔左洼毽基座周盈窒 學(xué)位論文作者簽名 圈蘊(yùn) 日期 塒年 月f 日 學(xué)位論文版權(quán)使用授權(quán)書 本人完全了解國防科學(xué)技術(shù)大學(xué)有關(guān)保留 使用學(xué)位論文的規(guī)定 本人授權(quán) 國防科學(xué)技術(shù)大學(xué)可以保留并向國家有關(guān)部門或機(jī)構(gòu)送交論文的復(fù)印件和電子 文檔 允許論文被查閱和借閱 可以將學(xué)位論文的全部或部分內(nèi)容編入有關(guān)數(shù)據(jù) 庫進(jìn)行檢索 可以采用影印 縮印或掃描等復(fù)制手段保存 匯編學(xué)位論文 保密學(xué)位論文在解密后適用本授權(quán)書 學(xué)位論文題目 基王塵達(dá)魚厘掛塹煎邀進(jìn)墜墮厶臉遲剔虛洼區(qū)基廑周玨窺 學(xué)位論文作者簽名 凄 盞 日期 糾年 月f 日 作者指導(dǎo)教師樣 星超日期 廬7 年f 2 月 日 第一章緒論 1 1 研究背景 在過去的幾十年間 人臉識別技術(shù)作為圖像分析 理解研究的成功應(yīng)用之一 正逐漸引起計算機(jī)視覺領(lǐng)域科研人員和信息安全產(chǎn)業(yè)界人士的極大關(guān)注 由于問 題本身的特殊性和復(fù)雜性 人臉識別已不再局限于計算機(jī)科學(xué)研究的單一范疇 越來越多的心理學(xué)家和神經(jīng)科學(xué)家也對該技術(shù)表現(xiàn)出了濃厚的興趣 人臉識別作 為一個跨學(xué)科的新興研究領(lǐng)域 為模式識別 圖像處理 計算機(jī)視覺 人工智能 機(jī)器學(xué)習(xí) 計算機(jī)圖形學(xué) 生理學(xué) 心理學(xué)等多種學(xué)科提供了一個良好的具體問 題 有利于構(gòu)建這些學(xué)科領(lǐng)域的基礎(chǔ)實驗平臺 嘗試新方法 驗證新理論 解釋 新現(xiàn)象 因此 人臉識別問題的深入研究和最終解決 可以極大的促進(jìn)這些學(xué)科 的發(fā)展和成熟 人臉是一種極為復(fù)雜的 多維的模式 也是一種典型的非剛性模式 人的面 部特征十分豐富 除了形狀 表情之外 還有五官的特征及分布 通過對這些特 征的研究 可以理解人的情緒等狀況 與其他利用視網(wǎng)膜識別 無法確保對人體 的安全性 及指紋識別 涉及個人隱私 等人體生物特征進(jìn)行身份驗證相比 人 臉識別的應(yīng)用具有直觀 友好及方便等特點 正越來越受到國際學(xué)術(shù)界 企業(yè)界 政府及國防軍事部門的高度關(guān)注 具有廣泛的應(yīng)用前景 l 人臉因人而異 絕對不會有完全相同的兩張臉出現(xiàn) 雖然人類的人臉識別能 力很強(qiáng) 能夠記住上千個不同人臉 并且可以在表情 年齡 2 或發(fā)型等發(fā)生巨大變 化的情況下 可以毫不困難地由人臉而辨別出某一個人 可是這對于計算機(jī)而言 要建立一個能夠完全自動進(jìn)行人臉識別的系統(tǒng)卻是非常困難的 主要原因包括人 臉表情豐富 人臉隨年齡增長而變化 人臉受光照 成像角度及成像距離的影響 從二維圖形重建三維圖像是一個艱難的過程 目前還沒有很好的描述人臉的三維 模型等 另外 人臉識別還牽涉到模式識別 圖像處理 統(tǒng)計分類 神經(jīng)網(wǎng)絡(luò) 生理學(xué) 心理學(xué)以及認(rèn)知科學(xué)等方面的諸多知識 這諸多因素使人臉識別成為一 項極富挑戰(zhàn)性的課題 與指紋 視網(wǎng)膜 虹膜 基因等其他人體生物特征識別系 統(tǒng)相比 人臉識別系統(tǒng)更加直接 友好 易于為用戶接受 并且通過人臉的表情 姿態(tài)分析 還能獲得其他識別系統(tǒng)難以得到的一些信息 人臉識別是人類視覺最杰出的能力之一 人臉?biāo)囊曈X信息占據(jù)了主導(dǎo) 地位 它是區(qū)別人與人之間差別的最重要的特征 因而人臉識別技術(shù)成為當(dāng)今研 究的一個熱點 3 盡管對人類自己毫不費(fèi)力 但實際上 由于人臉之間存在很大的 相似性以及人臉的高度可變性 所以它的內(nèi)在的機(jī)制是非常復(fù)雜的 因此人臉識 第l 頁 國隨抖堂撞丕太堂班塞生瞳工堂亟土堂僮j 金塞 別不但具有非常重要的意義 還非常具有挑戰(zhàn)性 人臉識別技術(shù)在國家安全 軍事安全和公共安全 智能門禁 視頻監(jiān)控 身 份驗證等領(lǐng)域得到了廣泛的應(yīng)用 4 在民事和經(jīng)濟(jì)領(lǐng)域 各類銀行卡 信用卡 儲 蓄卡的持卡人的身份驗證等具有重要的應(yīng)用價值 1 1 1 公共場所安全監(jiān)控 美國9 1 1 事件之后 世界各國普遍意識到公共場所在國家安全方面存在的隱 患 這促使各國對機(jī)場 碼頭 娛樂場所等人流較為密集的場所的安全問題更加 關(guān)注 一些國家已經(jīng)開始在機(jī)場安裝人臉識別系統(tǒng) 這些人臉識別系統(tǒng)能夠在很 短的時間內(nèi)拍下路過乘客的面部圖像 分析處理后 將圖像信息與恐怖分子和在 逃犯人的人臉圖像數(shù)據(jù)庫進(jìn)行比較 進(jìn)行人物識別 1 1 2 智能監(jiān)控 人臉識別作為一種智能技術(shù) 可以滿足政府部門 住宅小區(qū)和企事業(yè)單位出 入的自動化管理的要求 通過對各種門的出入控制 可以方便內(nèi)部人員出入 杜 絕陌生人的隨意進(jìn)出 增強(qiáng)了安全防范水平 1 1 3 銀行和金融系統(tǒng) 在一些國家 每年約有上億美元的福利款被人以假冒的身份領(lǐng)取 每年利用 丟失和被盜的信用卡進(jìn)行犯罪的金額也有上億的美元 由于使用盜竊來的身份識 別碼 造成移動電話通訊的損失高達(dá)十億美元 利用有效的方法進(jìn)行人物的身份 識別可大大減少損失的金額 據(jù)估計 利用可靠的方法鑒別自動提款機(jī)持卡人的 身份可以使每年由自動提款機(jī)詐騙造成的損失減少數(shù)十億美元 因此 將人臉識 別技術(shù)應(yīng)用于柜臺提款 自動提款機(jī) 遠(yuǎn)程交易身份確認(rèn) 各種社會福利受益人 的身份確認(rèn)將起到不可忽視的安全保障作用 1 2 人臉識別研究的發(fā)展 人臉識別技術(shù)開始于本世紀(jì)六十年代 但由于受技術(shù)條件的限制 發(fā)展緩慢 因而在最初的二三十年里關(guān)于這個課題只有少量的論文出現(xiàn) 5 1 八十年代開始 隨 著計算機(jī)技術(shù)以及圖像處理和模式識別技術(shù)的發(fā)展 人臉識別技術(shù)受到很大重視 并得到了進(jìn)一步的發(fā)展 第2 頁 1 2 1 人臉識別的研究歷程 人臉識別的研究已經(jīng)有很長的歷史 最初的人臉識別研究可以追溯到1 8 7 2 年 但從2 0 世紀(jì)中期開始才有了較系統(tǒng)的研究 人臉識別的輸入圖像通常有三種情況 正面 側(cè)面和傾斜 6 由于人臉正面圖像包含了人臉更明顯的特征 所以對人臉正 面模式的研究最多 它的發(fā)展可以分為三個階段 刀 第一階段是從二十世紀(jì)5 0 到6 0 年代 以b e r t i l l o n a 1 1 e i l 和p a r k e 為代表 主 要研究人臉識別所需要的面部特征 在b e r t i l l o n 系統(tǒng)中 提供了一個較強(qiáng)的識別 系統(tǒng) 他用一個簡單的語句與數(shù)據(jù)庫中某一張人臉相聯(lián)系 為了提高臉部識別率 a l l 脅為待識別臉設(shè)計了一種有效逼真的摹寫 p 破e 則用計算機(jī)實現(xiàn)了這一思想 并且產(chǎn)生了較高質(zhì)量的人臉灰度圖模型 總的來說 這一階段的工作都需要利用 人的某些先驗知識 擺脫不了人的干預(yù) 還不能完成自動人臉識別工作 第二階段是人機(jī)交互識別階段 時間是二十世紀(jì)7 0 年代 人臉識別研究剛剛 起步f 8 9 經(jīng)典的模式分類方法 即采用正面臉部圖像或者側(cè)面臉部圖像中那些可 以可計算的 比較精確的屬性來識別人臉 這一時期的代表性工作 g o l d s t i o m h a 加伽和l e s k 用幾何特征 g o l d s t i o n 等人用幾何特征參數(shù)來表示人臉 正面圖像 采用2 1 維特征矢量表示人臉面部特征 并設(shè)計了基于這一特征表示法 的識別系統(tǒng) 吼和k o b a y a s l l i 使用基于統(tǒng)計的識別方法 用歐氏距離表征人臉 t m a d c m n a g a 0 設(shè)計了一個高速而且有一定知識引導(dǎo)的半自動回溯識別系統(tǒng) i o 創(chuàng)造性地運(yùn)用積分投影法從單幅圖像上計算出一組人臉特征參數(shù) 再利用模 式分類技術(shù)與標(biāo)準(zhǔn)人臉匹配 k a n a d e 的系統(tǒng)實現(xiàn)了快速 實時的處理 是一個很 大的進(jìn)步 相比之下 b 啪n l l 所做的工作較少為人所知 他先將圖像灰度歸一化 再用掩模 眼 鼻 嘴及眉毛以下的整個臉部 表示人臉 然后分別計算4 個掩 模與數(shù)據(jù)庫中每幅標(biāo)準(zhǔn)圖像的相應(yīng)掩模之間的互相關(guān)系數(shù) 以此作為判別依據(jù) 總的來說 這類方法需要利用操作員的某些先驗知識 仍然擺脫不了人的干預(yù) 第三階段是真正的機(jī)器自動人臉識別階段 近幾十年來 隨著高速度高性能 計算機(jī)的出現(xiàn) 人臉識別方法有了重大突破 提出了多種機(jī)器全自動識別系統(tǒng) 進(jìn)入了真正的機(jī)器自動識別階段 人臉識別研究也吸引了更多科學(xué)家的注意 使 發(fā)展更具有魯棒性的人臉識別方法稱為時代的必然 于是基于整體的識別方法應(yīng) 運(yùn)而生 如特征臉方法 1 2 和彈性圖匹配方法 1 3 國外有很多大學(xué)在此方面取得了 很大進(jìn)展 他們研究涉及的領(lǐng)域很廣 其中有從感知和心理學(xué)角度探索人類識別 人臉的機(jī)理 如美國t e x 嬲a td a l l 船大學(xué)的a b d i 和t o o l e 小組 主要研究人類感知 人臉的規(guī)律 如漫畫效應(yīng) 性別識別與人臉識別的關(guān)系 種族效應(yīng)等 由s t i r l i n g 大學(xué)的b r u c e 教授和g l a s g o w 大學(xué)的b u n o n 教授合作領(lǐng)導(dǎo)的小組 主要是研究人 類大腦在人臉認(rèn)知中的作用 并在此基礎(chǔ)上建立了人臉認(rèn)知的兩個功能模型 他 第3 頁 一 旦隨抖堂掛苤太堂受宜生醫(yī)王堂亟土堂僮論塞 們對熟悉和陌生人臉的識別規(guī)律以及圖像序列的人臉識別規(guī)律也進(jìn)行了研究 也 有從視覺機(jī)理角度進(jìn)行研究的 如英國a b e f d e 饑大學(xué)的c r 刪小組 主要研究人 臉視覺表征方法 他們對空間頻率在人臉識別中的作用也進(jìn)行了分析 荷蘭 g m 血g c i l 大學(xué)的p e r k o v 小組 主要研究人類視覺系統(tǒng)的神經(jīng)生理學(xué)機(jī)理并在此基 礎(chǔ)上發(fā)展了并行模式識別方法 不僅如此 隨著計算機(jī)技術(shù)以及圖像處理和模式 識別技術(shù)的發(fā)展 人臉識別技術(shù)已應(yīng)用到商用領(lǐng)域 代表性的商用人臉識別軟件 有f a c e i t i s a g es y s t e m 1 m e f a c e 等 1 2 2 人臉識別的研究現(xiàn)狀 人臉識別的研究歷史是比較悠久的 g a l t o n 早在1 8 8 8 年和1 9 1 0 年就分別在 n a t u r e 雜志發(fā)表了兩篇關(guān)于利用人臉進(jìn)行身份識別的文章 對人類自身的人臉 識別能力進(jìn)行了分析 但當(dāng)時還不可能涉及到人臉的自動識別問題 最早的人臉 自動識別 a u t o m a t i cf a c er e c o 嘶t i o 瑪a f r 的研究論文見于1 9 6 5 年c h 觚 b l e d s o e 在p a n o 刪血cr e s e 盯c h1 1 1 c 發(fā)表的技術(shù)報告 1 4 l 到現(xiàn)在已有三十多年的歷 史 人臉識別試驗所采用的人臉庫通常不大 最常見的人臉庫一般包括1 0 0 幅左 右的人臉圖像 如m i t 庫 y 礬e 庫 c m u 庫 o r l 庫 近年來 人臉識別研究 得到了諸多研究人員的青睞 涌現(xiàn)出了諸多技術(shù)方法 尤其是1 9 9 0 年以來 人臉 識別更得到了長足的發(fā)展 每年都有大量的學(xué)術(shù)論文發(fā)表 我國人臉識別技術(shù)的研究起步較晚 但發(fā)展較快 國內(nèi)關(guān)于人臉識別的研究 始于二十世紀(jì)8 0 年代 主要是在國際流行的方法基礎(chǔ)上作了發(fā)展性工作 1 5 1 6 1 7 f 1 8 1 9 中國科技大學(xué)楊光正 2 0 等提出一種基于鑲嵌圖的人臉自動識別方法 采用基 于知識的三級金字塔結(jié)構(gòu)對人臉進(jìn)行分割和定位 前兩級建立在不同分辨率的鑲 嵌圖基礎(chǔ)上 用于對人臉進(jìn)行基本定位 第三級用一種改進(jìn)的邊緣檢測方法進(jìn)一 步檢測眼睛和嘴 基于這些器官的匹配就可進(jìn)行人臉識別 清華大學(xué)張長水 2 l 等對特征臉的方法做了進(jìn)一步發(fā)展 提出來用類間散度矩 陣作為產(chǎn)生矩陣 進(jìn)一步降低了產(chǎn)生矩陣的維數(shù) 在保持識別率的情況下大大降 低了運(yùn)算量 南京理工大學(xué)楊靜宇 2 2 2 3 等主要是采用奇異值分解方法進(jìn)行人臉識別研究 如用d a u b e c l l i e s 正交小波變換對人臉圖像作預(yù)處理 得到它在不同頻帶上的4 個 子圖像 對它們分別提取奇異值 然后用最近鄰方法進(jìn)行分類 同時設(shè)計一種適 用于多分類結(jié)果融合的群體決策算法 并且對分類結(jié)果有選擇的進(jìn)行融合 他們 還研究了基于f i s h e r 最佳鑒別矢量的人臉識別方法 并對神經(jīng)網(wǎng)絡(luò)用于人臉識別 也進(jìn)行了研究 與此同時 中科院自動化所 公安部等單位也進(jìn)行了人臉識別方面的研究 第4 貞 國隨抖堂拉丕太堂班葒生院王堂鱈 堂焦i 金塞 并取得了一定的成果 人臉識別的大多數(shù)算法及理論主要集中解決兩個方面的問題 一是如何提取 特征以表示人臉 二是對未知人臉用已有的特征表示出來并進(jìn)行識別分類 事實 上 特征提取是許多方法及理論中研究的重中之重 因為對于某一特定的分類方 法而言 特征提取幾乎決定了最終的識別效果 總的來說 這些方法與理論的目 的就是找出一種在較低維空間中具有較大判別能力的人臉特征表示技術(shù) 從目前 來看 人臉識別技術(shù)中最為成功的都是將人臉直接看成一個二維 2 d 的整體圖 案來處理 從而避免了對于三維 3 d 模型中的其它物體邊界的檢測 2 4 1 3 人臉識別的主要方法 計算機(jī)人臉識別方法的研究主要有兩大方向 一是基于人臉圖像局部特征的 識別方法 二是基于人臉圖像整體特征的識別方法 基于人臉圖像局部特征的識別通常抽取人臉器官如眼睛 眉毛 鼻子和嘴等 器官的位置 尺度以及彼此間的比率作為特征 進(jìn)一步地可以用幾何形狀擬合人 臉器官 從而以幾何參數(shù)作為描述人臉的特征 由于此類方法通常要精確地抽取 出人臉器官位置 尺度 比率或幾何參數(shù)作為描述人臉的特征 因此這類方法對 人臉圖像的表情變化比較敏感 同時 人臉器官分割的精確度也對人臉特征的提 取有一定的影響 另外 該類方法并沒有充分利用到人臉圖像本身具有的灰度信 息 這類方法已經(jīng)不是人臉識別技術(shù)發(fā)展的主流方向 基于人臉圖像整體特征的人臉識別方法由于不需要提取人臉圖像中器官的具 體信息 而且充分利用到人臉圖像本身具有的灰度信息 因此可獲得更高的識別 性能 基于人臉圖像整體特征的人臉識別方法主要有特征臉法 最佳鑒別矢量集 法 貝葉斯法 基于傅里葉變換特征法 彈性圖匹配法 線性子空間法 可變形 模型法和基于人工神經(jīng)網(wǎng)絡(luò)的方法等等 其中彈性圖匹配法和傅里葉不變特征法 側(cè)重于表述人臉圖像 最佳鑒別矢量集法 貝葉斯法 基于人工神經(jīng)網(wǎng)絡(luò)的方法 側(cè)重于分類 特征臉法和線性子空間法等側(cè)重于人臉圖像的重構(gòu) 下面分別介紹 幾種主流的人臉識別方法 1 3 1 基于幾何特征的人臉識別方法 人臉由眼睛 鼻子 嘴巴 下巴等部位構(gòu)成 正因為這些人臉面部具有代表 性的部位形狀 大小和結(jié)構(gòu)上的各種差異才使得世界上每張人臉千差萬別 因此 對這些部件的形狀和結(jié)構(gòu)關(guān)系的集合描述 可以作為人臉識別的重要特征 這種識別方法首先將人臉用一個幾何特征矢量表示 用模式識別中的層次聚 類思想設(shè)計分類器來對人臉進(jìn)行識別 它要求該矢量具有一定獨(dú)特性 可以反映 第5 頁 國隨抖堂技丕厶堂班窒生瞳王堂亟塵堂僮途塞 不同人面部特征的差別 由于該方法對臉部朝向的改變非常敏感 要求有一定的 彈性 以消除時間跨度和光照的影響 識別工作的流程大體如下 首先檢測出面 部特征點 通過測量這些關(guān)鍵點之間的相對距離 得到描述每張臉的特征矢量 比如眼睛 鼻子和嘴的位置和寬度 眉毛的厚度和彎曲程度等 以及這些特征之 間的關(guān)系 用這些特征來表示人臉 比較未知臉和圖像庫中已知人臉的這些特征 矢量 從而決定最佳匹配 常用的方法有灰度的水平或垂直投影 基于邊緣的特征提取等 由于對人臉 器官的關(guān)鍵點進(jìn)行水平或垂直投影后對應(yīng)波峰或波谷 因此可以用來定位臉部主 要器官 這種方法比較簡單 但精度較差 邊緣檢測是圖像處理中的一個經(jīng)典的 方法 它是利用圖像的灰度變化來反映圖像的特征 分別檢測每個像素的鄰域并 對灰度變化率進(jìn)行量化 通常也包括方向的確定 根據(jù)檢測的領(lǐng)域和權(quán)值系數(shù)的 不同 可將邊緣算子分為 梯度邊緣算子 l a p l a c c 邊緣算子 r o b e n s 邊緣算子 s o b e l 邊緣算子 c 趾n y 邊緣算子等 基于邊緣的特征提取往往不是把提取出的邊 緣作為最終結(jié)果 而是在這個基礎(chǔ)上進(jìn)一步處理 如利用一些先驗知識和規(guī)律進(jìn) 行邊緣的連接 擬合等 邊緣的連接一般要考慮物體的實際形狀以及當(dāng)前點的鄰 域情況 而曲線的擬合則可能需要用分段線性和高階樣條曲線來擬合這些點 通 常采用拋物線 橢圓等來擬合物體 h o u g l l 變換對直線和圓進(jìn)行擬合時能達(dá)到較 好的效果 在人臉識別中通常用它來對眼球進(jìn)行檢測 進(jìn)而完成對眼睛的定位 總體來說 人臉的幾何特征屬于直觀性特征 簡單卻容易受到人臉表情 光 照條件 噪音的因素的影響 如人臉表情變化會直接影響提取的人臉五官的輪廓 形態(tài)和位置的很大變化 因此雖然基于幾何特征的方法內(nèi)存要求少 識別速度要 比基于模板的方法高 但穩(wěn)定性不高 較難實現(xiàn)特征的準(zhǔn)確提取 1 3 2 基于模板匹配的人臉識別方法 基于模板匹配 2 5 的方法是模式識別中最簡單的一種模式分類方法 主要代表 是h a r v a r d 大學(xué)s m i t h k e t t l e w d l 眼睛研究中心的y u i l l e c o l l i l 和h a l l i n e l l 他們利 用可變形模版提取面部特征 這些模板可以平移 旋轉(zhuǎn)和變形以便能夠最佳地表 示它們在圖像中的形狀 他們對圖像進(jìn)行了預(yù)處理 定義了各種能量函數(shù) 并在 實驗中發(fā)現(xiàn) 模板的起始位置對于確定眼睛的準(zhǔn)確位置至關(guān)重要 當(dāng)模板從眉毛 上開始時 算法不能夠區(qū)分眼睛和眉毛 算法的另一個缺點是計算復(fù)雜 人臉識別和其它的3 d 目標(biāo)識別一樣 當(dāng)投影不同或形狀發(fā)生改變時 如何 保持視覺的拓?fù)浣Y(jié)構(gòu)是非常重要的一點 這一問題的一個有效的解決途徑是動態(tài) 連接結(jié)構(gòu)法或d l a d y i l 鋤i cl i n ka r c h i t e c t u r e 2 6 在通常的執(zhí)行中 d l a 可以視 為一個網(wǎng)格 它的節(jié)點包含對局部空間頻率的一種多分辨率描述 每一個節(jié)點包 含多個基于改進(jìn)的g a b o r 小波變換特征檢測器 這些特征檢測器用高的精度描述 第6 炙 局部灰度分布 用較低的精度描述更全局的灰度分布 網(wǎng)格的節(jié)點同彈性連接相 連 這些連接將特征分組成更高級別的排列 這些排列對可視目標(biāo)編碼 彈性使 得適應(yīng)目標(biāo)視角投影的扭曲和變化成為可能 一個新的人臉可以通過手工 用網(wǎng) 格覆蓋在臉上來注冊 一個人可以存儲多幅圖片以適應(yīng)不同的面部表情 識別時 將測試圖像變換成矢量網(wǎng)格 也稱為圖像域 識別過程就是將圖像域和存儲的所 有原型圖進(jìn)行匹配 目標(biāo)是最小化單個節(jié)點對之間的價格函數(shù) 如果一個人的原 型圖的匹配程度遠(yuǎn)大于其它圖的匹配程度 就認(rèn)為已被識別 圖的匹配分為兩個 階段 開始 用不變形的網(wǎng)格來定位圖像中的人臉 網(wǎng)格一旦覆蓋人臉 其結(jié)構(gòu) 按照每個節(jié)點在它的鄰域內(nèi)使價格函數(shù)達(dá)到極小值的方式變形 最終的匹配價格 是網(wǎng)格每個節(jié)點的匹配價格和網(wǎng)格變形量價格的加權(quán)合成 1 3 3 基于特征臉的人臉識別方法 特征臉方法是從主成分分析 p 血c i p a lc o m p o n e n t 加試y s i s 導(dǎo)出的一種人臉識 別和描述技術(shù) p c a 實質(zhì)上是k l 展開的遞推實現(xiàn) k l 變換是數(shù)字圖像壓縮中 的一種最優(yōu)正交變換 2 7 它以樣本的最優(yōu)重建為目的 通過k l 變換 可以把圖 像在高維空間表示轉(zhuǎn)換到低維空間表示 而由低維空間恢復(fù)的圖像和原圖像具有 最小的均方誤差 從而可以以圖像在低維空間的變換系數(shù)作為人臉圖像的描述特 征 k l 變換用于人臉識別的前提是人臉圖像處于低維空間 并且不同人臉是線性 可分的 通常情況下 k l 變換的變換矩陣由訓(xùn)練樣本類間散度矩陣的特征矢量生 成 由類間散度矩陣得到的特征矢量類似于人臉 故將其成為特征臉 將變換矩 陣的特征矢量按特征值的大小進(jìn)行排列 人臉圖像排在前面的特征矢量上的投影 具有較大的能量 稱為主分量 在排在后面的特征矢量上的投影具有較小的能量 稱為次分量 當(dāng)舍棄部分次分量時 稱為主成分分析法 p c a k l 變換從壓縮角度看是最優(yōu)的 但從分類角度來看卻不是最優(yōu)的 雖然它考 慮了人臉圖像的所有差異 從壓縮角度 但沒有考慮這些差異是類內(nèi)差異 如光 照變化 表情變化或幾何變化 還是類間差異 從分類角度 s 衲v i c h 和配r b y 2 8 首先采用主成分分析法 p c a 將k l 變換用于人臉圖像 的最優(yōu)表征 t u r k 和p e m l 觚d 2 9 具體將k l 變換應(yīng)用于人臉識別 提出了經(jīng)典的 特征臉 e i g e n f a c e s 方法 該方法的主要思想是 對于一幅由n 個象素組成 的圖像 可以看作是一個n 維矢量 或是一個n 維空間中的一點 e i g e n f a c e s 方 法假設(shè)人臉圖像只占據(jù)這個高維圖像空間的一個很小的子區(qū)域 因此可以利用 p c a 原理來得到一個人臉圖像的優(yōu)化坐標(biāo)系統(tǒng) 即是對這個人臉子區(qū)域的坐標(biāo)進(jìn) 行降維 使得每個人臉圖像可以用很少幾個參數(shù)來表示 這就大大地降低了人臉 識別的計算復(fù)雜度 第7 頁 傳統(tǒng)的特征臉存在的種種不足之處 促使研究人員在特征臉方法基礎(chǔ)上發(fā)展 了許多改進(jìn)方案 如將特征臉與線性判別函數(shù) 3 0 相結(jié)合的方法 特征半臉方法 3 1 等 1 3 4 基于神經(jīng)網(wǎng)絡(luò)的人臉識別方法 基于人工神經(jīng)網(wǎng)絡(luò) 3 2 j 3 3 的方法應(yīng)用比較廣泛 目前常用的人工神經(jīng)網(wǎng)絡(luò)方法 是b p 神經(jīng)網(wǎng)絡(luò) 3 4 1 自組織神經(jīng)網(wǎng)絡(luò) s o m 徑向基函數(shù)神經(jīng)網(wǎng)絡(luò) 3 5 1 人工神經(jīng) 網(wǎng)絡(luò) 圳f i c i a ln e u r a ln e 觚o r k a 1 州 是由大量簡單的處理單元 神經(jīng)元 相互 連接而構(gòu)成的網(wǎng)絡(luò)系統(tǒng) 人工神經(jīng)網(wǎng)絡(luò)目前正越來越被頻繁地應(yīng)用于人臉識別 人工神經(jīng)網(wǎng)絡(luò)方法的自學(xué)習(xí)功能非常強(qiáng)大 由于對人臉識別的許多規(guī)律和規(guī)則進(jìn) 行顯式描述是非常困難的 神經(jīng)網(wǎng)絡(luò)則可以通過反復(fù)學(xué)習(xí)的過程獲得對這些規(guī)律 或規(guī)則的隱式表達(dá) 因此在提取特征后進(jìn)行分類識別時具有其得天獨(dú)厚的優(yōu)勢 利用神經(jīng)網(wǎng)絡(luò)進(jìn)行人臉識別時 網(wǎng)絡(luò)輸入層的每一個節(jié)點對應(yīng)樣本的一個特征 而輸出層的節(jié)點對人臉的類別進(jìn)行編碼 可以直接將人臉圖像的灰度值輸入到神 經(jīng)網(wǎng)絡(luò)的輸入層 但這樣由于輸入層節(jié)點數(shù)目遠(yuǎn)大于輸出層節(jié)點數(shù)目 訓(xùn)練時網(wǎng) 絡(luò)的收斂速度慢 通常情況下 先對圖像進(jìn)行特征降維 再利用神經(jīng)網(wǎng)絡(luò)進(jìn)行分 類識別 f l e i l l i n g 和c o t t r e l l 3 6 提出了一種采用兩個網(wǎng)絡(luò)識別人臉的方法 第一個 網(wǎng)絡(luò)為特征提取網(wǎng)絡(luò) 用于人臉圖像的特征降維 這個網(wǎng)絡(luò)采用自聯(lián)想神經(jīng)網(wǎng)絡(luò) 網(wǎng)絡(luò)的輸出層和輸入層有相同的節(jié)點數(shù) 訓(xùn)練時網(wǎng)絡(luò)的輸出和輸入均為原始圖像 其隱層節(jié)點的輸出作為圖像的降維特征 隱層節(jié)點數(shù)決定特征的維數(shù) 第二個網(wǎng) 絡(luò)為分類識別網(wǎng)絡(luò) 將降維后的特征輸入到分類識別網(wǎng)絡(luò) 其輸出決定人臉圖像 的類別 s h a i l g h 蚰gl i 等人 3 7 提出基于概率決策神經(jīng)網(wǎng)絡(luò) p r o b a b i l i s t i cd e c i s i o n b 弱e d 的人臉識別算法 將基于概率決策的神經(jīng)網(wǎng)絡(luò)分別應(yīng)用于人臉定位 特征 提取和人臉識別 通過f e 砌玎和o i 也人臉庫的測試 算法具有良好的識別效果 鼬c a n e k k 3 8 將基于h o f i e l d 網(wǎng)絡(luò)的最優(yōu)能量方程應(yīng)用于模式識別與人臉識別 算法 具有較高的識別效率和良好的魯棒性 c m u 的r o w l e y 等 3 9 使用了多個a n n 檢測 多姿態(tài)的人臉 1 個位姿檢測器用于估計輸入窗口中人臉的位姿 3 個檢測器分別 檢測j 下面 半側(cè)面和側(cè)面的人臉 使用經(jīng)過對準(zhǔn)和預(yù)處理的 人臉 樣本以及采 用 自舉 b o o t s t r a p 方法收集分類器錯分的樣本作為 非人臉 樣本訓(xùn)練各個 a 1 州 進(jìn)一步修正分類器 基于神經(jīng)網(wǎng)絡(luò)的方法便于建模 魯棒性好 但是計算 量大 運(yùn)算時間較長 并可能陷入局部最優(yōu) 難于實現(xiàn)實時應(yīng)用 1 3 5 基于彈性圖匹配的人臉識別方法 基于彈性匹配的人臉識別方法 其基本思想體現(xiàn)在所謂動態(tài)連接結(jié)構(gòu) 第8 頁 國隨疊堂拄苤太堂硒究生院王堂亟 堂焦j 金室 d y i l 鋤i cl i i l l 心c 1 1 i t e c t i 鵬 d l a 2 6 上 可以認(rèn)為 彈性圖匹配是一種考慮到識 別目標(biāo)局部特征點之間拓?fù)浣Y(jié)構(gòu)的 具有適應(yīng)性的局部特征匹配方法 彈性匹配 的理論基礎(chǔ)是圖匹配 彈性圖匹配用圖來描述人臉 圖的頂點表示面部特殊的局 部特征點 邊則表示面部特征之間的拓?fù)溥B接關(guān)系 不僅可以利用整幅人臉圖像 的識別信息 而且還允許局部特征在一定程度上的變形 在很大程度上克服了人 臉姿態(tài)變化 表情變化和發(fā)型變化對人臉識別的影響 基于彈性圖匹配的人臉識別方法采用屬性拓?fù)鋱D來表述人臉模式 通常情況 下 屬性拓?fù)鋱D為二維稀疏網(wǎng)格 屬性拓?fù)鋱D上的每一個頂點均包含一特征矢量 它記錄了人臉在該頂點位置的分布信息 可以采用各種描述局部信息的特征 如 小波特征 形態(tài)特征和統(tǒng)計特征等 從二維稀疏網(wǎng)格到實際人臉圖像的映射數(shù)目相當(dāng)龐大 因此應(yīng)用彈性匹配進(jìn) 行人臉識別的時間也是非常長的 應(yīng)用不同尺度和方向的小波可以提取屬性拓?fù)?圖頂點處的人臉特征 較小尺度的小波用來描述局部細(xì)節(jié) 較大尺度的小波用來 描述較大范圍內(nèi)的概貌 不同方向的小波對方向信息敏感 在彈性匹配中 應(yīng)用 小波變換抽取特征對于細(xì)微表情變化具有一定的不變性 同時保留了空間位置信 息 在一定程度上容忍人臉從三維到二維投影引起的變化 本文以上介紹的是入臉識別中幾類最重要的算法 是當(dāng)前人臉識別算法發(fā)展 的主流方向 然而人臉識別問題是非常復(fù)雜的 單單憑借一種方法都難以達(dá)到理 想的識別效果 因此 在實際的應(yīng)用中 往往是把多個算法相結(jié)合 以發(fā)揮最大 的功效 提高識別效率 1 4 人臉識別研究的難點 人臉識別是指將采集到的人臉圖像的特征信息 與已知的人臉特征信息進(jìn)行 比較 從而判斷待識別人臉是否為一個已知人臉的過程 人臉是具有復(fù)雜結(jié)構(gòu)的 三維非剛性生物體 人臉圖像的模式受到多種因素的影響 人臉識別是一項極具 挑戰(zhàn)性的任務(wù) 影響識別效果的相關(guān)因素主要表現(xiàn)為以下幾個方面 1 姿態(tài) 從三維人臉到二維人臉圖像的投影成像過程中 當(dāng)頭部姿態(tài)發(fā)生變 化時 產(chǎn)生了人臉圖像的外觀變化 2 光照 當(dāng)光照的角度 強(qiáng)度和顏色發(fā)生變化時 人臉圖像的模式也會隨之 變化 同一個人在不同的光照條件下采集到的圖像差別甚至大于不同的被測對象 的圖像之間的差別 3 表情 人的心理和面部表情會直接影響人的外觀 4 遮擋 人臉在某些情況下會被遮擋 而使臉部特征缺損或丟失 會給識 別帶來嚴(yán)重的后果 例如眼鏡 胡須 和其他一些飾物等都會直接影響到人臉的 第9 頁 成像效果 另外 圖像的采集環(huán)境 圖像的分辨率 采集設(shè)備都影響著人臉圖像模式 這些變化通常都具有非常大的不確定性 因此增加了人臉識別的難度 1 5 本文的主要工作 本文在參考了大量的人臉識別中外文獻(xiàn)的基礎(chǔ)上 介紹了當(dāng)前國際上幾種主 流的人臉識別算法 并進(jìn)一步研究了基于統(tǒng)計的人臉識別方法 對目前較為盛行 的幾種算法作了詳盡的論述 然而 值得注意的是 在人臉自動識別系統(tǒng)研究中 這些方法在對信號圖像高頻部分進(jìn)行處理時效果并不理想 小波變換被譽(yù)為 數(shù) 學(xué)顯微鏡 它是信號分析發(fā)展史上的里程碑式的進(jìn)展 小波變換在信號分析 圖 像識別等方面具有重要的應(yīng)用價值 小波變換雖然具有頻率越高相應(yīng)的時間 或 空間 分辨率越高的優(yōu)點 但其在頻率域上的分辨率卻相應(yīng)降低 小波包在一定 程度上彌補(bǔ)小波的這一缺陷 1 5 1 本文的基本方法 本文借鑒了主成分分析 p c a 和線性判別分析 l d a 的算法思想 對傳 統(tǒng)的基于小波包的l d b l 0 c a ld i s 謝m i n a n tb 捌s 方法進(jìn)行改進(jìn) 提出了一種改 進(jìn)的基于特定小波包分解系數(shù)矩特性的人臉識別方法 l d bd so m 綜合p c a l d a 和l d b 三種方法 從三個方面作了改進(jìn) 1 以差可分度 d i 虢f e i l c es 印a l r a b i l i t y d s 代替l d b 算法中的平均類間類 內(nèi)距離 用來選擇小波包分解系數(shù)和最優(yōu)基 2 以選定子帶內(nèi)選定系數(shù)的一 二階原點矩 o r i 西nm o m e l l t s o m 作為人 臉特征 3 以b h a n a c h a n m 距離分量作為子帶分類特征向量距離度量 以各子帶差可 分度為權(quán)重對子帶分類特征向量距離線性加權(quán) 以加權(quán)子帶分類特征向量距離分 類法取代l d b 常用的最近鄰分類識別法 為了檢驗本文提出的改進(jìn)算法的效果 我們分別選取了來自0 1 i v 甜e 研究實驗 室的o r l 人臉數(shù)據(jù)庫 彩色的j 下面人物圖像c p o e p 和從新聞視頻中截選的人物 圖像p o n 其中o r l 人臉圖像庫包括從1 9 9 2 年4 月到1 9 9 4 年4 月拍攝的一系列 人臉圖像 由4 0 個人的4 0 0 幅灰度圖像組成 每人1 0 幅圖像 圖像尺寸為9 2 1 1 2 圖像背景為黑色 其中人臉面部表情和細(xì)節(jié)均有變化 例如笑與不笑 睜眼或閉 眼 戴或不戴眼鏡等 人臉姿態(tài)也有變化 其深度旋轉(zhuǎn)和平面旋轉(zhuǎn)可達(dá)2 0 度 人 臉的尺寸也有最多l(xiāng) o 的變化 這是目前使用最廣泛的人臉數(shù)據(jù)庫 另外兩類圖 像需要進(jìn)行人臉探測后再進(jìn)行人臉識別 實驗結(jié)果表明 本文所提出的算法具有 第1 0 頁 國隨疆堂拄苤盔堂班究生瞳 i 堂亟 堂僮論塞 很好的識別效果 與原始的l d b 算法相比 訓(xùn)練時間和識別時間均減少了兩個數(shù) 量級 1 5 2 本文結(jié)構(gòu) 全文共分六章 第一章研究的背景 介紹了人臉識別的研究歷史 以及目前的研究水平和取 得的成果 并對幾種重要的人臉識別方法進(jìn)行了詳細(xì)介紹 第二章介紹了小波與小波包的理論基礎(chǔ)和一些相關(guān)的基本概念以及性質(zhì) 本 文主要是基于小波包進(jìn)行的特征提取的研究 對特征提取的研究內(nèi)容涉及到很多 小波和小波包的基礎(chǔ)知識 因此在本章對小波和小波包的內(nèi)容作了詳盡的闡述 第三章本文提出的方法借鑒了主成分分析法 p c a 和線性判別分析方法 u a 這兩種方法是當(dāng)前比較流行的算法 本章從這兩種方法的基本原理入手 具體的介紹了它們在人臉識別中的應(yīng)用和基本原理 第四章在本章中首先對原始的人臉識別l d b 方法作了論述 然后提出了一 種新的特征提取的方法 對基于小波包特征提取的改進(jìn)方法 同時也從對可分度 定義和分類距離兩個方面作了改進(jìn) 第五章實驗分析與應(yīng)用研究 對人臉識別的各種方法作了大量的實驗研究 對各種方法的實驗結(jié)果進(jìn)行對比 實驗結(jié)果顯示 本文提出的算法具有更好的識 別效果 與原始l d b 方法相比 訓(xùn)練和識別的時間也都大大的縮短了 介紹了人 臉識別算法的實現(xiàn)和人臉探測與識別軟件模塊的構(gòu)建方法 闡述了本文在數(shù)字媒 體信息處理系統(tǒng)研究中的作用 第六章總結(jié)全文 指出本文在理論與實踐上的貢獻(xiàn) 并討論研究還有待改進(jìn) 的地方和指出未來研究的方向 第l l 頁 第二章小波與小波包分析的基本理論 在工程和數(shù)學(xué)上 f o u r i e r 級數(shù)可以將一個信號表示成正弦函數(shù)和余弦函數(shù)的 疊加 它的物理意義是 每個周期信號都是具有簡單頻率的簡諧振動的疊加 f o 塒e r 分析的誕生 給工程界帶來了一次深刻的革命 同時它是一個強(qiáng)有力的數(shù) 學(xué)工具 用它來刻畫函數(shù)空間 求解微分方程 進(jìn)行數(shù)值計算及信號處理等等 2 0 0 年來 f o 嘶c r 分析具有十分旺盛的生命力 不過 雖然f o 謝e r 分析在信號分析中長期占據(jù)突出位置 但它也具有不可忽 視的缺點 這是因為正弦函數(shù)和余弦函數(shù)是永不衰減地分布在整個時間域上的 因而f o 嘶e r 系數(shù)是信號在整個時間域上的加數(shù)平均 所以 要反映信號的局部性 是不可能的 小波分析是傳統(tǒng)f o u r i e r 分析發(fā)展史上的一個里程碑 近年來成為眾多學(xué)科共 同關(guān)注的熱點 一方面 小波分析被看成是調(diào)和分析這一數(shù)學(xué)領(lǐng)域半個世紀(jì)以來 工作的結(jié)晶 另一方面 它已經(jīng)廣泛應(yīng)用于圖像紋理分析 圖像編碼 布朗分形 維數(shù)計算 語音識別等科技領(lǐng)域 在許多使用傳統(tǒng)f o 謝e r 分析的地方都可以用小 波分析取代 小波分析優(yōu)于f o 嘶e r 分析的地方是 小波分析突破了傅氏分析在應(yīng) 用中的平穩(wěn)性假設(shè) 周期延拓等限制 具有時頻定位的能力 并在算法實施過程 中實現(xiàn)了多分辨率分析的功能 它在時域和頻域同時具有良好局部化性質(zhì) 而且 由于對高頻成分采用逐漸精細(xì)的時域或空間域取樣步長 從而可以聚焦到對象的 任意細(xì)節(jié) 小波分析的這一特點被譽(yù)為數(shù)學(xué)顯微鏡 這使得小波分析迅速成為數(shù) 字信號處理的強(qiáng)大工具 在圖像處理 語音識別等領(lǐng)域取得令人矚目的成績 成 為國際研究的一個熱點 小波變換有連續(xù)和離散兩種情形 由于小波變換在信號處理中一般是在計算 機(jī)上實現(xiàn) 為了使得敘述更直觀易懂 本文將從多分辨率分析的角度簡要講述離 散小波變換 并給出離散小波變換的分解與重構(gòu)算法 m a l l a t 快速算法 以及小波 包變換的分解與重構(gòu)算法 2 1 小波變換概述 小波分析方法的提出 可以追溯到1 9 1 0 年h 匏r 提出的小波規(guī)則正交基及1 9 3 8 年l i t t l e w o o d p a l e y 對傅立葉級數(shù)建立的l p 理論 即按二進(jìn)制頻率成分分組傅立 葉變換的相位變化在本質(zhì)上不影響函數(shù)的形狀和大小 其后 c a l d e m 于1 9 7 5 年用 其早期發(fā)現(xiàn)的再生公式給出拋物線空間h 上的原子分解 這個公式后來成了許多 函數(shù)分解的出發(fā)點 他的離散形式已接近小波展開 只是還無法得到組成一正交 系的結(jié)論 1 9 8 1 年s 仃0 n l b e r g 對h 掰系進(jìn)行了改造 證明了小波函數(shù)的存在性 值得注意的是 1 9 8 4 年法國地球物理學(xué)家m o r l e t 在分析地震的局部性質(zhì)時 發(fā)現(xiàn) 傳統(tǒng)的變換難以達(dá)到要求 因此 他引入小波概念于信號分析中 對信號進(jìn)行分 解 隨后 理論物理學(xué)家 s s m 鋤嘗試對一個確定函數(shù)甲 工 進(jìn)行了伸縮 平移 r t 成為 h 一 y f 蘭竺l 口 6 尺 口 o 形式 他對m o r l c t 的這種信號依此方法進(jìn)行展 l 口 j 開的可行性進(jìn)行了研究 這無疑為小波分析的形成開創(chuàng)了先河 小波變換實質(zhì)上是對信號用一種多分辨率的帶通濾波器進(jìn)行濾波 將信號分 解到不同的頻帶上再進(jìn)行分析處理 小波變換的優(yōu)點在于良好的時間和頻率特性 應(yīng)用范圍很廣 用小波來分解圖像的原因是 1 用小波變換將圖像分解之后 子帶圖像的分辨率降低了 相應(yīng)的計算復(fù)雜 度也大大降低了 2 小波分解提供了很好的空間和頻率局部信息 并能逐步聚焦到分析對象的 任何細(xì)節(jié) 3 人臉圖像信息中低頻部分保留了圖像中的主要信息 即圖像的整體 而圖 像的高頻部分則保存著圖像的細(xì)節(jié)信息 人臉的光照 遮掩 旋轉(zhuǎn)扭曲和面部表 情等因素只影響圖像中的高頻部分 4 小波的分解和重構(gòu)都具有快速算法 2 2f o u r i e r 分析 f 硎c r 分析這門學(xué)科是數(shù)學(xué)分析中最古老的的學(xué)科之一 它對數(shù)學(xué)家和工程 師都是相當(dāng)重要的 f o u r i e r 分析通常是指 積分 f o u r i c r 變換和f o 謝c r 級數(shù) f o 謝e r 變換是在實直線r 上定義的某個函數(shù)廠的f o 證e r 積分 當(dāng)廠看作是一個模擬信號 時 它的定義域r 就稱為連續(xù)時域 在此情況下 廠的f o 嘶e r 變換廠描述信號 廠 的譜特性 因為譜信息用頻率給出 所以f o 耐e r 變換 的定義域還是r 它稱為 頻域 另一個方面 一個f o u r i c r 級數(shù)是雙無限序列到周期函數(shù)的一種變換 因此 當(dāng)一個雙無限序列看作是一個數(shù)字信號時 它的定義域是整數(shù)集合z 稱為離散 時域 這時 它的f o u d e r 級數(shù)再次描述數(shù)字信號的譜特性 一個f o u r i e r 級數(shù)的周 期是2 萬 在此情況下 頻域瓞常用單位圓等同 f o u r i e r 變換與f o u r i e r 級數(shù)的重要性不僅由它們的物理解釋的重要性 如信號 的時間 頻率分析 而且還由于f o 謝e r 分析技術(shù)是極其有力的 例如 在小波分析 研究中 p o i s s o n 求和公式 級數(shù)與積分的p a r s e v a l 恒等式 g a u s s i a j l 的f o u r i e r 變 換等等都是經(jīng)常遇到的 f o 謝e r 分析理論提出了一種將能量有限的信號分解成一列 f 弦波或余弦波的 第1 3 頁 巨隨抖堂拉盔太堂班宜生瞳王堂亟 堂僮論塞 信號之疊加的f o u 矗e r 變換 簡記為f t 方法 其中能量有限是指i f 2 以 佃 至1 9 6 5 年 c o o l e y 和t u l e y 提出了一種f o u r i e r 變換的快速算法 簡記為f f t 使得f o 嘶e r 分析在工程技術(shù)領(lǐng)域得到廣泛的應(yīng)用 一個能量有限的信號 可視為實數(shù)集r 上平方可積函數(shù)空間r r 中的一個函 數(shù)廠 f 對信號廠 f r r 其f o 謝e r 變換定義為 f 國 皇廠 緲 i 廠 f p 1 州出 2 1 而f o 嘶e r 逆變換定義為 1 廠 f 亡i 緲 p 御如 2 2 z 7 r 經(jīng)典的傅氏變換在信號的分析與處理中發(fā)揮了重要的作用 然而 用 2 1 與 2 2 式對信號實施分解與重構(gòu) 有如下不足之處 1 為了從廠 f 中提取頻譜信息 仞 要用到廠 f 的無限時區(qū)的信息 2 2 1 式?jīng)]有反應(yīng)出隨時間變化的頻率 也就是說f o 嘶e r 變換不能較好的 刻畫信號在時域上的任何局部信息 3 沒有靈活可變的時間一頻率窗 使在 中心頻率 增大時自動變窄 而 在 中心頻率 降低時自動變寬 即f o 嘶e r 分析無法作局部分析 因此 傅氏變換對于大多數(shù)應(yīng)用來說是不夠的 在實際應(yīng)用中 人們需要確定時間間隔 使在任何希望的頻率范圍 或頻帶 上產(chǎn)生頻譜信息 由于信號的頻率與它的周期正反比 因此 對于高頻譜的信息 時間間隔變小 從而給出較好的精度 對于低頻譜的信息 時間間隔變大 從而 給出完全的信息 也就是 需要一個可變的時間 頻率窗 使得在高中心頻率的時 間窗自動變窄 而在低中心頻率的時間窗自動變寬 小波變換具有這種移近和遠(yuǎn) 離的伸縮能力 矧 2 3 多分辨率分析 小波分析能夠提供r r 中具有良好局部化性質(zhì)的正交基 把r r 中的函數(shù) 與r z 中的數(shù)列等同起來 從而把分析問題轉(zhuǎn)化為代數(shù)問題來解決 多分辨率分 析的思想就是 先在能量有限函數(shù)空間r 豫 的某個子空間中先建立基底 然后利 用簡單的伸縮與平移變換 把子空間的基底擴(kuò)充到r r 中 定義l 4 2 設(shè) 一 z z 為整數(shù)集 為r r 中的閉子空間列 如果滿足 1 c t ic c 巧c 第1 4 頁 2 u 亭 r n o j 盛 j 芭 3 廠 x 巧營廠 2 功 巧 i z 4 功 巧營廠 工 1 巧 刀 z 5 存在緲 力 使得 緲 工一后 七 z 是 的一個硒e s z 基 則稱 匕 歹 z 是三2 r 的一個多分辨率分析 緲被稱為尺度函數(shù) 定義l 中的 緲 z 一后 后 z 稱為 的r i e s z 基是指 刪 l 緲?biāo)埔缓?k z 其中聊力劬o 一尼 陋 z 表示由 縱z 一后 陋 z 所張成的閉線性空間的閉包 且存在正常數(shù)a 與b o 彳 曰 l 擊卿 1 功石硇 2 6 設(shè) k 為r 酞 的一個多分辨率分析 緲o 是其尺度函數(shù) 且使得劬o 一力 是 的規(guī)范正交基 玩 2 使得雙尺度方程 2 4 成立 令 邑 一1 4 石一 2 7 少 2 1 x 2 i g 伊 z 一以 2 8 記虬 力 2 25 f 2 工一刀 七 刀 z 則圪在圪 i 中的正交補(bǔ) a 缸o(hù) r l 印冊帆 功 2 糾2 i f 2 z 一 1 刀 z 且帆 石 以 z 是 的規(guī)范正交基 其中a

溫馨提示

  • 1. 本站所有資源如無特殊說明,都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請下載最新的WinRAR軟件解壓。
  • 2. 本站的文檔不包含任何第三方提供的附件圖紙等,如果需要附件,請聯(lián)系上傳者。文件的所有權(quán)益歸上傳用戶所有。
  • 3. 本站RAR壓縮包中若帶圖紙,網(wǎng)頁內(nèi)容里面會有圖紙預(yù)覽,若沒有圖紙預(yù)覽就沒有圖紙。
  • 4. 未經(jīng)權(quán)益所有人同意不得將文件中的內(nèi)容挪作商業(yè)或盈利用途。
  • 5. 人人文庫網(wǎng)僅提供信息存儲空間,僅對用戶上傳內(nèi)容的表現(xiàn)方式做保護(hù)處理,對用戶上傳分享的文檔內(nèi)容本身不做任何修改或編輯,并不能對任何下載內(nèi)容負(fù)責(zé)。
  • 6. 下載文件中如有侵權(quán)或不適當(dāng)內(nèi)容,請與我們聯(lián)系,我們立即糾正。
  • 7. 本站不保證下載資源的準(zhǔn)確性、安全性和完整性, 同時也不承擔(dān)用戶因使用這些下載資源對自己和他人造成任何形式的傷害或損失。

評論

0/150

提交評論