清分機(jī)軟件識別系統(tǒng)的研究_第1頁
清分機(jī)軟件識別系統(tǒng)的研究_第2頁
清分機(jī)軟件識別系統(tǒng)的研究_第3頁
清分機(jī)軟件識別系統(tǒng)的研究_第4頁
清分機(jī)軟件識別系統(tǒng)的研究_第5頁
已閱讀5頁,還剩57頁未讀, 繼續(xù)免費(fèi)閱讀

下載本文檔

版權(quán)說明:本文檔由用戶提供并上傳,收益歸屬內(nèi)容提供方,若內(nèi)容存在侵權(quán),請進(jìn)行舉報或認(rèn)領(lǐng)

文檔簡介

1、目錄 摘摘 要要.i abstract .ii 一一 緒緒 論論.1 1 引言.1 2 課題的提出及研究意義.1 (1) 適應(yīng)市場的迫切需要,彌補(bǔ)金融電子化的重要一環(huán).1 (2)實(shí)現(xiàn)國產(chǎn)化、降低成本的要求.1 3 紙幣清分機(jī)簡介.2 (1) 功能概述.2 (2) 發(fā)展現(xiàn)狀.2 4 本文研究內(nèi)容.4 5 本章小節(jié).4 二二 數(shù)字圖像處理基礎(chǔ)數(shù)字圖像處理基礎(chǔ).5 1 引言.5 2 數(shù)字圖像處理基礎(chǔ).5 (1) 基本概念.5 (2) 基本的研究方法.6 3 利用統(tǒng)計法分析紙幣圖像特征.6 (1) 直方圖.6 4 在頻域中分析紙幣圖像特征.7 (1) 概述.7 (2) 頻率分析.7 5 本章小結(jié).8

2、三三 新舊清分算法的研究新舊清分算法的研究.9 1 引言.9 2 直方圖清分.9 2 lvq(learning vector quantization)分類.10 3 相關(guān)性分析新舊.11 4 灰度加權(quán)平均判新舊法.11 (1) 灰度加權(quán)思想.11 (2) 灰度加權(quán)算法與仿真.12 5 本章小結(jié).13 四四 紙幣清分圖像識別算法研究紙幣清分圖像識別算法研究.14 1 引言.14 2 利用神經(jīng)網(wǎng)絡(luò)進(jìn)行模式識別.15 (1) 多輸出型.15 (2) 單輸出型.15 (3) 自組織映射.15 3 特征提取判別.16 (1) 邊界提取.16 (2) 五線法判大小.18 (3) 灰度加權(quán)判正反.21 4

3、 晶格比率法判殘缺.22 (1) 原理介紹.22 (2) 具體算法-補(bǔ)償法.23 5 本章小結(jié).24 五五 總結(jié)和展望總結(jié)和展望.25 1 總結(jié).25 2 有待進(jìn)一步開展的工作.25 致致 謝謝.26 參考文獻(xiàn)參考文獻(xiàn).27 附錄一附錄一 c+程序程序.28 附錄二附錄二 英文文獻(xiàn)英文文獻(xiàn).40 附錄三附錄三 中文文獻(xiàn)中文文獻(xiàn).45 摘 要 圖像識別技術(shù)是提高當(dāng)前紙幣清分機(jī)清分能力的重要手段,主要實(shí)現(xiàn)紙幣的面額、 面向及新舊殘缺清分,要求具有較高的實(shí)時性、很好的可靠性。本文針對當(dāng)前國內(nèi)圖像 識別技術(shù)在紙幣清分機(jī)中的應(yīng)用不成熟而導(dǎo)致對人民幣挑殘能力弱、在人民幣新舊程度 和面向分類中的一致性差的情

4、況,提出了一種基于區(qū)域灰度特征提取的灰度加權(quán)和五線 找點(diǎn)的算法圖像識別方法。 本文的識別系統(tǒng)首先通過專門的 cis 傳感器設(shè)備,對高速傳動的紙幣實(shí)時采集其圖 像。對于采集的圖像數(shù)據(jù),首先通過五線找點(diǎn)算法對紙幣大小進(jìn)行判定,從而確定紙幣 的面額?;叶戎堤卣鞣从沉巳嗣駧诺拿靼祵Ρ葟?qiáng)度,其分布反映了紙幣圖像的特征走向。 由于在特征區(qū)域內(nèi)的灰度值包含了人民幣圖像的主要分布信息,因此它代表紙幣圖像的 主體信息。因此根據(jù)灰度值提取紙幣圖像的特征區(qū)域。為了提高清分機(jī)對紙幣的挑殘能 力,采用網(wǎng)格劃分的方法,對各網(wǎng)格點(diǎn)進(jìn)行采樣,統(tǒng)計背景點(diǎn)與紙幣圖像點(diǎn)的數(shù)量關(guān)系, 確定紙幣的殘缺率。最后根據(jù)灰度加權(quán)判定紙幣的新舊

5、。 無論是區(qū)域特征提取還是殘缺率的判別,都需要建立能與之進(jìn)行對比的紙幣標(biāo)準(zhǔn)樣 本庫,這些樣本庫包括:特征區(qū)域位置、紙幣長寬、紙幣區(qū)域灰度均值、紙幣圖像與背 景圖像比例等標(biāo)準(zhǔn)樣本庫。 針對以上研究,開發(fā)、實(shí)現(xiàn)了圖像識別系統(tǒng)原型,采用 matlab 仿真實(shí)現(xiàn)算法功能。 試驗(yàn)表明,以上提出的方法在保證識別率和穩(wěn)定性的情況下,能夠滿足實(shí)時性要求,具 有良好的工程應(yīng)用價值。 關(guān)鍵字關(guān)鍵字: 清分機(jī) 模式識別 灰度 圖像處理 紙幣 abstract image identification technology, which characters the real-time identification

6、and steady reliability, is essential to enhance the identification ability of paper currency identification system . it can identify the denomination of the paper currency and seek out deformity . concerning shortages of the previous designs of paper currency identification instrument, such as poor

7、at deformity seeking-out and classifying the rank and directions of new and used bills , a new identifying method presented in this thesis is iteration based on regional gray scale and five-line seeking-points method. the identification system in this thesis collects the paper currency images by spe

8、cific cis sensor while paper currencies circumgyrating with high speed. the collected database of images will be located instantly by five -line seeking-points method to analysis the size and determine the denomination . then the characters of gray scale of images will be taken and analyzed. it illu

9、strates light and shades of the paper currency. consequently, it can represent the essence of identifying paper currency. moreover, the gridding method is taken to improve seeking out deformity. each gridding is going to be sampled and statistic in order to measure the relation between points on bac

10、kground and images so that deformity seeking is achieved.at last ,we can determine the taint degree. the paper currency sample database is required to be established for estimation both of regional characters and deformity. the sample database includes characterized region location, paper currency l

11、ength, gray scale average and ratio between paper currency image and scanned background image. the identification system is achieved by matlab simulation. the simulated test shows that the identification instrument has high value on project application with stability and real- time demands. keywords

12、: bill sorting machine mode identifying gray scale image processing paper currency 一 緒 論 1 引言引言 商品的流動及因此產(chǎn)生的貨幣流動,是人類社會生活中兩個基本的相互誘導(dǎo)的共生 流。貨幣流動是商品流動的映像,若貨幣運(yùn)行不暢,商品流動也不能暢通,商品生產(chǎn)也 要受阻。第二次世界大戰(zhàn)以來,商品生產(chǎn)的規(guī)模和交換方式都發(fā)生了很大的變化??茖W(xué) 技術(shù)的發(fā)展促進(jìn)了勞動生產(chǎn)率的迅速提高,此外,全國性和國際性貿(mào)易也有了急速發(fā)展, 無論是從規(guī)模還是從速度上,這都導(dǎo)致了商品流動和貨幣流動的急速加大。除了與商品 流動有關(guān)的貨幣流動外

13、,在現(xiàn)代銀行業(yè)務(wù)中,還有大量與實(shí)物商品流通沒有直接聯(lián)系的 貨幣流動。例如儲蓄和信貸,僅此一項(xiàng)就可使貨幣流動的強(qiáng)度增大 10 倍。 如此急劇增長的貨幣流通強(qiáng)度使銀行界陷入困境,整個銀行界日益為堆積如山的金 融紙票(現(xiàn)金、支票和各種憑證)所困擾。正當(dāng)銀行界為對付貨幣流通激增的局面尋找出路 時電子計算機(jī)應(yīng)運(yùn)而生。計算機(jī)與通信技術(shù)(c為客戶提供各種金融信息服務(wù);公用信 息發(fā)布、銀行業(yè)務(wù)介紹存款利率發(fā)布、貸款利率發(fā)布等公共信息服務(wù),等等。作為其中 的一員,紙幣清分機(jī)系統(tǒng)就是在這種背景下應(yīng)運(yùn)而生的。 2 課題的提出及研究意義課題的提出及研究意義 (1) 適應(yīng)市場的迫切需要,彌補(bǔ)金融電子化的重要一環(huán) 在眾多

14、的金融業(yè)務(wù)電子化后,整個行業(yè)的運(yùn)行效率迅速提高。然而,在銀行內(nèi)部, 對破舊的鈔票進(jìn)行回收處理,要求上繳的鈔票新、舊分類存放,這些日常事務(wù)仍然是依 靠人工處理。而這種人工選鈔是一項(xiàng)單調(diào)、繁重、重復(fù)性較高的體力勞動,不但占用較 多的人員,而且速度、分選質(zhì)量都存在很大問題。在以前,這種矛盾并不明顯。然而, 隨著我國經(jīng)濟(jì)不斷迅猛發(fā)展,市場的日趨成熟,紙幣的發(fā)行量和流通量每年也都在飛速 遞增。而且,自從我國加入 wto 以來,越來越多的外商來華投資設(shè)廠,近幾年我國已經(jīng) 成為全球吸引投資最多的國家,進(jìn)出口貿(mào)易飛速發(fā)展,因而,國外貨幣也越來越融入我 國的經(jīng)濟(jì)發(fā)展中來。在這種背景下,選鈔工作越來越成為金融系統(tǒng)

15、的負(fù)擔(dān),國內(nèi)對自動 化選鈔的需求極為迫切。 (2)實(shí)現(xiàn)國產(chǎn)化、降低成本的要求 目前,世界上只有英國得利來、勞雷爾、日本的東芝、光榮等幾家公司生產(chǎn)自動化 選鈔機(jī),現(xiàn)在國內(nèi)許多銀行采用的也大都是進(jìn)口產(chǎn)品。但是進(jìn)口產(chǎn)品價格昂貴,每臺估 計在 30-45 萬元之間,而且它們是專門針對國外貨幣進(jìn)行設(shè)計的,對于人民幣處理效果并 不是很好。面對我國數(shù)量龐大的金融系統(tǒng),實(shí)在是杯水車薪。如果研制國產(chǎn)的適合于人 民幣的自動化選鈔系統(tǒng),不但解決了金融系統(tǒng)的需求,而且會創(chuàng)造大量的社會財富。 3 紙幣清分機(jī)簡介紙幣清分機(jī)簡介 (1) 功能概述 綜上所述,紙幣清分機(jī)必須代替人工完成以下任務(wù):紙幣點(diǎn)算,偽鈔鑒別,根據(jù)面額

16、分類,根據(jù)紙幣版本分類,把破損的紙幣清分出來,使紙幣按照一個方位排放整齊,按 照新舊等級分類輸出。因而,最終輸出應(yīng)當(dāng)是按照要求排放整齊、類型一致的紙幣,而 且,為了提高效率必須達(dá)到一定速度。綜合以上要求,根據(jù)國外同類產(chǎn)品的情況,清分 機(jī)的基本功能和指標(biāo)規(guī)定如下: 、 點(diǎn)算功能:能夠進(jìn)行紙幣張數(shù)統(tǒng)計,速度必須達(dá)到 1000 張/分鐘以上; 、 偽鈔鑒別:能夠識別當(dāng)前流通紙幣的各種防偽標(biāo)記,可以準(zhǔn)確的鑒別 出偽鈔,速度必須保證點(diǎn)算的正常運(yùn)行; 、 面額清分:能夠識別出規(guī)定類型的紙幣面額,把不同面額的紙幣分類 輸出,速度必須達(dá)到 600 張/分鐘以上。 、 版本清分:能夠把不同版本的紙幣分類輸出,速

17、度達(dá)到 600 張/分鐘以 上; 、 殘缺檢驗(yàn):能夠檢出殘缺度(缺角、裂縫、破洞、卷角等)超過規(guī)定 的紙幣,速度達(dá)到 600 張/分鐘以上; 、 方位識別:能夠正確識別紙幣方位,可以把四種方位(正上、正下、 反上、反下)的紙幣分類輸出,速度達(dá)到 600 張/分鐘以上; 、 新舊清分:能夠正確識別紙幣新舊,分辨率達(dá)到 10 個等級以上,速度 達(dá)到 600 張/分鐘以上; (2) 發(fā)展現(xiàn)狀 把計算機(jī)技術(shù)應(yīng)用到紙幣清分上,很早以前就引起了國外研究者的廣泛興趣,目前 國外在紙幣識別領(lǐng)域技術(shù)已經(jīng)較為成熟。對于面額、面向的識別率已經(jīng)接近 100%,而對 于新舊清分,國外也陸續(xù)采用過一些方法,如聲音識別、圖

18、像識別等。同時,作為這些 技術(shù)的應(yīng)用,一些產(chǎn)品也己經(jīng)在市場上產(chǎn)生,如英國勞雷爾的 tdu-50c,日本光榮的 gru-200、東芝 fs-800 等。他們由于研發(fā)時間早,技術(shù)積累豐富,因而產(chǎn)品在市場上也 占有較大份額。 相比而言,國內(nèi)在這方面明顯落后。以前一直是采用人工完成紙幣清分工作,采用 國外進(jìn)口產(chǎn)品的銀行也是寥寥無幾,對清分機(jī)的需求也不是很迫切。然而,近幾年由于 經(jīng)濟(jì)的迅猛發(fā)展,整個市場忽然有了“忽如一夜春風(fēng)至”的感覺,對清分機(jī)的需求猛然 間變得極為迫切。同時,從事清分機(jī)研究、開發(fā)的機(jī)構(gòu)也如雨后春筍般紛紛亮相。最早 的有哈工大的 cf2000,清華同方與東芝合作的 s-1 oocn,鞍山

19、聚龍公司的 jl501 a 等 產(chǎn)品也已經(jīng)或即將上市。為了更好的了解清分機(jī)的發(fā)展形勢,下面對目前市場上的全要 產(chǎn)品進(jìn)行比較。 見表 1.1 生產(chǎn)廠家型號功能速度適用范圍 英國勞雷 爾 tdu- 50c 紙幣點(diǎn)數(shù)、金額 計算、批量點(diǎn)數(shù)、面 額清分、表里清分、 正損清分、紙幣厚度 檢測(防止兩張同時 通過)mg 磁墨檢偽、 uv 紫外線檢偽(10 個強(qiáng)/弱等級自由設(shè) 定) 、紙幣印刷錯位 檢測。 每秒 8 張, 每小時約 2 萬 張 第四套、 第五套的 10 元、20 元、 50 元、100 元 得利來小 型現(xiàn)金清分機(jī) dlr3 700e 人民幣( 10 元 券以上主幣)自動清 分處理、鑒偽、殘幣

20、 識別、可視化操作界 面、完備的操作記錄 功能、容易實(shí)現(xiàn)二次 開發(fā) 20,000 張 / 每小時 人民幣 德國 bps1 00 清分點(diǎn)算人民幣, 歐元,美元,港幣等 多種紙幣,并具有強(qiáng) 大的防偽功能 600 張/ 分鐘 人民幣、 歐元、美元、 港幣 日本光榮 uw 120 一次就能清分出 三類不同要求的紙幣 (如選出 atm 適用鈔、 流通鈔、待銷毀鈔 (舊鈔、殘鈔)并剔 除偽鈔、紙幣面向排 列功能 500 張/ 分鐘 銀行金庫、 各級分行、支 行、出納窗口, atmcd 補(bǔ)增 鈔票,中央押 運(yùn) 哈工大 cf20 00 1.自由點(diǎn)算、批 量點(diǎn)算;2.面額清分; 3.成色清分(10 個清 分等級

21、) ;4.正反清 分、方位清分;5.偽 鈔鑒別 640 張/ 分鐘 第四套、 第五套的 10 元、20 元、 50 元、100 元 清華同方 cs- 100cn 強(qiáng)大的 ccd 圖像 檢測功能可實(shí)現(xiàn)對票 面污漬、折角、破洞、 撕裂、涂寫痕跡的檢 測和清分 500 張/ 分鐘 第四套、 第五套的 10 元、20 元、 50 元、100 元 表 1.1 各清分機(jī)性能比較 4 本文研究內(nèi)容本文研究內(nèi)容 紙幣清分在金融行業(yè)中是一個非常重要的工作,為完成這一工作而開發(fā)的紙幣清分 機(jī)是完成紙幣的挑殘、清分、點(diǎn)算等工作的專用設(shè)備。在詳細(xì)研究國內(nèi)外清分機(jī)生產(chǎn)廠 家設(shè)計思想的基礎(chǔ)上,結(jié)合研發(fā)紙幣清分機(jī)項(xiàng)目的具體

22、實(shí)踐,本文對清分機(jī)中的算法進(jìn) 行研究,提出了基于灰度加權(quán)平均和特征區(qū)域提取相結(jié)合的人民幣新舊版面識別算法。 總的說來,本文共分為四部分: 第一部分緒論。提出本文的研究課題和研究意義,參看別人的研究結(jié)果,在此 基礎(chǔ)上提出本文的研究任務(wù); 第二部分理論基礎(chǔ),包括第二,三,四章。首先概述圖像處理領(lǐng)域的主要研究 方法,同時分析了紙幣圖像的特征。接著,重點(diǎn)講述了作者提出的基于灰度加權(quán)和特征 塊提取的算法。最后,又詳細(xì)論述了 清分機(jī)其它功能的圖像處理算法。 第三部分總結(jié)與展望。 5 本章小節(jié)本章小節(jié) 闡述了紙幣清分機(jī)的研究意義和當(dāng)前的發(fā)展現(xiàn)狀,對前人的研究結(jié)果進(jìn)行了系統(tǒng)的 分析,并在此基拙上提出了本課題的

23、研究內(nèi)容,最后給出了全文的結(jié)構(gòu)框架。 二 數(shù)字圖像處理基礎(chǔ) 1 引言引言 從前一章中可以看到,紙幣清分機(jī)中許多功能的實(shí)現(xiàn)最終都要依靠圖像處理的方法 來完成。而圖像處理一方面具有較好的處理效果,另一方面圖像采集不與紙幣接觸,速 度快,靈活性也比較大,因而在具體操作上也更加具有優(yōu)勢。而數(shù)字圖像處理本身就己 經(jīng)成為工程學(xué)、計算機(jī)科學(xué)、信息科學(xué)、統(tǒng)計學(xué)、物理、化學(xué)、生物學(xué)等領(lǐng)域中各學(xué)科 學(xué)習(xí)和研究的對象。為了更好的探討后面的算法,下而首先簡要介紹該領(lǐng)域中地基本概 念和主要研究方法 2 數(shù)字圖像處理基礎(chǔ)數(shù)字圖像處理基礎(chǔ) 人類對于數(shù)字圖像處理的研究源于兩個主要應(yīng)用領(lǐng)域:其一是為了便于人們分析而對 圖像信恩

24、進(jìn)行改進(jìn);其二是為使機(jī)器自動理解而對圖像數(shù)據(jù)迸行存儲、傳輸及顯示。下面 首先介紹一下一些基木概念. (1) 基本概念 1) .灰度 一幅圖像可定義為一個二維函數(shù) r(x. y). x, y 是空間坐標(biāo),而在任何一對空間坐標(biāo) (x.,y)上的幅值 f 成為該點(diǎn)圖形的強(qiáng)度或灰度。 2). 數(shù)字圖像表示 數(shù)字圖像是把需要處理的模擬圖像數(shù)字化。簡單的就是用一個網(wǎng)格把待處理的圖像 覆蓋,然后把每個方格中的模擬圖像的各個亮度取平均值,作為該小方格中點(diǎn)的值。 空間分辨率 是指網(wǎng)格在水平方向和龔直方向上分為多少格,計為 mxn.因此一副 mxn 數(shù)字圖像 可表示為 矩陣中的每個元素稱為圖像單元、圖像元素或像素

25、。 密度分辨率 在數(shù)字化過程中,對于 m 和 n 的值和每個像素允許的離散灰度級數(shù) l 需要一個規(guī)定。 對 m 和 n 除了必須取正整數(shù)外沒有其他要求。然而出于處理、存儲和取樣硬件的考慮, 灰度級典型的取值是 2 的整數(shù)次幕: l=2 k 這里,假設(shè)離散灰度級是等間距的而且是區(qū)間0, l-1內(nèi)的整數(shù)(一般取 k=8)。數(shù)字 b 存儲數(shù)字圖像需要的比特數(shù),有 b=mnk 一副圖像亮度層次變化多,則看起來越柔和越逼真,這個亮度層次的多少稱為密度 分辨率。 空間頻串 隨時間周期變化的信號可用頻率度量,如果把時間變量改為空間變量,即成為表示 在空間距離上有周期性變化的信號,因此,當(dāng)周期固定時,其周期的

26、倒數(shù)就表示為空間 頻率。在圖像中.這個周期性變量表示圖像明暗變化的快慢。因而空間頻率高的圖像主要 表征圖像的細(xì)微變化或細(xì)節(jié)內(nèi)容;空間頻率低的圖像則表征圖像中的物體輪廓或變化趨勢。 這個概念是圖像處理技術(shù)中頻域處理的基礎(chǔ)。 (2) 基本的研究方法 將數(shù)學(xué)形態(tài)學(xué)作為工具,從圖像中提取對于表達(dá)和描繪區(qū)域形狀有用處的圖像分量, 比如邊界、骨架、以及凸殼。另外,如果把一幅圖像看作一個三維坐標(biāo)的 x.y 平面,把灰 度值看作 z 坐標(biāo),那么整副圖像就成為一個立體圖形,完全可以應(yīng)用三元函數(shù)中的分析數(shù) 字圖像處理是一門計算機(jī)科學(xué)與數(shù)學(xué)以及其他學(xué)科的交又科學(xué),因而主要有以下幾種研 究方法: 、矩陣運(yùn)算及數(shù)理統(tǒng)計

27、在數(shù)字圖像處理的應(yīng)用 因?yàn)椋瑘D像的數(shù)字表示是以矩陣的形式出現(xiàn)的,對它的基本運(yùn)算也是建立在矩陣運(yùn) 算的基礎(chǔ)上。簡單的有加減法處理、對數(shù)變換、冪次變換、分段線性變換等,它們都是 數(shù)字圖像處理的基礎(chǔ)。 數(shù)理統(tǒng)計方法在圖像處理中也有應(yīng)用,最典型的是直方圖,還有利用相關(guān)性進(jìn)行圖 像匹配等。 、信號處理在數(shù)字圖像處理中的應(yīng)用 通過引入空間頻率的概念,數(shù)字處理中的許多問題就可以用信號處理中的方法來解 決。例如各種噪聲濾波算法、圖像銳化、圖像平滑、圖像壓縮、圖像分割、圖像提取等。 、數(shù)學(xué)形態(tài)學(xué)在數(shù)字圖像處理中的應(yīng)用工具進(jìn)行處理。 3 利用統(tǒng)計法分析紙幣圖像特征利用統(tǒng)計法分析紙幣圖像特征 (1) 直方圖直方圖

28、1) 基本概念 灰度直方圖是灰度級的函數(shù),描述的是圖像中具有該灰度級的像素的個數(shù):橫坐標(biāo) 是灰度級,縱坐標(biāo)是該灰度出現(xiàn)的頻率(像素的個數(shù))。經(jīng)常用圖像中像素總數(shù)來除它的每 一個值得到歸一化的直方圖。 直方圖是多種空間域處理技術(shù)的基礎(chǔ),它能有效的用于圖像增強(qiáng),在圖像壓縮和分 割中也是非常有用的。利用直方圖還可以進(jìn)行圖像分析,察看它圖像灰度的分布情況。 下面首先采用這種工具對紙幣進(jìn)行圖像分析。 2) 直方圖像分析 圖 2.1 灰度直方圖分析 4 在頻域中分析紙幣圖像特征在頻域中分析紙幣圖像特征 (1) 概述 引入空間頻率的概念后,圖像中周期性變量就表示為圖像明暗變化的快慢。因而, 圖像中明暗變化快

29、的地方就是高頻部分,變化慢的地方就是低頻部分。如果要對圖像根 據(jù)明暗變化的不同進(jìn)行處理,就需要用到信號處理的方法。其中濾波是信號處理在圖像 處理中用得最多的地方。主要的濾波器有:巴特沃斯低通濾波器、高斯低通濾波器、巴特 沃斯高通濾波器、高斯高通濾波器、同態(tài)濾波器等。下面利用頻域的工具對紙幣進(jìn)行分 析。 (2) 頻率分析 如下就是兩副圖像的二維傅利葉變換。 圖 2.2 紙幣圖像頻域分析 上圖中第一副圖像是標(biāo)準(zhǔn)的紙幣圖像,可見高頻成分相對而言比較少:第二副圖像是 在經(jīng)過空間對準(zhǔn)后,一副臟幣減去新幣后的差分圖像,其中除了殘留的標(biāo)準(zhǔn)圖案外.更多 的是剩余的污漬信息,從它右圖中看到,高頻成分減少了??梢?/p>

30、,紙幣標(biāo)準(zhǔn)圖像的頻域 分布與污漬圖像的頻域分布基本一樣,它們交織混雜在一起,利用一般的方法很難進(jìn)行 有效的分割。 5 本章小結(jié)本章小結(jié) 本章介紹了圖像處理方面的主要概念和研究方法,并且利用圖像處理的工具分析了 紙幣圖像的特征:灰度分布比較均勻,許多圖形都是由漸變的灰度值組成,不利于灰度特 征提取;紙幣圖案復(fù)雜。首先是細(xì)小、分布面廣并且互相連接的底紋。其次,大的圖形中 嵌套許多小圖形。而且,即使圖案簡單的圖形也是由許多色點(diǎn)組成的,不具有均一性。 增大了進(jìn)行圖形識別和分析的難度:污漬與紙幣圖像頻域混雜,無法區(qū)分。以上這些工作. 為我們下面的算法設(shè)計奠定了基礎(chǔ)。 三 新舊清分算法的研究 1 引言引言

31、 一些特定的場合,如 atm 機(jī)所使用的現(xiàn)金就要求票面比較新,這樣才能保證操作的 準(zhǔn)確性。因此,有必要開發(fā)清分新舊現(xiàn)金的技術(shù)。要區(qū)分出新舊程度不同的現(xiàn)金,就必 須找出它們之間的不同點(diǎn)。首先,新舊現(xiàn)金的紙質(zhì)是不同的,新的紙幣,之戰(zhàn)彈性和韌 性比較好,而舊的紙幣彈性和韌性都較差。用手捏住紙幣中間就能看到新幣較硬一些, 不容易彎折,而舊幣在自身重力的作用下兩端就會下垂。其次,新舊紙幣對光的反射和 透射特性也是有區(qū)別的。新幣表面比較干凈,對光的反射,透射律都比較高。而舊幣由 于上面沾油許多污漬,表面比較黯淡,沒有新幣的光澤,而且透光率較新幣低。另外, 由于使用時間長,經(jīng)手次數(shù)多,舊幣一般磨損較為嚴(yán)重。

32、在印刷紙幣時壓印留下的溝槽, 新幣用手摸能明顯的感覺出來,而舊幣沒有明顯的感覺。 紙幣的新舊識別,本質(zhì)上就是找出任一紙幣與標(biāo)準(zhǔn)新幣的圖像差異.而這個差異我們 可以從三個方面去尋找:一是紙幣圖像與污漬圖像的差異,無疑我們可以模仿人類的識別 方式,采用模式識別的方法,但是由于紙幣圖案非常復(fù)雜,用現(xiàn)有的模式識別是很難湊 效的,并且時間上也不允許,可見從空間上是沒法區(qū)分的。那么在頻域范圍呢?從上一章 中也可看出,污漬與圖像的頻域是混雜在一起的,這條路行不通。二是直接把臟幣與新 幣進(jìn)行對比,直接求差分那是最簡單的了,但是有兩個困難空間精確對準(zhǔn)和圖案完全 一致,首先我們不可能達(dá)到空間的精確對準(zhǔn),其次,由于

33、制造和掃描的誤差,即使兩張 全新的紙幣或一張新幣的兩副圖像也不可能沒有誤差。那么轉(zhuǎn)而求其次,在誤差存在的 基礎(chǔ)上,采用兩種方法,一種是先求差分,再根據(jù)殘留圖像基本上屬于高頻區(qū)域而污漬 圖像基本上屬于低頻區(qū)域的特點(diǎn).進(jìn)行濾波,然而,由于紙幣圖像太復(fù)雜,很難濾掉所有 誤差圖像,而且還損失了許多污漬信息。另一種是事先利用統(tǒng)計的方法做一張樣本紙幣 每一個像素都包含了各種新幣在空間盡力對準(zhǔn)的情況下的灰度值,因而,在作差分時, 樣本紙幣就包含了上述兩種誤差,只要臟幣對應(yīng)像素點(diǎn)的灰度值落在樣本紙幣的統(tǒng)計范 圍之內(nèi)就認(rèn)為不是污漬,可以去掉,這種方法由于工作量大,并且位置誤差不像想象的 那樣簡單,也被拋棄。因此

34、這條路也證明行不通。我們就幾種新舊分類方法做了分析和 比較,包括直方圖清分,相關(guān)性分析,lvq 分類等,并在此基礎(chǔ)上提出了自己的一種算 法灰度加權(quán)平均。 2 直方圖清分直方圖清分 直方圖是刻畫圖像中灰度分布的一種工具,一般來說不同的圖像具有不同的灰度分 布。對于同一版本、相同面額的新鈔來說,圖像是相同的,因而其灰度直方圖應(yīng)當(dāng)一致; 如果是帶有污漬的臟幣,反映在圖像上是不同的,那么它的灰度直方圖也會有一定的差 異。所以,如果把紙幣的灰度直方圖作為攜帶紙幣新舊信息的工具,那么衡量新舊等級 的標(biāo)準(zhǔn)就變成衡量臟幣直方圖與標(biāo)準(zhǔn)紙幣直方圖的差異性大小的問題了。 通過實(shí)例,可以總結(jié)規(guī)律如下: 、 灰度直方圖

35、曲線與坐標(biāo)軸所包圍的面積是一定的,新舊幣的差異表現(xiàn)在像素點(diǎn) 數(shù)在不同灰度級的分布上。 、 如果舊幣灰度高的地方曲線所圍面積比新幣少,表明白色區(qū)域有污漬;如果灰度 低的地方面積減少,表明紙幣褪色。在這兩種情況下,所減少的面積有向中間移動的趨 勢。 、 如果灰度低的地方面積增加,表明有顏色較深的污漬;如果灰度高的地方面積增 加,表明有亮色(如黃色、綠色)污漬。 、 污染程度不同的紙幣表現(xiàn)在高灰度區(qū)域面積向中間集中的程度,越向灰度低的 區(qū)域集中紙幣越臟,而低灰度面積越大臟點(diǎn)(線)越多。 但存在很大的缺點(diǎn): 、 由于與位置無關(guān),無法排除灰度總量不變,但由于空間位置不同造成的差異 即如果在一處灰度減少x

36、,在另一個地方增加 4x 的情況(雖然這屬于小概率事件)。 、精度比較低,對于少量的臟點(diǎn)或線由于所占像素數(shù)比較少,在直方圖上的差異 變得極小,因而無法區(qū)分。 2 lvq(learning vector quantization)分類分類 神經(jīng)網(wǎng)絡(luò)(ann)是仿生學(xué)的產(chǎn)物,它通過網(wǎng)絡(luò)節(jié)點(diǎn)的連接來存儲信息,并完成分 類。ann 分類器通過學(xué)習(xí),根據(jù)訓(xùn)練的特征樣本向量集來調(diào)整連接的權(quán)值,構(gòu)造出相應(yīng) 的分類曲面。ann 的學(xué)習(xí)能力使其能夠在復(fù)雜的分布中提取出人直觀還不能理解的規(guī)律。 在實(shí)際系統(tǒng)中,需要面臨紙幣幣種的擴(kuò)充等問題,而 ann 由于其固有的自組織、自適應(yīng) 和容錯性,只須重新訓(xùn)練就可以完成對新

37、舊的正確識別。目前廣泛使用的 ann 有:多層 感知(mlp,bp 網(wǎng))kohonen 網(wǎng)絡(luò)、pnn 自組織神經(jīng)元樹等。通過對多種神經(jīng)網(wǎng)絡(luò)的比較, 我們發(fā)現(xiàn) lvq(學(xué)習(xí)矢量量化算法分類器) ,由于具有在輸入節(jié)點(diǎn)的條件下,可以達(dá)到精 確分類的目的,所以,在這里選擇它作為分類器。 lvq 是一種 kohonen 網(wǎng)絡(luò)方法的擴(kuò)展形式。lvq 網(wǎng)絡(luò)由兩層組成,第一層為競爭網(wǎng) 絡(luò),第二層為線性層。競爭層能夠?qū)W習(xí)對輸入向量的分類,這與自組織競爭網(wǎng)絡(luò)非常相 似。線性層將競爭層傳來的分類信息轉(zhuǎn)變成使用者所定義的類別,將經(jīng)競爭層學(xué)習(xí)到的 類稱為子類,將現(xiàn)行層學(xué)習(xí)得到的類稱為目標(biāo)類。其具體方法如下: 計算圖像數(shù)

38、據(jù)(連同背景)的灰度直方圖曲線,并取其中的灰度范圍值 1-255 的作為 特征一維數(shù)組 x=x1,x2,x255,其中 xi 是圖像中灰度值為 i 的像素的個數(shù)。根據(jù)實(shí)驗(yàn)分 析,由于圖像掃描而導(dǎo)致的灰度值偏差一般小于 10,因此將特征一維數(shù)組 x 轉(zhuǎn)換為 y=y1,y2,y50,采用 y 作為特征數(shù)組,以減少由于圖像掃描而帶來的誤差。 y = i=1,2,50 i 5*5 4*5 i i i x 在實(shí)際掃描系統(tǒng)中掃描的紙幣圖像大小約為 200*30,像素灰度范圍值為 1-255,我們 以紙幣中心為起點(diǎn),分別向左右兩邊按 17 個像素間隔取點(diǎn),包括中心共取 10 個點(diǎn)。按 垂直方向上下間隔 5

39、個像素各取一個點(diǎn),包括中心點(diǎn)工 3 個點(diǎn)。這樣,我們在整個紙幣 圖像上共取了 30 個點(diǎn)。以這 30 個點(diǎn)為中心,分別取橫向 17 個像素,縱向?yàn)?10 個像素 的子區(qū)。取每一個子區(qū)的像素和作為分量,形成一個 30 維的特征向量 z=z1,z2,.z30.該 特征向量包含了圖像的位置信息,反映了紙幣圖像的特征位置走向,在垂直方向相鄰的 方向快存在重疊,減少了垂直位移的偏差。 最后,將特征向量 y 和特征向量 z 合并組成一個即包含位置信息,又包含了灰度分 布的新的特征向量 p=y1,y2,y50 z1,z2,.z30。對樣本紙幣按上述方法提取特征向量 p(包含 80 個元素的特征向量) ,采用

40、 lvq 神經(jīng)網(wǎng)絡(luò)進(jìn)行監(jiān)督分類訓(xùn)練,采用的 lvq 神 經(jīng)網(wǎng)絡(luò)有 80 個輸入節(jié)點(diǎn),4 個隱層節(jié)點(diǎn),2 個輸出節(jié)點(diǎn)。訓(xùn)練學(xué)習(xí)速率為 0。1 在實(shí)際系 統(tǒng)中,將訓(xùn)練好的 lvq 神經(jīng)網(wǎng)絡(luò)作為分類器,對待測試紙幣提取特征向量 p,并輸入到 神經(jīng)網(wǎng)絡(luò),得到最終分類結(jié)果。 但 lvq 分類的訓(xùn)練過程很久,而且輸入節(jié)點(diǎn)的選取,學(xué)習(xí)速率的選取很難定,無法 達(dá)到很好的效果。 3 相關(guān)性分析新舊相關(guān)性分析新舊 相關(guān)函數(shù)描述了兩個信號之間的關(guān)系或其相似程度,也可以描述同一信號的現(xiàn)在值 與過去值的關(guān)系,或者根據(jù)過去值、現(xiàn)在值來估計未來值。因而,這里如果要衡量兩個 直方圖之間的差異比較好的方法就是求它們的相關(guān)系數(shù)。

41、利用公式: = n i n i n i iyix iyix 1 2 1 2 1 )()( )()( matlab 仿真程序如下: x,map=imread(10ub.tif); 讀取圖像數(shù)據(jù); y=imresize(x,150 200); 改變圖像大小; k,map=imread(100.tif); j=imresize(k,150 200); imshow(y,map); 顯示圖像; figure,imshow(j,map); r=corrcoef(j,y); 求兩副圖的相關(guān)性; 但是仿真結(jié)果不太令人滿意,誤判較高,而且運(yùn)算量較大,在 dsp 編程中數(shù)據(jù)處理 太慢。因此,我不采用此方法。 4

42、 灰度加權(quán)平均判新舊法灰度加權(quán)平均判新舊法 (1) 灰度加權(quán)思想 紙幣的灰度值特征反映了其明暗程度,其分布反映了紙幣圖像的特征走向。由于灰 度值包含了紙幣圖像的主要分布信息,因此它代表紙幣圖像的主體信息。經(jīng)分析發(fā)現(xiàn), 紙幣存在著一些特殊的區(qū)域兩對稱區(qū)域有著相當(dāng)大的灰度均值差異,我們稱之為強(qiáng) 對比區(qū)域,在上章利用這些強(qiáng)對比區(qū)域灰度特征,確定了紙幣的面向和方位?,F(xiàn)在利用 這些強(qiáng)對比區(qū)域灰度特征,紙幣的新舊程度也可以由此確定。 通過對多個有不同污染度的多個 100 圓、50 圓、20 圓、10 圓樣品進(jìn)行試驗(yàn),發(fā)現(xiàn)正 反兩面灰度平均值差大于 5,而正反兩面的兩邊強(qiáng)對比區(qū)域灰度差值均大 于 10,可以

43、確定紙幣的面向及方位,因而提取區(qū)域灰度特征進(jìn)行識別是可行的。 (2) 灰度加權(quán)算法與仿真 對于新舊程度,可以采用紙幣灰度均值的大小進(jìn)行確定。在 matlab 上對多張 100 圓、 50 圓、20 圓、10 圓樣本進(jìn)行灰度提取并進(jìn)行平均,得到兩個等級:七成新及以上、七成 新以下。其中七成新以下的紙幣按照中國人民銀行頒布的不宜流通人民幣挑剔標(biāo)準(zhǔn) 將作銷毀處理。而通過試驗(yàn),此兩個新舊等級之間的灰度均值差值較大,容易分辨。新 舊程度 matlab 仿真程序: x,map=imread(d.tif); j=imresize(x,150 400); rgb=ind2rgb(j,map); r=rgb(:

44、,:,1); g=rgb(:,:,2); b=rgb(:,:,3); r_aver1=mean(r); r_aver=mean(r_aver1); g_aver1=mean(g); g_aver=mean(g_aver1); b_aver1=mean(b); b_aver=mean(b_aver1); gray_aver4=r_aver*0.3+g_aver*0.59+b_aver*0.11; 其中變量 為對第 i 張 rgb 紙幣圖像取灰度均值所得結(jié)果,grey_aver i (i=1,2,n) rgb 對應(yīng)的灰度值公式為: 。grey scale = r 0.3+g 0.59+b 0.11

45、 在工程上,rgb 對應(yīng)的灰度值公式為: 。適應(yīng)于黑grey scale = r 0.3+g 0.59+b 0.11 白兩色光照射,在彩色光照射下效果可能要差一些,但經(jīng)過試驗(yàn)調(diào)整某些參數(shù),還是能 反映新舊狀況的。 紙幣一 紙幣二 紙幣三 對于紙幣一,gray_aver4 為 0.9985 是張全新的;對于紙幣二 gray_aver4 為 0.8914; 對于紙幣三,gray_aver4 為 0.7211。使用 100 張紙幣進(jìn)行多次驗(yàn)證,誤差較小,可靠性可 以達(dá)到 95%以上。 5 本章小結(jié)本章小結(jié) 本章中,綜合比較了幾種新舊識別的算法,包括直方圖清分,lvq 分類,相關(guān)性分 析,灰度加權(quán)平均

46、,最后選擇了灰度加權(quán)。此算法彌補(bǔ)了國內(nèi)已有算法新舊信息包含少, 分辨率不高,運(yùn)算繁雜的缺點(diǎn),為清分機(jī)的實(shí)現(xiàn)做出了最核心的工作. 四 紙幣清分圖像識別算法研究 1 引言引言 紙幣的識別首先需要確定紙幣圖像在背景中的位置,根據(jù)紙幣的位置確定特征區(qū)域 位置,進(jìn)行特征提取來對紙幣圖像進(jìn)行識別。邊緣檢測算法常常用來對圖像邊緣進(jìn)行識 別,達(dá)到圖像定位的目的。 圖像的邊緣檢測算法有很多,較低級的有如:拉普拉茲算法、索貝爾算法,羅伯特 算法等,高級的有如:houge transform(霍夫變換)、marr(馬爾)、canny(坎尼)、 shen-castan(沈峻)(該算法準(zhǔn)確可靠,識別能力上與 canny

47、 算法接近)、sobel(索貝 爾),他們共同的原理是:邊緣提取即要保留圖像的灰度變化劇烈的區(qū)域,從數(shù)學(xué)上, 最直觀的方法就是微分(對于數(shù)字圖像來說就是差分),在信號處理的角度來看,也可以說 是用高通濾波器(前面的圖像預(yù)處理即是低通濾波),即保留高頻信號。 這些算法的實(shí)現(xiàn)大部分可采用模板運(yùn)算。運(yùn)算時,把模板中心對應(yīng)到圖像的每一個 像素位置,然后按照模板對應(yīng)的公式對中心像素和它周圍的像素進(jìn)行數(shù)學(xué)運(yùn)算,算出的 結(jié)果作為輸出圖像對應(yīng)像素點(diǎn)的值。 對于低級算法,常見的模板大小為 33,也有 22、55 或更大尺寸的。其中,拉 普拉茲算子是 2 階微分算子,也就是說,相當(dāng)于求取 2 次微分,它的精度還算

48、比較高, 但對噪聲過于敏感(有噪聲的情況下效果很差)是它的重大缺點(diǎn),所以這種算子并不是特別 常用。 sobel(索貝爾)算子是最常用的算子之一(它是一種一階算子),方法簡單效果也不錯, 但提取出的邊緣比較粗,要進(jìn)行細(xì)化處理。另外,索貝爾算子也可提取出圖像邊緣的方 向信息來,有文章論證過,在不考慮噪聲的情況下,它取得的邊緣信息誤差不超過 7 度。 對于高級算法,模板比低級算法大得多。其中,marr(馬爾)提出的邊緣提取算法 可以看成兩個步驟,一個是平滑作用來消除噪聲,另一個是微分提取邊緣,也可以說是 由兩個濾波器組成,低通濾波去除噪聲,高通濾波提取邊緣。人們也稱這種方法為 log 濾波器,這也是

49、根據(jù)它數(shù)學(xué)表達(dá)式和濾波器形狀起的名字。當(dāng)采用模板運(yùn)算來實(shí)現(xiàn)這種 算法時,但模板的大小一般要在 77 以上,所以運(yùn)算復(fù)雜程度比索貝爾算子等要大不少, 運(yùn)算時間當(dāng)然也長許多。 canny(坎尼)算子在使用時要提供給一些參數(shù),用于控制算法的性能,實(shí)際上,對 于不同的圖像或不同的邊緣提取目的,需要提供不同的參數(shù),以達(dá)到最佳效果,當(dāng)采用 模板運(yùn)算時,模板的大小也比較大,和提供的參數(shù)有關(guān),標(biāo)準(zhǔn)的大小差不多是 1717,可 以根據(jù)算子的可分離性用快速算法使得速度得以提高,否則相當(dāng)耗時。 shen-castan 算法,一般被稱為沈峻算法,是中國人的成果,效果和坎尼算子不相上 下,這種算法在對邊緣提取好壞的判別

50、標(biāo)準(zhǔn)上有些不同,模板大小也不盡相同,但明顯 大于上述低級算法。 houge transform(霍夫變換)基本步驟為:首先,初始化一塊緩沖區(qū),對應(yīng)于參數(shù) 平面,將其所有數(shù)據(jù)置為 0;對于圖像上每一前景點(diǎn),求出參數(shù)平面對應(yīng)的直線,把這直 線上的所有點(diǎn)的值都加;最后,找到參數(shù)平面上最大點(diǎn)的位置,這個位置就是原圖像 上直線的參數(shù)。這就是霍夫變換的基本思想。就是把圖像平面上的點(diǎn)對應(yīng)到參數(shù)平面上 的線,最后通過統(tǒng)計特性來解決問題。假如圖像平面上有兩條直線,那么最終在參數(shù)平 面上就會看到兩個峰值點(diǎn),依此類推。實(shí)現(xiàn)霍夫變換不僅需要遍歷整個源圖像,而且還 要遍歷參數(shù)平面進(jìn)行分析,所耗運(yùn)行時間較長。 由上可見,

51、低級算法中,拉普拉茲對噪聲過于敏感且相當(dāng)于 2 次微分,運(yùn)行時間長 且抗干擾能力差,無法滿足本課題的要求。索貝爾算法相當(dāng)于一階微分,運(yùn)行時間較少, 但提取出的邊緣比較粗,要進(jìn)行細(xì)化處理,消耗了時間,而且“邊緣信息誤差不超過 7 度”這樣的精度無法滿足本課題要求。而高級算法雖然比較精確,但其算子小則 77, 大則超過 1717,顯然無法滿足本課題的速度要求。因此,要想達(dá)到本課題實(shí)時、高速、 精確的要求,必須采用特定的算法。 通過以上各種算法的分析比較,可以看出,低級算法速度較快、耗時較少,但精度 低,不能滿足精度要求;高級算法精度高,但耗時太多、速度太慢,無法滿足實(shí)時的要 求。 因此,針對清分機(jī)

52、的實(shí)時性要求,無法選取以上任何一種確定的算法,必須要采用 特定的算法。下面一步步分析如何確定特定算法,實(shí)現(xiàn)本課題實(shí)時高速、高精確度的要 求。 2 利用神經(jīng)網(wǎng)絡(luò)進(jìn)行模式識別利用神經(jīng)網(wǎng)絡(luò)進(jìn)行模式識別 在各種人工神經(jīng)網(wǎng)絡(luò)模型中,在模式識別中應(yīng)用最多的也是最成功的當(dāng)數(shù)多層前饋 網(wǎng)絡(luò),其中又以采用 bp 學(xué)習(xí)算法的多層感知器(習(xí)慣上也簡稱為即網(wǎng)絡(luò) bp)為代表。由于 網(wǎng)絡(luò)采用的是監(jiān)督學(xué)習(xí)方式進(jìn)行訓(xùn)練.因此只能用于監(jiān)督模式識別同題。一般有以下兩種 應(yīng)用方式: (1) 多輸出型 網(wǎng)絡(luò)的每一個輸入節(jié)點(diǎn)對應(yīng)樣本一個特征,而輸出層節(jié)點(diǎn)數(shù)等于類別數(shù),一個輸入 節(jié)點(diǎn)對應(yīng)一個。在訓(xùn)練階段,如果輸入訓(xùn)練樣本的類別標(biāo)號是

53、i,則訓(xùn)練時的期望輸入設(shè) 為第 i 個節(jié)點(diǎn)為 1,而其余輸出節(jié)點(diǎn)均為 0。在識別階段,當(dāng)一個未知離別的樣本作用到 輸入端時,在某些情況下,如果輸出最大的節(jié)點(diǎn)與其它節(jié)點(diǎn)輸出的差距較小(小于某個域 值),則可以作出拒絕決策。這是用多層感知器進(jìn)行模式識別的最基本方式。 實(shí)際上,多輸出型神經(jīng)網(wǎng)絡(luò)還可以有很多其它的形式。更一般地,網(wǎng)絡(luò)可以有 m 個 輸出節(jié)點(diǎn),用他們的某種編碼來代表 c 個類別。上面這種方式只是其中地一個特例,有人 把它稱為“10”編碼模式或者“c 取 1”模式。 (2) 單輸出型 很多試驗(yàn)表明,在多輸出方式中,由于網(wǎng)絡(luò)要同時適應(yīng)所有類別,勢必需要更多的 隱層節(jié)點(diǎn);而且學(xué)習(xí)過程往往收斂較

54、慢,此時可以采用多個多輸入單輸出形式地網(wǎng)絡(luò), 讓每個網(wǎng)絡(luò)只完成識別兩類分類,即判斷樣本是否屬于某個類別。這樣可以克服類別之 間地耦合,經(jīng)常可以得到更好地結(jié)果。 具體作法是,網(wǎng)絡(luò)的每一個輸入節(jié)點(diǎn)對應(yīng)樣本一個特征,而輸出層節(jié)點(diǎn)只有一個。 為每個類建立一個這樣的網(wǎng)絡(luò)(網(wǎng)絡(luò)的隱層節(jié)點(diǎn)數(shù)可以不同) 。對每一類進(jìn)行分別訓(xùn)練, 將屬于這一類的阿樣本的期望輸出設(shè)為 1,而把屬于其它類的樣本的期望值輸入設(shè)為 0。 在識別階段,將為止類別的阿樣本輸入到每一個網(wǎng)絡(luò),如果某個網(wǎng)絡(luò)的輸出接近 1(或者 大于某個域值),則判斷該樣本屬于這一類,而如果有多個網(wǎng)絡(luò)的輸出均大于域值,則如 果有多個網(wǎng)絡(luò)輸出大于域值,則或者將類別

55、判斷為具有最大輸出的那以來,或者作出拒 絕;當(dāng)所有網(wǎng)絡(luò)的輸出均小于域值時也可以采取類似的決策方法。 (3) 自組織映射 它最早由 kohonen 提出的,是一個兩層網(wǎng)絡(luò),每一個輸入節(jié)點(diǎn)都通過一個具有可變權(quán) 值的連接與每一個輸出節(jié)點(diǎn)相連。隨著輸入矢量依次輸入網(wǎng)絡(luò),節(jié)點(diǎn)之間的連接權(quán)不斷 地被修正,當(dāng)網(wǎng)絡(luò)接受到足夠的輸入矢量后,各連接權(quán)就自動的形成各個相應(yīng)的矢量中 心。它可使得在進(jìn)行特征提取前將輸入信號映射到低維空間,并保持相同特征的輸入信 號在映射后的空間中對應(yīng)臨近區(qū)域。 自組織神經(jīng)網(wǎng)絡(luò)可以較好地完成聚類的任務(wù),其中每一個神經(jīng)元節(jié)點(diǎn)對應(yīng)一個聚類 中心,與普通聚類算法不同的是.所得的聚類之間仍保持一

56、定的關(guān)系就是在自組織網(wǎng)絡(luò)節(jié) 點(diǎn)平面上相鄰或相隔較近的節(jié)點(diǎn)對應(yīng)的類別.它們之間的相似性耍比相隔較遠(yuǎn)的類別之間 大,因此可以根據(jù)各個類別在節(jié)點(diǎn)平面上的相對位置進(jìn)行類別的合并和類別之間關(guān)系的 分析。 自組織特征映射最早的提出者 kohonen 的科研組就成功地利用這一原理講行了芬蘭 語語音識別。他們的做法是,將取自芬蘭語各種基本語音的各個樣本按一定順序輪流輸入 到一個自組織網(wǎng)絡(luò)中進(jìn)行學(xué)習(xí),經(jīng)過足夠次數(shù)的學(xué)習(xí)后這些樣本逐漸在網(wǎng)絡(luò)節(jié)點(diǎn)中形成 確定的映射關(guān)系,即每個樣本都映射到各自固定的一個節(jié)點(diǎn)(在這個樣本作輸入時,該 節(jié)點(diǎn)為最佳匹配節(jié)點(diǎn)或具有最大輸出) ,而映射到同一節(jié)點(diǎn)的樣本就可以看作是一個聚類。 學(xué)

57、習(xí)完成后,發(fā)現(xiàn)不但同一聚類中的樣本來自同一音素,而且鄰近節(jié)點(diǎn)對應(yīng)的聚類中樣 本往往來自相同或相近發(fā)音的音素。這樣,把各個聚類對應(yīng)的發(fā)音標(biāo)到相應(yīng)的節(jié)點(diǎn)上, 就得到了較好的結(jié)果。在識別時,對于新的輸入樣本,將其識別為它映射到的節(jié)點(diǎn)所標(biāo) 的發(fā)音即可。這種作法實(shí)際上是在非監(jiān)督學(xué)習(xí)的基礎(chǔ)上進(jìn)行監(jiān)督模式識別。其最大的優(yōu) 點(diǎn)就是,最終的各個相鄰聚類之間是有相似關(guān)系的 ,即使識別是把樣本映射到了一個錯 誤的節(jié)點(diǎn),它也傾向于被識別成同一音素或者一個發(fā)音相近的音素,這就十分接近人的 識別特性。 可以發(fā)現(xiàn),如果聚類分析的目的只是將樣本集中分為較少的幾個類。這種用自組織 映射網(wǎng)絡(luò)的作法沒有明顯的優(yōu)勢。為此,研究了一種

58、改進(jìn)的方法,稱作自組織映射分析 sofm).其基本原理是,通過自組織學(xué)習(xí)過程將樣本集映射到神經(jīng)元平面上,將學(xué)習(xí)后一 個樣本映射到的節(jié)點(diǎn)趁早這個樣本的像,而樣本被稱作這個節(jié)點(diǎn)的原像。在節(jié)點(diǎn)平面上 統(tǒng)計各個節(jié)點(diǎn)的原像數(shù)目,得到像密度圖。根據(jù)自組織神經(jīng)網(wǎng)絡(luò)的性質(zhì)和上面提到的節(jié) 點(diǎn)間對應(yīng)大的樣本之間的關(guān)系,則可以按照密度圖像把樣本集分類,將像密度較高且較 集中的節(jié)點(diǎn)對應(yīng)的樣本識別為一類。研究表明,這種方法不但無需事先確定聚類數(shù)目, 而且比之前的聚類方法能夠更好的適應(yīng)不同的分布情況,事一種較有效的方法。當(dāng)數(shù)據(jù) 分布不呈現(xiàn)明顯的單峰形式時,傳統(tǒng)方法通常仍繼續(xù)完成分類,單這種分類已經(jīng)不能反 映樣本集中實(shí)際的

59、分布和相似性關(guān)系,而這種情況下用自組織分析方法則可以從密度圖 反映出樣本集中無明顯據(jù)來的分布特性。 因此,我們在 cbuilder 下編程實(shí)現(xiàn)該算法。見附錄 1 但是經(jīng)我們對多張紙幣進(jìn)行訓(xùn)練后,發(fā)現(xiàn)速度比較慢,因此不采用此方法。 3 特征提取判別特征提取判別 (1) 邊界提取 1) 三色分離 rgb 圖像,也稱為真彩圖像,其每一個像素由三個數(shù)值來指定紅、綠、藍(lán)顏色分量。 在 matlab 中,一幅 rgb 圖像由一個 unit8,unit16 或雙精度類型的 mn3 數(shù)組 來描述,其中,m 和 n 分別表示圖像的寬度和高度。rgb 圖像不使用調(diào)色板。每個像素 的顏色由儲存在相應(yīng)的位置的紅、綠、

60、藍(lán)顏色分量共同決定。rgb 圖像是 24 位圖像,紅、 綠、藍(lán)個占用 8 位,因而圖像理論上可以包含 2種不同的顏色。 24 在一個雙精度類型的 rgb 數(shù)組中,每一個分量都是一個(0,1)范圍內(nèi)的 數(shù)值, 顏 色分量為(0,0,0)的 像素將顯示為黑色,顏色分量為(1,1,1)的像素將顯示 為白色。每一個像素的 三個顏色分量都儲存在數(shù)據(jù)數(shù)組的 第三維中。 為了分析紅色紙幣中紅,綠,藍(lán)三個不同顏色分量的作用效果,需將三種顏色分離 出來。分離結(jié)果如下: red green blue 2) 圖像分割 要進(jìn)行邊界提取,首先要對圖像分割。從數(shù)字圖像理論可知,在圖像中背景和前景 的灰度值有顯著的區(qū)別時,

溫馨提示

  • 1. 本站所有資源如無特殊說明,都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請下載最新的WinRAR軟件解壓。
  • 2. 本站的文檔不包含任何第三方提供的附件圖紙等,如果需要附件,請聯(lián)系上傳者。文件的所有權(quán)益歸上傳用戶所有。
  • 3. 本站RAR壓縮包中若帶圖紙,網(wǎng)頁內(nèi)容里面會有圖紙預(yù)覽,若沒有圖紙預(yù)覽就沒有圖紙。
  • 4. 未經(jīng)權(quán)益所有人同意不得將文件中的內(nèi)容挪作商業(yè)或盈利用途。
  • 5. 人人文庫網(wǎng)僅提供信息存儲空間,僅對用戶上傳內(nèi)容的表現(xiàn)方式做保護(hù)處理,對用戶上傳分享的文檔內(nèi)容本身不做任何修改或編輯,并不能對任何下載內(nèi)容負(fù)責(zé)。
  • 6. 下載文件中如有侵權(quán)或不適當(dāng)內(nèi)容,請與我們聯(lián)系,我們立即糾正。
  • 7. 本站不保證下載資源的準(zhǔn)確性、安全性和完整性, 同時也不承擔(dān)用戶因使用這些下載資源對自己和他人造成任何形式的傷害或損失。

評論

0/150

提交評論