模式識(shí)別方法及其研究進(jìn)展_第1頁(yè)
模式識(shí)別方法及其研究進(jìn)展_第2頁(yè)
模式識(shí)別方法及其研究進(jìn)展_第3頁(yè)
模式識(shí)別方法及其研究進(jìn)展_第4頁(yè)
模式識(shí)別方法及其研究進(jìn)展_第5頁(yè)
已閱讀5頁(yè),還剩54頁(yè)未讀 繼續(xù)免費(fèi)閱讀

下載本文檔

版權(quán)說(shuō)明:本文檔由用戶提供并上傳,收益歸屬內(nèi)容提供方,若內(nèi)容存在侵權(quán),請(qǐng)進(jìn)行舉報(bào)或認(rèn)領(lǐng)

文檔簡(jiǎn)介

模式識(shí)別方法及其研究進(jìn)展PatternRecorgnitionMethodAndItsResearchReview1主要內(nèi)容有關(guān)組織與出版物模式識(shí)別的基本概念模式識(shí)別系統(tǒng)模式識(shí)別過(guò)程模式識(shí)別方法與進(jìn)展未來(lái)展望2機(jī)構(gòu)、會(huì)議、刊物1973年IEEE發(fā)起了第一次關(guān)于模式識(shí)別的國(guó)際會(huì)議“ICPR”(此后兩年一次),成立了國(guó)際模式識(shí)別協(xié)會(huì)---“IAPR”1977年IEEE成立PAMI委員會(huì),創(chuàng)立IEEETrans.onPAMI,并支持ICCV,CVPR兩個(gè)會(huì)議其他刊物PatternRecognition(PR)PatternRecognitionLetters(PRL)PatternAnalysisandApplication(PAA)InternationalJournalofPatternRecognitionandArtificialIntelligence(IJPRAI)3統(tǒng)計(jì)學(xué)概率論線性代數(shù)(矩陣計(jì)算)形式語(yǔ)言機(jī)器學(xué)習(xí)人工智能圖像處理計(jì)算機(jī)視覺(jué)…與模式識(shí)別相關(guān)的學(xué)科4什么是模式(Pattern)?5廣義地說(shuō),存在于時(shí)間和空間中可觀察的物體,如果我們可以區(qū)別它們是否相同或是否相似,都可以稱之為模式。模式所指的不是事物本身,而是從事物獲得的信息,因此,模式往往表現(xiàn)為具有時(shí)間和空間分布的信息。模式的直觀特性:可觀察性可區(qū)分性相似性什么是模式?6模式識(shí)別–直觀,無(wú)所不在,“人以類(lèi)聚,物以群分”周?chē)矬w的認(rèn)知:桌子、椅子人的識(shí)別:張三、李四聲音的辨別:汽車(chē)、火車(chē),狗叫、人語(yǔ)氣味的分辨:炸帶魚(yú)、紅燒肉人和動(dòng)物的模式識(shí)別能力是極其平常的,但對(duì)計(jì)算機(jī)來(lái)說(shuō)卻是非常困難的。模式識(shí)別的概念7目的:利用計(jì)算機(jī)對(duì)物理對(duì)象進(jìn)行分類(lèi),在錯(cuò)誤概率最小的條件下,使識(shí)別的結(jié)果盡量與客觀物體相符合。Y=F(X)X的定義域取自特征集Y的值域?yàn)轭?lèi)別的標(biāo)號(hào)集F是模式識(shí)別的判別方法模式識(shí)別的研究81929年G.Tauschek發(fā)明閱讀機(jī),能夠閱讀0-9的數(shù)字。30年代Fisher提出統(tǒng)計(jì)分類(lèi)理論,奠定了統(tǒng)計(jì)模式識(shí)別的基礎(chǔ)。50年代NoamChemsky提出形式語(yǔ)言理論——傅京蓀提出句法結(jié)構(gòu)模式識(shí)別。60年代L.A.Zadeh提出了模糊集理論,模糊模式識(shí)別方法得以發(fā)展和應(yīng)用。80年代以Hopfield網(wǎng)、BP網(wǎng)為代表的神經(jīng)網(wǎng)絡(luò)模型導(dǎo)致人工神經(jīng)元網(wǎng)絡(luò)復(fù)活,并在模式識(shí)別得到較廣泛的應(yīng)用。90年代小樣本學(xué)習(xí)理論,支持向量機(jī)也受到了很大的重視。模式識(shí)別簡(jiǎn)史9生物學(xué)自動(dòng)細(xì)胞學(xué)、染色體特性研究、遺傳研究天文學(xué)天文望遠(yuǎn)鏡圖像分析、自動(dòng)光譜學(xué)經(jīng)濟(jì)學(xué)股票交易預(yù)測(cè)、企業(yè)行為分析醫(yī)學(xué)心電圖分析、腦電圖分析、醫(yī)學(xué)圖像分析模式識(shí)別的應(yīng)用(一)10工程產(chǎn)品缺陷檢測(cè)、特征識(shí)別、語(yǔ)音識(shí)別、自動(dòng)導(dǎo)航系統(tǒng)、污染分析軍事航空攝像分析、雷達(dá)和聲納信號(hào)檢測(cè)和分類(lèi)、自動(dòng)目標(biāo)識(shí)別安全指紋識(shí)別、人臉識(shí)別、監(jiān)視和報(bào)警系統(tǒng)模式識(shí)別的應(yīng)用(二)11模式識(shí)別目標(biāo)模式識(shí)別系統(tǒng)的目標(biāo):在特征空間和解釋空間之間找到一種映射關(guān)系,這種映射也稱之為假說(shuō)。特征空間:從模式得到的對(duì)分類(lèi)有用的度量屬性或基元構(gòu)成的空間。解釋空間:將c個(gè)類(lèi)別表示為 其中為所屬類(lèi)別的集合,稱為解釋空間。

12兩種實(shí)現(xiàn)假說(shuō):歸納監(jiān)督學(xué)習(xí)、概念驅(qū)動(dòng)或歸納假說(shuō):在特征空間中找到一個(gè)與解釋空間的結(jié)構(gòu)相對(duì)應(yīng)的假說(shuō)。在給定模式下假定一個(gè)解決方案,任何在訓(xùn)練集中接近目標(biāo)的假說(shuō)也都必須在“未知”的樣本上得到近似的結(jié)果。依靠已知所屬類(lèi)別的的訓(xùn)練樣本集,按它們特征向量的分布來(lái)確定假說(shuō)(通常為一個(gè)判別函數(shù)),只有在判別函數(shù)確定之后才能用它對(duì)未知的模式進(jìn)行分類(lèi);對(duì)分類(lèi)的模式要有足夠的先驗(yàn)知識(shí),通常需要采集足夠數(shù)量的具有典型性的樣本進(jìn)行訓(xùn)練。13兩種實(shí)現(xiàn)假說(shuō):演繹非監(jiān)督學(xué)習(xí)、數(shù)據(jù)驅(qū)動(dòng)或演繹假說(shuō):在解釋空間中找到一個(gè)與特征空間的結(jié)構(gòu)相對(duì)應(yīng)的假說(shuō)。這種方法試圖找到一種只以特征空間中的相似關(guān)系為基礎(chǔ)的有效假說(shuō)。在沒(méi)有先驗(yàn)知識(shí)的情況下,通常采用聚類(lèi)分析方法,基于“物以類(lèi)聚”的觀點(diǎn),用數(shù)學(xué)方法分析各特征向量之間的距離及分散情況;如果特征向量集聚集若干個(gè)群,可按群間距離遠(yuǎn)近把它們劃分成類(lèi);這種按各類(lèi)之間的親疏程度的劃分,若事先能知道應(yīng)劃分成幾類(lèi),則可獲得更好的分類(lèi)結(jié)果。14模式識(shí)別系統(tǒng)的基本構(gòu)成模式識(shí)別系統(tǒng)數(shù)據(jù)獲取特征提取和選擇預(yù)處理分類(lèi)決策分類(lèi)器設(shè)計(jì)15數(shù)據(jù)獲?。河糜?jì)算機(jī)可以運(yùn)算的符號(hào)來(lái)表示所研究的對(duì)象二維圖像:文字、指紋、地圖、照片等一維波形:腦電圖、心電圖、季節(jié)震動(dòng)波形等物理參量和邏輯值:體溫、化驗(yàn)數(shù)據(jù)、參量正常與否的描述預(yù)處理單元:去噪聲,提取有用信息,并對(duì)輸入測(cè)量?jī)x器或其它因素所造成的退化現(xiàn)象進(jìn)行復(fù)原模式識(shí)別系統(tǒng)組成(一)16特征提取和選擇:對(duì)原始數(shù)據(jù)進(jìn)行變換,得到最能反映分類(lèi)本質(zhì)的特征測(cè)量空間:原始數(shù)據(jù)組成的空間特征空間:分類(lèi)識(shí)別賴以進(jìn)行的空間模式表示:維數(shù)較高的測(cè)量空間->維數(shù)較低的特征空間分類(lèi)決策:在特征空間中用模式識(shí)別方法把被識(shí)別對(duì)象歸為某一類(lèi)別基本做法:在樣本訓(xùn)練集基礎(chǔ)上確定某個(gè)判決規(guī)則,使得按這種規(guī)則對(duì)被識(shí)別對(duì)象進(jìn)行分類(lèi)所造成的錯(cuò)誤識(shí)別率最小或引起的損失最小模式識(shí)別系統(tǒng)組成(二)17由訓(xùn)練樣本所得特征空間分布圖18光學(xué)傳感器對(duì)魚(yú)分類(lèi):鱸魚(yú)(Seabass)鮭魚(yú)(Salmon)模式識(shí)別過(guò)程實(shí)例19數(shù)據(jù)獲?。杭茉O(shè)一個(gè)攝像機(jī),采集一些樣本圖像,獲取樣本數(shù)據(jù)預(yù)處理:去噪聲,用一個(gè)分割操作把魚(yú)和魚(yú)之間以及魚(yú)和背景之間分開(kāi)特征提取和選擇:對(duì)單個(gè)魚(yú)的信息進(jìn)行特征選擇,從而通過(guò)測(cè)量某些特征來(lái)減少信息量長(zhǎng)度亮度寬度魚(yú)翅的數(shù)量和形狀嘴的位置,等等…分類(lèi)決策:把特征送入決策分類(lèi)器識(shí)別過(guò)程202122232425數(shù)據(jù)聚類(lèi)、PCA統(tǒng)計(jì)模式識(shí)別結(jié)構(gòu)模式識(shí)別(句法)神經(jīng)網(wǎng)絡(luò)支持向量機(jī)模糊理論特征提取理論分形理論小波分析模式分類(lèi)的主要方法26目標(biāo):用某種相似性度量的方法將原始數(shù)據(jù)組織成有意義的和有用的各種數(shù)據(jù)集。是一種非監(jiān)督學(xué)習(xí)的方法,解決方案是數(shù)據(jù)驅(qū)動(dòng)的。數(shù)據(jù)聚類(lèi)2728基于概率統(tǒng)計(jì)模型得到各類(lèi)別的特征向量的分布,以取得分類(lèi)的方法。特征向量分布的獲得是基于一個(gè)類(lèi)別已知的訓(xùn)練樣本集。是一種監(jiān)督分類(lèi)的方法,分類(lèi)器是概念驅(qū)動(dòng)的。統(tǒng)計(jì)模式識(shí)別29該方法通過(guò)考慮識(shí)別對(duì)象的各部分之間的聯(lián)系來(lái)達(dá)到識(shí)別分類(lèi)的目的。識(shí)別采用結(jié)構(gòu)匹配的形式,通過(guò)計(jì)算一個(gè)匹配程度值(matchingscore)來(lái)評(píng)估一個(gè)未知的對(duì)象或未知對(duì)象某些部分與某種典型模式的關(guān)系如何。當(dāng)成功地制定出了一組可以描述對(duì)象部分之間關(guān)系的規(guī)則后,可以應(yīng)用一種特殊的結(jié)構(gòu)模式識(shí)別方法–句法模式識(shí)別,來(lái)檢查一個(gè)模式基元的序列是否遵守某種規(guī)則,即句法規(guī)則或語(yǔ)法。結(jié)構(gòu)模式識(shí)別30神經(jīng)網(wǎng)絡(luò)是受人腦組織的生理學(xué)啟發(fā)而創(chuàng)立的。由一系列互相聯(lián)系的、相同的單元(神經(jīng)元)組成。相互間的聯(lián)系可以在不同的神經(jīng)元之間傳遞增強(qiáng)或抑制信號(hào)。增強(qiáng)或抑制是通過(guò)調(diào)整神經(jīng)元相互間聯(lián)系的權(quán)重系數(shù)來(lái)(weight)實(shí)現(xiàn)。神經(jīng)網(wǎng)絡(luò)可以實(shí)現(xiàn)監(jiān)督和非監(jiān)督學(xué)習(xí)條件下的分類(lèi)。神經(jīng)網(wǎng)絡(luò)31MP模型32多層感知器如果在輸入和輸出層間加上一層或多層的神經(jīng)元(隱層神經(jīng)元),就可構(gòu)成多層前向網(wǎng)絡(luò),這里稱為多層感知器。

33支持向量機(jī)基于統(tǒng)計(jì)學(xué)習(xí)理論的支持向量機(jī)(supportvectormachines,SVM),作為一種新的強(qiáng)大數(shù)據(jù)分類(lèi)和函數(shù)估計(jì)工具以及神經(jīng)網(wǎng)絡(luò)領(lǐng)域中一種新的重要方法學(xué),得到了巨大的發(fā)展。目前SVM已經(jīng)達(dá)到了一個(gè)比較成熟的水平,被成功地應(yīng)用于模式識(shí)別和目標(biāo)檢測(cè)、函數(shù)估計(jì)、基因分析等領(lǐng)域。34線性分類(lèi)器f

xy+1-1f(x,w,b)=sign(w.x

-b)Howwouldyouclassifythisdata?35f

xy+1-1f(x,w,b)=sign(w.x

-b)Howwouldyouclassifythisdata?36f

x+1-1f(x,w,b)=sign(w.x

-b)Howwouldyouclassifythisdata?37f

x+1-1f(x,w,b)=sign(w.x

-b)Howwouldyouclassifythisdata?38f

xy+1-1f(x,w,b)=sign(w.x

-b)Anyofthesewouldbefine....butwhichisbest?39xy+1-1f(x,w,b)=sign(w.x

-b)線性分類(lèi)器的間隔(margin):到超平面最近的樣本與此超平面之間的距離。40最大間隔f

xy+1-1f(x,w,b)=sign(w.x

-b)具有最大間隔的線性分類(lèi)器叫做最大間隔線性分類(lèi)器。其就是一種最簡(jiǎn)單的支持向量機(jī)(SVM)(稱為線性支持向量機(jī),即LSVM)線性支持向量機(jī)41f

xy+1-1f(x,w,b)=sign(w.x

-b)支持向量(SupportVectors):是那些距離超平面最近的點(diǎn)。具有最大間隔的線性分類(lèi)器叫做最大間隔線性分類(lèi)器。其就是一種最簡(jiǎn)單的支持向量機(jī)(SVM)(稱為線性支持向量機(jī),即LSVM)線性支持向量機(jī)最大間隔42Why…最大間隔?+1-1f(x,w,b)=sign(w.x

-b)支持向量(SupportVectors):是那些距離超平面最近的點(diǎn)。具有最大間隔的線性分類(lèi)器叫做最大間隔線性分類(lèi)器。其就是一種最簡(jiǎn)單的支持向量機(jī)(SVM)(稱為線性支持向量機(jī),即LSVM)線性支持向量機(jī)直觀上感覺(jué)很好.學(xué)習(xí)得到的線性分類(lèi)器.其對(duì)未知樣本的預(yù)測(cè)能力與分類(lèi)器間隔有如下關(guān)系:43OverfittingandunderfittingProblem:howrichclassofclassificationsq(x;θ)touse.underfittingoverfittinggoodfitProblemofgeneralization:asmallempricalriskRempdoesnotimplysmalltrueexpectedriskR.44分形理論的創(chuàng)始人曼德布羅特(Mandelprot)曾說(shuō)過(guò):“浮云不呈球形,山峰不呈錐體,海岸線不是圓圈,樹(shù)干不是光溜溜的,閃電永不會(huì)沿直線行進(jìn)”,說(shuō)的就是人們一般不應(yīng)以簡(jiǎn)單的、理想的體系去對(duì)待實(shí)際體系。

大自然中存在的不規(guī)則的物體,可能存在不同尺度上的相似性,稱為自相似性。例如:

1.布朗微粒軌跡圖存在自相似性:雖然記錄時(shí)間間隔相差很大,但它們?nèi)远季哂邢嗤膹?fù)雜性。

2.不管漫步在海岸邊以厘米量級(jí)觀察,還是從人造衛(wèi)星上以數(shù)千米跨度觀察,海岸線的彎曲的復(fù)雜程度也可能是相同的。以不同尺度去測(cè)量都有相似結(jié)果說(shuō)明,測(cè)量對(duì)象沒(méi)有特征尺寸,它們具有尺度(標(biāo)度)不變性。分形多姿的大自然體形45布朗微粒軌跡

皮蘭(Perrin)于1908年用顯微鏡測(cè)量了布朗運(yùn)動(dòng)的軌跡,他每隔30秒記錄一次某個(gè)微粒的位置,再將相繼得到的兩點(diǎn)位置連成直線,得到一幅由長(zhǎng)短不等的直線段連接成的軌跡圖。他又將測(cè)量時(shí)間間隔縮短為每隔3秒,畫(huà)出的另外一幅微粒的軌跡圖。將兩圖進(jìn)行比較可以發(fā)現(xiàn),兩幅圖雖不盡相同,它們具有同等的復(fù)雜程度。以不同尺度去測(cè)量都有相似結(jié)果說(shuō)明,測(cè)量對(duì)象沒(méi)有特征尺寸,它們具有尺度(標(biāo)度)不變性。46大自然中的自相似體

不管漫步在海岸邊以厘米量級(jí)觀察,還是從人造衛(wèi)星上以數(shù)千米跨度觀察,海岸線的彎曲的復(fù)雜程度也可能是相同的。

大自然中的許多不規(guī)則物體,可能存在不同尺度上的相似性,稱為自相似性。47多彩的大自然大自然是異常復(fù)雜、豐富多彩的,那些簡(jiǎn)單、正規(guī)的理想對(duì)象只是少數(shù)。人們不應(yīng)以簡(jiǎn)單的、理想的體系去對(duì)待實(shí)際體系。48理不清的相軌線49奇妙的計(jì)算圖形50基于測(cè)量對(duì)象體形上的自相似性與標(biāo)度不變性,曼德布羅特提出了分形理論。1973年,在法蘭商學(xué)院講學(xué)期間提出了分形的幾何學(xué)的基本思想,1977年,出版了第一本著作:《分形對(duì)象:形、機(jī)遇與維數(shù)》,1982年,出版了第二本著作:《自然界的形幾何學(xué)》

分形的英文詞是“fractal”,是曼德布羅特創(chuàng)造的,用以表征某些不規(guī)則的幾何形體。分形定義“Afractalisashapemadeofpartssimslartothewholeinsomeway”,“分形是其組成部分以某種方式與整體相似的圖形”,或者說(shuō):

分形是指一類(lèi)體形復(fù)雜的體系,其局部與整體具有相似性。維數(shù):與人們熟悉的整規(guī)體形的整數(shù)維不同,分形體的維數(shù)不一定是整數(shù),它可取連續(xù)變化的各種數(shù)值,稱為分形維數(shù)(簡(jiǎn)稱分維)。根據(jù)分形體不同特征,分形維數(shù)的定義有多種,而且不同維數(shù)定義計(jì)算出的維數(shù)也有一些差別。分形的定義51分形的研究現(xiàn)已大大地超出了數(shù)學(xué)、物理學(xué)的范疇,它不僅廣泛用于處理自然科學(xué)中相關(guān)問(wèn)題,象雷電、相變、聚合物生長(zhǎng)等等,而且在擴(kuò)展到生態(tài)、生命、經(jīng)濟(jì)、人文的許多領(lǐng)域。在地震、氣象的預(yù)報(bào)預(yù)測(cè)、石油的多次開(kāi)采等應(yīng)用領(lǐng)域,甚至在股票漲落分析等方面,分形也都得到了廣泛的應(yīng)用。分形與系統(tǒng)的混沌運(yùn)動(dòng)是密切相關(guān)的,是非線性科學(xué)的一個(gè)重要分支。分形研究領(lǐng)域有如下方面1.數(shù)學(xué),這是分形的基礎(chǔ)領(lǐng)域;2.物理學(xué)、化學(xué)等自然科學(xué),如雷電、相變、聚合物生長(zhǎng)、天文、地理地質(zhì)、生態(tài)、生命等自然現(xiàn)象;3.非線性動(dòng)力系統(tǒng)中的分形研究;4.人文、經(jīng)濟(jì)如股票漲落分析等;5.國(guó)民經(jīng)濟(jì):如地震、氣象的預(yù)報(bào)預(yù)測(cè)、石油的多次開(kāi)采等領(lǐng)域。分形研究52小波分析時(shí)頻分析局部化時(shí)頻分析局部化的特點(diǎn)提高了信號(hào)分析的能力。Fourier變換無(wú)法做局部分析,小波分析正式為了克服Fourier變換這些不足而提出來(lái)的。具有多分辨率(multi-resolution),也叫多尺度

溫馨提示

  • 1. 本站所有資源如無(wú)特殊說(shuō)明,都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請(qǐng)下載最新的WinRAR軟件解壓。
  • 2. 本站的文檔不包含任何第三方提供的附件圖紙等,如果需要附件,請(qǐng)聯(lián)系上傳者。文件的所有權(quán)益歸上傳用戶所有。
  • 3. 本站RAR壓縮包中若帶圖紙,網(wǎng)頁(yè)內(nèi)容里面會(huì)有圖紙預(yù)覽,若沒(méi)有圖紙預(yù)覽就沒(méi)有圖紙。
  • 4. 未經(jīng)權(quán)益所有人同意不得將文件中的內(nèi)容挪作商業(yè)或盈利用途。
  • 5. 人人文庫(kù)網(wǎng)僅提供信息存儲(chǔ)空間,僅對(duì)用戶上傳內(nèi)容的表現(xiàn)方式做保護(hù)處理,對(duì)用戶上傳分享的文檔內(nèi)容本身不做任何修改或編輯,并不能對(duì)任何下載內(nèi)容負(fù)責(zé)。
  • 6. 下載文件中如有侵權(quán)或不適當(dāng)內(nèi)容,請(qǐng)與我們聯(lián)系,我們立即糾正。
  • 7. 本站不保證下載資源的準(zhǔn)確性、安全性和完整性, 同時(shí)也不承擔(dān)用戶因使用這些下載資源對(duì)自己和他人造成任何形式的傷害或損失。

評(píng)論

0/150

提交評(píng)論