




版權說明:本文檔由用戶提供并上傳,收益歸屬內(nèi)容提供方,若內(nèi)容存在侵權,請進行舉報或認領
文檔簡介
模式識別簡介1大媒體計算中心沈復民上節(jié)內(nèi)容回顧模式識別、樣本、特征、類的概念模式識別的應用:舉出至少三種??梢蕴幚砟膸追N信號或數(shù)據(jù)?模式識別系統(tǒng)的組成預處理操作、特征提取與選擇相似度和距離:常用的距離有哪幾種?KNN分類算法的步驟線性分類模型的形式幾種常見的線性模型學習方法(分類器)2
人臉圖像處理基礎人臉圖像的線性表示--線性回歸人臉圖像的稀疏表示基于線性表示的人臉識別系統(tǒng)3人臉圖像處理基礎4灰度圖像圖像在計算機中被表示為數(shù)字的組合,最小灰度值0(黑),最大灰度值255(白)5彩色圖像彩色圖像:每個像素的信息由RGB三原色構成,R、G、B由不同的灰度值來描述。6圖像的向量化7。。。2550向量化為簡化計算,一般將一副人臉圖像表示為向量,多幅圖像的組合表示為矩陣,每一列表示一個圖像。8圖像的信息量每個灰度值(0~255)用1個字節(jié)表示灰度圖像256x25664KB彩色圖像512x512768KB電視圖像:每秒60幀,分辨率1920x1080,請問一小
時的電視節(jié)目(未壓縮)占用的存儲量是多少?9典型圖像處理操作圖像增強10典型圖像處理操作圖像復原11典型圖像處理操作圖像壓縮12人臉圖像的線性表示13線性回歸描述因變量y
的平均值或期望值如何依賴于自變量x1,x2
,…,xp的方程——(多元)線性回歸方程多元線性回歸方程的形式為
y=0+1x1
+2x2
+…+p
xp1,2,…,
p稱為回歸系數(shù),y,xi為n維列向量。i
表示當其他變量保持不變,xi每變動一個單位時y的變動值。14二元線性回歸方程的直觀解釋15回歸參數(shù)估計
16
最小二乘的矩陣形式
17
回歸估計的正則化
18
正則化項
L1范數(shù)正則化(稀疏表示)
19L1范數(shù)正則化人臉圖像的線性表示一幅人臉圖像可以近似表示為一組人臉圖像的線性組合20=0.5*+0.4*+0.1*
估計出的圖像原圖像
人臉圖像的稀疏表示21=0.2*+0*+0*+…+0.8*+0*+0*+0*
稀疏表示效果22原圖像表示系數(shù)圖像庫誤差圖像人臉識別系統(tǒng)設計
--基于線性表示的人臉識別23概要我們的任務是啥?我們有啥?如何提取人臉特征?用啥分類算法?如何評價我們的系統(tǒng)?24人臉識別的任務
25?訓練數(shù)據(jù)庫
26特征提取任何模式識別的特征提取算法。常用的人臉特征提取算法:LBP,Gabor。。。最簡單、最常用的的特征——灰度值27特征變換1:重采樣28300x200=6000030x20=600重采樣圖像相鄰像素之間有很大的相似性。方法1:去近鄰像素的灰度值方法2:插值特征變換2:線性變換
29
30PCA的解釋把數(shù)據(jù)變換到一個新的坐標系統(tǒng)中,使得這一數(shù)據(jù)的任何投影的第一大方差在第一個坐標(稱為第一主成分)上,第二大方差在第二個坐標(第二主成分)上,依次類推。31最直觀的分類思想32回顧:K最近鄰分類器(KNN)計算待分類點到所有訓練樣本的距離,選出距離最短的k個訓練樣本;統(tǒng)計k個樣本所在的類;將待分類點分配給包含k個訓練樣本中數(shù)目最多的類。33最近鄰分類(NN)——KNN的簡化計算待分類點到所有訓練樣本的距離;將待分類點分配給距離最小的那個訓練樣本所在的類。34分類的關鍵:計算待識別樣本到各類的距離?;蛘哂嬎愦R別樣本和各類之間的相似度。NN的分類依據(jù):用距離待識別樣本最近的樣本代表本類,該距離作為本類到待識別樣本的距離。35基于線性表示(線性回歸)的分類器36
37
基于線性回歸的分類準則測試圖像到第i類的距離:測試圖像在第i類的表示誤差。38
基于線性表示的人臉識別算法流程將訓練圖像和測試圖像表示為列向量:,將圖像進行特征變換,e.g.,PCA:,利用最小二乘法求得表示系數(shù)計算測試圖像到各類的距離:39基于稀疏表示的人臉識別出發(fā)點:不同類別的人臉圖像之間存在相似性,例如人臉結(jié)構(分為額頭、眼睛、鼻子、嘴等不同部分)、光照、姿勢等。方法:用所有類別的人臉圖像來表示測試圖像。40
41基于稀疏表示人臉識別的分類準則分類準則1:表示誤差42
基于稀疏表示人臉識別的分類準則分類準則2:表示稀疏本類樣本對應的表示系數(shù)更大。43分類準則2:表示稀疏44
人臉識別系統(tǒng)評估
45人臉識別的應用46計算機視覺的三個不同階段low-levelimages(圖像)images(圖像)mid-level images(圖像)features(特征)high-level features(特征)analysis(分析)幾個例子Low-Levelblurring(模糊)sharpening(增強)幾個例子cannyORTMid-LeveloriginalimageedgeimageedgeimagecirculararcsandlinesegmentsdatastructureLow-LevelMid-levelK-meansclusteringoriginalcolorimageregionsofhomogeneouscolordatastructure幾個例子edgeimageconsistentlineclusterslow-levelmid-levelhigh-levelLowtohigh-LevelBuilding
Recognition幾個例子
其他計算機視覺應用行人檢測(PedestrianDetection)行人檢測(PedestrianDetection)應用范圍:智能輔助駕駛智能監(jiān)控行人分析智能機器人主要問題:性能和速度方面不能達到一個權衡
深度學習(DeepLearning)深度學習(Deeplearning)深度學習通過多角度、多層次的對訓練數(shù)據(jù)學習,學出最具代表性的特征信息。深度學習已經(jīng)取代傳統(tǒng)人工設計的特征算法(如:SIFT,HOG,LBP),成為一種流行的特征學習方法。深度學習(DeepLearning)在計算機視覺領域,目前最流行的神經(jīng)網(wǎng)絡是卷積神經(jīng)網(wǎng)絡目前的CNN有多種不同的網(wǎng)絡結(jié)構,但所有網(wǎng)絡結(jié)構都是主要由卷積層、池化層、全連接層、輸出層組成。直觀理解:可視化卷積層直觀理解:可視化卷積層
最左邊的圖像是原圖像,作者蓋住不同的區(qū)域,來分析對于一張圖片,經(jīng)過五次卷積之后,到底是如何判斷的,我們看到卷積到最后(左三),比較凸顯出來的是狗的頭部,左二和右二的意思是,當我們遮住不同的區(qū)域,判斷是狗的幾率,紅色區(qū)域代表概率很高,藍色區(qū)域代表概率很低,我們發(fā)現(xiàn),當我們遮擋住狗的頭的地方的時候,我們得到這個物體時狗的概率最低。
VisualizingandUnderstandingConvolutionalNetworks --MatthewD.ZeilerandRobFergus
溫馨提示
- 1. 本站所有資源如無特殊說明,都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請下載最新的WinRAR軟件解壓。
- 2. 本站的文檔不包含任何第三方提供的附件圖紙等,如果需要附件,請聯(lián)系上傳者。文件的所有權益歸上傳用戶所有。
- 3. 本站RAR壓縮包中若帶圖紙,網(wǎng)頁內(nèi)容里面會有圖紙預覽,若沒有圖紙預覽就沒有圖紙。
- 4. 未經(jīng)權益所有人同意不得將文件中的內(nèi)容挪作商業(yè)或盈利用途。
- 5. 人人文庫網(wǎng)僅提供信息存儲空間,僅對用戶上傳內(nèi)容的表現(xiàn)方式做保護處理,對用戶上傳分享的文檔內(nèi)容本身不做任何修改或編輯,并不能對任何下載內(nèi)容負責。
- 6. 下載文件中如有侵權或不適當內(nèi)容,請與我們聯(lián)系,我們立即糾正。
- 7. 本站不保證下載資源的準確性、安全性和完整性, 同時也不承擔用戶因使用這些下載資源對自己和他人造成任何形式的傷害或損失。
最新文檔
- 私人教練與學員健身成果合同
- 租賃住宅合同范本簡版
- 南京勞動合同模板合同范本(勞務派遣律師定制)
- 資產(chǎn)收購合同
- 歷史文化名城拍攝許可合同
- 廣告宣傳合同范文
- 商品供應合同范本
- 批發(fā)業(yè)渠道管理與拓展考核試卷
- D打印技術在汽車輕量化設計的應用考核試卷
- 工業(yè)控制計算機在智能機器人編程與控制中的實踐考核試卷
- 護理分級標準
- 水池維修改造方案
- 國網(wǎng)陜西省電力有限公司高校畢業(yè)生招聘考試試題及答案
- 非公司企業(yè)法人章程范本樣本
- 《高溫熔融金屬吊運安全規(guī)程》(AQ7011-2018)
- 電機與拖動(高職)全套教學課件
- 散裝液體危險貨物申報員培訓講義
- 山東春季高考-汽車專業(yè)必備考試題庫(學校)
- 返家鄉(xiāng)社會實踐
- 小學生網(wǎng)絡安全省公開課金獎全國賽課一等獎微課獲獎課件
- 2022小學語文新課程標準模擬測試題六份答案
評論
0/150
提交評論