機器學習原理與應用電子教案 4圖像處理基礎(chǔ)_第1頁
機器學習原理與應用電子教案 4圖像處理基礎(chǔ)_第2頁
機器學習原理與應用電子教案 4圖像處理基礎(chǔ)_第3頁
機器學習原理與應用電子教案 4圖像處理基礎(chǔ)_第4頁
機器學習原理與應用電子教案 4圖像處理基礎(chǔ)_第5頁
已閱讀5頁,還剩2頁未讀, 繼續(xù)免費閱讀

下載本文檔

版權(quán)說明:本文檔由用戶提供并上傳,收益歸屬內(nèi)容提供方,若內(nèi)容存在侵權(quán),請進行舉報或認領(lǐng)

文檔簡介

備課日期:年月日授課時間課時(理論+實驗)周次星期:節(jié)次:授課課題圖像處理基礎(chǔ)教學目標1.理解圖像處理的意義。2.掌握圖像處理關(guān)鍵術(shù)語與常用方法。3.了解圖像擴充技術(shù)。教學重點1.圖像處理關(guān)鍵術(shù)語。2.圖像處理常用方法。教學準備PPT、點名冊等。教學方法案例法、探究法。教學過程設(shè)計備注課題引入【思考】人類從客觀世界獲取信息的渠道有哪些?哪個渠道最重要?【關(guān)鍵】視覺的重要性以及圖像處理的重要性。【時間】分鐘。教學步驟及主要內(nèi)容【主板書】§4.圖像處理基礎(chǔ)圖像處理意義【主板書】1.意義1.圖像獲取與處理的重要性。2.圖像處理技術(shù)的應用?!糚PT〗圖像處理技術(shù)應用實例。【時間】分鐘?!咎釂枴俊D像處理關(guān)鍵術(shù)語【主板書】2.關(guān)鍵術(shù)語1.RGB顏色模型:任意顏色可由取值為0-255的紅(R)、綠(G)、藍(B)三種顏色混合而成,三種顏色比例不同,最終合成后的顏色也不同。例如:純紅色對應的RGB分別為255、0與0;灰色對應的RGB三個值相等(除0和255);白色對應RGB值均為255;黑色對應的RGB值均為0。2.圖像基本屬性(1)亮度亮度是指彩色光作用于人眼時在視覺上引起的明暗程度;如果是灰度圖像(每個像素取值范圍為0-255),灰度值越高則圖像越亮。(2)對比度對比度指圖像中不同顏色最亮處和最暗處之間的差別(對比度=最大灰度值/最小灰度值),差別越大對比度越高;一般而言,對比度越大,圖像越清晰醒目,色彩也越鮮明艷麗,但對比度過大,圖像就會顯得很刺眼。(3)飽和度飽和度指圖像顏色的深淺程度。飽和度越高,顏色就越深或飽滿,即所謂的青翠欲滴的感覺。飽和度越低,顏色就越淺或陳舊(飽和度為0時,圖像就為灰度圖像);高飽和度的彩色光可因摻入白光而降低純度或變淺,變成低飽和度的色光。(4)色相色調(diào)指顏色的種類(如彩虹由紅、橙、黃、綠、青、藍、紫七色組成),是區(qū)別各種不同色彩的最準確的標準。任何黑白灰以外的顏色都有色相的屬性,而對于灰度圖像,當色調(diào)級別為255時,就是白色,當級別為0時,就是黑色,中間是各種程度不同的灰色。3.圖像坐標與顏色(1)圖像坐標:以圖像像素矩陣的左上角為原點、以圖像像素矩陣列數(shù)與行數(shù)分別為橫坐標與縱坐標建立以像素為單位的直角坐標系,則可確定圖像像素矩陣中任意像素的位置。(2)顏色或灰度值:圖像像素矩陣中像素的具體值決定了其最終呈現(xiàn)的顏色?!糚PT〗圖像坐標與顏色圖示與實例。4.分辨率(1)分辨率定義:水平分辨率與垂直分辨率,兩者分別指圖像在水平與垂直兩個方向各有多少像素。(2)分辨率指標:指標DPI是指每英寸圖像內(nèi)的像素數(shù)?!緯r間】分鐘?!咎釂枴俊H?、圖像處理常用方法【主板書】3.常用方法〖PPT〗圖像處理結(jié)果。1.PIL圖像處理類庫:最重要的模塊為Image,利用相關(guān)函數(shù)可以方便地對圖像進行圖像縮放、裁剪、旋轉(zhuǎn)、顏色轉(zhuǎn)換等處理。PIL庫Image類庫的導入方式如下:fromPILimportImage2.圖像處理(1)加載并顯示圖像:采用open()與show()函數(shù)加載與顯示圖像。im=Image.open('sample.jpg')#打開圖像im.show()#顯示圖像或采用Matplotlib庫imshow()也可顯示已加載圖像,即:plt.imshow(im)plt.axis('off')#不顯示坐標軸(2)獲取圖像尺寸:圖像size、format與mode等屬性。(3)保存圖像(可更改格式):save()函數(shù)。im.save('002.png','PNG')【強化與拓展】圖像常用格式。(4)圖像與NumPy數(shù)組之間的轉(zhuǎn)換:np.array()函數(shù)與mage.fromarray()函數(shù)。im_array=np.array(im)#轉(zhuǎn)換為NumPy數(shù)組im_new=Image.fromarray(im_array)#NumPy數(shù)組轉(zhuǎn)換為圖像【強化與拓展】利用數(shù)組切片方式可對像素進行批量操作。im_array[i,:]=im_array[j,:]#將第j行的數(shù)值賦值給第i行im_array[:,i]=255#將第i列的所有數(shù)值設(shè)為255im_array[10:20,30:40]#10-20行與30-40列(不含第20行與第40列)im_array[:,-1]#獲取最后1列注意,負序號表示逆向計數(shù)。(5)顯示指定圖像通道im_1=plt.imshow(im_array[:,:,0])#顯示第1個通道【強化與拓展】利用set_cmap()設(shè)置灰度顏色映射表。(6)RGB圖像轉(zhuǎn)換為灰度圖與二值圖利用convert()函數(shù)可將RGB圖像轉(zhuǎn)換為灰度與二值圖像。im_gray=im.convert('L')#轉(zhuǎn)換為灰度圖像im_bin=im.convert('1')#轉(zhuǎn)換為二值圖像(7)獲取像素RGB值可通過NumPy數(shù)組操作的方式獲取指定像素RGB值,即:rc=[100,200]#指定坐標RGB=im_array[rc[0],rc[1],:]#獲取像素RGB值或者直接使用getpixel()獲取指定像素RGB值,即:RGB=im.getpixel((200,100))(8)修改像素RGB值im_array[rc[0],rc[1],:]=[255,0,0]#將指定像素顏色值修改為紅色或直接采用putpixel()函數(shù)進行修改,即:im.putpixel((200,100),(255,0,0))【知識要點】批量修改像素RGB值。(9)添加噪聲c,r=im.sizeforiinrange(10000):x=np.random.randint(0,c)y=np.random.randint(0,r)im_array[y,x,:]=255im_new=Image.fromarray(im_array);im_new.show()(10)調(diào)整尺寸可利用resize()函數(shù)對圖像尺寸進行修改,即:im_small=im.resize((128,128))(11)旋轉(zhuǎn)可利用rotate()函數(shù)對圖像進行旋轉(zhuǎn)處理,即:im_rotate=im.rotate(45)#旋轉(zhuǎn)45度(12)圖像區(qū)域截取可使用crop()函數(shù)方法幅圖像中截取指定區(qū)域,其中區(qū)域使用坐標依次是(左,上,右,下)的四元組指定,即:box=(10,20,400,300)#指定區(qū)域sub_im=im.crop(box)#截取區(qū)域(13)特效濾鏡PIL庫ImageFilter模塊集成模糊、銳化、邊緣強化、浮雕等特效,通過調(diào)用相關(guān)函數(shù)即可產(chǎn)生相應的效果;示例如下:im_filter=im.filter(ImageFilter.CONTOUR)#輪廓im_filter=im.filter(ImageFilter.GaussianBlur(radius=2))#模糊(參數(shù)radius用于控制模糊的程度)im_filter=im.filter(ImageFilter.EDGE_ENHANCE)#邊緣增強發(fā)使得圖像中邊緣部分更加明顯。im_filter=im.filter(ImageFilter.EMBOSS)#浮雕im_filter=im.filter(ImageFilter.FIND_EDGES)#邊緣檢測(14)繪制點線Matplotlib庫不但具有強大的繪圖功能,可以對圖像中興趣點或區(qū)域進行標注。plt.imshow(im)x=[300,300,400,400]y=[200,300,200,300]plt.plot(x,y,'ro')#使用紅色星狀標記繪制點plt.plot([x[0],x[3]],[y[0],y[3]],'b')#連接第1與4點plt.plot([x[1],x[2]],[y[1],y[2]],'g')#連接第2與3點plt.show()(15)交互式標注當需要通過用戶交互的方式在獲取圖像像素坐標時,可通過Matplotlib庫Pylab模塊中的ginput()函數(shù)實現(xiàn)。importmatplotlib.pylabasmpplt.imshow(im)xy=mp.ginput(3)#在圖像中點擊三下以將點擊處坐標保存至xy【時間】分鐘。【提問】。圖像擴充技術(shù)【主板書】4.圖像擴充1.概述:在利用機器學習算法(如深度神經(jīng)網(wǎng)絡(luò))構(gòu)建圖像識別模型時,大量具有代表性的圖像是基礎(chǔ),圖像擴充的目的是對原始圖像進行隨機變換(平移、剪裁、旋轉(zhuǎn)、色彩變換等)以產(chǎn)生一些相似但不同的圖像,從而擴大訓練數(shù)據(jù)集的規(guī)模,降低過擬合的發(fā)生的可能性。此外,在圖像擴充中,隨機改變訓練樣本可以降低模型對某些屬性的依賴,從而提高模型的泛化能力。2.Torchvision庫:包含豐富的圖像預處理操作。importtorchvision.transformsasT#導入圖像變換類庫3.擴充操作(1)圖像剪裁以圖像中心作為基準點,通過指定尺寸剪裁圖像區(qū)域。其中,圖像區(qū)域尺寸可通過元組tuple(H,W)或通過整數(shù)(寬高相等)指定。transform=T.CenterCrop(100)#定義圖像剪裁對象sub_im=transform(im)#對圖像進行剪裁plt.imshow(np.array(result))(2)改變圖像亮度、對比度與飽和度transform=T.ColorJitter(brightness=0.8,contrast=0.3,saturation=0.9,hue=0.2)sub_im=transform(im)(3)截取五個圖像區(qū)域在圖像四個角及中心處剪裁五個圖像區(qū)域。transform=T.FiveCrop(100)sub_ims=transform(im)(4)圖像灰度處理對圖像進行灰度化處理。transform=T.Grayscale(num_output_channels=3)#參數(shù)可設(shè)置為1或3(3表示RGB值通道數(shù)相同)im_gray=transform(im)plt.imshow(im_gray,cmap='gray')(5)圖像四邊填充transform=T.Pad(padding=(2,4,6,8),fill=(255,0,0),padding_mode='constant')result=transform(im)【強化與拓展】padding、fill與padding_mode等參數(shù)設(shè)置。(6)隨機仿射變換transform=T.RandomAffine(degrees=(-30,30),translate=None,scale=None,shear=30,resample=Image.BILINEAR,fillcolor=(255,0,0))im_new=transform(im)【強化與拓展】degree、translate、scale、shear、resample與fillcolor等參數(shù)設(shè)置。(7)隨機裁剪transform=T.RandomCrop((100,200))sub_im=transform(im)(8)按概率隨機灰度transform=T.RandomGrayscale(p=0.1)sub_im=transform(im)(9)按概率水平翻轉(zhuǎn)transform=T.RandomHorizontalFlip(p=0.9)im_new=transform(im)(10)按概率垂直翻轉(zhuǎn)transform=T.RandomVerticalFlip(p=0.9)im_new=transform(im)(11)調(diào)整尺寸transform=T.Resize((20,30),interpolation=Image.BILINEAR)im_new=transform(im)(12)以指定概率隨機選擇預處理操作transforms=[T.CenterCrop(160),T.Pad(padding=(2,4,6,8),fill=(255,255,255),padding_mode='constant')]transform=T.RandomApply(transforms,p=0.9)im_new=transform(im)plt.imshow(im_new)(13)隨機選擇預處理操作transforms=[T.CenterCrop(160),T.Pad(padding=(2,4,6,8),fill=(255,255,255),padding_mode='constant')]transform=T.RandomChoice(transform

溫馨提示

  • 1. 本站所有資源如無特殊說明,都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請下載最新的WinRAR軟件解壓。
  • 2. 本站的文檔不包含任何第三方提供的附件圖紙等,如果需要附件,請聯(lián)系上傳者。文件的所有權(quán)益歸上傳用戶所有。
  • 3. 本站RAR壓縮包中若帶圖紙,網(wǎng)頁內(nèi)容里面會有圖紙預覽,若沒有圖紙預覽就沒有圖紙。
  • 4. 未經(jīng)權(quán)益所有人同意不得將文件中的內(nèi)容挪作商業(yè)或盈利用途。
  • 5. 人人文庫網(wǎng)僅提供信息存儲空間,僅對用戶上傳內(nèi)容的表現(xiàn)方式做保護處理,對用戶上傳分享的文檔內(nèi)容本身不做任何修改或編輯,并不能對任何下載內(nèi)容負責。
  • 6. 下載文件中如有侵權(quán)或不適當內(nèi)容,請與我們聯(lián)系,我們立即糾正。
  • 7. 本站不保證下載資源的準確性、安全性和完整性, 同時也不承擔用戶因使用這些下載資源對自己和他人造成任何形式的傷害或損失。

評論

0/150

提交評論