深度學(xué)習(xí)入門(基于Python的理論與實現(xiàn))_第1頁
深度學(xué)習(xí)入門(基于Python的理論與實現(xiàn))_第2頁
深度學(xué)習(xí)入門(基于Python的理論與實現(xiàn))_第3頁
深度學(xué)習(xí)入門(基于Python的理論與實現(xiàn))_第4頁
深度學(xué)習(xí)入門(基于Python的理論與實現(xiàn))_第5頁
已閱讀5頁,還剩246頁未讀, 繼續(xù)免費(fèi)閱讀

下載本文檔

版權(quán)說明:本文檔由用戶提供并上傳,收益歸屬內(nèi)容提供方,若內(nèi)容存在侵權(quán),請進(jìn)行舉報或認(rèn)領(lǐng)

文檔簡介

深度學(xué)習(xí)入門基于Python的理論與實現(xiàn)目錄\h第1章Python入門\h1.1Python是什么\h1.2Python的安裝\h1.2.1Python版本\h1.2.2使用的外部庫\h1.2.3Anaconda發(fā)行版\h1.3Python解釋器\h1.3.1算術(shù)計算\h1.3.2數(shù)據(jù)類型\h1.3.3變量\h1.3.4列表\h1.3.5字典\h1.3.6布爾型\h1.3.7if語句\h1.3.8for語句\h1.3.9函數(shù)\h1.4Python腳本文件\h1.4.1保存為文件\h1.4.2類\h1.5NumPy\h1.5.1導(dǎo)入NumPy\h1.5.2生成NumPy數(shù)組\h1.5.3NumPy的算術(shù)運(yùn)算\h1.5.4NumPy的N維數(shù)組\h1.5.5廣播\h1.5.6訪問元素\h1.6Matplotlib\h1.6.1繪制簡單圖形\h1.6.2pyplot的功能\h1.6.3顯示圖像\h1.7小結(jié)\h第2章感知機(jī)\h2.1感知機(jī)是什么\h2.2簡單邏輯電路\h2.2.1與門\h2.2.2與非門和或門\h2.3感知機(jī)的實現(xiàn)\h2.3.1簡單的實現(xiàn)\h2.3.2導(dǎo)入權(quán)重和偏置\h2.3.3使用權(quán)重和偏置的實現(xiàn)\h2.4感知機(jī)的局限性\h2.4.1異或門\h2.4.2線性和非線性\h2.5多層感知機(jī)\h2.5.1已有門電路的組合\h2.5.2異或門的實現(xiàn)\h2.6從與非門到計算機(jī)\h2.7小結(jié)\h第3章神經(jīng)網(wǎng)絡(luò)\h3.1從感知機(jī)到神經(jīng)網(wǎng)絡(luò)\h3.1.1神經(jīng)網(wǎng)絡(luò)的例子\h3.1.2復(fù)習(xí)感知機(jī)\h3.1.3激活函數(shù)登場\h3.2激活函數(shù)\h3.2.1sigmoid函數(shù)\h3.2.2階躍函數(shù)的實現(xiàn)\h3.2.3階躍函數(shù)的圖形\h3.2.4sigmoid函數(shù)的實現(xiàn)\h3.2.5sigmoid函數(shù)和階躍函數(shù)的比較\h3.2.6非線性函數(shù)\h3.2.7ReLU函數(shù)\h3.3多維數(shù)組的運(yùn)算\h3.3.1多維數(shù)組\h3.3.2矩陣乘法\h3.3.3神經(jīng)網(wǎng)絡(luò)的內(nèi)積\h3.43層神經(jīng)網(wǎng)絡(luò)的實現(xiàn)\h3.4.1符號確認(rèn)\h3.4.2各層間信號傳遞的實現(xiàn)\h3.4.3代碼實現(xiàn)小結(jié)\h3.5輸出層的設(shè)計\h3.5.1恒等函數(shù)和softmax函數(shù)\h3.5.2實現(xiàn)softmax函數(shù)時的注意事項\h3.5.3softmax函數(shù)的特征\h3.5.4輸出層的神經(jīng)元數(shù)量\h3.6手寫數(shù)字識別\h3.6.1MNIST數(shù)據(jù)集\h3.6.2神經(jīng)網(wǎng)絡(luò)的推理處理\h3.6.3批處理\h3.7小結(jié)\h第4章神經(jīng)網(wǎng)絡(luò)的學(xué)習(xí)\h4.1從數(shù)據(jù)中學(xué)習(xí)\h4.1.1數(shù)據(jù)驅(qū)動\h4.1.2訓(xùn)練數(shù)據(jù)和測試數(shù)據(jù)\h4.2損失函數(shù)\h4.2.1均方誤差\h4.2.2交叉熵誤差\h4.2.3mini-batch學(xué)習(xí)\h4.2.4mini-batch版交叉熵誤差的實現(xiàn)\h4.2.5為何要設(shè)定損失函數(shù)\h4.3數(shù)值微分\h4.3.1導(dǎo)數(shù)\h4.3.2數(shù)值微分的例子\h4.3.3偏導(dǎo)數(shù)\h4.4梯度\h4.4.1梯度法\h4.4.2神經(jīng)網(wǎng)絡(luò)的梯度\h4.5學(xué)習(xí)算法的實現(xiàn)\h4.5.12層神經(jīng)網(wǎng)絡(luò)的類\h4.5.2mini-batch的實現(xiàn)\h4.5.3基于測試數(shù)據(jù)的評價\h4.6小結(jié)\h第5章誤差反向傳播法\h5.1計算圖\h5.1.1用計算圖求解\h5.1.2局部計算\h5.1.3為何用計算圖解題\h5.2鏈?zhǔn)椒▌t\h5.2.1計算圖的反向傳播\h5.2.2什么是鏈?zhǔn)椒▌t\h5.2.3鏈?zhǔn)椒▌t和計算圖\h5.3反向傳播\h5.3.1加法節(jié)點(diǎn)的反向傳播\h5.3.2乘法節(jié)點(diǎn)的反向傳播\h5.3.3蘋果的例子\h5.4簡單層的實現(xiàn)\h5.4.1乘法層的實現(xiàn)\h5.4.2加法層的實現(xiàn)\h5.5激活函數(shù)層的實現(xiàn)\h5.5.1ReLU層\h5.5.2Sigmoid層\h5.6Affine/Softmax層的實現(xiàn)\h5.6.1Affine層\h5.6.2批版本的Affine層\h5.6.3Softmax-with-Loss層\h5.7誤差反向傳播法的實現(xiàn)\h5.7.1神經(jīng)網(wǎng)絡(luò)學(xué)習(xí)的全貌圖\h5.7.2對應(yīng)誤差反向傳播法的神經(jīng)網(wǎng)絡(luò)的實現(xiàn)\h5.7.3誤差反向傳播法的梯度確認(rèn)\h5.7.4使用誤差反向傳播法的學(xué)習(xí)\h5.8小結(jié)\h第6章與學(xué)習(xí)相關(guān)的技巧\h6.1參數(shù)的更新\h6.1.1探險家的故事\h6.1.2SGD\h6.1.3SGD的缺點(diǎn)\h6.1.4Momentum\h6.1.5AdaGrad\h6.1.6Adam\h6.1.7使用哪種更新方法呢\h6.1.8基于MNIST數(shù)據(jù)集的更新方法的比較\h6.2權(quán)重的初始值\h6.2.1可以將權(quán)重初始值設(shè)為0嗎\h6.2.2隱藏層的激活值的分布\h6.2.3ReLU的權(quán)重初始值\h6.2.4基于MNIST數(shù)據(jù)集的權(quán)重初始值的比較\h6.3BatchNormalization\h6.3.1BatchNormalization的算法\h6.3.2BatchNormalization的評估\h6.4正則化\h6.4.1過擬合\h6.4.2權(quán)值衰減\h6.4.3Dropout\h6.5超參數(shù)的驗證\h6.5.1驗證數(shù)據(jù)\h6.5.2超參數(shù)的最優(yōu)化\h6.5.3超參數(shù)最優(yōu)化的實現(xiàn)\h6.6小結(jié)\h第7章卷積神經(jīng)網(wǎng)絡(luò)\h7.1整體結(jié)構(gòu)\h7.2卷積層\h7.2.1全連接層存在的問題\h7.2.2卷積運(yùn)算\h7.2.3填充\h7.2.4步幅\h7.2.53維數(shù)據(jù)的卷積運(yùn)算\h7.2.6結(jié)合方塊思考\h7.2.7批處理\h7.3池化層\h7.4卷積層和池化層的實現(xiàn)\h7.4.14維數(shù)組\h7.4.2基于im2col的展開\h7.4.3卷積層的實現(xiàn)\h7.4.4池化層的實現(xiàn)\h7.5CNN的實現(xiàn)\h7.6CNN的可視化\h7.6.1第1層權(quán)重的可視化\h7.6.2基于分層結(jié)構(gòu)的信息提取\h7.7具有代表性的CNN\h7.7.1LeNet\h7.7.2AlexNet\h7.8小結(jié)\h第8章深度學(xué)習(xí)\h8.1加深網(wǎng)絡(luò)\h8.1.1向更深的網(wǎng)絡(luò)出發(fā)\h8.1.2進(jìn)一步提高識別精度\h8.1.3加深層的動機(jī)\h8.2深度學(xué)習(xí)的小歷史\h8.2.1ImageNet\h8.2.2VGG\h8.2.3GoogLeNet\h8.2.4ResNet\h8.3深度學(xué)習(xí)的高速化\h8.3.1需要努力解決的問題\h8.3.2基于GPU的高速化\h8.3.3分布式學(xué)習(xí)\h8.3.4運(yùn)算精度的位數(shù)縮減\h8.4深度學(xué)習(xí)的應(yīng)用案例\h8.4.1物體檢測\h8.4.2圖像分割\h8.4.3圖像標(biāo)題的生成\h8.5深度學(xué)習(xí)的未來\h8.5.1圖像風(fēng)格變換\h8.5.2圖像的生成\h8.5.3自動駕駛\h8.5.4DeepQ-Network(強(qiáng)化學(xué)習(xí))\h8.6小結(jié)\h附錄ASoftmax-with-Loss層的計算圖\hA.1正向傳播\hA.2反向傳播\hA.3小結(jié)

注:原文檔電子版,非掃描,需要的請下載本文檔后留言謝謝。第1章Python入門Python這一編程語言已經(jīng)問世20多年了,在這期間,Python不僅完成了自身的進(jìn)化,還獲得了大量的用戶?,F(xiàn)在,Python作為最具人氣的編程語言,受到了許多人的喜愛。接下來我們將使用Python實現(xiàn)深度學(xué)習(xí)系統(tǒng)。不過在這之前,本章將簡單地介紹一下Python,看一下它的使用方法。已經(jīng)掌握了Python、NumPy、Matplotlib等知識的讀者,可以跳過本章,直接閱讀后面的章節(jié)。1.1Python是什么Python是一個簡單、易讀、易記的編程語言,而且是開源的,可以免費(fèi)地自由使用。Python可以用類似英語的語法編寫程序,編譯起來也不費(fèi)力,因此我們可以很輕松地使用Python。特別是對首次接觸編程的人士來說,Python是最合適不過的語言。事實上,很多高校和大專院校的計算機(jī)課程均采用Python作為入門語言。此外,使用Python不僅可以寫出可讀性高的代碼,還可以寫出性能高(處理速度快)的代碼。在需要處理大規(guī)模數(shù)據(jù)或者要求快速響應(yīng)的情況下,使用Python可以穩(wěn)妥地完成。因此,Python不僅受到初學(xué)者的喜愛,同時也受到專業(yè)人士的喜愛。實際上,Google、Microsoft、Facebook等戰(zhàn)斗在IT行業(yè)最前沿的企業(yè)也經(jīng)常使用Python。再者,在科學(xué)領(lǐng)域,特別是在機(jī)器學(xué)習(xí)、數(shù)據(jù)科學(xué)領(lǐng)域,Python也被大量使用。Python除了高性能之外,憑借著NumPy、SciPy等優(yōu)秀的數(shù)值計算、統(tǒng)計分析庫,在數(shù)據(jù)科學(xué)領(lǐng)域占有不可動搖的地位。深度學(xué)習(xí)的框架中也有很多使用Python的場景,比如Caffe、TensorFlow、Chainer、Theano等著名的深度學(xué)習(xí)框架都提供了Python接口。因此,學(xué)習(xí)Python對使用深度學(xué)習(xí)框架大有益處。綜上,Python是最適合數(shù)據(jù)科學(xué)領(lǐng)域的編程語言。而且,Python具有受眾廣的優(yōu)秀品質(zhì),從初學(xué)者到專業(yè)人士都在使用。因此,為了完成本書的從零開始實現(xiàn)深度學(xué)習(xí)的目標(biāo),Python可以說是最合適的工具。1.2Python的安裝下面,我們首先將Python安裝到當(dāng)前環(huán)境(電腦)上。這里說明一下安裝時需要注意的一些地方。1.2.1Python版本Python有Python2.x和Python3.x兩個版本。如果我們調(diào)查一下目前Python的使用情況,會發(fā)現(xiàn)除了最新的版本3.x以外,舊的版本2.x仍在被大量使用。因此,在安裝Python時,需要慎重選擇安裝Python的哪個版本。這是因為兩個版本之間沒有兼容性(嚴(yán)格地講,是沒有“向后兼容性”),也就是說,會發(fā)生用Python3.x寫的代碼不能被Python2.x執(zhí)行的情況。本書中使用Python3.x,只安裝了Python2.x的讀者建議另外安裝一下Python3.x。1.2.2使用的外部庫本書的目標(biāo)是從零開始實現(xiàn)深度學(xué)習(xí)。因此,除了NumPy庫和Matplotlib庫之外,我們極力避免使用外部庫。之所以使用這兩個庫,是因為它們可以有效地促進(jìn)深度學(xué)習(xí)的實現(xiàn)。NumPy是用于數(shù)值計算的庫,提供了很多高級的數(shù)學(xué)算法和便利的數(shù)組(矩陣)操作方法。本書中將使用這些便利的方法來有效地促進(jìn)深度學(xué)習(xí)的實現(xiàn)。Matplotlib是用來畫圖的庫。使用Matplotlib能將實驗結(jié)果可視化,并在視覺上確認(rèn)深度學(xué)習(xí)運(yùn)行期間的數(shù)據(jù)。本書將使用下列編程語言和庫。Python3.x(2016年8月時的最新版本是3.5)NumPyMatplotlib下面將為需要安裝Python的讀者介紹一下Python的安裝方法。已經(jīng)安裝了Python的讀者,請?zhí)^這一部分內(nèi)容。1.2.3Anaconda發(fā)行版Python的安裝方法有很多種,本書推薦使用Anaconda這個發(fā)行版。發(fā)行版集成了必要的庫,使用戶可以一次性完成安裝。Anaconda是一個側(cè)重于數(shù)據(jù)分析的發(fā)行版,前面說的NumPy、Matplotlib等有助于數(shù)據(jù)分析的庫都包含在其中1。1Anaconda作為一個針對數(shù)據(jù)分析的發(fā)行版,包含了許多有用的庫,而本書中實際上只會使用其中的NumPy庫和Matplotlib庫。因此,如果想保持輕量級的開發(fā)環(huán)境,單獨(dú)安裝這兩個庫也是可以的?!g者注如前所述,本書將使用Python3.x版本,因此Anaconda發(fā)行版也要安裝3.x的版本。請讀者從官方網(wǎng)站下載與自己的操作系統(tǒng)相應(yīng)的發(fā)行版,然后安裝。1.3Python解釋器完成Python的安裝后,要先確認(rèn)一下Python的版本。打開終端(Windows中的命令行窗口),輸入python--version命令,該命令會輸出已經(jīng)安裝的Python的版本信息。

$

python--version

Python3.4.1::Anaconda2.1.0(x86_64)

如上所示,顯示了Python3.4.1(根據(jù)實際安裝的版本,版本號可能不同),說明已正確安裝了Python3.x。接著輸入python,啟動Python解釋器。

$

python

Python3.4.1|Anaconda2.1.0(x86_64)|(default,Sep102014,17:24:09)

[GCC4.2.1(AppleInc.build5577)]ondarwin

Type"help","copyright","credits"or"license"formoreinformation.

>>>

Python解釋器也被稱為“對話模式”,用戶能夠以和Python對話的方式進(jìn)行編程。比如,當(dāng)用戶詢問“1+2等于幾?”的時候,Python解釋器會回答“3”,所謂對話模式,就是指這樣的交互?,F(xiàn)在,我們實際輸入一下看看。

>>>

1+2

3

Python解釋器可以像這樣進(jìn)行對話式(交互式)的編程。下面,我們使用這個對話模式,來看幾個簡單的Python編程的例子。1.3.1算術(shù)計算加法或乘法等算術(shù)計算,可按如下方式進(jìn)行。

>>>

1-2

-1

>>>

4*5

20

>>>

7/5

1.4

>>>

3**2

9

*表示乘法,/表示除法,**表示乘方(3**2是3的2次方)。另外,在Python2.x中,整數(shù)除以整數(shù)的結(jié)果是整數(shù),比如,7÷5的結(jié)果是1。但在Python3.x中,整數(shù)除以整數(shù)的結(jié)果是小數(shù)(浮點(diǎn)數(shù))。1.3.2數(shù)據(jù)類型編程中有數(shù)據(jù)類型(datatype)這一概念。數(shù)據(jù)類型表示數(shù)據(jù)的性質(zhì),有整數(shù)、小數(shù)、字符串等類型。Python中的type()函數(shù)可以用來查看數(shù)據(jù)類型。

>>>

type(10)

<class'int'>

>>>

type(2.718)

<class'float'>

>>>

type("hello")

<class'str'>

根據(jù)上面的結(jié)果可知,10是int類型(整型),2.718是float類型(浮點(diǎn)型),"hello"是str(字符串)類型。另外,“類型”和“類”這兩個詞有時用作相同的意思。這里,對于輸出結(jié)果<class'int'>,可以將其解釋成“10是int類(類型)”。1.3.3變量可以使用x或y等字母定義變量(variable)。此外,可以使用變量進(jìn)行計算,也可以對變量賦值。

>>>

x=10

#初始化

>>>

print(x)

#輸出x

10

>>>

x=100

#賦值

>>>

print(x)

100

>>>

y=3.14

>>>

x*y

314.0

>>>

type(x*y)

<class'float'>

Python是屬于“動態(tài)類型語言”的編程語言,所謂動態(tài),是指變量的類型是根據(jù)情況自動決定的。在上面的例子中,用戶并沒有明確指出“x的類型是int(整型)”,是Python根據(jù)x被初始化為10,從而判斷出x的類型為int的。此外,我們也可以看到,整數(shù)和小數(shù)相乘的結(jié)果是小數(shù)(數(shù)據(jù)類型的自動轉(zhuǎn)換)。另外,“#”是注釋的意思,它后面的文字會被Python忽略。1.3.4列表除了單一的數(shù)值,還可以用列表(數(shù)組)匯總數(shù)據(jù)。

>>>

a=[1,2,3,4,5]

#生成列表

>>>

print(a)

#輸出列表的內(nèi)容

[1,2,3,4,5]

>>>

len(a)

#獲取列表的長度

5

>>>

a[0]

#訪問第一個元素的值

1

>>>

a[4]

5

>>>

a[4]=99

#賦值

>>>

print(a)

[1,2,3,4,99]

元素的訪問是通過a[0]這樣的方式進(jìn)行的。[]中的數(shù)字稱為索引(下標(biāo)),索引從0開始(索引0對應(yīng)第一個元素)。此外,Python的列表提供了切片(slicing)這一便捷的標(biāo)記法。使用切片不僅可以訪問某個值,還可以訪問列表的子列表(部分列表)。

>>>

print(a)

[1,2,3,4,99]

>>>

a[0:2]

#獲取索引為0到2(不包括2?。┑脑?/p>

[1,2]

>>>

a[1:]

#獲取從索引為1的元素到最后一個元素

[2,3,4,99]

>>>

a[:3]

#獲取從第一個元素到索引為3(不包括3?。┑脑?/p>

[1,2,3]

>>>

a[:-1]

#獲取從第一個元素到最后一個元素的前一個元素之間的元素

[1,2,3,4]

>>>

a[:-2]

#獲取從第一個元素到最后一個元素的前二個元素之間的元素

[1,2,3]

進(jìn)行列表的切片時,需要寫成a[0:2]這樣的形式。a[0:2]用于取出從索引為0的元素到索引為2的元素的前一個元素之間的元素。另外,索引-1對應(yīng)最后一個元素,-2對應(yīng)最后一個元素的前一個元素。1.3.5字典列表根據(jù)索引,按照0,1,2,...的順序存儲值,而字典則以鍵值對的形式存儲數(shù)據(jù)。字典就像《新華字典》那樣,將單詞和它的含義對應(yīng)著存儲起來。

>>>

me={'height':180}

#生成字典

>>>

me['height']

#訪問元素

180

>>>

me['weight']=70

#添加新元素

>>>

print(me)

{'height':180,'weight':70}

1.3.6布爾型Python中有bool型。bool型取True或False中的一個值。針對bool型的運(yùn)算符包括and、or和not(針對數(shù)值的運(yùn)算符有+、-、*、/等,根據(jù)不同的數(shù)據(jù)類型使用不同的運(yùn)算符)。

>>>

hungry=True

#餓了?

>>>

sleepy=False

#困了?

>>>

type(hungry)

<class'bool'>

>>>

nothungry

False

>>>

hungryandsleepy

#餓并且困

False

>>>

hungryorsleepy

#餓或者困

True

1.3.7if語句根據(jù)不同的條件選擇不同的處理分支時可以使用if/else語句。

>>>

hungry=True

>>>

ifhungry:

...

print("I'mhungry")

...

I'mhungry

>>>

hungry=False

>>>

ifhungry:

...

print("I'mhungry")

#使用空白字符進(jìn)行縮進(jìn)

...

else:

...

print("I'mnothungry")

...

print("I'msleepy")

...

I'mnothungry

I'msleepy

Python中的空白字符具有重要的意義。上面的if語句中,ifhungry:下面的語句開頭有4個空白字符。它是縮進(jìn)的意思,表示當(dāng)前面的條件(ifhungry)成立時,此處的代碼會被執(zhí)行。這個縮進(jìn)也可以用tab表示,Python中推薦使用空白字符。Python使用空白字符表示縮進(jìn)。一般而言,每縮進(jìn)一次,使用4個空白字符。1.3.8for語句進(jìn)行循環(huán)處理時可以使用for語句。

>>>

foriin[1,2,3]:

...

print(i)

...

1

2

3

這是輸出列表[1,2,3]中的元素的例子。使用for…in…:語句結(jié)構(gòu),可以按順序訪問列表等數(shù)據(jù)集合中的各個元素。1.3.9函數(shù)可以將一連串的處理定義成函數(shù)(function)。

>>>

defhello():

...

print("HelloWorld!")

...

>>>

hello()

HelloWorld!

此外,函數(shù)可以取參數(shù)。

>>>

defhello(object):

...

print("Hello"+object+"!")

...

>>>

hello("cat")

Hellocat!

另外,字符串的拼接可以使用+。關(guān)閉Python解釋器時,Linux或MacOSX的情況下輸入Ctrl-D(按住Ctrl,再按D鍵);Windows的情況下輸入Ctrl-Z,然后按Enter鍵。1.4Python腳本文件到目前為止,我們看到的都是基于Python解釋器的例子。Python解釋器能夠以對話模式執(zhí)行程序,非常便于進(jìn)行簡單的實驗。但是,想進(jìn)行一連串的處理時,因為每次都需要輸入程序,所以不太方便。這時,可以將Python程序保存為文件,然后(集中地)運(yùn)行這個文件。下面,我們來看一個Python腳本文件的例子。1.4.1保存為文件打開文本編輯器,新建一個hungry.py的文件。hungry.py只包含下面一行語句。print("I'mhungry!")

接著,打開終端(Windows中的命令行窗口),移至hungry.py所在的位置。然后,將hungry.py文件名作為參數(shù),運(yùn)行python命令。這里假設(shè)hungry.py在~/deep-learning-from-scratch/ch01目錄下(在本書提供的源代碼中,hungry.py文件位于ch01目錄下)。

$

cd~/deep-learning-from-scratch/ch01

#移動目錄

$

pythonhungry.py

I'mhungry!

這樣,使用pythonhungry.py命令就可以執(zhí)行這個Python程序了。1.4.2類前面我們了解了int和str等數(shù)據(jù)類型(通過type()函數(shù)可以查看對象的類型)。這些數(shù)據(jù)類型是“內(nèi)置”的數(shù)據(jù)類型,是Python中一開始就有的數(shù)據(jù)類型?,F(xiàn)在,我們來定義新的類。如果用戶自己定義類的話,就可以自己創(chuàng)建數(shù)據(jù)類型。此外,也可以定義原創(chuàng)的方法(類的函數(shù))和屬性。Python中使用class關(guān)鍵字來定義類,類要遵循下述格式(模板)。class類名:

def__init__(self,參數(shù),…):#構(gòu)造函數(shù)

...

def方法名1(self,參數(shù),…):#方法1

...

def方法名2(self,參數(shù),…):#方法2

...

這里有一個特殊的init方法,這是進(jìn)行初始化的方法,也稱為構(gòu)造函數(shù)(constructor),只在生成類的實例時被調(diào)用一次。此外,在方法的第一個參數(shù)中明確地寫入表示自身(自身的實例)的self是Python的一個特點(diǎn)(學(xué)過其他編程語言的人可能會覺得這種寫self的方式有一點(diǎn)奇怪)。下面我們通過一個簡單的例子來創(chuàng)建一個類。這里將下面的程序保存為man.py。classMan:

def__init__(self,name):

=name

print("Initialized!")

defhello(self):

print("Hello"++"!")

defgoodbye(self):

print("Good-bye"++"!")

m=Man("David")

m.hello()

m.goodbye()

從終端運(yùn)行man.py。

$

pythonman.py

Initialized!

HelloDavid!

Good-byeDavid!

這里我們定義了一個新類Man。上面的例子中,類Man生成了實例(對象)m。類Man的構(gòu)造函數(shù)(初始化方法)會接收參數(shù)name,然后用這個參數(shù)初始化實例變量。實例變量是存儲在各個實例中的變量。Python中可以像這樣,通過在self后面添加屬性名來生成或訪問實例變量。1.5NumPy在深度學(xué)習(xí)的實現(xiàn)中,經(jīng)常出現(xiàn)數(shù)組和矩陣的計算。NumPy的數(shù)組類(numpy.array)中提供了很多便捷的方法,在實現(xiàn)深度學(xué)習(xí)時,我們將使用這些方法。本節(jié)我們來簡單介紹一下后面會用到的NumPy。1.5.1導(dǎo)入NumPyNumPy是外部庫。這里所說的“外部”是指不包含在標(biāo)準(zhǔn)版Python中。因此,我們首先要導(dǎo)入NumPy庫。

>>>

importnumpyasnp

Python中使用import語句來導(dǎo)入庫。這里的importnumpyasnp,直譯的話就是“將numpy作為np導(dǎo)入”的意思。通過寫成這樣的形式,之后NumPy相關(guān)的方法均可通過np來調(diào)用。1.5.2生成NumPy數(shù)組要生成NumPy數(shù)組,需要使用np.array()方法。np.array()接收Python列表作為參數(shù),生成NumPy數(shù)組(numpy.ndarray)。

>>>

x=np.array([1.0,2.0,3.0])

>>>

print(x)

[1.2.3.]

>>>

type(x)

<class'numpy.ndarray'>

1.5.3NumPy的算術(shù)運(yùn)算下面是NumPy數(shù)組的算術(shù)運(yùn)算的例子。

>>>

x=np.array([1.0,2.0,3.0])

>>>

y=np.array([2.0,4.0,6.0])

>>>

x+y

#對應(yīng)元素的加法

array([3.,6.,9.])

>>>

x-y

array([-1.,-2.,-3.])

>>>

x*y

#element-wiseproduct

array([2.,8.,18.])

>>>

x/y

array([0.5,0.5,0.5])

這里需要注意的是,數(shù)組x和數(shù)組y的元素個數(shù)是相同的(兩者均是元素個數(shù)為3的一維數(shù)組)。當(dāng)x和y的元素個數(shù)相同時,可以對各個元素進(jìn)行算術(shù)運(yùn)算。如果元素個數(shù)不同,程序就會報錯,所以元素個數(shù)保持一致非常重要。另外,“對應(yīng)元素的”的英文是element-wise,比如“對應(yīng)元素的乘法”就是element-wiseproduct。NumPy數(shù)組不僅可以進(jìn)行element-wise運(yùn)算,也可以和單一的數(shù)值(標(biāo)量)組合起來進(jìn)行運(yùn)算。此時,需要在NumPy數(shù)組的各個元素和標(biāo)量之間進(jìn)行運(yùn)算。這個功能也被稱為廣播(詳見后文)。

>>>

x=np.array([1.0,2.0,3.0])

>>>

x/2.0

array([0.5,1.,1.5])

1.5.4NumPy的N維數(shù)組NumPy不僅可以生成一維數(shù)組(排成一列的數(shù)組),也可以生成多維數(shù)組。比如,可以生成如下的二維數(shù)組(矩陣)。

>>>

A=np.array([[1,2],[3,4]])

>>>

print(A)

[[12]

[34]]

>>>

A.shape

(2,2)

>>>

A.dtype

dtype('int64')

這里生成了一個2×2的矩陣A。另外,矩陣A的形狀可以通過shape查看,矩陣元素的數(shù)據(jù)類型可以通過dtype查看。下面,我們來看一下矩陣的算術(shù)運(yùn)算。

>>>

B=np.array([[3,0],[0,6]])

>>>

A+B

array([[4,2],

[3,10]])

>>>

A*B

array([[3,0],

[0,24]])

和數(shù)組的算術(shù)運(yùn)算一樣,矩陣的算術(shù)運(yùn)算也可以在相同形狀的矩陣間以對應(yīng)元素的方式進(jìn)行。并且,也可以通過標(biāo)量(單一數(shù)值)對矩陣進(jìn)行算術(shù)運(yùn)算。這也是基于廣播的功能。

>>>

print(A)

[[12]

[34]]

>>>

A*10

array([[10,20],

[30,40]])

NumPy數(shù)組(np.array)可以生成N維數(shù)組,即可以生成一維數(shù)組、二維數(shù)組、三維數(shù)組等任意維數(shù)的數(shù)組。數(shù)學(xué)上將一維數(shù)組稱為向量,將二維數(shù)組稱為矩陣。另外,可以將一般化之后的向量或矩陣等統(tǒng)稱為張量(tensor)。本書基本上將二維數(shù)組稱為“矩陣”,將三維數(shù)組及三維以上的數(shù)組稱為“張量”或“多維數(shù)組”。1.5.5廣播NumPy中,形狀不同的數(shù)組之間也可以進(jìn)行運(yùn)算。之前的例子中,在2×2的矩陣A和標(biāo)量10之間進(jìn)行了乘法運(yùn)算。在這個過程中,如圖1-1所示,標(biāo)量10被擴(kuò)展成了2×2的形狀,然后再與矩陣A進(jìn)行乘法運(yùn)算。這個巧妙的功能稱為廣播(broadcast)。圖1-1廣播的例子:標(biāo)量10被當(dāng)作2×2的矩陣我們通過下面這個運(yùn)算再來看一個廣播的例子。

>>>

A=np.array([[1,2],[3,4]])

>>>

B=np.array([10,20])

>>>

A*B

array([[10,40],

[30,80]])

在這個運(yùn)算中,如圖1-2所示,一維數(shù)組B被“巧妙地”變成了和二位數(shù)組A相同的形狀,然后再以對應(yīng)元素的方式進(jìn)行運(yùn)算。圖1-2廣播的例子2綜上,因為NumPy有廣播功能,所以不同形狀的數(shù)組之間也可以順利地進(jìn)行運(yùn)算。1.5.6訪問元素元素的索引從0開始。對各個元素的訪問可按如下方式進(jìn)行。

>>>

X=np.array([[51,55],[14,19],[0,4]])

>>>

print(X)

[[5155]

[1419]

[04]]

>>>

X[0]

#第0行

array([51,55])

>>>

X[0][1]

#(0,1)的元素

55

也可以使用for語句訪問各個元素。

>>>

forrowinX:

...

print(row)

...

[5155]

[1419]

[04]

除了前面介紹的索引操作,NumPy還可以使用數(shù)組訪問各個元素。

>>>

X=X.flatten()

#將X轉(zhuǎn)換為一維數(shù)組

>>>

print(X)

[5155141904]

>>>

X[np.array([0,2,4])]

#獲取索引為0、2、4的元素

array([51,14,0])

運(yùn)用這個標(biāo)記法,可以獲取滿足一定條件的元素。例如,要從X中抽出大于15的元素,可以寫成如下形式。

>>>

X>15

array([True,True,False,True,False,False],dtype=bool)

>>>

X[X>15]

array([51,55,19])

對NumPy數(shù)組使用不等號運(yùn)算符等(上例中是X>15),結(jié)果會得到一個布爾型的數(shù)組。上例中就是使用這個布爾型數(shù)組取出了數(shù)組的各個元素(取出True對應(yīng)的元素)。Python等動態(tài)類型語言一般比C和C++等靜態(tài)類型語言(編譯型語言)運(yùn)算速度慢。實際上,如果是運(yùn)算量大的處理對象,用C/C++寫程序更好。為此,當(dāng)Python中追求性能時,人們會用C/C++來實現(xiàn)處理的內(nèi)容。Python則承擔(dān)“中間人”的角色,負(fù)責(zé)調(diào)用那些用C/C++寫的程序。NumPy中,主要的處理也都是通過C或C++實現(xiàn)的。因此,我們可以在不損失性能的情況下,使用Python便利的語法。1.6Matplotlib在深度學(xué)習(xí)的實驗中,圖形的繪制和數(shù)據(jù)的可視化非常重要。Matplotlib是用于繪制圖形的庫,使用Matplotlib可以輕松地繪制圖形和實現(xiàn)數(shù)據(jù)的可視化。這里,我們來介紹一下圖形的繪制方法和圖像的顯示方法。1.6.1繪制簡單圖形可以使用matplotlib的pyplot模塊繪制圖形。話不多說,我們來看一個繪制sin函數(shù)曲線的例子。importnumpyasnp

importmatplotlib.pyplotasplt

#生成數(shù)據(jù)

x=np.arange(0,6,0.1)#以0.1為單位,生成0到6的數(shù)據(jù)

y=np.sin(x)

#繪制圖形

plt.plot(x,y)

plt.show()

這里使用NumPy的arange方法生成了[0,0.1,0.2,…,5.8,5.9]的數(shù)據(jù),將其設(shè)為x。對x的各個元素,應(yīng)用NumPy的sin函數(shù)np.sin(),將x、y的數(shù)據(jù)傳給plt.plot方法,然后繪制圖形。最后,通過plt.show()顯示圖形。運(yùn)行上述代碼后,就會顯示圖1-3所示的圖形。圖1-3sin函數(shù)的圖形1.6.2pyplot的功能在剛才的sin函數(shù)的圖形中,我們嘗試追加cos函數(shù)的圖形,并嘗試使用pyplot的添加標(biāo)題和x軸標(biāo)簽名等其他功能。importnumpyasnp

importmatplotlib.pyplotasplt

#生成數(shù)據(jù)

x=np.arange(0,6,0.1)#以0.1為單位,生成0到6的數(shù)據(jù)

y1=np.sin(x)

y2=np.cos(x)

#繪制圖形

plt.plot(x,y1,label="sin")

plt.plot(x,y2,linestyle="--",label="cos")#用虛線繪制

plt.xlabel("x")#x軸標(biāo)簽

plt.ylabel("y")#y軸標(biāo)簽

plt.title('sin&cos')#標(biāo)題

plt.legend()

plt.show()

結(jié)果如圖1-4所示,我們看到圖的標(biāo)題、軸的標(biāo)簽名都被標(biāo)出來了。圖1-4sin函數(shù)和cos函數(shù)的圖形1.6.3顯示圖像pyplot中還提供了用于顯示圖像的方法imshow()。另外,可以使用matplotlib.image模塊的imread()方法讀入圖像。下面我們來看一個例子。importmatplotlib.pyplotasplt

frommatplotlib.imageimportimread

img=imread('lena.png')#讀入圖像(設(shè)定合適的路徑?。?/p>

plt.imshow(img)

plt.show()

運(yùn)行上述代碼后,會顯示圖1-5所示的圖像。圖1-5顯示圖像這里,我們假定圖像lena.png在當(dāng)前目錄下。讀者根據(jù)自己的環(huán)境,可能需要變更文件名或文件路徑。另外,本書提供的源代碼中,在dataset目錄下有樣本圖像lena.png。比如,在通過Python解釋器從ch01目錄運(yùn)行上述代碼的情況下,將圖像的路徑'lena.png'改為'../dataset/lena.png',即可正確運(yùn)行。1.7小結(jié)本章重點(diǎn)介紹了實現(xiàn)深度學(xué)習(xí)(神經(jīng)網(wǎng)絡(luò))所需的編程知識,以為學(xué)習(xí)深度學(xué)習(xí)做好準(zhǔn)備。從下一章開始,我們將通過使用Python實際運(yùn)行代碼,逐步了解深度學(xué)習(xí)。本章只介紹了關(guān)于Python的最低限度的知識,想進(jìn)一步了解Python的讀者,可以參考下面這些圖書。首先推薦《Python語言及其應(yīng)用》[1]一書。這是一本詳細(xì)介紹從Python編程的基礎(chǔ)到應(yīng)用的實踐性的入門書。關(guān)于NumPy,《利用Python進(jìn)行數(shù)據(jù)分析》[2]一書中進(jìn)行了簡單易懂的總結(jié)。此外,“ScipyLectureNotes”[3]這個網(wǎng)站上也有以科學(xué)計算為主題的NumPy和Matplotlib的詳細(xì)介紹,有興趣的讀者可以參考。下面,我們來總結(jié)一下本章所學(xué)的內(nèi)容,如下所示。本章所學(xué)的內(nèi)容Python是一種簡單易記的編程語言。Python是開源的,可以自由使用。本書中將使用Python3.x實現(xiàn)深度學(xué)習(xí)。本書中將使用NumPy和Matplotlib這兩種外部庫。Python有“解釋器”和“腳本文件”兩種運(yùn)行模式。Python能夠?qū)⒁幌盗刑幚砑蔀楹瘮?shù)或類等模塊。NumPy中有很多用于操作多維數(shù)組的便捷方法。

第2章感知機(jī)本章將介紹感知機(jī)1(perceptron)這一算法。感知機(jī)是由美國學(xué)者FrankRosenblatt在1957年提出來的。為何我們現(xiàn)在還要學(xué)習(xí)這一很久以前就有的算法呢?因為感知機(jī)也是作為神經(jīng)網(wǎng)絡(luò)(深度學(xué)習(xí))的起源的算法。因此,學(xué)習(xí)感知機(jī)的構(gòu)造也就是學(xué)習(xí)通向神經(jīng)網(wǎng)絡(luò)和深度學(xué)習(xí)的一種重要思想。1嚴(yán)格地講,本章中所說的感知機(jī)應(yīng)該稱為“人工神經(jīng)元”或“樸素感知機(jī)”,但是因為很多基本的處理都是共通的,所以這里就簡單地稱為“感知機(jī)”。本章我們將簡單介紹一下感知機(jī),并用感知機(jī)解決一些簡單的問題。希望讀者通過這個過程能熟悉感知機(jī)。2.1感知機(jī)是什么感知機(jī)接收多個輸入信號,輸出一個信號。這里所說的“信號”可以想象成電流或河流那樣具備“流動性”的東西。像電流流過導(dǎo)線,向前方輸送電子一樣,感知機(jī)的信號也會形成流,向前方輸送信息。但是,和實際的電流不同的是,感知機(jī)的信號只有“流/不流”(1/0)兩種取值。在本書中,0對應(yīng)“不傳遞信號”,1對應(yīng)“傳遞信號”。圖2-1是一個接收兩個輸入信號的感知機(jī)的例子。、是輸入信號,y是輸出信號,、是權(quán)重(w是weight的首字母)。圖中的○稱為“神經(jīng)元”或者“節(jié)點(diǎn)”。輸入信號被送往神經(jīng)元時,會被分別乘以固定的權(quán)重(、)。神經(jīng)元會計算傳送過來的信號的總和,只有當(dāng)這個總和超過了某個界限值時,才會輸出1。這也稱為“神經(jīng)元被激活”。這里將這個界限值稱為閾值,用符號θ表示。圖2-1有兩個輸入的感知機(jī)感知機(jī)的運(yùn)行原理只有這些!把上述內(nèi)容用數(shù)學(xué)式來表示,就是式(2.1)。感知機(jī)的多個輸入信號都有各自固有的權(quán)重,這些權(quán)重發(fā)揮著控制各個信號的重要性的作用。也就是說,權(quán)重越大,對應(yīng)該權(quán)重的信號的重要性就越高。權(quán)重相當(dāng)于電流里所說的電阻。電阻是決定電流流動難度的參數(shù),電阻越低,通過的電流就越大。而感知機(jī)的權(quán)重則是值越大,通過的信號就越大。不管是電阻還是權(quán)重,在控制信號流動難度(或者流動容易度)這一點(diǎn)上的作用都是一樣的。2.2簡單邏輯電路2.2.1與門現(xiàn)在讓我們考慮用感知機(jī)來解決簡單的問題。這里首先以邏輯電路為題材來思考一下與門(ANDgate)。與門是有兩個輸入和一個輸出的門電路。圖2-2這種輸入信號和輸出信號的對應(yīng)表稱為“真值表”。如圖2-2所示,與門僅在兩個輸入均為1時輸出1,其他時候則輸出0。圖2-2與門的真值表下面考慮用感知機(jī)來表示這個與門。需要做的就是確定能滿足圖2-2的真值表的、、θ的值。那么,設(shè)定什么樣的值才能制作出滿足圖2-2的條件的感知機(jī)呢?實際上,滿足圖2-2的條件的參數(shù)的選擇方法有無數(shù)多個。比如,當(dāng)時,可以滿足圖2-2的條件。此外,當(dāng)為(0.5,0.5,0.8)或者(1.0,1.0,1.0)時,同樣也滿足與門的條件。設(shè)定這樣的參數(shù)后,僅當(dāng)和同時為1時,信號的加權(quán)總和才會超過給定的閾值θ。2.2.2與非門和或門接著,我們再來考慮一下與非門(NANDgate)。NAND是NotAND的意思,與非門就是顛倒了與門的輸出。用真值表表示的話,如圖2-3所示,僅當(dāng)和同時為1時輸出0,其他時候則輸出1。那么與非門的參數(shù)又可以是什么樣的組合呢?圖2-3與非門的真值表要表示與非門,可以用這樣的組合(其他的組合也是無限存在的)。實際上,只要把實現(xiàn)與門的參數(shù)值的符號取反,就可以實現(xiàn)與非門。接下來看一下圖2-4所示的或門?;蜷T是“只要有一個輸入信號是1,輸出就為1”的邏輯電路。那么我們來思考一下,應(yīng)該為這個或門設(shè)定什么樣的參數(shù)呢?圖2-4或門的真值表這里決定感知機(jī)參數(shù)的并不是計算機(jī),而是我們?nèi)?。我們看著真值表這種“訓(xùn)練數(shù)據(jù)”,人工考慮(想到)了參數(shù)的值。而機(jī)器學(xué)習(xí)的課題就是將這個決定參數(shù)值的工作交由計算機(jī)自動進(jìn)行。學(xué)習(xí)是確定合適的參數(shù)的過程,而人要做的是思考感知機(jī)的構(gòu)造(模型),并把訓(xùn)練數(shù)據(jù)交給計算機(jī)。如上所示,我們已經(jīng)知道使用感知機(jī)可以表示與門、與非門、或門的邏輯電路。這里重要的一點(diǎn)是:與門、與非門、或門的感知機(jī)構(gòu)造是一樣的。實際上,3個門電路只有參數(shù)的值(權(quán)重和閾值)不同。也就是說,相同構(gòu)造的感知機(jī),只需通過適當(dāng)?shù)卣{(diào)整參數(shù)的值,就可以像“變色龍演員”表演不同的角色一樣,變身為與門、與非門、或門。2.3感知機(jī)的實現(xiàn)2.3.1簡單的實現(xiàn)現(xiàn)在,我們用Python來實現(xiàn)剛才的邏輯電路。這里,先定義一個接收參數(shù)x1和x2的AND函數(shù)。defAND(x1,x2):

w1,w2,theta=0.5,0.5,0.7

tmp=x1*w1+x2*w2

iftmp<=theta:

return0

eliftmp>theta:

return1

在函數(shù)內(nèi)初始化參數(shù)w1、w2、theta,當(dāng)輸入的加權(quán)總和超過閾值時返回1,否則返回0。我們來確認(rèn)一下輸出結(jié)果是否如圖2-2所示。AND(0,0)#輸出0

AND(1,0)#輸出0

AND(0,1)#輸出0

AND(1,1)#輸出1

果然和我們預(yù)想的輸出一樣!這樣我們就實現(xiàn)了與門。按照同樣的步驟,也可以實現(xiàn)與非門和或門,不過讓我們來對它們的實現(xiàn)稍作修改。2.3.2導(dǎo)入權(quán)重和偏置剛才的與門的實現(xiàn)比較直接、容易理解,但是考慮到以后的事情,我們將其修改為另外一種實現(xiàn)形式。在此之前,首先把式(2.1)的θ換成-b,于是就可以用式(2.2)來表示感知機(jī)的行為。式(2.1)和式(2.2)雖然有一個符號不同,但表達(dá)的內(nèi)容是完全相同的。此處,b稱為偏置,和稱為權(quán)重。如式(2.2)所示,感知機(jī)會計算輸入信號和權(quán)重的乘積,然后加上偏置,如果這個值大于0則輸出1,否則輸出0。下面,我們使用NumPy,按式(2.2)的方式實現(xiàn)感知機(jī)。在這個過程中,我們用Python的解釋器逐一確認(rèn)結(jié)果。

>>>

importnumpyasnp

>>>

x=np.array([0,1])

#輸入

>>>

w=np.array([0.5,0.5])

#權(quán)重

>>>

b=-0.7

#偏置

>>>

w*x

array([0.,0.5])

>>>

np.sum(w*x)

0.5

>>>

np.sum(w*x)+b

-0.19999999999999996#大約為-0.2(由浮點(diǎn)小數(shù)造成的運(yùn)算誤差)

如上例所示,在NumPy數(shù)組的乘法運(yùn)算中,當(dāng)兩個數(shù)組的元素個數(shù)相同時,各個元素分別相乘,因此w*x的結(jié)果就是它們的各個元素分別相乘([0,1]*[0.5,0.5]=>[0,0.5])。之后,np.sum(w*x)再計算相乘后的各個元素的總和。最后再把偏置加到這個加權(quán)總和上,就完成了式(2.2)的計算。2.3.3使用權(quán)重和偏置的實現(xiàn)使用權(quán)重和偏置,可以像下面這樣實現(xiàn)與門。defAND(x1,x2):

x=np.array([x1,x2])

w=np.array([0.5,0.5])

b=-0.7

tmp=np.sum(w*x)+b

iftmp<=0:

return0

else:

return1

這里把-θ命名為偏置b,但是請注意,偏置和權(quán)重、的作用是不一樣的。具體地說,和是控制輸入信號的重要性的參數(shù),而偏置是調(diào)整神經(jīng)元被激活的容易程度(輸出信號為1的程度)的參數(shù)。比如,若b為-0.1,則只要輸入信號的加權(quán)總和超過0.1,神經(jīng)元就會被激活。但是如果b為-20.0,則輸入信號的加權(quán)總和必須超過20.0,神經(jīng)元才會被激活。像這樣,偏置的值決定了神經(jīng)元被激活的容易程度。另外,這里我們將和稱為權(quán)重,將b稱為偏置,但是根據(jù)上下文,有時也會將b、、這些參數(shù)統(tǒng)稱為權(quán)重。偏置這個術(shù)語,有“穿木屐”2的效果,即在沒有任何輸入時(輸入為0時),給輸出穿上多高的木屐(加上多大的值)的意思。實際上,在式(2.2)的的計算中,當(dāng)輸入和為0時,只輸出偏置的值。2因為木屐的底比較厚,穿上它后,整個人也會顯得更高。——譯者注接著,我們繼續(xù)實現(xiàn)與非門和或門。

defNAND(x1,x2):

x=np.array([x1,x2])

w=np.array([-0.5,-0.5])

#僅權(quán)重和偏置與AND不同!

b=0.7

tmp=np.sum(w*x)+b

iftmp<=0:

return0

else:

return1

defOR(x1,x2):

x=np.array([x1,x2])

w=np.array([0.5,0.5])

#僅權(quán)重和偏置與AND不同!

b=-0.2

tmp=np.sum(w*x)+b

iftmp<=0:

return0

else:

return1

我們在2.2節(jié)介紹過,與門、與非門、或門是具有相同構(gòu)造的感知機(jī),區(qū)別只在于權(quán)重參數(shù)的值。因此,在與非門和或門的實現(xiàn)中,僅設(shè)置權(quán)重和偏置的值這一點(diǎn)和與門的實現(xiàn)不同。2.4感知機(jī)的局限性到這里我們已經(jīng)知道,使用感知機(jī)可以實現(xiàn)與門、與非門、或門三種邏輯電路?,F(xiàn)在我們來考慮一下異或門(XORgate)。2.4.1異或門異或門也被稱為邏輯異或電路。如圖2-5所示,僅當(dāng)或中的一方為1時,才會輸出1(“異或”是拒絕其他的意思)。那么,要用感知機(jī)實現(xiàn)這個異或門的話,應(yīng)該設(shè)定什么樣的權(quán)重參數(shù)呢?圖2-5異或門的真值表實際上,用前面介紹的感知機(jī)是無法實現(xiàn)這個異或門的。為什么用感知機(jī)可以實現(xiàn)與門、或門,卻無法實現(xiàn)異或門呢?下面我們嘗試通過畫圖來思考其中的原因。首先,我們試著將或門的動作形象化?;蜷T的情況下,當(dāng)權(quán)重參數(shù)時,可滿足圖2-4的真值表條件。此時,感知機(jī)可用下面的式(2.3)表示。式(2.3)表示的感知機(jī)會生成由直線分割開的兩個空間。其中一個空間輸出1,另一個空間輸出0,如圖2-6所示。圖2-6感知機(jī)的可視化:灰色區(qū)域是感知機(jī)輸出0的區(qū)域,這個區(qū)域與或門的性質(zhì)一致或門在時輸出0,在為(0,1)、(1,0)、(1,1)時輸出1。圖2-6中,○表示0,△表示1。如果想制作或門,需要用直線將圖2-6中的○和△分開。實際上,剛才的那條直線就將這4個點(diǎn)正確地分開了。那么,換成異或門的話會如何呢?能否像或門那樣,用一條直線作出分割圖2-7中的○和△的空間呢?圖2-7○和△表示異或門的輸出??煞裢ㄟ^一條直線作出分割○和△的空間呢?想要用一條直線將圖2-7中的○和△分開,無論如何都做不到。事實上,用一條直線是無法將○和△分開的。2.4.2線性和非線性圖2-7中的○和△無法用一條直線分開,但是如果將“直線”這個限制條件去掉,就可以實現(xiàn)了。比如,我們可以像圖2-8那樣,作出分開○和△的空間。圖2-8使用曲線可以分開○和△感知機(jī)的局限性就在于它只能表示由一條直線分割的空間。圖2-8這樣彎曲的曲線無法用感知機(jī)表示。另外,由圖2-8這樣的曲線分割而成的空間稱為非線性空間,由直線分割而成的空間稱為線性空間。線性、非線性這兩個術(shù)語在機(jī)器學(xué)習(xí)領(lǐng)域很常見,可以將其想象成圖2-6和圖2-8所示的直線和曲線。2.5多層感知機(jī)感知機(jī)不能表示異或門讓人深感遺憾,但也無需悲觀。實際上,感知機(jī)的絕妙之處在于它可以“疊加層”(通過疊加層來表示異或門是本節(jié)的要點(diǎn))。這里,我們暫且不考慮疊加層具體是指什么,先從其他視角來思考一下異或門的問題。2.5.1已有門電路的組合異或門的制作方法有很多,其中之一就是組合我們前面做好的與門、與非門、或門進(jìn)行配置。這里,與門、與非門、或門用圖2-9中的符號表示。另外,圖2-9中與非門前端的○表示反轉(zhuǎn)輸出的意思。圖2-9與門、與非門、或門的符號那么,請思考一下,要實現(xiàn)異或門的話,需要如何配置與門、與非門和或門呢?這里給大家一個提示,用與門、與非門、或門代替圖2-10中的各個“?”,就可以實現(xiàn)異或門。圖2-10將與門、與非門、或門代入到“?”中,就可以實現(xiàn)異或門!2.4節(jié)講到的感知機(jī)的局限性,嚴(yán)格地講,應(yīng)該是“單層感知機(jī)無法表示異或門”或者“單層感知機(jī)無法分離非線性空間”。接下來,我們將看到通過組合感知機(jī)(疊加層)就可以實現(xiàn)異或門。異或門可以通過圖2-11所示的配置來實現(xiàn)。這里,和表示輸入信號,y表示輸出信號。和是與非門和或門的輸入,而與非門和或門的輸出則是與門的輸入。圖2-11通過組合與門、與非門、或門實現(xiàn)異或門現(xiàn)在,我們來確認(rèn)一下圖2-11的配置是否真正實現(xiàn)了異或門。這里,把作為與非門的輸出,把作為或門的輸出,填入真值表中。結(jié)果如圖2-12所示,觀察、、y,可以發(fā)現(xiàn)確實符合異或門的輸出。圖2-12異或門的真值表2.5.2異或門的實現(xiàn)下面我們試著用Python來實現(xiàn)圖2-11所示的異或門。使用之前定義的AND函數(shù)、NAND函數(shù)、OR函數(shù),可以像下面這樣(輕松地)實現(xiàn)。defXOR(x1,x2):

s1=NAND(x1,x2)

s2=OR(x1,x2)

y=AND(s1,s2)

returny

這個XOR函數(shù)會輸出預(yù)期的結(jié)果。XOR(0,0)#輸出0

XOR(1,0)#輸出1

XOR(0,1)#輸出1

XOR(1,1)#輸出0

這樣,異或門的實現(xiàn)就完成了。下面我們試著用感知機(jī)的表示方法(明確地顯示神經(jīng)元)來表示這個異或門,結(jié)果如圖2-13所示。圖2-13用感知機(jī)表示異或門如圖2-13所示,異或門是一種多層結(jié)構(gòu)的神經(jīng)網(wǎng)絡(luò)。這里,將最左邊的一列稱為第0層,中間的一列稱為第1層,最右邊的一列稱為第2層。圖2-13所示的感知機(jī)與前面介紹的與門、或門的感知機(jī)(圖2-1)形狀不同。實際上,與門、或門是單層感知機(jī),而異或門是2層感知機(jī)。疊加了多層的感知機(jī)也稱為多層感知機(jī)(multi-layeredperceptron)。圖2-13中的感知機(jī)總共由3層構(gòu)成,但是因為擁有權(quán)重的層實質(zhì)上只有2層(第0層和第1層之間,第1層和第2層之間),所以稱為“2層感知機(jī)”。不過,有的文獻(xiàn)認(rèn)為圖2-13的感知機(jī)是由3層構(gòu)成的,因而將其稱為“3層感知機(jī)”。在圖2-13所示的2層感知機(jī)中,先在第0層和第1層的神經(jīng)元之間進(jìn)行信號的傳送和接收,然后在第1層和第2層之間進(jìn)行信號的傳送和接收,具體如下所示。第0層的兩個神經(jīng)元接收輸入信號,并將信號發(fā)送至第1層的神經(jīng)元。第1層的神經(jīng)元將信號發(fā)送至第2層的神經(jīng)元,第2層的神經(jīng)元輸出y。這種2層感知機(jī)的運(yùn)行過程可以比作流水線的組裝作業(yè)。第1段(第1層)的工人對傳送過來的零件進(jìn)行加工,完成后再傳送給第2段(第2層)的工人。第2層的工人對第1層的工人傳過來的零件進(jìn)行加工,完成這個零件后出貨(輸出)。像這樣,在異或門的感知機(jī)中,工人之間不斷進(jìn)行零件的傳送。通過這樣的結(jié)構(gòu)(2層結(jié)構(gòu)),感知機(jī)得以實現(xiàn)異或門。這可以解釋為“單層感知機(jī)無法表示的東西,通過增加一層就可以解決”。也就是說,通過疊加層(加深層),感知機(jī)能進(jìn)行更加靈活的表示。2.6從與非門到計算機(jī)多層感知機(jī)可以實現(xiàn)比之前見到的電路更復(fù)雜的電路。比如,進(jìn)行加法運(yùn)算的加法器也可以用感知機(jī)實現(xiàn)。此外,將二進(jìn)制轉(zhuǎn)換為十進(jìn)制的編碼器、滿足某些條件就輸出1的電路(用于等價檢驗的電路)等也可以用感知機(jī)表示。實際上,使用感知機(jī)甚至可以表示計算機(jī)!計算機(jī)是處理信息的機(jī)器。向計算機(jī)中輸入一些信息后,它會按照某種既定的方法進(jìn)行處理,然后輸出結(jié)果。所謂“按照某種既定的方法進(jìn)行處理”是指,計算機(jī)和感知機(jī)一樣,也有輸入和輸出,會按照某個既定的規(guī)則進(jìn)行計算。人們一般會認(rèn)為計算機(jī)內(nèi)部進(jìn)行的處理非常復(fù)雜,而令人驚訝的是,實際上只需要通過與非門的組合,就能再現(xiàn)計算機(jī)進(jìn)行的處理。這一令人吃驚的事實說明了什么呢?說明使用感知機(jī)也可以表示計算機(jī)。前面也介紹了,與非門可以使用感知機(jī)實現(xiàn)。也就是說,如果通過組合與非門可以實現(xiàn)計算機(jī)的話,那么通過組合感知機(jī)也可以表示計算機(jī)(感知機(jī)的組合可以通過疊加了多層的單層感知機(jī)來表示)。說到僅通過與非門的組合就能實現(xiàn)計算機(jī),大家也許一下子很難相信。建議有興趣的讀者看一下《計算機(jī)系統(tǒng)要素:從零開始構(gòu)建現(xiàn)代計算機(jī)》。這本書以深入理解計算機(jī)為主題,論述了通過NAND構(gòu)建可運(yùn)行俄羅斯方塊的計算機(jī)的過程。此書能讓讀者真實體會到,通過簡單的NAND元件就可以實現(xiàn)計算機(jī)這樣復(fù)雜的系統(tǒng)。綜上,多層感知機(jī)能夠進(jìn)行復(fù)雜的表示,甚至可以構(gòu)建計算機(jī)。那么,什么構(gòu)造的感知機(jī)才能表示計算機(jī)呢?層級多深才可以構(gòu)建計算機(jī)呢?理論上可以說2層感知機(jī)就能構(gòu)建計算機(jī)。這是因為,已有研究證明,2層感知機(jī)(嚴(yán)格地說是激活函數(shù)使用了非線性的sigmoid函數(shù)的感知機(jī),具體請參照下一章)可以表示任意函數(shù)。但是,使用2層感知機(jī)的構(gòu)造,通過設(shè)定合適的權(quán)重來構(gòu)建計算機(jī)是一件非常累人的事情。實際上,在用與非門等低層的元件構(gòu)建計算機(jī)的情況下,分階段地制作所需的零件(模塊)會比較自然,即先實現(xiàn)與門和或門,然后實現(xiàn)半加器和全加器,接著實現(xiàn)算數(shù)邏輯單元(ALU),然后實現(xiàn)CPU。因此,通過感知機(jī)表示計算機(jī)時,使用疊加了多層的構(gòu)造來實現(xiàn)是比較自然的流程。本書中不會實際來實現(xiàn)計算機(jī),但是希望讀者能夠記住,感知機(jī)通過疊加層能夠進(jìn)行非線性的表示,理論上還可以表示計算機(jī)進(jìn)行的處理。2.7小結(jié)本章我們學(xué)習(xí)了感知機(jī)。感知機(jī)是一種非常簡單的算法,大家應(yīng)該很快就能理解它的構(gòu)造。感知機(jī)是下一章要學(xué)習(xí)的神經(jīng)網(wǎng)絡(luò)的基礎(chǔ),因此本章的內(nèi)容非常重要。本章所學(xué)的內(nèi)容感知機(jī)是具有輸入和輸出的算法。給定一個輸入后,將輸出一個既定的值。感知機(jī)將權(quán)重和偏置設(shè)定為參數(shù)。使用感知機(jī)可以表示與門和或門等邏輯電路。異或門無法通過單層感知機(jī)來表示。使用2層感知機(jī)可以表示異或門。單層感知機(jī)只能表示線性空間,而多層感知機(jī)可以表示非線性空間。多層感知機(jī)(在理論上)可以表示計算機(jī)。

第3章神經(jīng)網(wǎng)絡(luò)上一章我們學(xué)習(xí)了感知機(jī)。關(guān)于感知機(jī),既有好消息,也有壞消息。好消息是,即便對于復(fù)雜的函數(shù),感知機(jī)也隱含著能夠表示它的可能性。上一章已經(jīng)介紹過,即便是計算機(jī)進(jìn)行的復(fù)雜處理,感知機(jī)(理論上)也可以將其表示出來。壞消息是,設(shè)定權(quán)重的工作,即確定合適的、能符合預(yù)期的輸入與輸出的權(quán)重,現(xiàn)在還是由人工進(jìn)行的。上一章中,我們結(jié)合與門、或門的真值表人工決定了合適的權(quán)重。神經(jīng)網(wǎng)絡(luò)的出現(xiàn)就是為了解決剛才的壞消息。具體地講,神經(jīng)網(wǎng)絡(luò)的一個重要性質(zhì)是它可以自動地從數(shù)據(jù)中學(xué)習(xí)到合適的權(quán)重參數(shù)。本章中,我們會先介紹神經(jīng)網(wǎng)絡(luò)的概要,然后重點(diǎn)關(guān)注神經(jīng)網(wǎng)絡(luò)進(jìn)行識別時的處理。在下一章中,我們將了解如何從數(shù)據(jù)中學(xué)習(xí)權(quán)重參數(shù)。3.1從感知機(jī)到神經(jīng)網(wǎng)絡(luò)神經(jīng)網(wǎng)絡(luò)和上一章介紹的感知機(jī)有很多共同點(diǎn)。這里,我們主要以兩者的差異為中心,來介紹神經(jīng)網(wǎng)絡(luò)的結(jié)構(gòu)。3.1.1神經(jīng)網(wǎng)絡(luò)的例子用圖來表示神經(jīng)網(wǎng)絡(luò)的話,如圖3-1所示。我們把最左邊的一列稱為輸入層,最右邊的一列稱為輸出層,中間的一列稱為中間層。中間層有時也稱為隱藏層?!半[藏”一詞的意思是,隱藏層的神經(jīng)元(和輸入層、輸出層不同)肉眼看不見。另外,本書中把輸入層到輸出層依次稱為第0層、第1層、第2層(層號之所以從0開始,是為了方便后面基于Python進(jìn)行實現(xiàn))。圖3-1中,第0層對應(yīng)輸入層,第1層對應(yīng)中間層,第2層對應(yīng)輸出層。圖3-1神經(jīng)網(wǎng)絡(luò)的例子圖3-1中的網(wǎng)絡(luò)一共由3層神經(jīng)元構(gòu)成,但實質(zhì)上只有2層神經(jīng)元有權(quán)重,因此將其稱為“2層網(wǎng)絡(luò)”。請注意,有的書也會根據(jù)構(gòu)成網(wǎng)絡(luò)的層數(shù),把圖3-1的網(wǎng)絡(luò)稱為“3層網(wǎng)絡(luò)”。本書將根據(jù)實質(zhì)上擁有權(quán)重的層數(shù)(輸入層、隱藏層、輸出層的總數(shù)減去1后的數(shù)量)來表示網(wǎng)絡(luò)的名稱。只看圖3-1的話,神經(jīng)網(wǎng)絡(luò)的形狀類似上一章的感知機(jī)。實際上,就神經(jīng)元的連接方式而言,與上一章的感知機(jī)并沒有任何差異。那么,神經(jīng)網(wǎng)絡(luò)中信號是如何傳遞的呢?3.1.2復(fù)習(xí)感知機(jī)在觀察神經(jīng)網(wǎng)絡(luò)中信號的傳遞方法之前,我們先復(fù)習(xí)一下感知機(jī)。現(xiàn)在來思考一下圖3-2中的網(wǎng)絡(luò)結(jié)構(gòu)。圖3-2復(fù)習(xí)感知機(jī)圖3-2中的感知機(jī)接收和兩個輸入信號,輸出y。如果用數(shù)學(xué)式來表示圖3-2中的感知機(jī),則如式(3.1)所示。b是被稱為偏置的參數(shù),用于控制神經(jīng)元被激活的容易程度;而和是表示各個信號的權(quán)重的參數(shù),用于控制各個信號的重要性。順便提一下,在圖3-2的網(wǎng)絡(luò)中,偏置b并沒有被畫出來。如果要明確地表示出b,可以像圖3-3那樣做。圖3-3中添加了權(quán)重為b的輸入信號1。這個感知機(jī)將、、1三個信號作為神經(jīng)元的輸入,將其和各自的權(quán)重相乘后,傳送至下一個神經(jīng)元。在下一個神經(jīng)元中,計算這些加權(quán)信號的總和。如果這個總和超過0,則輸出1,否則輸出0。另外,由于偏置的輸入信號一直是1,所以為了區(qū)別于其他神經(jīng)元,我們在圖中把這個神經(jīng)元整個涂成灰色?,F(xiàn)在將式(3.1)改寫成更加簡潔的形式。為了簡化式(3.1),我們用一個函數(shù)來表示這種分情況的動作(超過0則輸出1,否則輸出0)。引入新函數(shù)h(x),將式(3.1)改寫成下面的式(3.2)和式(3.3)。圖3-3明確表示出偏置式(3.2)中,輸入信號的總和會被函數(shù)h(x)轉(zhuǎn)換,轉(zhuǎn)換后的值就是輸出y。然后,式(3.3)所表示的函數(shù)h(x),在輸入超過0時返回1,否則返回0。因此,式(3.1)和式(3.2)、式(3.3)做的是相同的事情。3.1.3激活函數(shù)登場剛才登場的h(x)函數(shù)會將輸入信號的總和轉(zhuǎn)換為輸出信號,這種函數(shù)一般稱為激活函數(shù)(activationfunction)。如“激活”一詞所示,激活函數(shù)的作用在于決定如何來激活輸入信號的總和。現(xiàn)在來進(jìn)一步改寫式(3.2)。式(3.2)分兩個階段進(jìn)行處理,先計算輸入信號的加權(quán)總和,然后用激活函數(shù)轉(zhuǎn)換這一總和。因此,如果將式(3.2)寫得詳細(xì)一點(diǎn),則可以分成下面兩個式子。首先,式(3.4)計算加權(quán)輸入信號和偏置的總和,記為a。然后,式(3.5)用h()函數(shù)將a轉(zhuǎn)換為輸出y。之前的神經(jīng)元都是用一個○表示的,如果要在圖中明確表示出式(3.4)和式(3.5),則可以像圖3-4這樣做。圖3-4明確顯示激活函數(shù)的計算過程如圖3-4所示,表示神經(jīng)元的○中明確顯示了激活函數(shù)的計算過程,即信號的加權(quán)總和為節(jié)點(diǎn)a,然后節(jié)點(diǎn)a被激活函數(shù)h()轉(zhuǎn)換成節(jié)點(diǎn)y。本書中,“神經(jīng)元”和“節(jié)點(diǎn)”兩個術(shù)語的含義相同。這里,我們稱a和y為“節(jié)點(diǎn)”,其實它和之前所說的“神經(jīng)元”含義相同。通常如圖3-5的左圖所示,神經(jīng)元用一個○表示。本書中,在可以明確神經(jīng)網(wǎng)絡(luò)的動作的情況下,將在圖中明確顯示激活函數(shù)的計算過程,如圖3-5的右圖所示。圖3-5左圖是一般的神經(jīng)元的圖,右圖是在神經(jīng)元內(nèi)部明確顯示激活函數(shù)的計算過程的圖(a表示輸入信號的總和,h()表示激活函數(shù),y表示輸出)下面,我們將仔細(xì)介紹激活函數(shù)。激活函數(shù)是連接感知機(jī)和神經(jīng)網(wǎng)絡(luò)的橋梁。本書在使用“感知機(jī)”一詞時,沒有嚴(yán)格統(tǒng)一它所指的算法。一般而言,“樸素感知機(jī)”是指單層網(wǎng)絡(luò),指的是激活函數(shù)使用了階躍函數(shù)1的模型?!岸鄬痈兄獧C(jī)”是指神經(jīng)網(wǎng)絡(luò),即使用sigmoid函數(shù)(后述)等平滑的激活函數(shù)的多層網(wǎng)絡(luò)。1階躍函數(shù)是指一旦輸入超過閾值,就切換輸出的函數(shù)。3.2激活函數(shù)式(3.3)表示的激活函數(shù)以閾值為界,一旦輸入超過閾值,就切換輸出。這樣的函數(shù)稱為“階躍函數(shù)”。因此,可以說感知機(jī)中使用了階躍函數(shù)作為激活函數(shù)。也就是說,在激活函數(shù)的眾多候選函數(shù)中,感知機(jī)使用了階躍函數(shù)。那么,如果感知機(jī)使用其他函數(shù)作為激活函數(shù)的話會怎么樣呢?實際上,如果將激活函數(shù)從階躍函數(shù)換成其他函數(shù),就可以進(jìn)入神經(jīng)網(wǎng)絡(luò)的世界了。下面我們就來介紹一下神經(jīng)網(wǎng)絡(luò)使用的激活函數(shù)。3.2.1sigmoid函數(shù)神經(jīng)網(wǎng)絡(luò)中經(jīng)常使用的一個激活函數(shù)就是式(3.6)表示的sigmoid函數(shù)(sigmoidfunction)。式(3.6)中的exp(-x)表示的意思。e是納皮爾常數(shù)2.7182...。式(3.6)表示的sigmoid函數(shù)看上去有些復(fù)雜,但它也僅僅是個函數(shù)而已。而函數(shù)就是給定某個輸入后,會返回某個輸出的轉(zhuǎn)換器。比如,向sigmoid函數(shù)輸入1.0或2.0后,就會有某個值被輸出,類似h(1.0)=0.731...、h(2.0)=0.880...這樣。神經(jīng)網(wǎng)絡(luò)中用sigmoid函數(shù)作為激活函數(shù),進(jìn)行信號的轉(zhuǎn)換,轉(zhuǎn)換后的信號被傳送給下一個神經(jīng)元。實際上

溫馨提示

  • 1. 本站所有資源如無特殊說明,都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請下載最新的WinRAR軟件解壓。
  • 2. 本站的文檔不包含任何第三方提供的附件圖紙等,如果需要附件,請聯(lián)系上傳者。文件的所有權(quán)益歸上傳用戶所有。
  • 3. 本站RAR壓縮包中若帶圖紙,網(wǎng)頁內(nèi)容里面會有圖紙預(yù)覽,若沒有圖紙預(yù)覽就沒有圖紙。
  • 4. 未經(jīng)權(quán)益所有人同意不得將文件中的內(nèi)容挪作商業(yè)或盈利用途。
  • 5. 人人文庫網(wǎng)僅提供信息存儲空間,僅對用戶上傳內(nèi)容的表現(xiàn)方式做保護(hù)處理,對用戶上傳分享的文檔內(nèi)容本身不做任何修改或編輯,并不能對任何下載內(nèi)容負(fù)責(zé)。
  • 6. 下載文件中如有侵權(quán)或不適當(dāng)內(nèi)容,請與我們聯(lián)系,我們立即糾正。
  • 7. 本站不保證下載資源的準(zhǔn)確性、安全性和完整性, 同時也不承擔(dān)用戶因使用這些下載資源對自己和他人造成任何形式的傷害或損失。

最新文檔

評論

0/150

提交評論