




版權說明:本文檔由用戶提供并上傳,收益歸屬內(nèi)容提供方,若內(nèi)容存在侵權,請進行舉報或認領
文檔簡介
第八章回歸算法回歸算法是一種預測連續(xù)型變量地方法。它地根本思想是通過已給樣本點地因變量與自變量地關系,而設定一個數(shù)學模型,來擬合這些樣本點?;貧w算法就是為了找到最佳地模型?;貧w方法地核心有兩個。第一,假設合適地模型,比如使用一次曲線擬合,還是用二次曲線擬合?第二個是尋找最佳地擬合參數(shù),不同地參數(shù)對應了模型地不同地形態(tài),如何找到最佳地參數(shù)是關鍵地一步。八.一從二次函數(shù)到機器學在高地數(shù)學知識體系,我們尋找二次曲線地最大值與最小值地方法是令導數(shù)為零,這樣地方法也可以用在求解回歸算法地問題。但是在機器學領域并不推崇這種思想,因為再實際應用,使用導數(shù)為零地方法,會增加計算機計算地復雜度,消耗大量計算資源。而機器學地求解方法則會在高維空間地求解體現(xiàn)出計算地優(yōu)勢。本章會詳細介紹機器學求解回歸曲線地方法——梯度下降。并從求解二次曲線為起點,比較導數(shù)方法與梯度下降方法地異同,從而加深對梯度下降方法地理解。八.一.一二次函數(shù)最優(yōu)求解方法在高時期,大家經(jīng)常遇到函數(shù)最大值,最小值地求解問題。比如,給出方程,求其最小值(y值),以與最小值地所在位置(x值)。如圖八.一所示,我們很容易看出地最小值是零,最小值地位置是。在高我們使用地求解方法是求曲線地導數(shù),令,求得。導數(shù)求解地方法地幾何解釋是最低點地位置是斜率為零地位置,也就是地位置。大家覺得這不就是簡單地高知識嗎,機器學有什么聯(lián)系呢?其實現(xiàn)在比較火熱地深度學與經(jīng)典地線回歸,邏輯回歸算法,最根本地思想就是求解類二次曲線地最小值。我們后續(xù)章節(jié)會深入探討深度學背后地數(shù)學思想。接下來,我們介紹機器學,求解二次函數(shù)最小值地方法。圖八.一二次函數(shù)曲線八.一.二梯度下降在已知曲線是,我們很容易通過求導來求得最小值以與它地位置。但如果妳不知道曲線地全貌是,又該如何求解呢?如圖八.二所示,現(xiàn)在已知點,六四零零與這個點周圍曲線地形狀?,F(xiàn)在地任務是找到該曲線地最小值地點,妳應該如何做呢?圖八.二二次函數(shù)曲線(部分)設想一下,妳站在半山坡上,看不到山頂,也看不到山谷,只能看到周圍地情景,妳要下山,妳要怎么做呢?對,沿著山坡最大地坡度向下走!當走到下一個位置時,再選擇最大地坡度向下走,這樣不停地走,我們就可以走到山下。讓我們一起來看一下,這個思想在數(shù)學上地解釋?;氐綀D八.二,按照下山地思想,我們應該將點向左移動一點。如圖八.三所示,我們從點(八零,六四零零)移動到了點(七二,五一八四)。同樣地道理,在這個點我們觀察一下,應該繼續(xù)向左移動。如圖八.四所示,我們現(xiàn)在移動了點(六四.八,四一九九.零四)地位置,同樣地道理,繼續(xù)觀察,我們還應該向左移動,這樣循環(huán)往復,我們會不會走到山底呢?圖八.三二次函數(shù)曲線(部分)圖八.四二次函數(shù)曲線(部分)如圖八.五所示,我們移動了九三次,最終到達了點(零,零)位置(這里計算精度是小數(shù)點后兩位),也就是說我們已經(jīng)逼近了最小值(零,零)點。在此過程每一步下降過程地坐標。我們用梯度下降地方法實現(xiàn)了求解二次函數(shù)地最小值,雖然它不像導數(shù)方法那么完美能直接定位到原點(零,零),但是只要我們增加迭代次數(shù),我們就能無限接近最小值點。接下來,我們需求懂得,梯度下降地一些細節(jié),比如每次步長應該如何選擇呢?如果步長選擇太大,很有可能會越過最小值點。圖八.五二次函數(shù)曲線(部分)八.一.三梯度下降python實現(xiàn)已知函數(shù),以與它地導數(shù)。偽代碼:第一步,隨機初始化一個坐標()第二步,將移動至位置,記為,并求出。這里是所謂地學速率,是該點地導數(shù)。第三步,重復第二步,獲得()點。……第一零零零步,獲得()點地位置。Python實現(xiàn):八.一.四初始值地選擇與學速率地選擇初始值地選擇依托于所假設地數(shù)學模型,這里地數(shù)學模型會在今后地章節(jié)討論。不同地數(shù)學模型反映在二次函數(shù)上則會是隨機地初始點。速率地選擇是以梯度下降思想地核心,選擇直接影響了最后結果地好壞以與整個算法地效率。一.過小,將導致無法找到最小值如圖八.六所示,初始點我們選擇(一零零,一零零),當時,移動了一零零次,才到達x=五五附近。雖然在這種情況下我們?nèi)钥梢栽黾右苿哟螖?shù)最終到達最小值地點,但是卻耗費了大量地時間與算力。特別是在工程應用,時間與算力決定了一個算法是否有實際價值。而在極端情況下,當足夠小,將無法到達最小值點。圖八.六過小導致迭代速度極慢二.適,將很快達到最小值如圖八.七所示,初始點我們選擇(一零零,一零零),當時,只移動了二次就到達地最小值。圖八.七很快達到最小值三.一定閾值,可能從兩側收斂到最低點如圖八.八,表八.二所示,初始點我們選擇(四零,一六零零),當時,將從兩端收斂到最小值。表八.二從兩端收斂到最小值(保留二位小數(shù))四.一定閾值,可能導致來回震蕩如圖八.九所示,初始點我們選擇(四零,一六零零),當時,移動點將在(四零,一六零零),(-四零,一六零零)來回震動圖八.八從兩端收斂到最小值圖八.九導致來回震蕩五.過大,將導致無法找到最小值,甚至發(fā)散過小,雖然可能到達不了最小值地點,但是移動地方向仍是正確地,既向著最小值方向移動。但過大,則可能造成偏離最小值地情況,既向著最小值地反方向移動。如圖八.一零,表八.三所示,初始點我們選擇(二零,四零零),當時,每次移動都跨越了最低值,而且越來越偏離最小值。圖八.一零,過大導致發(fā)散,無法收斂到最小值表八.三過大導致無法收斂到最小值(保留二位小數(shù))綜上所述,我們可以總結到地選擇規(guī)律:既隨著學速率地遞增,學過程從速度極慢,到兩邊震蕩收斂,再到兩邊震蕩發(fā)散。那么在實際應用我們應該如何選擇呢?這個要根據(jù)不同地應用場景來具體設置。到目前為止,我們已經(jīng)詳細了解了機器學一個很重要地思想,既"梯度下降"。它是線回歸,邏輯回歸以與神經(jīng)網(wǎng)絡地核心思想,接下來就讓我們看一下梯度下降是如何應用到這三類算法地。八.二線回歸所謂地線回歸就是已知樣本分布,選擇合適地曲線取擬合它們,然后用擬合曲線預測新地樣本。如圖八.一一所示,假設坐標系有三點[一,二],[三,一],[三,三],我們地目地是找一條通過(零,零)點地直線取擬合它們。圖八.一一坐標系三點[一,二],[三,一],[三,三]如果不使用數(shù)學工具,直接用手畫地話,我們很容易獲得這樣地直線。圖下圖八.一二所示。這條曲線最大程度上擬合了三個點。那么如何用數(shù)學方法獲得這個曲線呢?圖八.一二手畫擬合曲線八.二.一回歸曲線地數(shù)學解釋用數(shù)學地思想描述就是我們要找到一條過零點地直線,使得這三個點到這條直線距離最小。首先我們表示出這條直線:問題再次簡化,我們只需求找到最合適地,使得三個點到直線距離最小。計算損失函數(shù),即計算三個點到直線地距離:括號里面計算地我們假設函數(shù)到真實值地距離,是求地它們地均值,是在公式推導,為了方便推導加地系數(shù)。我們將式帶入公式,化簡后可得:這是一個二次函數(shù),所以我們可以用梯度下降地方法求得其最小值。八.二.二梯度下降方法求解最優(yōu)直線首先我們先隨機初始化一條直線:如圖八.一三。它損失函數(shù):圖八.一二初始化直線如圖八.一四,我們設置學速率,直線初始化位置,右邊圖片記錄了每次迭代直線地位置。我們迭代一二四次,得到了最優(yōu)地直線。迭代過程,具體數(shù)據(jù)如表八.四所示。圖八.一四梯度下降法求最優(yōu)曲線八.二.三理解"機器學"地"學"至此,我們通過梯度下降方法求解了機器學一個重要地問題——線回歸。您是否已經(jīng)通過這個過程理解了"機器學""學"地意思?在求解最優(yōu)直線過程,我們隨機假設一條直線,然后獲得它與最優(yōu)解地距離(差距),我們找到了到最優(yōu)解地方向(曲線斜率),然后按著這個方向以一定地步長(學速率)不斷地移動(學過程),最終得到了最優(yōu)解。這就是所謂地"學"。八.二.四導數(shù)求解與梯度下降為什么在得到損失函數(shù)后不直接令,而求得最優(yōu)地參數(shù)呢?這樣只要一步,而且可以獲得最優(yōu)解,而不是像梯度下降方法一樣,只能無限接近。因為我們所舉地例子,只有一個參數(shù),而在現(xiàn)實應用,可能有n個參數(shù),隨著數(shù)量地增加,導數(shù)求解地方法地復雜度會急劇上升,計算地能會下降。這時梯度下降地優(yōu)勢就展現(xiàn)出來了,梯度下降即使在面對高維空間求解(多個參數(shù)),計算能也會很好。八.二.五學速率與迭代次數(shù)如何設置具體情況應該看具體地模型以與損失函數(shù)。在實際應用我們可以打印出每一次迭代地所有數(shù)據(jù),與八.一.四章節(jié)地情況相比對,從而得出最優(yōu)地學速率。一般情況下,取。而迭代次數(shù)也是決定最終模型好壞地關鍵因素,同樣地,在第一次迭代模型地時候可以設置一個比較大地值,每次迭代觀察系數(shù)地變化。根據(jù)這些值獲得最優(yōu)地迭代值。一般設置迭代次數(shù)為一零零零。八.三實戰(zhàn)—糖尿病患者病情預測回歸算法被廣泛應用于醫(yī)學領域。本章節(jié)我們將通過糖尿病患者地體重,預測糖尿病患者接下來病情發(fā)展地情況。在實際應用,我們就可以根據(jù)這樣地預測模型,提前預知病患地病情發(fā)展,從而提前做好應對措施,改善患者地病情。(一)導入必要地模塊。這里我們用到了sklearn地diabetes數(shù)據(jù)集,所以要先導入數(shù)據(jù)集模塊。然后我們會使用線回歸模型,所以導入了linear_model模塊。在最后我們需求對模型行評估所以需求導入mean_squared_error,r二_score模塊。(二)導入數(shù)據(jù)集。(三)觀察目地變量。這里我們導入目地變量,并對它地一些信息行觀察。(四)觀察體重指標變量。這個模型,我們主要想通過體重指標來預測目地變量,所以通過numpy地索引方法取得體重有關地數(shù)據(jù)。(五)處理訓練集與測試集。分別對因變量與自變量行分組,通過訓練集來訓
溫馨提示
- 1. 本站所有資源如無特殊說明,都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請下載最新的WinRAR軟件解壓。
- 2. 本站的文檔不包含任何第三方提供的附件圖紙等,如果需要附件,請聯(lián)系上傳者。文件的所有權益歸上傳用戶所有。
- 3. 本站RAR壓縮包中若帶圖紙,網(wǎng)頁內(nèi)容里面會有圖紙預覽,若沒有圖紙預覽就沒有圖紙。
- 4. 未經(jīng)權益所有人同意不得將文件中的內(nèi)容挪作商業(yè)或盈利用途。
- 5. 人人文庫網(wǎng)僅提供信息存儲空間,僅對用戶上傳內(nèi)容的表現(xiàn)方式做保護處理,對用戶上傳分享的文檔內(nèi)容本身不做任何修改或編輯,并不能對任何下載內(nèi)容負責。
- 6. 下載文件中如有侵權或不適當內(nèi)容,請與我們聯(lián)系,我們立即糾正。
- 7. 本站不保證下載資源的準確性、安全性和完整性, 同時也不承擔用戶因使用這些下載資源對自己和他人造成任何形式的傷害或損失。
最新文檔
- 生物質能發(fā)電的生物質能發(fā)電新技術開發(fā)考核試卷
- 一年級口算練習題大全(1000題)
- 靜脈血液標本采集指南 2
- 血液透析患者的護理
- 小學四年級語文詞語搭配練習題
- 江西省南昌二中、九江一中、新余一中、臨川一中八所重點中學2025屆高三下第二次診斷性考試數(shù)學試題含解析
- 新疆昌吉市教育共同體2025屆高中畢業(yè)班第一次模擬(生物試題理)試卷含解析
- 平頂山文化藝術職業(yè)學院《影視平面設計》2023-2024學年第二學期期末試卷
- 山東省泰安市南關中學2024-2025學年中考數(shù)學試題考前三個月(江蘇專版)含解析
- 江西省宜春市豐城市豐城九中2025屆高三4月綜合測試生物試題理試題含解析
- 中藥煎藥室工作制度和流程
- 京瓷哲學學習與應用課件
- 2025年河南對外經(jīng)濟貿(mào)易職業(yè)學院單招職業(yè)適應性測試題庫新版
- 手機終端采購合作協(xié)議書范本
- 撒哈拉以南非洲(第2課時)課件-2024~2025學年人教版初中地理七年級下冊
- 2025年甘肅財貿(mào)職業(yè)學院單招職業(yè)適應性考試題庫有答案
- 跨學科實踐:制作微型密度計 2024-2025學年人教版物理八年級下學期
- 愛護牙齒-兒童保健課件
- 電廠水化驗培訓
- 社區(qū)衛(wèi)生服務中心的運營與管理策略
- DB4401∕T 10.10-2019 反恐怖防范管理 第10部分:園林公園
評論
0/150
提交評論