機器學習概要介紹_第1頁
機器學習概要介紹_第2頁
機器學習概要介紹_第3頁
機器學習概要介紹_第4頁
機器學習概要介紹_第5頁
已閱讀5頁,還剩6頁未讀, 繼續(xù)免費閱讀

下載本文檔

版權(quán)說明:本文檔由用戶提供并上傳,收益歸屬內(nèi)容提供方,若內(nèi)容存在侵權(quán),請進行舉報或認領

文檔簡介

1、 機器學習概要介紹導讀:MATLAB開發(fā)運營團隊深度解析何為機器學習,什么時候使用機器學習,如何選擇機器學習算法,MATLAB到底能為機器學習提供怎樣的便利?機器學習是一種數(shù)據(jù)分析技術(shù),讓計算機執(zhí)行人和動物與生俱來的活動:從經(jīng)驗中學習。機器學習算法使用計算方法直接從數(shù)據(jù)中“學習”信息,而不依賴于預定方程模型。當可用于學習的樣本數(shù)量增加時,這些算法可自適應提高性能。一機器學習為什么那么重要?隨著大數(shù)據(jù)應用增加,機器學習已成為解決以下領域問題的一項關鍵技術(shù):計算金融學,用于信用評估和算法交易。圖像處理和計算機視覺,用于人臉識別、運動檢測和對象檢測。計算生物學,用于腫瘤檢測、藥物發(fā)現(xiàn)和 DNA 序列

2、分析。能源生產(chǎn),用于預測價格和負載。汽車、航空航天和制造業(yè),用于預見性維護。自然語言處理,用于語音識別應用。更多數(shù)據(jù)、更多問題、更好的解答機器學習算法能夠在產(chǎn)生洞察力的數(shù)據(jù)中發(fā)現(xiàn)自然模式,幫助你更好地制定決策和做出預測。醫(yī)療診斷、股票交易、能量負荷預測及更多行業(yè)每天都在使用這些算法制定關鍵決策。例如,媒體網(wǎng)站依靠機器學習算法從數(shù)百萬種選項中篩選出為你推薦的歌曲或影片。零售商利用這些算法深入了解客戶的購買行為。何時應該使用機器學習?當你遇到涉及大量數(shù)據(jù)和許多變量的復雜任務或問題,但沒有現(xiàn)成的處理公式或方程式時,可以考慮使用機器學習。例如,如果你需要處理以下情況,使用機器學習是一個很好的選擇:二機

3、器學習的工作原理:機器學習采用兩種技術(shù):監(jiān)督式學習和無監(jiān)督學習。監(jiān)督式學習根據(jù)已知的輸入和輸出訓練模型,讓模型能夠預測未來輸出;無監(jiān)督學習從輸入數(shù)據(jù)中找出隱藏模式或內(nèi)在結(jié)構(gòu)。監(jiān)督式學習:監(jiān)督式機器學習能夠根據(jù)已有的包含不確定性的數(shù)據(jù)建立一個預測模型。監(jiān)督式學習算法接受已知的輸入數(shù)據(jù)集(包含預測變量)和對該數(shù)據(jù)集的已知響應(輸出,響應變量),然后訓練模型,使模型能夠?qū)π螺斎霐?shù)據(jù)的響應做出合理的預測。如果你嘗試去預測已知數(shù)據(jù)的輸出,則使用監(jiān)督式學習。監(jiān)督式學習采用分類和回歸技術(shù)開發(fā)預測模型。分類技術(shù)可預測離散的響應 例如,電子郵件是不是垃圾郵件,腫瘤是惡性還是良性的。分類模型可將輸入數(shù)據(jù)劃分成不同

4、類別。典型的應用包括醫(yī)學成像、語音識別和信用評估。如果你的數(shù)據(jù)能進行標記、分類或分為特定的組或類,則使用分類。例如,筆跡識別的應用程序使用分類來識別字母和數(shù)字。在圖像處理和計算機視覺中,無監(jiān)督模式識別技術(shù)用于對象檢測和圖像分割。用于實現(xiàn)分類的常用算法包括:支持向量機 (SVM)、提升 (boosted)決策樹和袋裝 (bagged)決策樹、k-最近鄰、樸素貝葉斯 (Nave Bayes)、判別分析、邏輯回歸和神經(jīng)網(wǎng)絡。回歸技術(shù)可預測連續(xù)的響應 例如,溫度的變化或電力需求中的波動。典型的應用包括電力系統(tǒng)負荷預測和算法交易。如果你在處理一個數(shù)據(jù)范圍,或你的響應性質(zhì)是一個實數(shù)(比如溫度,或一件設備發(fā)

5、生故障前的運行時間),則使用回歸方法。常用回歸算法包括:線性模型、非線性模型、規(guī)則化、逐步回歸、提升 (boosted)和袋裝 (bagged)決策樹、神經(jīng)網(wǎng)絡和自適應神經(jīng)模糊學習。小例子:使用監(jiān)督式學習預測心臟病發(fā)作假設臨床醫(yī)生希望預測某位患者在一年內(nèi)是否會心臟病發(fā)作。他們有以前就醫(yī)的患者的相關數(shù)據(jù),包括年齡、體重、身高和血壓。他們知道以前的患者在一年內(nèi)是否出現(xiàn)過心臟病發(fā)作。因此,問題在于如何將現(xiàn)有數(shù)據(jù)合并到模型中,讓該模型能夠預測新患者在一年內(nèi)是否會出現(xiàn)心臟病發(fā)作。無監(jiān)督學習:無監(jiān)督學習可發(fā)現(xiàn)數(shù)據(jù)中隱藏的模式或內(nèi)在結(jié)構(gòu)。這種技術(shù)可根據(jù)未做標記的輸入數(shù)據(jù)集得到推論。聚類是一種最常用的無監(jiān)督學

6、習技術(shù)。這種技術(shù)可通過探索性數(shù)據(jù)分析發(fā)現(xiàn)數(shù)據(jù)中隱藏的模式或分組。聚類分析的應用包括基因序列分析、市場調(diào)查和對象識別。例如,如果移動電話公司想優(yōu)化他們手機信號塔的建立位置,則可以使用機器學習來估算依賴這些信號塔的人群數(shù)量。一部電話一次只能與一個信號塔通信,所以,該團隊使用聚類算法設計蜂窩塔的最佳布局,優(yōu)化他們的客戶群組或集群的信號接收。用于執(zhí)行聚類的常用算法包括:k-均值和 k-中心點(k-medoids)、層次聚類、高斯混合模型、隱馬爾可夫模型、自組織映射、模糊 c-均值聚類法和減法聚類。如何確定使用哪種機器學習算法?選擇正確的算法看似難以駕馭需要從幾十種監(jiān)督式和無監(jiān)督機器學習算法中選擇,每種

7、算法又包含不同的學習方法。沒有最佳方法或萬全之策。找到正確的算法只是試錯過程的一部分即使是經(jīng)驗豐富的數(shù)據(jù)科學家,也無法說出某種算法是否無需試錯即可使用。但算法的選擇還取決于你要處理的數(shù)據(jù)的大小和類型、你要從數(shù)據(jù)中獲得的洞察力以及如何運用這些洞察力。下面是選擇監(jiān)督式或者無監(jiān)督機器學習的一些準則:在以下情況下選擇監(jiān)督式學習:你需要訓練模型進行預測(例如溫度和股價等連續(xù)變量的值)或者分類(例如根據(jù)網(wǎng)絡攝像頭的錄像片段確定汽車的技術(shù)細節(jié))。在以下情況下選擇無監(jiān)督學習:你需要深入了解數(shù)據(jù)并希望訓練模型找到好的內(nèi)部表示形式,例如將數(shù)據(jù)拆分到集群中。三MATLAB機器學習:你如何借助機器學習的力量,使用數(shù)據(jù)做出更好的決策?MATLAB 讓機器學習簡單易行。借助用于處理大數(shù)據(jù)的工具和函數(shù),以及讓機器學習發(fā)揮作用的應用程序,MATLAB 是將機器學習應用于你的數(shù)據(jù)分析的理想環(huán)境。使用 MATLAB,工程師和數(shù)據(jù)科學家可以立即訪問預置的函數(shù)、大量的工具箱以及用于分類、回歸和聚類的專門應用程序。MATLAB可以做到:比較各種方法,例如邏輯回歸、分類樹、支持

溫馨提示

  • 1. 本站所有資源如無特殊說明,都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請下載最新的WinRAR軟件解壓。
  • 2. 本站的文檔不包含任何第三方提供的附件圖紙等,如果需要附件,請聯(lián)系上傳者。文件的所有權(quán)益歸上傳用戶所有。
  • 3. 本站RAR壓縮包中若帶圖紙,網(wǎng)頁內(nèi)容里面會有圖紙預覽,若沒有圖紙預覽就沒有圖紙。
  • 4. 未經(jīng)權(quán)益所有人同意不得將文件中的內(nèi)容挪作商業(yè)或盈利用途。
  • 5. 人人文庫網(wǎng)僅提供信息存儲空間,僅對用戶上傳內(nèi)容的表現(xiàn)方式做保護處理,對用戶上傳分享的文檔內(nèi)容本身不做任何修改或編輯,并不能對任何下載內(nèi)容負責。
  • 6. 下載文件中如有侵權(quán)或不適當內(nèi)容,請與我們聯(lián)系,我們立即糾正。
  • 7. 本站不保證下載資源的準確性、安全性和完整性, 同時也不承擔用戶因使用這些下載資源對自己和他人造成任何形式的傷害或損失。

評論

0/150

提交評論