版權說明:本文檔由用戶提供并上傳,收益歸屬內容提供方,若內容存在侵權,請進行舉報或認領
文檔簡介
第三章機器學習3.1
應用場景CONTENTS目錄應用場景
01自動駕駛
02應用范圍文本分類基因識別空間數(shù)據(jù)處理衛(wèi)星圖片分析客戶群的特征分類與價值分析……01OriginalPointsK-means(2Clusters)
01應用范圍經濟預測疾病自動診斷病人分類新聞分類郵件分類……01
01應用范圍應用范圍:01范圍領域模式識別機器學習數(shù)據(jù)挖掘機器學習+數(shù)據(jù)庫統(tǒng)計學習統(tǒng)計+機器學習計算機視覺圖像處理+機器學習語音識別語音處理+機器學習自然語言處理文本處理+機器學習
01應用范圍01視頻來源:/sv/cIfmOW4mUBP7UC.html?from=videoso_result
01自動駕駛駕駛輔助系統(tǒng)(DAS)
部分自動化系統(tǒng)高度自動化系統(tǒng)完全自動化01
02第三章機器學習3.2
機器人學習概述CONTENTS目錄人工智能,機器學習和深度學習的區(qū)別
01機器學習的發(fā)展
02機器學習的分類
03各主流框架基本情況
04人工智能,機器學習和深度學習的區(qū)別02人工智能:人工智能,簡稱AI,是指為機器賦予人的智能。人工智能是計算機科學的一個分支,它企圖了解智能的本質,并生產出一種新的能以人類智能相似的方式做出反應的智能機器,是研究、開發(fā)用于模擬、延伸和擴展人的智能的理論、方法、技術及應用系統(tǒng)的一門新的技術科學。機器學習:機器學習,簡稱ML,是一種實現(xiàn)人工智能的方法。機器學習屬于人工智能的一個分支,也是人工智能的和核心。機器學習理論主要是設計和分析一些讓計算機可以自動“”學習的算法。深度學習:深度學習,簡稱DL,是一種實現(xiàn)機器學習的技術。最初的深度學習是利用深度神經網絡來解決特征表達的一種學習過程。深度神經網絡本身并不是一個全新的概念,可大致理解為包含多個隱含層的神經網絡結構。
01人工智能,機器學習和深度學習的區(qū)別請分別討論下列各組數(shù)據(jù)的內部關系,并填空。02x131724y14.52.58.53.5?x236812y210.537.565.52.5?y1=x1+1.5y2=x22+1.5
01人工智能,機器學習和深度學習的區(qū)別定義:計算機利用已有的數(shù)據(jù)(經驗),得出了某種模型(規(guī)律),并利用此模型預測未來數(shù)據(jù)特征的一種方法。02人類學習VS機器學習
01人工智能,機器學習和深度學習的區(qū)別視頻來源:/video/BV1fA411a7X6?from=search&seid=1697965520941191505502
01機器學習的發(fā)展02機器學習的發(fā)展:在機器學習領域,計算機科學家不斷探索,基于不同的理論創(chuàng)建出不同的機器學習模型。從發(fā)展歷程來說,大致經歷了三個階段:符號主義時代(1980年左右)概率論時代(1990-2000年)聯(lián)結主義時代(2010年左右)
02機器學習的分類機器學習的分類:可以按照輸入的數(shù)據(jù)本身是否已被標定特定的標簽將機器學習區(qū)分為有監(jiān)督學習、無監(jiān)督學習以及半監(jiān)督學習三類。02機器學習有監(jiān)督學習無監(jiān)督學習半監(jiān)督學習
03機器學習的分類監(jiān)督學習:從帶標簽(標注)的訓練樣本中建立一個模式(模型),并依此模式推測新的數(shù)據(jù)標簽的算法。無監(jiān)督學習:在學習時并不知道其分類結果,其目的是對原始資料進行分類,以便了解資料內部結構算法。半監(jiān)督學習:利用少量標注樣本和大量未標注樣本進行機器學習,利用數(shù)據(jù)分布上的模型假設,建立學習器對未標簽樣本進行標簽。02
03各主流框架基本情況各主流框架基本情況對比:02庫名發(fā)布者支持語言支持系統(tǒng)TensorFlowGooglePython/C++/Java/GoLinux/Mac
OS/Android/iOSCaffeUCBerkeleyPython/C++/MatlabLinux/Mac
OS/WindowsCNTKMicrosoftPython/C++/BrainScriptLinux/WindowsMXNetDMLC(分布式機器學習社區(qū))Python/C++/Matlab/Julia/Go/R/ScalaLinux/Mac
OS/Windows/Android/iOSTorchFacebookC/Lua/Linux/Mac
OS/Windows/Android/iOSTheano蒙特利爾大學PythonLinux/Mac
OS/WindowsNeonIntelPythonLinux
04各主流框架基本情況各主流框架的性能對比:02庫名學習材料豐富程度CNN建模能力RNN建模能力易用程度運行速度多GPU支持程度TensorFlow★★★★★★★★★★★★★★★Caffe★★★★★★★CNTK★★★★★★★★★★★MXNet★★★★★★★★★★★★Torch★★★★★★★★★★★★★Theano★★★★★★★★★★★Neon★★★★★★★★★04第三章機器學習3.3監(jiān)督學習及案例體驗CONTENTS目錄監(jiān)督學習簡介
01案例體驗1:電影票房數(shù)據(jù)分析
02案例體驗2:鳶尾花分類
03監(jiān)督學習簡介在監(jiān)督學習中,每一個例子都是一對由一個輸入對象(通常是一個向量)和一個期望的輸出值(也被稱為監(jiān)督信號)組成的。01
01監(jiān)督學習簡介應用步驟:步驟1:數(shù)據(jù)集的創(chuàng)建和分類。步驟2:訓練。步驟3:驗證。步驟4:使用。01
01監(jiān)督學習簡介回歸(Regression)y是連續(xù)值(實數(shù)或連續(xù)整數(shù)),f(x)的輸出也是連續(xù)值。這種類型的問題就是回歸問題。對于所有已知或未知的(x,y),使得f(x,θ)和y盡可能地一致。損失函數(shù)通常定義為平方誤差。分類(Classification)y是離散的類別標記(符號),就是分類問題。損失函數(shù)有一般用0-1損失函數(shù)或負對數(shù)似然函數(shù)等。在分類問題中,通過學習得到的決策函數(shù)f(x,θ)也叫分類器。01
01監(jiān)督學習簡介回歸分析確定兩種或兩種以上變量間相互依賴的定量關系的一種統(tǒng)計分析方法。一元線性回歸只涉及一個自變量和一個因變量。因變量與自變量呈線性關系。因變量與自變量的關系可以用一個線性方程表示:01
01案例體驗1:電影票房數(shù)據(jù)分析步驟:數(shù)據(jù)讀取數(shù)據(jù)預處理模型建立與訓練數(shù)據(jù)可視化模型預測與可視化02
022.1數(shù)據(jù)讀取02案例體驗1:電影票房數(shù)據(jù)分析
0202案例體驗1:電影票房數(shù)據(jù)分析2.2數(shù)據(jù)預處理
0202案例體驗1:電影票房數(shù)據(jù)分析2.3模型建立與訓練(使用一元線性回歸進行分析)
0202案例體驗1:電影票房數(shù)據(jù)分析2.4數(shù)據(jù)可視化
0202案例體驗1:電影票房數(shù)據(jù)分析2.5模型預測與可視化
02案例體驗2:鳶尾花分類步驟:數(shù)據(jù)讀取數(shù)據(jù)預處理數(shù)據(jù)可視化模型建立與訓練模型評估03山鳶尾(setosa)
變色鳶尾(versicolor)
維吉尼亞鳶尾(virginica)
03使用K近鄰對鳶尾花進行分類(物以類聚,人以群分)K近鄰(K-NearestNeighbor,KNN)方法的核心思想是:在特征空間中,如果一個樣本的K個最相似的樣本中的大多數(shù)屬于某一個類別,則該樣本也屬于這個類別,并具有這個類別上樣本的特性。03案例體驗2:鳶尾花分類
03花萼長度(spepallength)花萼寬度(spepalwidth)花瓣長度(petallength)花瓣寬度(petalwidth)03案例體驗2:鳶尾花分類3.1數(shù)據(jù)讀取
03標簽映射03案例體驗2:鳶尾花分類3.2數(shù)據(jù)預處理
03四個特征值相關性03案例體驗2:鳶尾花分類3.3數(shù)據(jù)可視化
03四個特征值相關性03案例體驗2:鳶尾花分類3.3數(shù)據(jù)可視化
0303案例體驗2:鳶尾花分類3.4模型建立與訓練
0303案例體驗2:鳶尾花分類3.5模型評估
03第三章機器學習3.4無監(jiān)督學習及案例體驗CONTENTS目錄無監(jiān)督學習簡介
01案例體驗:使用K-Means對觀影用戶進行聚類
02無監(jiān)督學習簡介無監(jiān)督學習就是在樣本數(shù)據(jù)中只有數(shù)據(jù),而沒有對數(shù)據(jù)進行標記。無監(jiān)督學習的目的就是讓計算機對這些原始數(shù)據(jù)進行分析,讓計算機自己去學習、找到數(shù)據(jù)之間的某種關系。01視頻來源:/v?vid=11285795004709214679&pd=bjh&fr=bjhauthor&type=video視頻:監(jiān)督學習、無監(jiān)督學習、強化學習是什么?
01無監(jiān)督學習簡介無監(jiān)督學習主要包括:聚類聚類是對于未標記的數(shù)據(jù),在訓練時根據(jù)數(shù)據(jù)本身的數(shù)據(jù)特征進行訓練,呈現(xiàn)出數(shù)據(jù)集聚的形式,每一個集聚群中的數(shù)據(jù),彼此都有相似的性質,從而形成分組。降維降維是緩解維數(shù)災難的一種重要方法,就是通過某種數(shù)學變換將原始高維屬性空間轉變成一個低維子空間。01
01無監(jiān)督學習簡介聚類主要方法:基于劃分的聚類方法(partitioningmethods):K-MEANS算法、K-MEDOIDS算法、CLARANS算法基于層次的聚類方法(hierarchicalmethods):BIRCH算法、CURE算法、CHAMELEON算法基于密度的聚類方法(density-basedmethods):DBSCAN算法、OPTICS算法、DENCLUE算法基于網格的聚類方法(grid-basedmethods):STING算法、CLIQUE算法、WAVE-CLUSTER算法基于模型的聚類方法(model-basedmethods):統(tǒng)計的方案和神經網絡的方案01聚類方法的優(yōu)點:對數(shù)據(jù)輸入順序不敏感。聚類方法的缺點:在數(shù)據(jù)分布稀疏時,分類不準確;當高維數(shù)據(jù)集中存在大量無關的屬性時,使得在所有維中存在簇的可能性幾乎為零;缺乏處理“噪聲”數(shù)據(jù)的能力。
01案例體驗:使用K-Means對觀影用戶進行聚類K-Means算法原理:K-Means是典型的聚類方法。其中,K表示類別數(shù),Means表示均值。顧名思義,K-Means是一種通過均值對數(shù)據(jù)點進行聚類的方法。K-Means算法的思想很簡單,對于給定的樣本集,按照樣本之間的距離大小,將樣本集劃分為K個簇。讓簇內的點盡量緊密的連在一起,而讓簇間的距離盡量的大。01視頻來源:/video/BV1ei4y1V7hX/?spm_id_from=333.788.recommend_more_video.-1
02案例體驗:使用K-Means對觀影用戶進行聚類K-Means算法步驟:(隨機)選擇K個聚類的初始中心;對任意一個樣本點,求其到K個聚類中心的距離,將樣本點歸類到距離最小的中心的聚類,如此迭代n次;每次迭代過程中,利用均值等方法更新各個聚類的中心點(質心);對K個聚類中心,利用2,3步迭代更新后,如果位置點變化很小(可以設置閾值),則認為達到穩(wěn)定狀態(tài),迭代結束,對不同的聚類塊和聚類中心可選擇不同的顏色標注。01
02案例體驗:使用K-Means對觀影用戶進行聚類K-Means算法的優(yōu)缺點及應用領域:優(yōu)點:算法簡單、快速。特別是在處理大數(shù)據(jù)集時,算法可伸縮性高,并且相對高效。當分類(簇)是密集的球狀或團狀,且簇與簇之間區(qū)別明顯時,聚類效果較好。缺點:只有在簇的平均值被定義的情況下才能使用,且對有些分類屬性的數(shù)據(jù)不適合;要求用戶必須事先給出要生成的簇的數(shù)目K;對初始值敏感:使用不同的初始值可能會形成不同的聚類結果;不適合于非凸面形狀的簇類分析,或者大小差別很大的簇;對于“噪聲”和孤立點數(shù)據(jù)敏感,少量的該類數(shù)據(jù)可能對平均值產生極大影響。應用:廣泛應用于統(tǒng)計學、生物學、數(shù)據(jù)庫技術和市場營銷等領域。01
02案例體驗:使用K-Means對觀影用戶進行聚類使用K-Means對觀影用戶進行聚類,
溫馨提示
- 1. 本站所有資源如無特殊說明,都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請下載最新的WinRAR軟件解壓。
- 2. 本站的文檔不包含任何第三方提供的附件圖紙等,如果需要附件,請聯(lián)系上傳者。文件的所有權益歸上傳用戶所有。
- 3. 本站RAR壓縮包中若帶圖紙,網頁內容里面會有圖紙預覽,若沒有圖紙預覽就沒有圖紙。
- 4. 未經權益所有人同意不得將文件中的內容挪作商業(yè)或盈利用途。
- 5. 人人文庫網僅提供信息存儲空間,僅對用戶上傳內容的表現(xiàn)方式做保護處理,對用戶上傳分享的文檔內容本身不做任何修改或編輯,并不能對任何下載內容負責。
- 6. 下載文件中如有侵權或不適當內容,請與我們聯(lián)系,我們立即糾正。
- 7. 本站不保證下載資源的準確性、安全性和完整性, 同時也不承擔用戶因使用這些下載資源對自己和他人造成任何形式的傷害或損失。
最新文檔
- 新員工培訓匯報
- 大班科學活動仿生現(xiàn)象
- 名師班主任培訓心得
- 數(shù)控車削加工技術 教案 項目十 螺紋車削工藝及編程
- 13.1 分子熱運動(6大題型)(含答案解析)
- 新疆喀什地區(qū)2024-2025學年高二上學期期中地理試卷(無答案)
- 廣東順德德勝學校2024-2025學年高二上學期10月月考英語試題(含答案無聽力原文及音頻)
- 2025屆湖北省部分高中高三上學期11月期中聯(lián)考數(shù)學試題(含答案)
- 2024-2025學年安徽省六安市裕安區(qū)六安九中九年級(上)月考物理試卷(10月份)(含答案)
- T-YNZYC 0106-2023 綠色藥材 烏天麻產地環(huán)境標準
- 醫(yī)療設備應急預案及流程
- 啟封密閉排放瓦斯方案及安全技術措施
- 2023-2024年湖北省鄂東南聯(lián)盟高一上學期期中聯(lián)考物理試題(解析版)
- 2023年康復醫(yī)學治療技術(士)考試題庫匯總500道含解析253
- 獎牌施工方案
- 加油站可行性研究報告范文
- 國家獎學金申請審批表模板
- 物理化學二氧化碳和硫的相圖
- 接地裝置及接地電阻檢測記錄表
- 新員工入職考核評估表
- 國開2023秋人文英語4形考任務1-4參考答案
評論
0/150
提交評論