




版權說明:本文檔由用戶提供并上傳,收益歸屬內容提供方,若內容存在侵權,請進行舉報或認領
文檔簡介
第三章機器學習3.1
應用場景CONTENTS目錄應用場景
01自動駕駛
02應用范圍文本分類基因識別空間數據處理衛(wèi)星圖片分析客戶群的特征分類與價值分析……01OriginalPointsK-means(2Clusters)
01應用范圍經濟預測疾病自動診斷病人分類新聞分類郵件分類……01
01應用范圍應用范圍:01范圍領域模式識別機器學習數據挖掘機器學習+數據庫統(tǒng)計學習統(tǒng)計+機器學習計算機視覺圖像處理+機器學習語音識別語音處理+機器學習自然語言處理文本處理+機器學習
01應用范圍01視頻來源:/sv/cIfmOW4mUBP7UC.html?from=videoso_result
01自動駕駛駕駛輔助系統(tǒng)(DAS)
部分自動化系統(tǒng)高度自動化系統(tǒng)完全自動化01
02第三章機器學習3.2
機器人學習概述CONTENTS目錄人工智能,機器學習和深度學習的區(qū)別
01機器學習的發(fā)展
02機器學習的分類
03各主流框架基本情況
04人工智能,機器學習和深度學習的區(qū)別02人工智能:人工智能,簡稱AI,是指為機器賦予人的智能。人工智能是計算機科學的一個分支,它企圖了解智能的本質,并生產出一種新的能以人類智能相似的方式做出反應的智能機器,是研究、開發(fā)用于模擬、延伸和擴展人的智能的理論、方法、技術及應用系統(tǒng)的一門新的技術科學。機器學習:機器學習,簡稱ML,是一種實現(xiàn)人工智能的方法。機器學習屬于人工智能的一個分支,也是人工智能的和核心。機器學習理論主要是設計和分析一些讓計算機可以自動“”學習的算法。深度學習:深度學習,簡稱DL,是一種實現(xiàn)機器學習的技術。最初的深度學習是利用深度神經網絡來解決特征表達的一種學習過程。深度神經網絡本身并不是一個全新的概念,可大致理解為包含多個隱含層的神經網絡結構。
01人工智能,機器學習和深度學習的區(qū)別請分別討論下列各組數據的內部關系,并填空。02x131724y14.52.58.53.5?x236812y210.537.565.52.5?y1=x1+1.5y2=x22+1.5
01人工智能,機器學習和深度學習的區(qū)別定義:計算機利用已有的數據(經驗),得出了某種模型(規(guī)律),并利用此模型預測未來數據特征的一種方法。02人類學習VS機器學習
01人工智能,機器學習和深度學習的區(qū)別視頻來源:/video/BV1fA411a7X6?from=search&seid=1697965520941191505502
01機器學習的發(fā)展02機器學習的發(fā)展:在機器學習領域,計算機科學家不斷探索,基于不同的理論創(chuàng)建出不同的機器學習模型。從發(fā)展歷程來說,大致經歷了三個階段:符號主義時代(1980年左右)概率論時代(1990-2000年)聯(lián)結主義時代(2010年左右)
02機器學習的分類機器學習的分類:可以按照輸入的數據本身是否已被標定特定的標簽將機器學習區(qū)分為有監(jiān)督學習、無監(jiān)督學習以及半監(jiān)督學習三類。02機器學習有監(jiān)督學習無監(jiān)督學習半監(jiān)督學習
03機器學習的分類監(jiān)督學習:從帶標簽(標注)的訓練樣本中建立一個模式(模型),并依此模式推測新的數據標簽的算法。無監(jiān)督學習:在學習時并不知道其分類結果,其目的是對原始資料進行分類,以便了解資料內部結構算法。半監(jiān)督學習:利用少量標注樣本和大量未標注樣本進行機器學習,利用數據分布上的模型假設,建立學習器對未標簽樣本進行標簽。02
03各主流框架基本情況各主流框架基本情況對比:02庫名發(fā)布者支持語言支持系統(tǒng)TensorFlowGooglePython/C++/Java/GoLinux/Mac
OS/Android/iOSCaffeUCBerkeleyPython/C++/MatlabLinux/Mac
OS/WindowsCNTKMicrosoftPython/C++/BrainScriptLinux/WindowsMXNetDMLC(分布式機器學習社區(qū))Python/C++/Matlab/Julia/Go/R/ScalaLinux/Mac
OS/Windows/Android/iOSTorchFacebookC/Lua/Linux/Mac
OS/Windows/Android/iOSTheano蒙特利爾大學PythonLinux/Mac
OS/WindowsNeonIntelPythonLinux
04各主流框架基本情況各主流框架的性能對比:02庫名學習材料豐富程度CNN建模能力RNN建模能力易用程度運行速度多GPU支持程度TensorFlow★★★★★★★★★★★★★★★Caffe★★★★★★★CNTK★★★★★★★★★★★MXNet★★★★★★★★★★★★Torch★★★★★★★★★★★★★Theano★★★★★★★★★★★Neon★★★★★★★★★04第三章機器學習3.3監(jiān)督學習及案例體驗CONTENTS目錄監(jiān)督學習簡介
01案例體驗1:電影票房數據分析
02案例體驗2:鳶尾花分類
03監(jiān)督學習簡介在監(jiān)督學習中,每一個例子都是一對由一個輸入對象(通常是一個向量)和一個期望的輸出值(也被稱為監(jiān)督信號)組成的。01
01監(jiān)督學習簡介應用步驟:步驟1:數據集的創(chuàng)建和分類。步驟2:訓練。步驟3:驗證。步驟4:使用。01
01監(jiān)督學習簡介回歸(Regression)y是連續(xù)值(實數或連續(xù)整數),f(x)的輸出也是連續(xù)值。這種類型的問題就是回歸問題。對于所有已知或未知的(x,y),使得f(x,θ)和y盡可能地一致。損失函數通常定義為平方誤差。分類(Classification)y是離散的類別標記(符號),就是分類問題。損失函數有一般用0-1損失函數或負對數似然函數等。在分類問題中,通過學習得到的決策函數f(x,θ)也叫分類器。01
01監(jiān)督學習簡介回歸分析確定兩種或兩種以上變量間相互依賴的定量關系的一種統(tǒng)計分析方法。一元線性回歸只涉及一個自變量和一個因變量。因變量與自變量呈線性關系。因變量與自變量的關系可以用一個線性方程表示:01
01案例體驗1:電影票房數據分析步驟:數據讀取數據預處理模型建立與訓練數據可視化模型預測與可視化02
022.1數據讀取02案例體驗1:電影票房數據分析
0202案例體驗1:電影票房數據分析2.2數據預處理
0202案例體驗1:電影票房數據分析2.3模型建立與訓練(使用一元線性回歸進行分析)
0202案例體驗1:電影票房數據分析2.4數據可視化
0202案例體驗1:電影票房數據分析2.5模型預測與可視化
02案例體驗2:鳶尾花分類步驟:數據讀取數據預處理數據可視化模型建立與訓練模型評估03山鳶尾(setosa)
變色鳶尾(versicolor)
維吉尼亞鳶尾(virginica)
03使用K近鄰對鳶尾花進行分類(物以類聚,人以群分)K近鄰(K-NearestNeighbor,KNN)方法的核心思想是:在特征空間中,如果一個樣本的K個最相似的樣本中的大多數屬于某一個類別,則該樣本也屬于這個類別,并具有這個類別上樣本的特性。03案例體驗2:鳶尾花分類
03花萼長度(spepallength)花萼寬度(spepalwidth)花瓣長度(petallength)花瓣寬度(petalwidth)03案例體驗2:鳶尾花分類3.1數據讀取
03標簽映射03案例體驗2:鳶尾花分類3.2數據預處理
03四個特征值相關性03案例體驗2:鳶尾花分類3.3數據可視化
03四個特征值相關性03案例體驗2:鳶尾花分類3.3數據可視化
0303案例體驗2:鳶尾花分類3.4模型建立與訓練
0303案例體驗2:鳶尾花分類3.5模型評估
03第三章機器學習3.4無監(jiān)督學習及案例體驗CONTENTS目錄無監(jiān)督學習簡介
01案例體驗:使用K-Means對觀影用戶進行聚類
02無監(jiān)督學習簡介無監(jiān)督學習就是在樣本數據中只有數據,而沒有對數據進行標記。無監(jiān)督學習的目的就是讓計算機對這些原始數據進行分析,讓計算機自己去學習、找到數據之間的某種關系。01視頻來源:/v?vid=11285795004709214679&pd=bjh&fr=bjhauthor&type=video視頻:監(jiān)督學習、無監(jiān)督學習、強化學習是什么?
01無監(jiān)督學習簡介無監(jiān)督學習主要包括:聚類聚類是對于未標記的數據,在訓練時根據數據本身的數據特征進行訓練,呈現(xiàn)出數據集聚的形式,每一個集聚群中的數據,彼此都有相似的性質,從而形成分組。降維降維是緩解維數災難的一種重要方法,就是通過某種數學變換將原始高維屬性空間轉變成一個低維子空間。01
01無監(jiān)督學習簡介聚類主要方法:基于劃分的聚類方法(partitioningmethods):K-MEANS算法、K-MEDOIDS算法、CLARANS算法基于層次的聚類方法(hierarchicalmethods):BIRCH算法、CURE算法、CHAMELEON算法基于密度的聚類方法(density-basedmethods):DBSCAN算法、OPTICS算法、DENCLUE算法基于網格的聚類方法(grid-basedmethods):STING算法、CLIQUE算法、WAVE-CLUSTER算法基于模型的聚類方法(model-basedmethods):統(tǒng)計的方案和神經網絡的方案01聚類方法的優(yōu)點:對數據輸入順序不敏感。聚類方法的缺點:在數據分布稀疏時,分類不準確;當高維數據集中存在大量無關的屬性時,使得在所有維中存在簇的可能性幾乎為零;缺乏處理“噪聲”數據的能力。
01案例體驗:使用K-Means對觀影用戶進行聚類K-Means算法原理:K-Means是典型的聚類方法。其中,K表示類別數,Means表示均值。顧名思義,K-Means是一種通過均值對數據點進行聚類的方法。K-Means算法的思想很簡單,對于給定的樣本集,按照樣本之間的距離大小,將樣本集劃分為K個簇。讓簇內的點盡量緊密的連在一起,而讓簇間的距離盡量的大。01視頻來源:/video/BV1ei4y1V7hX/?spm_id_from=333.788.recommend_more_video.-1
02案例體驗:使用K-Means對觀影用戶進行聚類K-Means算法步驟:(隨機)選擇K個聚類的初始中心;對任意一個樣本點,求其到K個聚類中心的距離,將樣本點歸類到距離最小的中心的聚類,如此迭代n次;每次迭代過程中,利用均值等方法更新各個聚類的中心點(質心);對K個聚類中心,利用2,3步迭代更新后,如果位置點變化很小(可以設置閾值),則認為達到穩(wěn)定狀態(tài),迭代結束,對不同的聚類塊和聚類中心可選擇不同的顏色標注。01
02案例體驗:使用K-Means對觀影用戶進行聚類K-Means算法的優(yōu)缺點及應用領域:優(yōu)點:算法簡單、快速。特別是在處理大數據集時,算法可伸縮性高,并且相對高效。當分類(簇)是密集的球狀或團狀,且簇與簇之間區(qū)別明顯時,聚類效果較好。缺點:只有在簇的平均值被定義的情況下才能使用,且對有些分類屬性的數據不適合;要求用戶必須事先給出要生成的簇的數目K;對初始值敏感:使用不同的初始值可能會形成不同的聚類結果;不適合于非凸面形狀的簇類分析,或者大小差別很大的簇;對于“噪聲”和孤立點數據敏感,少量的該類數據可能對平均值產生極大影響。應用:廣泛應用于統(tǒng)計學、生物學、數據庫技術和市場營銷等領域。01
02案例體驗:使用K-Means對觀影用戶進行聚類使用K-Means對觀影用戶進行聚類,
溫馨提示
- 1. 本站所有資源如無特殊說明,都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請下載最新的WinRAR軟件解壓。
- 2. 本站的文檔不包含任何第三方提供的附件圖紙等,如果需要附件,請聯(lián)系上傳者。文件的所有權益歸上傳用戶所有。
- 3. 本站RAR壓縮包中若帶圖紙,網頁內容里面會有圖紙預覽,若沒有圖紙預覽就沒有圖紙。
- 4. 未經權益所有人同意不得將文件中的內容挪作商業(yè)或盈利用途。
- 5. 人人文庫網僅提供信息存儲空間,僅對用戶上傳內容的表現(xiàn)方式做保護處理,對用戶上傳分享的文檔內容本身不做任何修改或編輯,并不能對任何下載內容負責。
- 6. 下載文件中如有侵權或不適當內容,請與我們聯(lián)系,我們立即糾正。
- 7. 本站不保證下載資源的準確性、安全性和完整性, 同時也不承擔用戶因使用這些下載資源對自己和他人造成任何形式的傷害或損失。
最新文檔
- 河南駐馬店春林醫(yī)院招聘真題2024
- 寒露氣象與農業(yè)生產
- 廣東省深圳市2022-2023學年九年級上學期數學期末考前模擬試卷(二)(解析版)
- 2025至2030年中國金屬基復合襯套數據監(jiān)測研究報告
- 2025至2030年中國菠蘿丹數據監(jiān)測研究報告
- 第十四章抗感染藥物藥師培訓基礎知識課件
- 2025至2030年中國獸用連續(xù)注射器數據監(jiān)測研究報告
- 2025-2035年全球及中國聚苯行業(yè)市場發(fā)展現(xiàn)狀及發(fā)展前景研究報告
- 蘇寧倉儲作業(yè)流程
- 2025年濕式靜電除塵器合作協(xié)議書
- 橋梁與地下工程上崗資格考試題庫(濃縮500題)
- 《大學物理學》精美課件(全)
- 政府投資項目立項申請表-正面
- me實驗2 電位、電壓的測定及電路電位圖的繪制
- EGCs與腸道微環(huán)境相互作用的研究進展
- 特殊兒童隨班就讀申請書范本
- 三年級下冊英語教材解讀-教材解讀|魯科版(五四學制)(三起)
- 道路施工導改及施工方案
- 《實數》單元作業(yè)設計
- (word完整版)教師個人簡歷模板
- 專題11 以小見大-【幫作文】初中語文之從課文中學習寫作 課件(共25張PPT)
評論
0/150
提交評論