Lecture 1_Introduction 機器學習概論 教學課件.ppt_第1頁
Lecture 1_Introduction 機器學習概論 教學課件.ppt_第2頁
Lecture 1_Introduction 機器學習概論 教學課件.ppt_第3頁
Lecture 1_Introduction 機器學習概論 教學課件.ppt_第4頁
Lecture 1_Introduction 機器學習概論 教學課件.ppt_第5頁
已閱讀5頁,還剩41頁未讀, 繼續(xù)免費閱讀

下載本文檔

版權說明:本文檔由用戶提供并上傳,收益歸屬內容提供方,若內容存在侵權,請進行舉報或認領

文檔簡介

1、機器學習導論,機器學習導論,第一講導論,2020年8月13日,星期四,鄧志鴻eecs,執(zhí)行摘要,助教參考課程網站的課程要求和目標,課程評估機制,機器學習課程內容簡介,助教和教師鄧志鴻辦公室:2318,科學樓2電話:62755592電子郵件:助理教授:王中輝實驗室:2320,科學樓2電話:62757756電子郵件:余杭實驗室:2320,科學樓2電話教學助理參考課程網站課程要求和目標課程評估機制機器學習簡介課程內容簡介參考資料教科書機器學習Tom Mitchell (CMU)數(shù)據挖掘:概念和技術韓佳偉(uiuc)補充資料期刊tkde,dmkd,jml,conferences KDD,icml,SI

2、MOD,VLDB,執(zhí)行摘要,教學助理參考課程網站課程要求和目的課程評估機制機器學習簡介課程內容簡介,課程網站,網站:用戶名:ml2009密碼:2318,執(zhí)行摘要, 教學和助理參考課程網站課程要求和目的課程評估機制機器學習介紹課程內容介紹課程要求高等數(shù)學微分和積分概率統(tǒng)計數(shù)據結構程序設計語言c,c,java,可以使用一種,并有基本概念。 課程目的:了解和掌握機器學習的基本內容、問題、背景類型、基本方法和算法,了解現(xiàn)有機器學習系統(tǒng)的工作原理,并擁有多種相關軟件,能夠輕松實現(xiàn)分類和聚類等機器學習任務。Matlab,Weka工具包,將不僅使用這些軟件,而且知道如何實現(xiàn)它們。在以后的工作中可以應用機器學

3、習的理論和方法來解決實際問題。執(zhí)行摘要,助教參考資料,課程網站,課程要求和目標,課程評估機制,機器學習簡介,課程評估機制,和小課堂問題。我希望你能積極參加三個小項目的期末考試,即分類、聚類、頻繁模式挖掘和課程成績構成。通常,10個項目、40個分類項目、15個聚類項目、10個模式挖掘項目、15個期末考試、50個項目策略和策略是獨立完成的。鼓勵討論,但禁止剽竊。當數(shù)據合適時,將在課程網站上發(fā)布,內容提要,助教參考資料,課程要求和目的,課程評估機制,機器學習介紹,課程內容介紹,什么是學習,學習儒家經典:有效性;Xi:鳥經常飛。、什么是機器學習希爾伯特西蒙學習是一個系統(tǒng)從經驗中提高性能的任何過程,等同

4、于研究在某些任務中提高性能的算法。機器學習之任務,問題求解規(guī)劃控制分類聚類關聯(lián)挖掘,下棋駕駛汽車、飛機控制電梯控制機器人,機器學習之分類,有指導學習(監(jiān)督學習(分類預測無指導學習(無監(jiān)督學習(聚類關聯(lián)挖掘,歷史回顧1,20世紀50年代塞繆爾斯棋手塞爾弗里奇大混亂1960年代:神經網絡:感知器模式識別極限理論中的學習明斯基和帕伯特證明了感知器的局限性1970 3360符號概念歸納溫斯頓拱形學習者專家系統(tǒng)和知識獲取瓶頸奎寧蘭ID3米哈爾斯基斯AQ和大豆診斷科學發(fā)現(xiàn)與培根數(shù)學發(fā)現(xiàn)與調幅,歷史回顧2,1980 3360高級決策樹和規(guī)則學習基于解釋的學習(EBL)學習和規(guī)劃和問題解決效用問題類比認知結構

5、神經網絡的復興(連接主義,反向傳播(纈氨酸包裝學習理論側重于實驗方法90年代數(shù)據挖掘自適應軟件代理和網絡應用文本學習強化學習歸納邏輯編程集成打包,提升和堆疊貝葉斯網絡學習,歷史回顧3,2000支持向量機內核方法圖形模型統(tǒng)計關系學習轉移學習序列標記集合分類和結構化輸出計算機系統(tǒng)應用程序編譯器調試圖形安全性(入侵,病毒和蠕蟲檢測(電子郵件管理學習機器人學和視覺的個性化助手,為什么要學習機器學習?知識工程瓶頸基于知識工程的智能系統(tǒng)存在以下問題人工構造知識(規(guī)則(的代價高系統(tǒng)移植性差。一旦應用到一個新領域,需要重新構造個性化服務個性化新聞或郵件過濾器個性化輔導從大量數(shù)據中發(fā)現(xiàn)新知識(數(shù)據挖掘(購物籃分

6、析醫(yī)學文本挖掘網絡數(shù)據挖掘,為什么要學習機器學習?時機成熟算法成熟神經網路、貝葉斯方法、支持向量機等大量可用數(shù)據存儲設備性價比越來越高網絡數(shù)據、電子商務、百貨商店/雜貨店購物、銀行/信用卡交易計算資源豐富計算機性價比越來越高莫爾定律:18個月,中央處理器速度提高一倍競爭加劇,需要智能手段為用戶提供更好,更方便的服務(如在客戶關系管理(發(fā)現(xiàn)商業(yè)規(guī)律,提高企業(yè)競爭力,為什么要學習機器學習?海量科學研究數(shù)據衛(wèi)星上的遙感器望遠鏡掃描天空微陣列產生基因表達數(shù)據科學模擬產生萬億字節(jié)的數(shù)據傳統(tǒng)技術無法及時處理這些海量數(shù)據機器學習可以幫助科學家分類和分割數(shù)據發(fā)現(xiàn)新的假設形成,相關學科與機器學習關系、預測建模、

7、聚類、關聯(lián)規(guī)則、異常檢測、牛奶、數(shù)據、機器學習應用,尋找模型類別屬性作為其它屬性的函數(shù),預測貸款信用的模型,類,分類,預測腫瘤細胞是良性還是惡性識別信用卡交易是否是合法還是欺詐蛋白質結構功能分類把新聞報道歸類為財經、天氣、娛樂和體育等識別電腦病毒信用卡用戶欺詐檢測電信客戶流失分析,分類應用場景,分類應用示例銀行放貸,分類,分類,定量,類,訓練集,學習分類器、給對象進行歸組,使得:同一組的對象之間盡可能相似;不同組的對象之間盡可能不相似2007年。聚類,文本聚類把相關文檔歸并在一起方便瀏覽。市場細分是指將市場細分為不同的客戶群,每個客戶群都有相似的行為,這使得廣告、促銷等商業(yè)銷售手段具有針對性。

8、其他人將功能相似的基因或蛋白質放在一起,以便于分析。獲得價格波動相似的股票有助于決策。聚類分析應用場景,聚類分析應用示例搜索結果聚類,元搜索引擎Pinky Search,關聯(lián)規(guī)則,給定一組記錄,記錄由項目組成,以獲取項目之間的依賴關系,規(guī)則發(fā)現(xiàn):牛奶-可樂尿布,牛奶-啤酒,啤酒和尿布,關聯(lián)規(guī)則的應用場景,購物籃分析發(fā)現(xiàn)規(guī)則:用于推廣電信報警診斷,發(fā)現(xiàn)在同一時期經常同時發(fā)生的報警。醫(yī)學信息學發(fā)現(xiàn)與某種疾病相關的并發(fā)癥狀。關聯(lián)規(guī)則應用示例推薦系統(tǒng),關聯(lián)規(guī)則購買(u,book a)購買(u,book b),置信度=95%,查找數(shù)據挖掘:概念和技術,推薦,亞馬遜書店,內容摘要,助教參考資料課程網站課程

9、要求和目標課程評估機制機器學習入門課程內容簡介,課程內容簡介分類,符號邏輯方法謂詞邏輯規(guī)則查找-s,候選項排除,決策樹, 順序覆蓋算法一階謂詞規(guī)則基本概率概念相關的箔貝葉斯方法和貝葉斯公式樸素貝葉斯方法貝葉斯網絡電磁算法神經網絡感知器(線性)前饋多層神經網絡反向傳播算法(任意函數(shù)),課程內容介紹分類,其他支持向量機(SVM)統(tǒng)計學習理論線性SVM非線性SVM核k最近鄰(kNN)分類器集成Bagging Boosting性能評價,課程內容介紹聚類, 相似性度量距離向量距離編輯距離相似性系數(shù)相似性度量聚類核心算法層次聚類方法層次內聚聚類算法劃分聚類方法K-Means密度聚類方法DBSCAN基于模型的方法EM SOM性能評估課程內容介紹模式挖掘基本概念支持置信度關聯(lián)規(guī)則頻繁模式, 頻繁模式挖掘經典算法Apriori算法垂直算法(Eclat和dEclat) FP-Growth挖掘交互式挖掘增量挖掘高級主題序列模式挖掘圖形模式挖掘數(shù)據流環(huán)境中的頻繁模式挖掘,課后思考,日視圖溫度濕度風播放時

溫馨提示

  • 1. 本站所有資源如無特殊說明,都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請下載最新的WinRAR軟件解壓。
  • 2. 本站的文檔不包含任何第三方提供的附件圖紙等,如果需要附件,請聯(lián)系上傳者。文件的所有權益歸上傳用戶所有。
  • 3. 本站RAR壓縮包中若帶圖紙,網頁內容里面會有圖紙預覽,若沒有圖紙預覽就沒有圖紙。
  • 4. 未經權益所有人同意不得將文件中的內容挪作商業(yè)或盈利用途。
  • 5. 人人文庫網僅提供信息存儲空間,僅對用戶上傳內容的表現(xiàn)方式做保護處理,對用戶上傳分享的文檔內容本身不做任何修改或編輯,并不能對任何下載內容負責。
  • 6. 下載文件中如有侵權或不適當內容,請與我們聯(lián)系,我們立即糾正。
  • 7. 本站不保證下載資源的準確性、安全性和完整性, 同時也不承擔用戶因使用這些下載資源對自己和他人造成任何形式的傷害或損失。

評論

0/150

提交評論