《機器學習算法與應用》課件-第一章 準備_第1頁
《機器學習算法與應用》課件-第一章 準備_第2頁
《機器學習算法與應用》課件-第一章 準備_第3頁
《機器學習算法與應用》課件-第一章 準備_第4頁
《機器學習算法與應用》課件-第一章 準備_第5頁
已閱讀5頁,還剩31頁未讀, 繼續(xù)免費閱讀

下載本文檔

版權(quán)說明:本文檔由用戶提供并上傳,收益歸屬內(nèi)容提供方,若內(nèi)容存在侵權(quán),請進行舉報或認領

文檔簡介

第一章機器學習算法與應用01機器學習簡介添加相關標題文字添加相關標題文字添加相關標題文字添加相關標題文字機器學習簡介人工智能應用在哪里呢?無人駕駛汽車是智能汽車的一種,也稱為輪式移動機器人,主要依靠車內(nèi)以計算機系統(tǒng)為主的智能駕駛控制器來實現(xiàn)無人駕駛。無人駕駛中涉及的技術(shù)包含多個方面,例如計算機視覺、自動控制技術(shù)等。美國、英國、德國等發(fā)達國家從20世紀70年代開始就投入到無人駕駛汽車的研究中,中國從20世紀80年代起也開始了無人駕駛汽車的研究。例如,Google的GoogleX實驗室正在積極研發(fā)無人駕駛汽車GoogleDriverlessCar,百度也已啟動了“百度無人駕駛汽車”研發(fā)計劃,其自主研發(fā)的無人駕駛汽車Apollo還曾亮相2018年央視春晚/video/BV14s4y1i7rg/?spm_id_from=333.337.search-card.all.click&vd_source=1c017a7bb5bf576a61625cd62367a647機器學習簡介人工智能應用在哪里呢?人臉識別系統(tǒng)的研究始于20世紀60年代,之后,隨著計算機技術(shù)和光學成像技術(shù)的發(fā)展,人臉識別技術(shù)水平在20世紀80年代得到不斷提高。在20世紀90年代后期,人臉識別技術(shù)進入初級應用階段。目前,人臉識別技術(shù)已廣泛應用于多個領域,如金融、司法、公安、邊檢、航天、電力、教育、醫(yī)療等。有一個關于人臉識別技術(shù)應用的有趣案例:張學友獲封“逃犯克星”,因為警方利用人臉識別技術(shù)在其演唱會上多次抓到了在逃人員。/video/BV1ou41187iD/?spm_id_from=333.337.search-card.all.click&vd_source=1c017a7bb5bf576a61625cd62367a647機器學習簡介人工智能應用在哪里呢?機器翻譯技術(shù)在促進政治、經(jīng)濟、文化交流等方面的價值凸顯,也給人們的生活帶來了許多便利。例如我們在閱讀英文文獻時,可以方便地通過有道翻譯、Google翻譯等網(wǎng)站將英文轉(zhuǎn)換為中文,免去了查字典的麻煩,提高了學習和工作的效率。/video/BV1bx411X7rJ/?spm_id_from=trigger_reload&vd_source=1c017a7bb5bf576a61625cd62367a647機器學習簡介人工智能應用在哪里呢?聲紋識別的工作過程為,系統(tǒng)采集說話人的聲紋信息并將其錄入數(shù)據(jù)庫,當說話人再次說話時,系統(tǒng)會采集這段聲紋信息并自動與數(shù)據(jù)庫中已有的聲紋信息做對比,從而識別出說話人的身份。相比于傳統(tǒng)的身份識別方法(如鑰匙、證件),聲紋識別具有抗遺忘、可遠程的鑒權(quán)特點,在現(xiàn)有算法優(yōu)化和隨機密碼的技術(shù)手段下,聲紋也能有效防錄音、防合成,因此安全性高、響應迅速且識別精準。同時,相較于人臉識別、虹膜識別等生物特征識別技術(shù),聲紋識別技術(shù)具有可通過電話信道、網(wǎng)絡信道等方式采集用戶的聲紋特征的特點,因此其在遠程身份確認上極具優(yōu)勢。機器學習簡介人工智能的起源圖靈測試(TheTuringtest)由艾倫·麥席森·圖靈發(fā)明,指測試者與被測試者(一個人和一臺機器)隔開的情況下,通過一些裝置(如鍵盤)向被測試者隨意提問。進行多次測試后,如果機器讓平均每個參與者做出超過30%的誤判,那么這臺機器就通過了測試,并被認為具有人類智能。圖靈測試一詞來源于計算機科學和密碼學的先驅(qū)艾倫·麥席森·圖靈寫于1950年的一篇論文《計算機器與智能》,其中30%是圖靈對2000年時的機器思考能力的一個預測,目前我們已遠遠落后于這個預測。機器學習簡介人工智能的起源1956年8月,在美國漢諾斯小鎮(zhèn)寧靜的達特茅斯學院中,約翰·麥卡錫(JohnMcCarthy)、馬文·閔斯基(MarvinMinsky,人工智能與認知學專家)、克勞德·香農(nóng)(ClaudeShannon,信息論的創(chuàng)始人)、艾倫·紐厄爾(AllenNewell,計算機科學家)、赫伯特·西蒙(HerbertSimon,諾貝爾經(jīng)濟學獎得主)等科學家正聚在一起,討論著一個完全不食人間煙火的主題:用機器來模仿人類學習以及其他方面的智能。會議足足開了兩個月的時間,雖然大家沒有達成普遍的共識,但是卻為會議討論的內(nèi)容起了一個名字:人工智能。因此,1956年也就成為了人工智能元年。機器學習簡介1、起步發(fā)展期:1956年—20世紀60年代初人工智能概念提出后,相繼取得了一批令人矚目的研究成果,如機器定理證明、跳棋程序等,掀起人工智能發(fā)展的第一個高潮。2、反思發(fā)展期:20世紀60年代—70年代初人工智能發(fā)展初期的突破性進展大大提升了人們對人工智能期望,人們開始嘗試更具挑戰(zhàn)性的任務,并提出了一些不切實際的研發(fā)目標。然而,接二連三的失敗和預期目標落空使人工智能發(fā)展走入低谷。3、應用發(fā)展期:20世紀70年代初—80年代中20世紀70年代出現(xiàn)的專家系統(tǒng)模擬人類專家的知識和經(jīng)驗解決特定領域的問題,實現(xiàn)了人工智能從理論研究走向?qū)嶋H應用、從一般推理策略探討轉(zhuǎn)向運用專門知識的重大突破。專家系統(tǒng)在醫(yī)療、化學、地質(zhì)等領域取得成功,推動人工智能走入應用發(fā)展的新高潮。機器學習簡介4、低迷發(fā)展期:20世紀80年代中—90年代中隨著人工智能的應用規(guī)模不斷擴大,專家系統(tǒng)存在的應用領域狹窄、缺乏常識性知識、知識獲取困難、推理方法單一、缺乏分布式功能、難以與現(xiàn)有數(shù)據(jù)庫兼容等問題逐漸暴露出來。5、穩(wěn)步發(fā)展期:20世紀90年代中—2010年由于網(wǎng)絡技術(shù)特別是互聯(lián)網(wǎng)技術(shù)的發(fā)展,加速了人工智能的創(chuàng)新研究,促使人工智能技術(shù)進一步走向?qū)嵱没?。深藍戰(zhàn)勝國際象棋冠軍6、蓬勃發(fā)展期:2011年至今隨著大數(shù)據(jù)、云計算、互聯(lián)網(wǎng)、物聯(lián)網(wǎng)等信息技術(shù)的發(fā)展,泛在感知數(shù)據(jù)和圖形處理器等計算平臺推動以深度神經(jīng)網(wǎng)絡為代表的人工智能技術(shù)飛速發(fā)展,大幅跨越了科學與應用之間的“技術(shù)鴻溝”,諸如圖像分類、語音識別、知識問答、人機對弈、無人駕駛等人工智能技術(shù)實現(xiàn)了從“不能用、不好用”到“可以用”的技術(shù)突破,迎來爆發(fā)式增長新高潮。機器學習簡介機器學習計算機視覺語音識別文本挖掘、分類機器翻譯機器人機器學習簡介人工智能機器學習深度學習機器學習是人工智能的一種實現(xiàn)途徑深度學習是機器學習的一個方法發(fā)展而來機器學習簡介人工智能發(fā)展三要素數(shù)據(jù)、算法、計算力02機器學習工作流程添加相關標題文字添加相關標題文字添加相關標題文字添加相關標題文字機器學習簡介什么是機器學習?機器學習是從數(shù)據(jù)中自動分析獲得模型,并利用模型對未知數(shù)據(jù)進行預測。機器學習簡介機器學習工作流程。1.獲取數(shù)據(jù)2.數(shù)據(jù)基本處理3.特征工程4.機器學習(模型訓練)5.模型評估結(jié)果達到要求,上線服務沒有達到要求,重新上面步驟機器學習簡介獲取到的數(shù)據(jù)集介紹目標值特征值機器學習簡介獲取到的數(shù)據(jù)集介紹數(shù)據(jù)類型構(gòu)成:數(shù)據(jù)類型一:特征值+目標值(目標值是連續(xù)的和離散的)數(shù)據(jù)類型二:只有特征值,沒有目標值數(shù)據(jù)分割:機器學習一般的數(shù)據(jù)集會劃分為兩個部分:訓練數(shù)據(jù):用于訓練,構(gòu)建模型測試數(shù)據(jù):在模型檢驗時使用,用于評估模型是否有效機器學習簡介數(shù)據(jù)基本處理即對數(shù)據(jù)進行缺失值、去除異常值等處理機器學習簡介特征工程特征工程包含

特征提取

特征預處理

特征降維機器學習簡介特征工程機器學習簡介特征工程03算法分類添加相關標題文字添加相關標題文字添加相關標題文字添加相關標題文字機器學習算法1.監(jiān)督學習輸入數(shù)據(jù)是由輸入特征和目標值所組成

函數(shù)的輸出可以是一個連續(xù)的值(稱為回歸)

或是輸出是有限個離散值(稱作分類)回歸問題分類問題機器學習算法2.無監(jiān)督學習輸入數(shù)據(jù)是由輸入特征值組成,沒有目標值輸入數(shù)據(jù)沒有被標記,也沒有確定的結(jié)果。樣本數(shù)據(jù)類別未知;

需要根據(jù)樣本間的現(xiàn)實性對樣本進行類別劃分機器學習算法3.半監(jiān)督學習訓練集數(shù)據(jù)同事包含有標記樣本數(shù)據(jù)和未標記樣本數(shù)據(jù)04常用工具添加相關標題文字添加相關標題文字添加相關標題文字添加相關標題文字常用工具matplotlibMatplotlib是Python的繪圖庫。它可與NumPy一起使用,提供了一種有效的MatLab開源替代方案。它也可以和圖形工具包一起使用.1.繪制折線圖plt.plot(X,Y)2.繪制散點圖plt.scatter(X,Y)常用工具matplotlibMatplotlib是Python的繪圖庫。它可與NumPy一起使用,提供了一種有效的MatLab開源替代方案。它也可以和圖形工具包一起使用.練習1:創(chuàng)建畫布,并將以下坐標繪制在折線圖、散點圖中

x123y456常用工具matplotlib練習2:畫出某城市11點到12點之間內(nèi)每分鐘的溫度變化折線圖,溫度范圍在15-20之間(溫度數(shù)值隨機產(chǎn)生)常用工具Numpy庫np.arange()函數(shù)用于創(chuàng)建等差數(shù)組,可以指定起始值、終止值和步長。2.

np.linspace()函數(shù)用于創(chuàng)建等間隔數(shù)組,可以指定起始值、終止值和數(shù)組長度。3.

np.random.rand()函數(shù)用于創(chuàng)建隨機數(shù)組,數(shù)組元素為0到1之間的隨機數(shù)。常用工具Matplotlib與Numpy練習3:隨機生成10個坐標點,繪制一個散點圖常用工具pandaspandas是基于NumPy的一種工具,該工具是為解決數(shù)據(jù)分析任務而創(chuàng)建的。Pandas納入了大量庫和一些標準的數(shù)據(jù)模型,提供了高效地操作大型數(shù)據(jù)集所需的工具。pandas提供了大量能使我們快速便捷地處理數(shù)據(jù)的函數(shù)和方法。Series類似一維數(shù)組的數(shù)據(jù)結(jié)構(gòu),他能保存任何類型的數(shù)據(jù)。主要由一組數(shù)據(jù)和與之相關的索引兩部分構(gòu)成。常用工具pandas.Series(data,index,dtype)參數(shù)說明:data:一組數(shù)據(jù)(ndarray類型)。index:數(shù)據(jù)索引標簽,如果不指定,默認從0開始。dtype:數(shù)據(jù)類型,默認會自己判斷。importpandasaspda=[1,2,3]myvar=pd.Series(a)print(myvar)importpandasaspda=["Google","Runoob","Wiki"]myvar=pd.Series(a,index=["x","y","z"])print(myvar)常用工具DataFrame類似于二維數(shù)組或者表格的對象,既有行索引,又有列索引行索引,表明不同行,橫向索引,叫index,0軸,axis=0列索引,表明不同列

溫馨提示

  • 1. 本站所有資源如無特殊說明,都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請下載最新的WinRAR軟件解壓。
  • 2. 本站的文檔不包含任何第三方提供的附件圖紙等,如果需要附件,請聯(lián)系上傳者。文件的所有權(quán)益歸上傳用戶所有。
  • 3. 本站RAR壓縮包中若帶圖紙,網(wǎng)頁內(nèi)容里面會有圖紙預覽,若沒有圖紙預覽就沒有圖紙。
  • 4. 未經(jīng)權(quán)益所有人同意不得將文件中的內(nèi)容挪作商業(yè)或盈利用途。
  • 5. 人人文庫網(wǎng)僅提供信息存儲空間,僅對用戶上傳內(nèi)容的表現(xiàn)方式做保護處理,對用戶上傳分享的文檔內(nèi)容本身不做任何修改或編輯,并不能對任何下載內(nèi)容負責。
  • 6. 下載文件中如有侵權(quán)或不適當內(nèi)容,請與我們聯(lián)系,我們立即糾正。
  • 7. 本站不保證下載資源的準確性、安全性和完整性, 同時也不承擔用戶因使用這些下載資源對自己和他人造成任何形式的傷害或損失。

最新文檔

評論

0/150

提交評論