




版權(quán)說(shuō)明:本文檔由用戶提供并上傳,收益歸屬內(nèi)容提供方,若內(nèi)容存在侵權(quán),請(qǐng)進(jìn)行舉報(bào)或認(rèn)領(lǐng)
文檔簡(jiǎn)介
《大數(shù)據(jù)導(dǎo)論》機(jī)器學(xué)習(xí)1.什么是機(jī)器學(xué)習(xí)
機(jī)器學(xué)習(xí)(MachineLearning,ML)是一門多領(lǐng)域交叉學(xué)科,涉及概率論、統(tǒng)計(jì)學(xué)、逼近論、凸分析、算法復(fù)雜度理論等多門學(xué)科。
專門研究計(jì)算機(jī)怎樣模擬或?qū)崿F(xiàn)人類的學(xué)習(xí)行為,以獲取新的知識(shí)或技能,重新組織已有的知識(shí)結(jié)構(gòu)使之不斷改善自身的性能。
“機(jī)器學(xué)習(xí)之父”——阿瑟·塞繆爾(ArthurSamuel)將其定義為“沒(méi)有明確編程就能學(xué)習(xí)的能力”。2.機(jī)器學(xué)習(xí)案例——圖像識(shí)別機(jī)器學(xué)習(xí)已經(jīng)被用來(lái)大大改進(jìn)計(jì)算機(jī)識(shí)別圖像或視頻中的對(duì)象的能力。你收集了數(shù)十萬(wàn)甚至數(shù)百萬(wàn)張圖片,然后讓人類標(biāo)記它們。例如,人類可能會(huì)標(biāo)記其中包含貓的圖片與不包含貓的圖片。然后,該算法嘗試構(gòu)建一個(gè)模型,該模型可以準(zhǔn)確地將另外的圖片標(biāo)記出是否包含貓。當(dāng)準(zhǔn)確度達(dá)到足夠高,機(jī)器現(xiàn)在就“學(xué)會(huì)”了識(shí)別貓的樣子。
分類是一種有監(jiān)督的機(jī)器學(xué)習(xí),它將數(shù)據(jù)分為相關(guān)的、以前學(xué)習(xí)過(guò)的類別。它包括兩個(gè)步驟:
1、將已經(jīng)被分類或者有標(biāo)號(hào)的訓(xùn)練數(shù)據(jù)給系統(tǒng)
2、將未知或者相似數(shù)據(jù)給系統(tǒng)來(lái)分類,基于訓(xùn)練數(shù)據(jù)形成的理解,算法會(huì)分類無(wú)標(biāo)號(hào)數(shù)據(jù)。例如,銀行想找出哪些客戶可能會(huì)拖欠貸款。3.機(jī)器學(xué)習(xí)——分類(有監(jiān)督的機(jī)器學(xué)習(xí))分類適用的樣例問(wèn)題可以是:·基于其他申請(qǐng)是否被接受或者被拒絕,申請(qǐng)人的信用卡申請(qǐng)是否應(yīng)該被接受?·基于已知的水果蔬菜樣例,西紅柿是水果還是蔬菜?·病人的藥檢結(jié)果是否表示有心臟病的風(fēng)險(xiǎn)?4.機(jī)器學(xué)習(xí)——分類,可適用的問(wèn)題
聚類是一種無(wú)監(jiān)督的學(xué)習(xí)技術(shù),通過(guò)這項(xiàng)技術(shù),數(shù)據(jù)被分割成不同的組,這樣在每組中數(shù)據(jù)有相似的性質(zhì)。聚類不需要先學(xué)習(xí)類別。相反,類別是基于分組數(shù)據(jù)產(chǎn)生的。數(shù)據(jù)如何成組取決于用什么類型的算法,每個(gè)算法都有不同的技術(shù)來(lái)確定聚類。
例如,一個(gè)銀行想基于已有的顧客記錄檔案,對(duì)顧客進(jìn)行分類,以便向他們介紹不同的金融產(chǎn)品,但是還不知道分成哪幾類,聚類就是通過(guò)不同類型的算法,分析出不同的類型。5.機(jī)器學(xué)習(xí)——聚類(無(wú)監(jiān)督的機(jī)器學(xué)習(xí))
聚類適用的樣例問(wèn)題可以是:·根據(jù)樹之間的相似性,存在多少種樹?·根據(jù)相似的購(gòu)買記錄,存在多少組顧客?·根據(jù)病毒的特性,它們的不同分組是什么?6.機(jī)器學(xué)習(xí)——聚類,可用于的問(wèn)題
異常檢測(cè)是指在給定數(shù)據(jù)集中,發(fā)現(xiàn)明顯不同于其他數(shù)據(jù)或與其他數(shù)據(jù)不一致的數(shù)據(jù)的過(guò)程。這種機(jī)器學(xué)習(xí)技術(shù)被用來(lái)識(shí)別反常、異常和偏差,它們可以是有利的,例如機(jī)會(huì),也可能是不利的,例如風(fēng)險(xiǎn)。異常檢測(cè)與分類和聚類的概念緊密相關(guān),雖然它的算法專注于尋找不同值。它可以基于有監(jiān)督或無(wú)監(jiān)督的學(xué)習(xí)。異常檢測(cè)的應(yīng)用包括欺詐檢測(cè)、醫(yī)療診斷、網(wǎng)絡(luò)數(shù)據(jù)分析和傳感器數(shù)據(jù)分析。7.機(jī)器學(xué)習(xí)——異常檢測(cè)
過(guò)濾是自動(dòng)從項(xiàng)目池中尋找有關(guān)項(xiàng)目的過(guò)程。項(xiàng)目可以基于用戶行為或通過(guò)匹配多個(gè)用戶的行為被過(guò)濾。過(guò)濾常用的媒介是推薦系統(tǒng)。通常過(guò)濾的主要方法是協(xié)同過(guò)濾和內(nèi)容過(guò)濾。例如,為了實(shí)現(xiàn)交叉銷售,一家銀行構(gòu)建了使用內(nèi)容過(guò)濾的推薦
溫馨提示
- 1. 本站所有資源如無(wú)特殊說(shuō)明,都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請(qǐng)下載最新的WinRAR軟件解壓。
- 2. 本站的文檔不包含任何第三方提供的附件圖紙等,如果需要附件,請(qǐng)聯(lián)系上傳者。文件的所有權(quán)益歸上傳用戶所有。
- 3. 本站RAR壓縮包中若帶圖紙,網(wǎng)頁(yè)內(nèi)容里面會(huì)有圖紙預(yù)覽,若沒(méi)有圖紙預(yù)覽就沒(méi)有圖紙。
- 4. 未經(jīng)權(quán)益所有人同意不得將文件中的內(nèi)容挪作商業(yè)或盈利用途。
- 5. 人人文庫(kù)網(wǎng)僅提供信息存儲(chǔ)空間,僅對(duì)用戶上傳內(nèi)容的表現(xiàn)方式做保護(hù)處理,對(duì)用戶上傳分享的文檔內(nèi)容本身不做任何修改或編輯,并不能對(duì)任何下載內(nèi)容負(fù)責(zé)。
- 6. 下載文件中如有侵權(quán)或不適當(dāng)內(nèi)容,請(qǐng)與我們聯(lián)系,我們立即糾正。
- 7. 本站不保證下載資源的準(zhǔn)確性、安全性和完整性, 同時(shí)也不承擔(dān)用戶因使用這些下載資源對(duì)自己和他人造成任何形式的傷害或損失。
最新文檔
- 卡宴訂購(gòu)合同范本
- 別墅區(qū)車位租賃合同范例
- 商貿(mào)區(qū)間協(xié)議合同范本
- 個(gè)人提出解除合同范例
- 儲(chǔ)能電站合同范本
- 農(nóng)民耕地蓋房合同范本
- ktv轉(zhuǎn)讓協(xié)議合同范本
- 云南電力交易合同范本
- 商城平臺(tái)搭建合同范例
- 商鋪分塊出租合同范本
- 山東管理學(xué)院聲樂(lè)題庫(kù)復(fù)習(xí)題
- DL-T5796-2019水電工程邊坡安全監(jiān)測(cè)技術(shù)規(guī)范
- 高等數(shù)學(xué)教案第四章不定積分
- 2024年高考時(shí)事政治考試題庫(kù)(134題)
- DZ∕T 0201-2020 礦產(chǎn)地質(zhì)勘查規(guī)范 鎢、錫、汞、銻(正式版)
- 安全生產(chǎn)責(zé)任制考試試卷及答案
- 擠壓模具拋光培訓(xùn)課件
- 大學(xué)生寒假回訪母校社會(huì)實(shí)踐報(bào)告
- 2023年跨境電商年度總結(jié)報(bào)告
- 魁北克腰痛障礙評(píng)分表(Quebec-Baclain-Disability-Scale-QBPDS)
- 水磨鉆成本分析
評(píng)論
0/150
提交評(píng)論