SVM算法及R語言介紹課件_第1頁
SVM算法及R語言介紹課件_第2頁
SVM算法及R語言介紹課件_第3頁
SVM算法及R語言介紹課件_第4頁
SVM算法及R語言介紹課件_第5頁
已閱讀5頁,還剩15頁未讀 繼續(xù)免費(fèi)閱讀

下載本文檔

版權(quán)說明:本文檔由用戶提供并上傳,收益歸屬內(nèi)容提供方,若內(nèi)容存在侵權(quán),請進(jìn)行舉報(bào)或認(rèn)領(lǐng)

文檔簡介

SVM算法及R語言介紹SVM算法及R語言介紹010203SVM算法技術(shù)流程R語言介紹CONTENTS目錄010203SVM算法技術(shù)流程R語言介紹CONTENTS目錄201SVM算法01SVM算法3SVM算法SVM(SupportVectorMachine)指的是支持向量機(jī),是常見的一種判別方法。SVM算法為二分法,當(dāng)有多個(gè)類別時(shí),進(jìn)行兩兩二分,直到不能再分為止。桌上有兩種顏色的球,使用一條直線把它們分開。當(dāng)球的數(shù)量增加,開始有球站錯(cuò)陣營。于是SVM調(diào)整直線的位置,好讓直線兩邊有盡量大的距離,以適應(yīng)球的數(shù)量增加。SVM算法SVM(SupportVectorMachin4SVM算法SVM算法不僅能解決線性分類的問題,還能通過增加向量的維度來解決非線性分類的問題?,F(xiàn)實(shí)生活中的大量問題都屬于此類,即需要通過多維度來分類。下圖是一個(gè)典型的線性不可分的情況把這兩個(gè)類似于橢圓形的點(diǎn)映射到一個(gè)三維空間后,并且對映射后的坐標(biāo)加以旋轉(zhuǎn)之后就可以得到一個(gè)線性可分的點(diǎn)集了。SVM算法SVM算法不僅能解決線性分類的問題,還能通過增加向503操作流程03操作流程6操作流程數(shù)據(jù)獲取去除無效數(shù)據(jù)、實(shí)驗(yàn)數(shù)據(jù),并對其進(jìn)行分詞處理,去除副詞虛詞等無實(shí)際意義的詞。分詞采用NLPIR自然語言處理系統(tǒng)。數(shù)據(jù)預(yù)處理取高頻詞與需求相關(guān)的詞作為特征詞,并計(jì)算每條數(shù)據(jù)的特征值。特征詞提取使用訓(xùn)練集對分類器進(jìn)行訓(xùn)練。分類器訓(xùn)練用訓(xùn)練完畢的分類器對測試集數(shù)據(jù)進(jìn)行分類,計(jì)算其分類結(jié)果的查全率與查準(zhǔn)率,對分類效果進(jìn)行評價(jià)。分類結(jié)果評價(jià)操作流程數(shù)據(jù)獲取去除無效數(shù)據(jù)、實(shí)驗(yàn)數(shù)據(jù),并對其進(jìn)行分詞處理,7分類器訓(xùn)練010203分類器分類器訓(xùn)練分類器評價(jià)相關(guān)參數(shù)調(diào)整K-折交叉驗(yàn)證交叉驗(yàn)證法(crossvalidation)先將數(shù)據(jù)D劃分為k個(gè)大小相似的互斥子集,即每個(gè)子集都盡可能保持?jǐn)?shù)據(jù)分布的一致性,即從D中通過分層采樣得到,然后,每次用k-1個(gè)自己的并集作為訓(xùn)練,余下的那個(gè)子集作為測試集,這樣就就可以獲得k組訓(xùn)練/測試集,從而可以進(jìn)行k次訓(xùn)練和測試,最終返回的是這k個(gè)測試結(jié)果的均值。通常又將交叉驗(yàn)證法稱為k-折交叉驗(yàn)證((k-foldcrossvalidation),k這里通常取值為10,此時(shí)稱為十折交叉驗(yàn)證。

分類器訓(xùn)練010203分類器分類器訓(xùn)練分類器評價(jià)相關(guān)參數(shù)調(diào)整804R語言軟件04R語言軟件9R語言R語言簡介R是用于統(tǒng)計(jì)分析、繪圖的語言和操作環(huán)境。R是一個(gè)自由、免費(fèi)、源代碼開放的軟件,它是一個(gè)用于統(tǒng)計(jì)計(jì)算和統(tǒng)計(jì)制圖的優(yōu)秀工具。R語言功能數(shù)組運(yùn)算工具(其向量、矩陣運(yùn)算方面功能尤其強(qiáng)大);完整連貫的統(tǒng)計(jì)分析工具;優(yōu)秀的統(tǒng)計(jì)制圖功能;簡便而強(qiáng)大的編程語言:可操縱數(shù)據(jù)的輸入和輸出,可實(shí)現(xiàn)分支、循環(huán),用戶可自定義功能。R語言R語言簡介R是用于統(tǒng)計(jì)分析、繪圖的語言和操作環(huán)境。R是10R語言使用R語言的使用,很大程度上是借助各種各樣的R包的輔助,R包就是針對于R的插件,不同的插件滿足不同的需求。在加載過相關(guān)的包后,通過調(diào)用包內(nèi)函數(shù)進(jìn)行相關(guān)操作。

此處輸入標(biāo)題這里輸入主要敘述內(nèi)容這里輸入主要敘述內(nèi)容R語言的下載包與包的獲取都需通過CRAN鏡像站,CRAN為ComprehensiveRArchiveNetwork(R綜合點(diǎn)藏網(wǎng))的簡稱,它收藏了R的下載版、源代碼和說明文件,也收錄了各種用戶撰寫的包。R語言使用R語言的使用,很大程度上是借助各種各樣的R包的輔助11為何選取R擅長處理數(shù)據(jù)語法簡單開源可供使用的包多可視化功能強(qiáng)大e1071包svm()函數(shù)為何選取R擅長處理數(shù)據(jù)開源e1071包12常用包介紹04030201wordcloud2生成詞云Wordcloud2()函數(shù)中包含多個(gè)參數(shù),可對詞云的字體顏色形狀等特征進(jìn)行設(shè)置。ggplot2個(gè)性化的統(tǒng)計(jì)繪圖ggplot()作為泛型函數(shù),能對任意類型的R對象進(jìn)行可視化操作。jiebaR中文分詞提供了三種分詞方式plyr數(shù)據(jù)整理可以進(jìn)行類似于數(shù)據(jù)透視表的操作切分?jǐn)?shù)據(jù),對分割后的數(shù)據(jù)進(jìn)行操作,最后匯總操作結(jié)果。常用包介紹04030201wordcloud2ggplot213周杰倫歌詞詞云案例jiebaR包(中文分詞)wordcloud2包(生成詞云)周杰倫《十一月肖邦》全部歌詞文檔:去除文檔中的換行符與空格周杰倫歌詞詞云案例14周杰倫歌詞詞云案例安裝jiebar包和wordcloud2包周杰倫歌詞詞云案例15周杰倫歌詞詞云案例周杰倫歌詞詞云案例16周杰倫歌詞詞云案例周杰倫歌詞詞云案例17ggplot2玫瑰圖案例星巴克門店分布圖ggplot2包:制作放射狀玫瑰圖獲取相關(guān)數(shù)據(jù)整理

溫馨提示

  • 1. 本站所有資源如無特殊說明,都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請下載最新的WinRAR軟件解壓。
  • 2. 本站的文檔不包含任何第三方提供的附件圖紙等,如果需要附件,請聯(lián)系上傳者。文件的所有權(quán)益歸上傳用戶所有。
  • 3. 本站RAR壓縮包中若帶圖紙,網(wǎng)頁內(nèi)容里面會有圖紙預(yù)覽,若沒有圖紙預(yù)覽就沒有圖紙。
  • 4. 未經(jīng)權(quán)益所有人同意不得將文件中的內(nèi)容挪作商業(yè)或盈利用途。
  • 5. 人人文庫網(wǎng)僅提供信息存儲空間,僅對用戶上傳內(nèi)容的表現(xiàn)方式做保護(hù)處理,對用戶上傳分享的文檔內(nèi)容本身不做任何修改或編輯,并不能對任何下載內(nèi)容負(fù)責(zé)。
  • 6. 下載文件中如有侵權(quán)或不適當(dāng)內(nèi)容,請與我們聯(lián)系,我們立即糾正。
  • 7. 本站不保證下載資源的準(zhǔn)確性、安全性和完整性, 同時(shí)也不承擔(dān)用戶因使用這些下載資源對自己和他人造成任何形式的傷害或損失。

最新文檔

評論

0/150

提交評論