




版權(quán)說明:本文檔由用戶提供并上傳,收益歸屬內(nèi)容提供方,若內(nèi)容存在侵權(quán),請進(jìn)行舉報或認(rèn)領(lǐng)
文檔簡介
【原創(chuàng)】【原創(chuàng)】R語言案例數(shù)據(jù)分析報告論文(附代碼數(shù)據(jù))有問題到淘寶找“大數(shù)據(jù)部落”就可以了NOAA風(fēng)暴數(shù)據(jù)數(shù)據(jù)分析可視化報告概要風(fēng)暴和其他惡劣的天氣事件可能導(dǎo)致社區(qū)和市政的公共衛(wèi)生和經(jīng)濟(jì)問題。許多嚴(yán)重的事件可能導(dǎo)致死亡,受傷和財產(chǎn)損失,并盡可能地防止這些結(jié)果是一個關(guān)鍵問題。作為數(shù)據(jù)科學(xué)專業(yè)的可重復(fù)性研究項目2作業(yè)的一部分,該項目將探索美國NOAA的風(fēng)暴數(shù)據(jù)庫。該數(shù)據(jù)庫跟蹤美國主要風(fēng)暴和天氣事件的特征,包括發(fā)生的時間和地點,以及死亡,受傷和財產(chǎn)損失的估計。數(shù)據(jù)處理NOAA的Storm數(shù)據(jù)庫位于以下URL地址:/repdata%2Fdata%2FStormData.csv.bz2有關(guān)如何收集數(shù)據(jù)以及有關(guān)變量的說明的信息,請參閱/repdata%2Fpeer2_doc%2Fpd01016005curr.pdf加載數(shù)據(jù):數(shù)據(jù)壓縮在bz2文件中,但可以使用read.csv函數(shù)直接從中讀取數(shù)據(jù)。這將需要一些時間來加載:FILENAME<-"repdata%2Fdata%2FStormData.csv.bz2"NOAAS_DT<-read.csv(FILENAME,header=TRUE,sep=",",quote="\"")初始分析如何看起來將有助于確定是否需要數(shù)據(jù)轉(zhuǎn)換,所以我們先做一個總結(jié):summary(NOAASDT)##STATEBGNDATEBGNTIME##Min.:1.05/25/20110:00:00:120212:00:00AM:10163##1stQu.:19?04/27/20110:00:00:119306:00:00PM:7350##Median:30.06/9/20110:00:00:103004:00:00PM:7261##Mean:31.25/30/20040:00:00:101605:00:00PM:6891##3rdQu.:45?04/4/20110:00:00:100912:00:00PM:6703##Max.:95?04/2/20060:00:00:98103:00:00PM:6700##(Other):895866(Other):857229##TIMEZONECOUNTYCOUNTYNAMESTATE##CST:547493Min.:0.0JEFFERSON:7840TX:83728##EST:2455581stQu.:31.0WASHINGTON:7603KS:53440##MST:68390Median:75.0JACKSON:6660OK:46802
##PST:28302Mean100.6FRANKLIN:6256MO:35648##AST:63603rdQu.131.0LINCOLN:5937IA:31069##HST:2563Max.873.0MADISON:5632NE:30271##(Other):3631(Other):862369(Other):621339##EVTYPEBGNRANGEBGNAZI##HAIL:288661Min.:0.000:547332##TSTMWIND:2199401stQu.:0.000N:86752##THUNDERSTORMWIND:82563Median:0.000W:38446##TORNADO:60652Mean:1.484S:37558##FLASHFLOOD:542773rdQu.:1.000E:33178##FLOOD:25326Max.:3749.000NW:24041##(Other):170878(Other):134990##BGNLOCATIENDDATEENDTIME##:287743:243411:238978##COUNTYWIDE:196804/27/20110:00:00:121406:00:00PM:9802##Countywide:9935/25/20110:00:00:119605:00:00PM:8314##SPRINGFIELD:8436/9/20110:00:00:102104:00:00PM:8104##SOUTHPORTION:8104/4/20110:00:00:100712:00:00PM:7483##NORTHPORTION:7845/30/20040:00:00:99811:59:00PM:7184##(Other):591444(Other):653450(Other):622432
100444-EVTYPEEXCESSIVEHEATFLASHFLOODFLOOD100444-EVTYPEEXCESSIVEHEATFLASHFLOODFLOODHEATICESTORMLIGHTNINGTHUNDERSTORMWINDTORNADOT$TMWINDWINTERSTORMEVTYPE從輸出結(jié)果可以看出,不需要特殊的轉(zhuǎn)換來準(zhǔn)備數(shù)據(jù),所以繼續(xù)進(jìn)行分析。這個分析重點是回答以下問題:1?在美國,哪些類型的事件(如EVTYPE變量所示)對人群健康危害最大?2?在美國,哪類事件的經(jīng)濟(jì)后果最大?以下部分將涵蓋有關(guān)數(shù)據(jù)分析的詳細(xì)信息,需要找到答案1?在美國各地,哪些類型的事件(如EVTYPE變量所示)在人群健康方面是最有害的?考慮到以死亡或受傷為終點的人口健康危害事件,為了回答這個問題,需要計算每次事件的死亡和傷害總數(shù)。讓我們在一個名為total_victims的新專欄里總結(jié)死傷:library(dplyr)####Attachingpackage:'dplyr##Thefollowingobjectsaremaskedfrom'package:stats':####filter,lag##Thefollowingobjectsaremaskedfrom'package:base':####intersect,setdiff,setequal,unionlibrary(grDevices)
library(ggplot2)NOAAS_DT$TOTAL_VICTIMS<-NOAAS_DT$FATALITIES+NOAAS_DT$INJURIESNow,itisrequiredtogroupbyeventthetotalnumberofvictims,sothatwayitcanbeseenwhicheventisthemostharmful.Toachievethis,theuseofthegroup_bydyplr'sfunctionpipelinedwithsummarisewilldothework.Afterthatlet'sshowthe10mostharmfulevents#ThetrickisdonebygroupingbyEventTypeanddoasummarycountingthenumberofvictimsnoaas_evtype_victims<-NOAAS_DT%>%group_by(EVTYPE)%>%summarise(VICTIMS=sum(TOTAL_VICTIMS))%>%arrange(desc(VICTIMS))#getthetoptenmostharmfuleventsnoaasevtypevictims<-noaasevtypevictims[1:10,]ggplot(noaas_evtype_victims,aes(x=EVTYPE,y=VICTIMS))+geombar(stat="identity",aes(fill=EVTYPE))+scalexdiscretelabels=c())lOOOOC-75000-EVTYPELIGHTNINGTl-UNDERSTORMWINDTORNADOlOOOOC-75000-EVTYPELIGHTNINGTl-UNDERSTORMWINDTORNADOTSTMWINDWIN'TEFtSTORMEVTYPEEXCESSIVEHEATFLASHFLOODHLOOD|HEATIICESTORMQothereventsTheplotaboveclearlyshowsthatTornadosleadmorevictimswithahugedifferencetootherevents【原創(chuàng)】R語言案例數(shù)據(jù)分析報告論文(附代碼數(shù)據(jù))有問題到淘寶找“大數(shù)據(jù)部落”就可以了2.AcrosstheUnitedStates,whichtypesofeventshavethegreatesteconomicconsequences?FromthestructureoftheNOAASDatasetitcanbeseenthatdamagesaredividedinto2bigcategories:#####PropertyDamages:Thoseocurredtobuildings,insfrastructuressupportingdevices.DescribedinNOAASDatasetPROPDMGvariable.#####CultiveDamages:Thoseoccurredaggriculturalactivities.DescribedinNOAASDatasetCROPDMGvariableAdditionally,NOAASDatasetdoesspecifydamagesmagnitudeusinganacronym:h:100factorK:1000factorM:1000000factorB:1000000000factorNOAASDatasetPROPDMGEXPandNOAASDatasetCROPDMGEXPspecifythemagnitudeforeachobservationaccordingly.Again,groupingisthekeytasktopresentthedataforthegivenquestion.Thefollowingcodespippetdoesthework:#definethefactors:H_FACTOR<-100K_FACTOR<-1000M_FACTOR<-K_FACTOR*K_FACTORB_FACTOR<-M_FACTOR*K_FACTORNOAAS_DT$PROPDMG[NOAAS_DT$PROPDMGEXP==""]<-NOAAS_DT$PROPDMG[NOAAS_DT$PROPDMGEXP==""]*1NOAAS_DT$PROPDMG[NOAAS_DT$PROPDMGEXP=="0"]<-NOAAS_DT$PROPDMG[NOAAS_DT$PROPDMGEXP=="0"]*1NOAAS_DT$PROPDMG[NOAAS_DT$PROPDMGEXP=="1"]<-NOAAS_DT$PROPDMG[NOAAS_DT$PROPDMGEXP=="1"]*1NOAAS_DT$PROPDMG[NOAAS_DT$PROPDMGEXP=="2"]<-NOAAS_DT$PROPDMG[NOAAS_DT$PROPDMGEXP=="2"]*1NOAAS_DT$PROPDMG[NOAAS_DT$PROPDMGEXP=="3"]<-NOAAS_DT$PROPDMG[NOAAS_DT$PROPDMGEXP=="3"]*1NOAAS_DT$PROPDMG[NOAAS_DT$PROPDMGEXP=="4"]<-NOAAS_DT$PROPDMG[NOAAS_DT$PROPDMGEXP=="4"]*1NOAAS_DT$PROPDMG[NOAAS_DT$PROPDMGEXP=="5"]<-NOAAS_DT$PROPDMG[NOAAS_DT$PROPDMGEXP=="5"]*1NOAAS_DT$PROPDMG[NOAAS_DT$PROPDMGEXP=="6"]<-NOAAS_DT$PROPDMG[NOAAS_DT$PROPDMGEXP=="6"]*1NOAAS_DT$PROPDMG[NOAAS_DT$PROPDMGEXP=="7"]<-NOAAS_DT$PROPDMG[NOAAS_DT$PROPDMGEXP=="7"]*1NOAAS_DT$PROPDMG[NOAAS_DT$PROPDMGEXP=="8"]<-NOAAS_DT$PROPDMG[NOAAS_DT$PROPDMGEXP=="8"]*1【原創(chuàng)】【原創(chuàng)】R語言案例數(shù)據(jù)分析報告論文(附代碼數(shù)據(jù))有問題到淘寶找“大數(shù)據(jù)部落”就可以了NOAAS_DT$PROPDMG[NOAAS_DT$PROPDMGEXP=="+"]<-NOAAS_DT$PROPDMG[N0AAS_DT$PR0PDMGEXP=="+"]*1NOAAS_DT$PROPDMG[N0AAS_DT$PR0PDMGEXP=="8"]<-N0AAS_DT$PR0PDMG[N0AAS_DT$PR0PDMGEXP=="-"]*1NOAAS_DT$PROPDMG[NOAAS_DT$PROPDMGEXP=="K"]<-NOAAS_DT$PROPDMG[NOAAS_DT$PROPDMGEXP=="K"]*K_FACTORNOAAS_DT$PROPDMG[NOAAS_DT$PROPDMGEXP=="M"]<-NOAAS_DT$PROPDMG[NOAAS_DT$PROPDMGEXP=="M"]*M_FACTORNOAAS_DT$PROPDMG[NOAAS_DT$PROPDMGEXP=="B"]<-NOAAS_DT$PROPDMG[NOAAS_DT$PROPDMGEXP=="B"]*B_FACTORNOAAS_DT$PROPDMG[NOAAS_DT$PROPDMGEXP=="h"]<-NOAAS_DT$PROPDMG[NOAAS_DT$PROPDMGEXP=="h"]*H_FACTORNOAAS_DT$CROPDMG[NOAAS_DT$CROPDMGEXP==""]<-NOAAS_DT$CROPDMG[NOAAS_DT$CROPDMGEXP==""]*1NOAAS_DT$CROPDMG[NOAAS_DT$CROPDMGEXP=="0"]<-NOAAS_DT$CROPDMG[NOAAS_DT$CROPDMGEXP=="0"]*1NOAAS_DT$CROPDMG[NOAAS_DT$CROPDMGEXP=="2"]<-NOAAS_DT$CROPDMG[NOAAS_DT$CROPDMGEXP=="2"]*1NOAAS_DT$CROPDMG[NOAAS_DT$CROPDMGEXP=="?"]<-NOAAS_DT$CROPDMG[NOAAS_DT$CROPDMGEXP=="?"]*1NOAAS_DT$CROPDMG[NOAAS_DT$CROPDMGEXP=="B"]<-NOAAS_DT$CROPDMG[NOAAS_DT$CROPDMGEXP=="B"]*B_FACTORNOAAS_DT$CROPDMG[NOAAS_DT$CROPDMGEXP=="K"]<-NOAAS_DT$CROPDMG[NOAAS_DT$CROPDMGEXP=="K"]*K_FACTORNOAAS_DT$CROPDMG[NOAAS_DT$CROPD
溫馨提示
- 1. 本站所有資源如無特殊說明,都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請下載最新的WinRAR軟件解壓。
- 2. 本站的文檔不包含任何第三方提供的附件圖紙等,如果需要附件,請聯(lián)系上傳者。文件的所有權(quán)益歸上傳用戶所有。
- 3. 本站RAR壓縮包中若帶圖紙,網(wǎng)頁內(nèi)容里面會有圖紙預(yù)覽,若沒有圖紙預(yù)覽就沒有圖紙。
- 4. 未經(jīng)權(quán)益所有人同意不得將文件中的內(nèi)容挪作商業(yè)或盈利用途。
- 5. 人人文庫網(wǎng)僅提供信息存儲空間,僅對用戶上傳內(nèi)容的表現(xiàn)方式做保護(hù)處理,對用戶上傳分享的文檔內(nèi)容本身不做任何修改或編輯,并不能對任何下載內(nèi)容負(fù)責(zé)。
- 6. 下載文件中如有侵權(quán)或不適當(dāng)內(nèi)容,請與我們聯(lián)系,我們立即糾正。
- 7. 本站不保證下載資源的準(zhǔn)確性、安全性和完整性, 同時也不承擔(dān)用戶因使用這些下載資源對自己和他人造成任何形式的傷害或損失。
最新文檔
- 上海市靜安區(qū)風(fēng)華中學(xué)2025年高三下學(xué)期教學(xué)質(zhì)量第一次檢測試題考試語文試題含解析
- 如何評估創(chuàng)業(yè)扶持政策的經(jīng)濟(jì)影響試題及答案
- 小學(xué)師資教育教學(xué)反思與改進(jìn)試卷
- 煉丹知識測試題及答案
- 教師教育教學(xué)反思與改進(jìn)策略的深度考核
- 純潔度測試題及答案
- 教育教學(xué)反思及改進(jìn)策略測試
- 教師教育教學(xué)反思與課堂改革的考試
- 政治決策面試題及答案
- 自動駕駛車輛的技術(shù)架構(gòu)和安全策略試題及答案
- 建筑勞務(wù)分包合同中的稅務(wù)問題3篇
- 2025年中國熔融鹽儲能行業(yè)市場占有率及投資前景預(yù)測分析報告
- 消防作戰(zhàn)訓(xùn)練安全常識及災(zāi)情處置考試題庫
- 教育培訓(xùn)機(jī)構(gòu)加盟經(jīng)營合同書
- 小學(xué)語文教學(xué):深度融入過程性評價
- 唐山2025年唐山市市直事業(yè)單位招聘277人筆試歷年參考題庫附帶答案詳解
- 血液透析室的管理規(guī)范
- 四年級上冊信息技術(shù)教案-《龜兔賽跑》教學(xué)設(shè)計+說課稿-人教(新版) (2份打包)
- 肺癌的手術(shù)治療方案
- 高溫后超高性能混凝土力學(xué)性能研究
- 金屬冶煉負(fù)責(zé)人安管人員培訓(xùn)
評論
0/150
提交評論