R語言NOAA風(fēng)暴數(shù)據(jù)數(shù)據(jù)分析可視化報告(附代碼數(shù)據(jù))_第1頁
R語言NOAA風(fēng)暴數(shù)據(jù)數(shù)據(jù)分析可視化報告(附代碼數(shù)據(jù))_第2頁
R語言NOAA風(fēng)暴數(shù)據(jù)數(shù)據(jù)分析可視化報告(附代碼數(shù)據(jù))_第3頁
R語言NOAA風(fēng)暴數(shù)據(jù)數(shù)據(jù)分析可視化報告(附代碼數(shù)據(jù))_第4頁
R語言NOAA風(fēng)暴數(shù)據(jù)數(shù)據(jù)分析可視化報告(附代碼數(shù)據(jù))_第5頁
已閱讀5頁,還剩3頁未讀, 繼續(xù)免費閱讀

下載本文檔

版權(quán)說明:本文檔由用戶提供并上傳,收益歸屬內(nèi)容提供方,若內(nèi)容存在侵權(quán),請進(jìn)行舉報或認(rèn)領(lǐng)

文檔簡介

【原創(chuàng)】【原創(chuàng)】R語言案例數(shù)據(jù)分析報告論文(附代碼數(shù)據(jù))有問題到淘寶找“大數(shù)據(jù)部落”就可以了NOAA風(fēng)暴數(shù)據(jù)數(shù)據(jù)分析可視化報告概要風(fēng)暴和其他惡劣的天氣事件可能導(dǎo)致社區(qū)和市政的公共衛(wèi)生和經(jīng)濟(jì)問題。許多嚴(yán)重的事件可能導(dǎo)致死亡,受傷和財產(chǎn)損失,并盡可能地防止這些結(jié)果是一個關(guān)鍵問題。作為數(shù)據(jù)科學(xué)專業(yè)的可重復(fù)性研究項目2作業(yè)的一部分,該項目將探索美國NOAA的風(fēng)暴數(shù)據(jù)庫。該數(shù)據(jù)庫跟蹤美國主要風(fēng)暴和天氣事件的特征,包括發(fā)生的時間和地點,以及死亡,受傷和財產(chǎn)損失的估計。數(shù)據(jù)處理NOAA的Storm數(shù)據(jù)庫位于以下URL地址:/repdata%2Fdata%2FStormData.csv.bz2有關(guān)如何收集數(shù)據(jù)以及有關(guān)變量的說明的信息,請參閱/repdata%2Fpeer2_doc%2Fpd01016005curr.pdf加載數(shù)據(jù):數(shù)據(jù)壓縮在bz2文件中,但可以使用read.csv函數(shù)直接從中讀取數(shù)據(jù)。這將需要一些時間來加載:FILENAME<-"repdata%2Fdata%2FStormData.csv.bz2"NOAAS_DT<-read.csv(FILENAME,header=TRUE,sep=",",quote="\"")初始分析如何看起來將有助于確定是否需要數(shù)據(jù)轉(zhuǎn)換,所以我們先做一個總結(jié):summary(NOAASDT)##STATEBGNDATEBGNTIME##Min.:1.05/25/20110:00:00:120212:00:00AM:10163##1stQu.:19?04/27/20110:00:00:119306:00:00PM:7350##Median:30.06/9/20110:00:00:103004:00:00PM:7261##Mean:31.25/30/20040:00:00:101605:00:00PM:6891##3rdQu.:45?04/4/20110:00:00:100912:00:00PM:6703##Max.:95?04/2/20060:00:00:98103:00:00PM:6700##(Other):895866(Other):857229##TIMEZONECOUNTYCOUNTYNAMESTATE##CST:547493Min.:0.0JEFFERSON:7840TX:83728##EST:2455581stQu.:31.0WASHINGTON:7603KS:53440##MST:68390Median:75.0JACKSON:6660OK:46802

##PST:28302Mean100.6FRANKLIN:6256MO:35648##AST:63603rdQu.131.0LINCOLN:5937IA:31069##HST:2563Max.873.0MADISON:5632NE:30271##(Other):3631(Other):862369(Other):621339##EVTYPEBGNRANGEBGNAZI##HAIL:288661Min.:0.000:547332##TSTMWIND:2199401stQu.:0.000N:86752##THUNDERSTORMWIND:82563Median:0.000W:38446##TORNADO:60652Mean:1.484S:37558##FLASHFLOOD:542773rdQu.:1.000E:33178##FLOOD:25326Max.:3749.000NW:24041##(Other):170878(Other):134990##BGNLOCATIENDDATEENDTIME##:287743:243411:238978##COUNTYWIDE:196804/27/20110:00:00:121406:00:00PM:9802##Countywide:9935/25/20110:00:00:119605:00:00PM:8314##SPRINGFIELD:8436/9/20110:00:00:102104:00:00PM:8104##SOUTHPORTION:8104/4/20110:00:00:100712:00:00PM:7483##NORTHPORTION:7845/30/20040:00:00:99811:59:00PM:7184##(Other):591444(Other):653450(Other):622432

100444-EVTYPEEXCESSIVEHEATFLASHFLOODFLOOD100444-EVTYPEEXCESSIVEHEATFLASHFLOODFLOODHEATICESTORMLIGHTNINGTHUNDERSTORMWINDTORNADOT$TMWINDWINTERSTORMEVTYPE從輸出結(jié)果可以看出,不需要特殊的轉(zhuǎn)換來準(zhǔn)備數(shù)據(jù),所以繼續(xù)進(jìn)行分析。這個分析重點是回答以下問題:1?在美國,哪些類型的事件(如EVTYPE變量所示)對人群健康危害最大?2?在美國,哪類事件的經(jīng)濟(jì)后果最大?以下部分將涵蓋有關(guān)數(shù)據(jù)分析的詳細(xì)信息,需要找到答案1?在美國各地,哪些類型的事件(如EVTYPE變量所示)在人群健康方面是最有害的?考慮到以死亡或受傷為終點的人口健康危害事件,為了回答這個問題,需要計算每次事件的死亡和傷害總數(shù)。讓我們在一個名為total_victims的新專欄里總結(jié)死傷:library(dplyr)####Attachingpackage:'dplyr##Thefollowingobjectsaremaskedfrom'package:stats':####filter,lag##Thefollowingobjectsaremaskedfrom'package:base':####intersect,setdiff,setequal,unionlibrary(grDevices)

library(ggplot2)NOAAS_DT$TOTAL_VICTIMS<-NOAAS_DT$FATALITIES+NOAAS_DT$INJURIESNow,itisrequiredtogroupbyeventthetotalnumberofvictims,sothatwayitcanbeseenwhicheventisthemostharmful.Toachievethis,theuseofthegroup_bydyplr'sfunctionpipelinedwithsummarisewilldothework.Afterthatlet'sshowthe10mostharmfulevents#ThetrickisdonebygroupingbyEventTypeanddoasummarycountingthenumberofvictimsnoaas_evtype_victims<-NOAAS_DT%>%group_by(EVTYPE)%>%summarise(VICTIMS=sum(TOTAL_VICTIMS))%>%arrange(desc(VICTIMS))#getthetoptenmostharmfuleventsnoaasevtypevictims<-noaasevtypevictims[1:10,]ggplot(noaas_evtype_victims,aes(x=EVTYPE,y=VICTIMS))+geombar(stat="identity",aes(fill=EVTYPE))+scalexdiscretelabels=c())lOOOOC-75000-EVTYPELIGHTNINGTl-UNDERSTORMWINDTORNADOlOOOOC-75000-EVTYPELIGHTNINGTl-UNDERSTORMWINDTORNADOTSTMWINDWIN'TEFtSTORMEVTYPEEXCESSIVEHEATFLASHFLOODHLOOD|HEATIICESTORMQothereventsTheplotaboveclearlyshowsthatTornadosleadmorevictimswithahugedifferencetootherevents【原創(chuàng)】R語言案例數(shù)據(jù)分析報告論文(附代碼數(shù)據(jù))有問題到淘寶找“大數(shù)據(jù)部落”就可以了2.AcrosstheUnitedStates,whichtypesofeventshavethegreatesteconomicconsequences?FromthestructureoftheNOAASDatasetitcanbeseenthatdamagesaredividedinto2bigcategories:#####PropertyDamages:Thoseocurredtobuildings,insfrastructuressupportingdevices.DescribedinNOAASDatasetPROPDMGvariable.#####CultiveDamages:Thoseoccurredaggriculturalactivities.DescribedinNOAASDatasetCROPDMGvariableAdditionally,NOAASDatasetdoesspecifydamagesmagnitudeusinganacronym:h:100factorK:1000factorM:1000000factorB:1000000000factorNOAASDatasetPROPDMGEXPandNOAASDatasetCROPDMGEXPspecifythemagnitudeforeachobservationaccordingly.Again,groupingisthekeytasktopresentthedataforthegivenquestion.Thefollowingcodespippetdoesthework:#definethefactors:H_FACTOR<-100K_FACTOR<-1000M_FACTOR<-K_FACTOR*K_FACTORB_FACTOR<-M_FACTOR*K_FACTORNOAAS_DT$PROPDMG[NOAAS_DT$PROPDMGEXP==""]<-NOAAS_DT$PROPDMG[NOAAS_DT$PROPDMGEXP==""]*1NOAAS_DT$PROPDMG[NOAAS_DT$PROPDMGEXP=="0"]<-NOAAS_DT$PROPDMG[NOAAS_DT$PROPDMGEXP=="0"]*1NOAAS_DT$PROPDMG[NOAAS_DT$PROPDMGEXP=="1"]<-NOAAS_DT$PROPDMG[NOAAS_DT$PROPDMGEXP=="1"]*1NOAAS_DT$PROPDMG[NOAAS_DT$PROPDMGEXP=="2"]<-NOAAS_DT$PROPDMG[NOAAS_DT$PROPDMGEXP=="2"]*1NOAAS_DT$PROPDMG[NOAAS_DT$PROPDMGEXP=="3"]<-NOAAS_DT$PROPDMG[NOAAS_DT$PROPDMGEXP=="3"]*1NOAAS_DT$PROPDMG[NOAAS_DT$PROPDMGEXP=="4"]<-NOAAS_DT$PROPDMG[NOAAS_DT$PROPDMGEXP=="4"]*1NOAAS_DT$PROPDMG[NOAAS_DT$PROPDMGEXP=="5"]<-NOAAS_DT$PROPDMG[NOAAS_DT$PROPDMGEXP=="5"]*1NOAAS_DT$PROPDMG[NOAAS_DT$PROPDMGEXP=="6"]<-NOAAS_DT$PROPDMG[NOAAS_DT$PROPDMGEXP=="6"]*1NOAAS_DT$PROPDMG[NOAAS_DT$PROPDMGEXP=="7"]<-NOAAS_DT$PROPDMG[NOAAS_DT$PROPDMGEXP=="7"]*1NOAAS_DT$PROPDMG[NOAAS_DT$PROPDMGEXP=="8"]<-NOAAS_DT$PROPDMG[NOAAS_DT$PROPDMGEXP=="8"]*1【原創(chuàng)】【原創(chuàng)】R語言案例數(shù)據(jù)分析報告論文(附代碼數(shù)據(jù))有問題到淘寶找“大數(shù)據(jù)部落”就可以了NOAAS_DT$PROPDMG[NOAAS_DT$PROPDMGEXP=="+"]<-NOAAS_DT$PROPDMG[N0AAS_DT$PR0PDMGEXP=="+"]*1NOAAS_DT$PROPDMG[N0AAS_DT$PR0PDMGEXP=="8"]<-N0AAS_DT$PR0PDMG[N0AAS_DT$PR0PDMGEXP=="-"]*1NOAAS_DT$PROPDMG[NOAAS_DT$PROPDMGEXP=="K"]<-NOAAS_DT$PROPDMG[NOAAS_DT$PROPDMGEXP=="K"]*K_FACTORNOAAS_DT$PROPDMG[NOAAS_DT$PROPDMGEXP=="M"]<-NOAAS_DT$PROPDMG[NOAAS_DT$PROPDMGEXP=="M"]*M_FACTORNOAAS_DT$PROPDMG[NOAAS_DT$PROPDMGEXP=="B"]<-NOAAS_DT$PROPDMG[NOAAS_DT$PROPDMGEXP=="B"]*B_FACTORNOAAS_DT$PROPDMG[NOAAS_DT$PROPDMGEXP=="h"]<-NOAAS_DT$PROPDMG[NOAAS_DT$PROPDMGEXP=="h"]*H_FACTORNOAAS_DT$CROPDMG[NOAAS_DT$CROPDMGEXP==""]<-NOAAS_DT$CROPDMG[NOAAS_DT$CROPDMGEXP==""]*1NOAAS_DT$CROPDMG[NOAAS_DT$CROPDMGEXP=="0"]<-NOAAS_DT$CROPDMG[NOAAS_DT$CROPDMGEXP=="0"]*1NOAAS_DT$CROPDMG[NOAAS_DT$CROPDMGEXP=="2"]<-NOAAS_DT$CROPDMG[NOAAS_DT$CROPDMGEXP=="2"]*1NOAAS_DT$CROPDMG[NOAAS_DT$CROPDMGEXP=="?"]<-NOAAS_DT$CROPDMG[NOAAS_DT$CROPDMGEXP=="?"]*1NOAAS_DT$CROPDMG[NOAAS_DT$CROPDMGEXP=="B"]<-NOAAS_DT$CROPDMG[NOAAS_DT$CROPDMGEXP=="B"]*B_FACTORNOAAS_DT$CROPDMG[NOAAS_DT$CROPDMGEXP=="K"]<-NOAAS_DT$CROPDMG[NOAAS_DT$CROPDMGEXP=="K"]*K_FACTORNOAAS_DT$CROPDMG[NOAAS_DT$CROPD

溫馨提示

  • 1. 本站所有資源如無特殊說明,都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請下載最新的WinRAR軟件解壓。
  • 2. 本站的文檔不包含任何第三方提供的附件圖紙等,如果需要附件,請聯(lián)系上傳者。文件的所有權(quán)益歸上傳用戶所有。
  • 3. 本站RAR壓縮包中若帶圖紙,網(wǎng)頁內(nèi)容里面會有圖紙預(yù)覽,若沒有圖紙預(yù)覽就沒有圖紙。
  • 4. 未經(jīng)權(quán)益所有人同意不得將文件中的內(nèi)容挪作商業(yè)或盈利用途。
  • 5. 人人文庫網(wǎng)僅提供信息存儲空間,僅對用戶上傳內(nèi)容的表現(xiàn)方式做保護(hù)處理,對用戶上傳分享的文檔內(nèi)容本身不做任何修改或編輯,并不能對任何下載內(nèi)容負(fù)責(zé)。
  • 6. 下載文件中如有侵權(quán)或不適當(dāng)內(nèi)容,請與我們聯(lián)系,我們立即糾正。
  • 7. 本站不保證下載資源的準(zhǔn)確性、安全性和完整性, 同時也不承擔(dān)用戶因使用這些下載資源對自己和他人造成任何形式的傷害或損失。

評論

0/150

提交評論