“數(shù)理統(tǒng)計”綜合作業(yè)_第1頁
“數(shù)理統(tǒng)計”綜合作業(yè)_第2頁
“數(shù)理統(tǒng)計”綜合作業(yè)_第3頁
“數(shù)理統(tǒng)計”綜合作業(yè)_第4頁
“數(shù)理統(tǒng)計”綜合作業(yè)_第5頁
已閱讀5頁,還剩6頁未讀 繼續(xù)免費閱讀

下載本文檔

版權(quán)說明:本文檔由用戶提供并上傳,收益歸屬內(nèi)容提供方,若內(nèi)容存在侵權(quán),請進行舉報或認領(lǐng)

文檔簡介

1、 “數(shù)理統(tǒng)計”課程綜合作業(yè)作業(yè)要求為了考核同學們綜合運用統(tǒng)計方法解決實際問題的過程,請同學們結(jié)合當前社會生活實際中的問題,自己擬定一個研究題目,并應用參數(shù)估計、假設(shè)檢驗、回歸分析、方差分析、正交設(shè)計(這些方法中至少選擇兩個)對其進行分析。要求:(一) 內(nèi)容必須涵蓋以下幾個方面:1.題目;2.研討的問題是什么;3.相關(guān)的數(shù)據(jù)及來源;4.建立的統(tǒng)計模型和統(tǒng)計問題是什么,樣本數(shù)據(jù)是什么;5.使用的統(tǒng)計方法是什么?使用的統(tǒng)計分析軟件是什么?5.計算過程(若統(tǒng)計軟件,其計算結(jié)果是什么)6.對計算結(jié)果的說明或解釋。(二) 格式 包括報告題目、摘要、正文、參考文獻和附錄五個部分。正文內(nèi)容一般包括問題描述、數(shù)

2、據(jù)描述、模型建立、統(tǒng)計方法選擇和問題求解、結(jié)果分析等內(nèi)容。報告用Word 文本格式,中文字使用宋體、小四號字,英文用Roman 字體5 號字,數(shù)學符號用MathType 輸入。題 目(黑體,三號)摘要:(200-400字)(黑體,小四)正文(正文標題:宋體,粗體,小四)一、問題提出。(正文內(nèi)容:宋體,五號)二、數(shù)據(jù)描述(用表格表達數(shù)據(jù)信息,指出數(shù)據(jù)來源或提供原始數(shù)據(jù))三、建立統(tǒng)計模型四、統(tǒng)計方法設(shè)計和方法使用的條件,計算工具的選擇。五、計算過程和計算結(jié)果。六、結(jié)果分析。參考資料(標題:宋體,粗體,小四,內(nèi)容:宋體,五號)附錄(標題:宋體,粗體,小四,內(nèi)容:宋體,五號)(三) 課外作業(yè)提交形式紙

3、質(zhì)材料和電子文檔注意:紙質(zhì)材料打印內(nèi)容從封面開始,包括作業(yè)要求,直至作業(yè)的所有內(nèi)容。電子文檔:先提交給班長,再由班長將壓縮文件提交給老師。特別注意電子文檔的名稱,按如下模板寫: 2011級某班“數(shù)理統(tǒng)計”綜合作業(yè)姓名,學號。(四) 課外作業(yè)提交時間參加課程考試那天上午提交紙質(zhì)材料,當天班長提交電子文檔給老師。請注意:不能復制現(xiàn)有成果,同學之間也不能相互復制內(nèi)容。 股票市場中變量之間的關(guān)系摘要: 在經(jīng)濟飛速發(fā)展的當代,金融市場占據(jù)著半壁江山,而在金融市場中股票作為公司籌資的重要來源,它占據(jù)著重要的地位,我接下來就是要研究股票市場中變量之間的關(guān)系,通過統(tǒng)計分析方法還原大數(shù)據(jù)時代海量數(shù)據(jù)所反映的事實

4、,以及數(shù)據(jù)之間的規(guī)律性。 首先用統(tǒng)計中的參數(shù)估計的方法對所得數(shù)據(jù)進行分析建立模型Y=X+,對搜集到的數(shù)據(jù)做參數(shù)估計,即最小二乘估計。然后對數(shù)據(jù)建立回歸預測的模型,用回歸分析的方法對搜集到的中證100股指的數(shù)據(jù)建立線性模型,用R軟件編程進行求解,最后求出的估計值并用R軟件畫出殘差圖并與實際走勢相比較。最后對所得結(jié)果進行分析,聯(lián)系實際的K線圖,檢驗預測的效果,對R軟件中得出的異常點進行分析,用三種不同的方法得到的結(jié)果進行比較,分析此次分析對實際問題的實用性。 中證100指數(shù)的回歸分析1 問題的提出生活在21世紀,這個信息的海洋里,每天都面對著海量的數(shù)據(jù),而與我們并不遙遠的金融市場更是信息的集中體,

5、股票期權(quán)等每秒都有上億的數(shù)據(jù)信息量,面對如此多的數(shù)據(jù)信息,如何才能從眾多的股票中選出優(yōu)質(zhì)股進行投資成為人們爭奪的熱點,其實我們可以用統(tǒng)計的方法來解決這些問題。下面便針對這種現(xiàn)象提出如下的問題:請搜集有關(guān)股票數(shù)據(jù)并對其變量用統(tǒng)計方法進行分析。2 數(shù)據(jù)描述在大智慧軟件上搜集中證100的指數(shù),并對中證100支成分股搜集15分鐘k線的收盤價,共352組樣本數(shù)據(jù)得到如下數(shù)據(jù):(具體見附錄) 三.建立統(tǒng)計模型對搜集到的數(shù)據(jù)進行建模,因為影響因變量中證100收盤價Y的共有100支股票,設(shè)這一百只股票分別為X1,X2,X3.X99,X100.這100個變量與Y有如下相關(guān)關(guān)系:Y=+x+.+其中 N(0,) 且

6、cov()=0,ij.即建立了線性模型: Y=X+ E=0,cov()=I參數(shù)估計: 對上述建立的模型進行參數(shù)估計,設(shè)=()為的估計量,則稱為線性回歸方程,殘差平方和為給定觀測數(shù)據(jù)()i=1,2,3.100就是的最優(yōu)解即 (1)的解由(1)式可知為正規(guī)方程 rank()=rank(X)=p+1所以得到的LS 估計為即4、 統(tǒng)計方法設(shè)計和方法使用的條件,計算工具的選擇。 用用R軟件對所搜集的數(shù)據(jù)進行用回歸分析的方法對最小二乘估計進行計算,并用回歸分析建立回歸模型,首先把數(shù)據(jù)中缺失的即停盤的股票刪去,并將缺失的補齊,另存為Csv文件,下面在R軟件中編程進行解答。下面是程序DA=read.csv(f

7、ile=file.choose(),head=T) library(nnls) x=as.matrix(DA,2:101) y=as.vector(DA,1) a=2:101 b=0.000373465 D=data.frame(a,b) b0=as.vector(D,2) y1=y-x%*%b0 nnr nnr coef coef五、計算過程和計算結(jié)果。對數(shù)據(jù)做正回歸分析得出結(jié)果:coef(提取系數(shù)向量的估計值) 1 1.986219993 45.724918486 14.346167164 0.000373465 2.901370739 6.540717465 0.114566603 9.

8、684098103 36.471730436 0.682356715 0.000373465 12 0.000373465 0.835485658 0.000373465 3.471582198 0.000373465 1.488914287 1.500925835 0.000373465 0.000373465 0.000373465 0.000373465 23 0.000373465 0.000373465 14.426982052 31.705891305 0.000373465 0.000373465 0.000373465 18.460676674 0.000373465 0.00

9、0373465 0.000373465 34 0.000373465 0.000373465 0.000373465 0.000373465 5.243724570 12.354343316 0.000373465 0.000373465 0.000373465 0.000373465 0.000373465 45 0.000373465 0.000373465 0.671666765 0.000373465 0.000373465 0.000373465 1.631742836 0.000373465 0.000373465 0.000373465 29.402227896 56 3.856

10、391237 0.000373465 0.000373465 4.298749228 0.000373465 0.000373465 0.000373465 0.000373465 0.000373465 0.000373465 0.000373465 67 0.000373465 1.425965346 0.000373465 0.000373465 0.000373465 11.102420742 0.000373465 0.000373465 0.000373465 0.000373465 0.000373465 78 1.044591680 0.000373465 0.00037346

11、5 0.000373465 6.580593133 0.000373465 0.000373465 0.000373465 0.000373465 0.799960901 0.000373465 89 0.000373465 23.851547917 17.240759376 0.000373465 0.000373465 0.000373465 0.000373465 0.000373465 3.079589529 0.000373465 0.000373465100 0.000373465 x estimates: 1.985847 45.72455 14.34579 0 2.900997

12、 6.540344 0.1141931 9.683725 36.47136 0.6819832 0 0 0.8351122 0 3.471209 0 1.488541 1.500552 0 0 0 0 0 0 14.42661 31.70552 0 0 0 18.4603 0 0 0 0 0 0 0 5.243351 12.35397 0 0 0 0 0 0 0 0.6712933 0 0 0 1.631369 0 0 0 29.40185 3.856018 0 0 4.298376 0 0 0 0 0 0 0 0 1.425592 0 0 0 11.10205 0 0 0 0 0 1.044

13、218 0 0 0 6.58022 0 0 0 0 0.7995874 0 0 23.85117 17.24039 0 0 0 0 0 3.079216 0 0 0 residual sum-of-squares: 9190由X的估計值得到下列回歸方程:Y=1.985847x1+45.72455x2+14.34579x3+2.900997x5+6.540344x6+0.1141931x7+9.683725 x8+36.47136x9+0.6819832x10+0.835112x13+3.471209x15+1.488541x17+1.500552x18+14.42661x25+.+3.0792

14、16x98.可以看到殘差平方和為9190X的估計值系數(shù)也均為正的回歸系數(shù)殘差圖如下實際走勢與預測效果圖如下:從上圖可以看出此次回歸預測與實際走勢基本吻合。六、結(jié)果分析。下面對結(jié)果進行分析:分析方法:正態(tài)性檢驗此次檢驗選用了較為簡單的QQ圖進行檢驗分析,在R軟件中輸入以下的程序:DA=read.csv(file=file.choose(),head=T)lm.sz=lm(YX1+X2+X3+X4+X5+X6+X7+X8+X9+X10+X11+X12+X13+X14+X15+X16+X17+X18+X19+X20+X21+X22+X23+X24+X25+X26+X27+X28+X29+X30+X3

15、1+X32+X33+X34+X35+X36+X37+X38+X39+X40+X41+X42+X43+X44+X45+X46+X47+X48+X49+X50+X51+X52+X53+X54+X55+X56+X57+X58+X59+X60+X61+X62+X63+X64+X65+X66+X67+X68+X69+X70+X71+X72+X73+X74+X75+X76+X77+X78+X79+X80+X81+X82+X83+X84+X85+X86+X87+X88+X89+X90+X91+X92+X93+X94+X95+X96+X97+X98+X99+X100,data=DA)summary(lm.sz

16、)plot(lm.sz,2)#對數(shù)正態(tài)QQ殘差圖#條件數(shù)的計算XX2*sqrt(p+1)/n)#庫克距離計算infl=lm.influence(lm.sz,do.coef=FALSE)D=cooks.distance(lm.sz,infl=lm.influence(lm.sz,do.coef=FALSE),rs=weighted.residuals(lm.sz),sd=sqrt(deviance(lm.sz)/df.residual(lm.sz),hat=infl$hat)sort(D)#按從小到大的順序排列#協(xié)方差比診斷D=abs(1-covratio(lm.sz, infl=lm.infl

17、uence(lm.sz, do.coef = FALSE),res = weighted.residuals(lm.sz)sort(D)最后得出的結(jié)果是:1.由WK距離共有28個異常點2.用庫克距離診斷知:距離最大的是322和333.即2013年10月23號 10:45和15:00的數(shù)據(jù),但是距離值僅為0.0594和0.0544,在大智慧中23號的走勢如下3:002:3010:45從圖中可以看出在異常點10:45時股票價格達到了最大,此時是拋售股票的最佳時機,之后股票價格大幅下跌,而在異常點2:30和3:00中軌線和下軌線經(jīng)歷了一段時間的穩(wěn)定狀態(tài)后開始復蘇,到3:15時收盤價遠遠低于開盤價,所以異常點指導股民在3:00之前一定要拋售,否則將面臨更加大的虧損.因此,分析表明異常點為股票出現(xiàn)漲停或跌停的預示,給股民一定的指導意義,很好的預測出股票的走勢異常時點

溫馨提示

  • 1. 本站所有資源如無特殊說明,都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請下載最新的WinRAR軟件解壓。
  • 2. 本站的文檔不包含任何第三方提供的附件圖紙等,如果需要附件,請聯(lián)系上傳者。文件的所有權(quán)益歸上傳用戶所有。
  • 3. 本站RAR壓縮包中若帶圖紙,網(wǎng)頁內(nèi)容里面會有圖紙預覽,若沒有圖紙預覽就沒有圖紙。
  • 4. 未經(jīng)權(quán)益所有人同意不得將文件中的內(nèi)容挪作商業(yè)或盈利用途。
  • 5. 人人文庫網(wǎng)僅提供信息存儲空間,僅對用戶上傳內(nèi)容的表現(xiàn)方式做保護處理,對用戶上傳分享的文檔內(nèi)容本身不做任何修改或編輯,并不能對任何下載內(nèi)容負責。
  • 6. 下載文件中如有侵權(quán)或不適當內(nèi)容,請與我們聯(lián)系,我們立即糾正。
  • 7. 本站不保證下載資源的準確性、安全性和完整性, 同時也不承擔用戶因使用這些下載資源對自己和他人造成任何形式的傷害或損失。

評論

0/150

提交評論