版權(quán)說明:本文檔由用戶提供并上傳,收益歸屬內(nèi)容提供方,若內(nèi)容存在侵權(quán),請(qǐng)進(jìn)行舉報(bào)或認(rèn)領(lǐng)
文檔簡(jiǎn)介
第八講在金融工程中的應(yīng)用演示文稿目前一頁\總數(shù)一百零一頁\編于九點(diǎn)優(yōu)選第八講在金融工程中的應(yīng)用目前二頁\總數(shù)一百零一頁\編于九點(diǎn)
Matlab金融工具箱模塊1.FinancialToolboxMatlab自帶金融工具箱,具有下列功能:固定收益計(jì)算日期數(shù)據(jù)處理資產(chǎn)均值-方差分析時(shí)間序列分析有價(jià)證卷的收益和價(jià)格統(tǒng)計(jì)分析定價(jià)和靈敏度分析年金和現(xiàn)金流計(jì)算抵押支持債卷目前三頁\總數(shù)一百零一頁\編于九點(diǎn)
FinancialDerivativesToolbox
是金融衍生產(chǎn)品工具箱,用于固定收益、金融衍生物以及風(fēng)險(xiǎn)投資評(píng)估分析,也可用于各種金融衍生物定價(jià)策略以及敏感度分析。2.FinancialDerivativesToolbox3.FinancialTimeSeriesToolbox
FinancialTimeSeriesToolbox
用于分析金融市場(chǎng)的時(shí)間序列數(shù)據(jù)。金融數(shù)據(jù)是時(shí)間序列數(shù)據(jù),例如股票價(jià)格或每天的利息波動(dòng),可以用該工具箱進(jìn)行更加直觀的數(shù)據(jù)管理。該工具箱支持下列功能:技術(shù)分析函數(shù)分析投資??梢暬鹑跁r(shí)間序列的對(duì)象;提供兩種創(chuàng)建金融時(shí)間序列的對(duì)象(用構(gòu)造器和轉(zhuǎn)換文本文件);目前四頁\總數(shù)一百零一頁\編于九點(diǎn)
Fixed-IncomeToolbox擴(kuò)展了Matlab在金融財(cái)經(jīng)方面的應(yīng)用,可以用固定收益模型進(jìn)行計(jì)算,例如定價(jià)、收益和現(xiàn)金流動(dòng)等有價(jià)證券的固定收益計(jì)算。支持的固定收益類型包括有價(jià)證券抵押回報(bào)、社會(huì)債卷和保證金等。該工具箱還能夠處理相應(yīng)金融衍生物的計(jì)算,支持抵押回收有價(jià)證券、國(guó)債和可轉(zhuǎn)換債卷等的計(jì)算。
GarchToolbox
提供了一個(gè)集成計(jì)算環(huán)境,允許對(duì)單變量金融時(shí)序數(shù)據(jù)的易變性進(jìn)行建模。GarchToolbox使用一個(gè)廣義ARMAX/GARCH復(fù)合模型對(duì)帶有條件異方差的金融時(shí)序數(shù)據(jù)進(jìn)行仿真、預(yù)測(cè)和參數(shù)識(shí)別。GarchToolbox提供了基本工具為單變量廣義自回歸條件異方差GARCH(GeneralizedAutoRegressiveConditionalHeteroskedasticity)易變性進(jìn)行建模。GarchToolbox采用單變量GARCH模型對(duì)金融市場(chǎng)中的變化性進(jìn)行分析。4.Fixed-IncomeToolbox5.GarchToolbox目前五頁\總數(shù)一百零一頁\編于九點(diǎn)上述工具箱基本上囊括了通常的金融計(jì)算,適用于金融學(xué)術(shù)研究,特別適合金融實(shí)務(wù)工作者進(jìn)行金融計(jì)算。FinancialToolbox提供了一個(gè)基于Matlab的財(cái)務(wù)分析支撐環(huán)境,可以完成許多種財(cái)務(wù)分析統(tǒng)計(jì)任務(wù);從簡(jiǎn)單計(jì)算到全面的分布式應(yīng)用,財(cái)務(wù)工具箱都能夠用來進(jìn)行證卷定價(jià)、資產(chǎn)組合收益分析、偏差分析和優(yōu)化業(yè)務(wù)量等工作。目前六頁\總數(shù)一百零一頁\編于九點(diǎn)金融數(shù)據(jù)統(tǒng)計(jì)本講主要介紹了統(tǒng)計(jì)學(xué)的基本原理和基本統(tǒng)計(jì)量。要求讀者掌握均勻分布、正態(tài)分布隨機(jī)數(shù)生成辦法,學(xué)會(huì)常用的統(tǒng)計(jì)繪圖命令,掌握回歸的方法,學(xué)會(huì)運(yùn)用主成份、因子分析金融問題。一、隨機(jī)模擬基本原理
1977年,菲利浦.伯耶勒(PhelimBoyle)提出了模擬方法求解金融資產(chǎn)定價(jià)問題。其想法是假設(shè)資產(chǎn)價(jià)格分布是隨機(jī)波動(dòng),如果知道了這個(gè)波動(dòng)過程,就可以模擬不同的路徑;每做完一次模擬,就產(chǎn)生一個(gè)最終資產(chǎn)價(jià)值,在進(jìn)行若干次這樣的過程,那么所得到的結(jié)果就是一個(gè)最終資產(chǎn)價(jià)值分布,從這個(gè)分布中可以得到期望的資產(chǎn)價(jià)格。目前七頁\總數(shù)一百零一頁\編于九點(diǎn)(一)隨機(jī)數(shù)生成函數(shù)在Matlab中unidrnd函數(shù)可以生成1~N的均勻分布隨機(jī)數(shù)。其調(diào)用方式為:R=unidrnd(N)隨機(jī)數(shù)矩陣確定輸出隨機(jī)矩陣R的行數(shù)生成在1~N之間的一個(gè)隨機(jī)數(shù)1.均勻分布隨機(jī)數(shù)生成函數(shù)R=unidrnd(N,m)R=unidrnd(N,m,n)確定輸出隨機(jī)矩陣R的列數(shù)輸出方陣目前八頁\總數(shù)一百零一頁\編于九點(diǎn)>>unifrnd(0,1)ans=0.4565如果需要生成服從連續(xù)均勻分布的隨機(jī)數(shù),則可以調(diào)用
unifrnd函數(shù),其調(diào)用方式為:R=unifrnd(A,B)A,B是隨機(jī)數(shù)的下界與上界如:生成一個(gè)0~1之間隨機(jī)數(shù):2.生成服從連續(xù)均勻分布的隨機(jī)數(shù)R=unifrnd(A,B,m)R=unifrnd(A,B,m,n)m,n表示隨機(jī)數(shù)的維數(shù)目前九頁\總數(shù)一百零一頁\編于九點(diǎn)下面介紹兩種方法生成1~2之間隨機(jī)矩陣K,K為5行6列矩陣。方法1方法2>>unifrnd(1,2,[5,6])ans=1.93341.13381.57511.01291.61241.58691.68331.20711.45141.38401.60851.05761.21261.60721.04391.68311.01581.36761.83921.62991.02721.09281.01641.63151.62881.37051.31271.03531.19011.7176>>unifrnd(1,2,5,6)
ans=1.69271.15361.55481.27311.90841.64081.08411.67561.12101.25481.23191.19091.45441.69921.45081.86561.23931.84391.44181.72751.71591.23241.04981.17391.35331.47841.89281.80491.07841.1708目前十頁\總數(shù)一百零一頁\編于九點(diǎn)R=normrnd(mu,sigma)正態(tài)分布的均值隨機(jī)矩陣R的行數(shù)正態(tài)分布的方差3.生成正態(tài)分布的隨機(jī)數(shù)R=normrnd(mu,sigma,m)R=normrnd(mu,sigma,m,n)隨機(jī)矩陣R的列數(shù)調(diào)用方式為:>>normrnd(0,1)ans=-0.4326如:生成均值為0,方差為1正態(tài)分布的隨機(jī)數(shù),可用命令目前十一頁\總數(shù)一百零一頁\編于九點(diǎn)下面用兩種方法生成均值為0,方差為1的正態(tài)分布矩陣,矩陣為5行6列。方法1方法2>>normrnd(0,1,[5,6])ans=-0.31790.7310-0.25560.11840.7990-1.00781.09500.5779-0.37750.31480.9409-0.7420-1.87400.0403-0.29591.4435-0.99211.08230.42820.6771-1.4751-0.35100.2120-0.13150.89560.5689-0.23400.62320.23790.3899>>normrnd(0,1,5,6)ans=0.08800.7812-2.20230.0215-1.0559-1.1283-0.63550.56900.9863-1.00391.4725-1.3493-0.5596-0.8217-0.5186-0.94710.0557-0.26110.4437-0.26560.3274-0.3744-1.21730.9535-0.9499-1.18780.2341-1.1859-0.04120.1286目前十二頁\總數(shù)一百零一頁\編于九點(diǎn)4.特定分布隨機(jī)數(shù)發(fā)生器在Matlab中有統(tǒng)一格式隨機(jī)數(shù)發(fā)生器,函數(shù)名稱為random,可以生成許多服從不同分布的隨機(jī)數(shù)。調(diào)用方式y(tǒng)=random('name',A1,A2,A3,m,n)輸出參數(shù)name說明隨機(jī)分布的類型,具體如下表所列。目前十三頁\總數(shù)一百零一頁\編于九點(diǎn)類別貝塔二項(xiàng)分布卡方指數(shù)分布F分布伽碼對(duì)數(shù)正態(tài)分布BetabinomialChisquareExponentialFGammaLognormal簡(jiǎn)寫betabinochi2expfgamlogn類別均勻分布泊松分布
T分布正態(tài)分布非中心F分布非中心T分布分布UniformPoisson
TNormalNoncentralFNoncentralT簡(jiǎn)寫unifpoiss
tnormncfnct
特定分布的參數(shù)表>>a=random('Normal',0,1,3,2)a=0.6565-0.2624-1.1678-1.2132-0.4606-1.3194下面用random函數(shù)生成3行2列的正態(tài)分布隨機(jī)數(shù)矩陣,正態(tài)分布的均值為0、方差為1。目前十四頁\總數(shù)一百零一頁\編于九點(diǎn)5.多元正態(tài)分布的隨機(jī)數(shù)多元正態(tài)分布的隨機(jī)數(shù)可以用如下形式表示:式中:μ是均值向量,∑是協(xié)方差矩陣。
Xi~N(μ,∑)mu均值sigma協(xié)方差cases樣本個(gè)數(shù)在Matlab中可使用mvnrnd函數(shù)生成多元正態(tài)分布函數(shù)。調(diào)用方式
R=mvnrnd(mu,sigma)R=mvnrnd(mu,sigma,cases)輸入?yún)?shù)目前十五頁\總數(shù)一百零一頁\編于九點(diǎn)>>mu=[23];%均值>>SIGMA=[11.5;1.53];%協(xié)方差矩陣>>r=mvnrnd(mu,SIGMA,100);%生成100個(gè)隨機(jī)樣本>>plot(r(:,1),r(:,2),'+')下面生成一個(gè)多元正態(tài)分布的例子。樣本的散點(diǎn)圖如右所示:二元正態(tài)分布的散點(diǎn)圖目前十六頁\總數(shù)一百零一頁\編于九點(diǎn)(二)多元正態(tài)分布密度函數(shù)>>mu=[1-1];>>Sigma=[0.90.4;0.40.3];>>X=[21];>>p=mvnpdf(X,mu,Sigma)p=1.3828e-005多元正態(tài)分布的密度函數(shù)是mvnpdf。調(diào)用方式
mvnpdf(X,mu,Sigma)下面是一個(gè)例子。目前十七頁\總數(shù)一百零一頁\編于九點(diǎn)>>mu=[1-1];>>Sigma=[0.90.4;0.40.3];>>X=[21];>>f=mvncdf(X,mu,Sigma)f=0.8541
F(x,y)=P(X<x,Y<y)如果計(jì)算分布函數(shù),則X、Y為二元隨機(jī)正態(tài)分布,分布函數(shù)F(x,y)的定義如下:調(diào)用方式為:
p=mvncdf(X,mu,SIGMA)下面舉一個(gè)例子??梢钥闯觯簩?duì)于隨機(jī)變量X,Y,有
P(X<2,Y<1)=0.8541也即X<2且Y<1的概率為0.8541。目前十八頁\總數(shù)一百零一頁\編于九點(diǎn)二、隨機(jī)變量的數(shù)字特征A如果A為向量,則返回值為該向量的平均值;如果A是矩陣,則返回值是每列的平均值。dimdim=1(默認(rèn))表示每列平均,dim=2表示每行平均。(一)計(jì)算平均值調(diào)用方式
M=mean(A)mean(A,dim)輸入?yún)?shù)目前十九頁\總數(shù)一百零一頁\編于九點(diǎn)在Matlab中計(jì)算幾何平均數(shù)的函數(shù)為geomean;計(jì)算調(diào)和平均數(shù)的函數(shù)是harmmean函數(shù),調(diào)和平均數(shù)的計(jì)算公式是注意樣本數(shù)據(jù)不能為0。>>a=[12;34];a=1234下面是一個(gè)例子。>>mean(a)ans=23>>mean(a,2)ans=1.50003.5000目前二十頁\總數(shù)一百零一頁\編于九點(diǎn)(二)剔除異常值后的平均值X樣本觀察矩陣。percent剔除比率,例如percent=10表示同時(shí)剔除最大的5%和最小的5%觀察值。dimdim=1(默認(rèn))表示對(duì)每列求平均值,dim=2
表示對(duì)每行求平均值。有時(shí)觀察數(shù)據(jù)中有異常大或異常小的值,這些異常值會(huì)對(duì)平均值產(chǎn)生影響,需要去掉異常值。例如在體操比賽中,去掉一個(gè)最高分和最低分,然后計(jì)算運(yùn)動(dòng)員的最后得分。在Matlab中也有剔除異常值后的平均數(shù)。調(diào)用方式
M=trimmean(X,percent)M=trimmean(X,percent,dim)輸入?yún)?shù)目前二十一頁\總數(shù)一百零一頁\編于九點(diǎn)>>x=rand(1,20)>>trimmean(x,10)ans=0.5145(三)計(jì)算中位數(shù)A樣本觀測(cè)矩陣dimdim=1(默認(rèn))表示對(duì)每列求中位數(shù),dim=2表示對(duì)每行求中位數(shù)剔除10%的異常值之后的平均數(shù)為0.5145。調(diào)用方式
M=median(A)
M=median(A,dim)輸入?yún)?shù)有時(shí)數(shù)據(jù)中出現(xiàn)NaN,在計(jì)算中位數(shù)時(shí)需要忽略NaN,這時(shí)需要調(diào)用nanmedian函數(shù)。目前二十二頁\總數(shù)一百零一頁\編于九點(diǎn)(四)計(jì)算方差與標(biāo)準(zhǔn)差A(yù)樣本值flag0(默認(rèn)值)表示方差計(jì)算公式為
1表示方差計(jì)算公式為一般說來,資產(chǎn)組合的風(fēng)險(xiǎn)越大,方差越大,波動(dòng)性越大。方差由于其簡(jiǎn)單、直觀以及良好的統(tǒng)計(jì)性質(zhì)使其成為風(fēng)險(xiǎn)的代名詞。在Matlab中計(jì)算方差、標(biāo)準(zhǔn)差的函數(shù)分別是Var、Std。方差調(diào)用方式
Var(A)Var(A,flag)標(biāo)準(zhǔn)差調(diào)用方式
Std(A)
Std(A,flag)輸入?yún)?shù)目前二十三頁\總數(shù)一百零一頁\編于九點(diǎn)(五)計(jì)算樣本的百分位數(shù)>>x=rand(1,20);>>prctile(x,20)ans=0.1688調(diào)用方式
Y=prctile(X,p,dim)輸入?yún)?shù)X觀察值p計(jì)算大于p%值的數(shù)dim同上下面是一個(gè)例子目前二十四頁\總數(shù)一百零一頁\編于九點(diǎn)(六)計(jì)算樣本極差
r=range(q)r=range(q,dim)極差就是樣本極大值與極小值的差,反映樣本的離散程度。調(diào)用方式>>x=rand(1,20);>>range(x)ans=0.8404下面是一個(gè)例子目前二十五頁\總數(shù)一百零一頁\編于九點(diǎn)(七)計(jì)算偏度與峰度方差作為風(fēng)險(xiǎn)的度量指標(biāo)并不是完整的。比如講,兩種資產(chǎn)收益分布的均值和方差都是相同的,但是一種資產(chǎn)收益是左偏的,另一種是右偏的。對(duì)于風(fēng)險(xiǎn)而言,相對(duì)于大概率和小損失人們更加厭惡小概率大損失的情況,后一種情況給人們帶來的痛苦遠(yuǎn)大于第一情況。從這個(gè)意義上講,收益分布左偏的資產(chǎn)的風(fēng)險(xiǎn)水平要小于右偏的資產(chǎn)。此時(shí),方差作為風(fēng)險(xiǎn)的度量指標(biāo)就不是完全的,還要考慮峰度、偏度等指標(biāo)。偏度和峰度是兩個(gè)高階的統(tǒng)計(jì)量。計(jì)算偏度的目的在于考察組合收益率水平是否是對(duì)稱分布,也就是組合產(chǎn)生虧損與獲得盈利的概率如何;峰度是考察組合的收益率情況是否接近正態(tài)分布,如果組合的收益率存在尖峰厚尾的分布特征,則說明組合產(chǎn)生虧損和盈利的概率偏大,也就是在一定程度上認(rèn)為組合收益率出現(xiàn)極端性的可能性偏大,這種組合的收益率穩(wěn)定性是比較差的。目前二十六頁\總數(shù)一百零一頁\編于九點(diǎn)正態(tài)分布的峰度等于3,大于3表示尖峰,小于3表示分布比較均勻。股票市場(chǎng)收益率的時(shí)間序列大都為尖峰肥尾。偏度的計(jì)算公式為式中:μ,σ分別為樣本x的均值與方差。如果skewness=0,則表示分布形態(tài)與正態(tài)分布偏度相同;如果skewness>0,則表示正偏差數(shù)值較大,長(zhǎng)尾巴拖在右邊;如果skeqness<0,則表示負(fù)偏差數(shù)值較大,長(zhǎng)尾巴拖在左邊。峰度的計(jì)算公式為目前二十七頁\總數(shù)一百零一頁\編于九點(diǎn)>>x=rand(1,20);>>skewness(x)ans=-0.04871.計(jì)算偏度調(diào)用方式
Y=skewness(A)Y=skewness(A,flag)輸入?yún)?shù)A樣本值flag偏度的計(jì)算方式,0(默認(rèn))為無偏估計(jì),
1為有偏估計(jì)下面是一個(gè)例子。目前二十八頁\總數(shù)一百零一頁\編于九點(diǎn)
k=kurtosis(X)k=kurtosis(X,flag)k=kurtosis(X,flag,dim)2.計(jì)算峰度調(diào)用方式X樣本觀察矩陣flag峰度的計(jì)算方式,0(默認(rèn))為無偏估計(jì),
1為有偏估計(jì)dimdim=1(默認(rèn))表示對(duì)每列求平均,
dim=2表示對(duì)每行求平均輸入?yún)?shù)>>x=rand(1,20)>>kurtosis(x)ans=1.4407下面是一個(gè)例子。目前二十九頁\總數(shù)一百零一頁\編于九點(diǎn)(八)計(jì)算絕對(duì)離差絕對(duì)離差是以偏差絕對(duì)數(shù)來衡量決策方案的風(fēng)險(xiǎn)。在期望值相同的情況下,絕對(duì)離差越大,風(fēng)險(xiǎn)越大;絕對(duì)離差越小,風(fēng)險(xiǎn)越小。調(diào)用方式
Y=mad(X)Y=mad(X,n)輸入?yún)?shù)X觀察值n絕對(duì)偏差計(jì)算方式
n=0(默認(rèn))計(jì)算公式為mean(abs(X-mean(X)))n=1計(jì)算公式為median(abs(X-median(X)))>>x=rand(1,20)>>mad(x)ans=0.1750下面是一個(gè)絕對(duì)離差的例子。目前三十頁\總數(shù)一百零一頁\編于九點(diǎn)(九)計(jì)算中心矩?cái)?shù)理統(tǒng)計(jì)中經(jīng)常用到中心矩的概念,k階中心矩的計(jì)算公式為可以看出1階中心矩為0,如果觀察值是矩陣則以每列為樣本計(jì)算中心矩。X觀察樣本值order中心矩的階數(shù),必須為正整數(shù)調(diào)用方式
M=moment(X,order)輸入?yún)?shù)目前三十一頁\總數(shù)一百零一頁\編于九點(diǎn)>>X=rand([65])X=0.41540.99010.32000.43990.13380.30500.78890.96010.93340.20710.87440.43870.72660.68330.60720.01500.49830.41200.21260.62990.76800.21400.74460.83920.37050.97080.64350.26790.62880.5751>>m=moment(X,3)m=-0.01130.00140.0032-0.0058-0.0023下面計(jì)算樣本的3階矩。目前三十二頁\總數(shù)一百零一頁\編于九點(diǎn)(十)計(jì)算協(xié)方差和相關(guān)系數(shù)協(xié)方差是一個(gè)用于衡量投資組合任意兩個(gè)資產(chǎn)相關(guān)性的統(tǒng)計(jì)指標(biāo)。當(dāng)協(xié)方差為正值時(shí),表示兩種資產(chǎn)的收益率呈同方向變動(dòng);協(xié)方差為負(fù)值時(shí),表示兩種資產(chǎn)的收益率呈相反方向變化;協(xié)方差等于0時(shí),表示兩種資產(chǎn)不存在相關(guān)性。相關(guān)系數(shù)總是在-1~1之間的范圍內(nèi)變動(dòng),-1表示完全負(fù)相關(guān)(反向),1表示完全正相關(guān)(同向),0則表示不相關(guān)。Matlab計(jì)算協(xié)方差、相關(guān)系數(shù)的函數(shù)分別是cov和corrcoef。目前三十三頁\總數(shù)一百零一頁\編于九點(diǎn)協(xié)方差調(diào)用方式
C=cov(X)C=cov(x,y)下面是一個(gè)例子>>A=[-112;-231;403];>>cov(A)ans=10.333-4.16673.0000-4.16672.3333-1.50003.0000-1.50001.0000目前三十四頁\總數(shù)一百零一頁\編于九點(diǎn)X觀察值矩陣Y觀察向量param1參數(shù)1,參數(shù)的值如下:
alpha表示置信度,在0~1之間val1參數(shù)1的值param2參數(shù)2val2參數(shù)2的值2.相關(guān)系數(shù)調(diào)用方式
R=corrcoef(X)R=corrcoef(x,y)[R,P]=corrcoef(X,'param1',val1,'param2',val2,…)輸入?yún)?shù)R相關(guān)系數(shù)矩陣P每個(gè)相關(guān)系數(shù)的概率矩陣輸出參數(shù)目前三十五頁\總數(shù)一百零一頁\編于九點(diǎn)>>x=rand(30,4);>>x(:,4)=sum(x,2);>>[r,p]=corrcoef(x)>>[i,j]=find(p<0.05);>>[i,j]下面是一個(gè)計(jì)算相關(guān)系數(shù)的例子。r=1.00000.1412-0.19540.49930.14121.0000-0.13120.5848-0.1954-0.13121.00000.37290.49930.58480.37291.0000p=1.00000.45660.30080.00500.45661.00000.48960.00070.30080.48961.00000.04240.00500.00070.04241.0000ans=414243142434目前三十六頁\總數(shù)一百零一頁\編于九點(diǎn)三、統(tǒng)計(jì)繪圖>>x=[1235733.4]x=1.00002.00003.00005.00007.00003.00003.4000>>tabulate(x)ValueCountPercent1114.29%2114.29%3228.57%3.4114.29%5114.29%7114.29%(一)樣本頻率分布圖樣本頻率分布圖函數(shù)是tabulate。目前三十七頁\總數(shù)一百零一頁\編于九點(diǎn)下面調(diào)用cdfplot函數(shù)繪出x的分布圖。>>cdfplot(x)向量x的分布圖目前三十八頁\總數(shù)一百零一頁\編于九點(diǎn)(二)最小二乘擬合圖在Matlab中繪制最小二乘擬合圖的命令是lsline,下面是一個(gè)例子。>>x=rand(1,20)>>x=cumsum(x)>>plot(x,'+')>>lsline最小二乘擬合圖目前三十九頁\總數(shù)一百零一頁\編于九點(diǎn)(三)正態(tài)分布概率圖有時(shí)需要判斷樣本數(shù)據(jù)是否服從正態(tài)分布,normplot函數(shù)用圖的形式給出直觀的判斷。如果數(shù)據(jù)點(diǎn)越靠近直線則分布越近似正態(tài)分布,越遠(yuǎn)則越偏離正態(tài)分布。>>x=normrnd(0,1,20,1)>>plot(x,'+')>>normplot(x)正態(tài)分布擬合圖目前四十頁\總數(shù)一百零一頁\編于九點(diǎn)從圖中可以看出,數(shù)據(jù)點(diǎn)基本上是直線,所以符合正態(tài)分布。如果判斷數(shù)據(jù)是否服從Weibull分布則可以對(duì)生成的數(shù)據(jù)用wblplot函數(shù)進(jìn)行判斷。下圖給出了Weibull分布擬合的結(jié)果。從圖中看出對(duì)于數(shù)據(jù)較小、較大的點(diǎn)偏離較大,數(shù)據(jù)不服從Weibull分布。
Weibull分布擬合圖目前四十一頁\總數(shù)一百零一頁\編于九點(diǎn)(四)樣本密度圖>>randn('seed',0);>>x=randn(1,20);>>x=cumsum(x)>>capaplot(x,[0,10])在Matlab中繪出樣本數(shù)據(jù)的密度圖函數(shù)為capaplot。樣本的密度示意圖如右圖所示。
樣本的密度示意圖目前四十二頁\總數(shù)一百零一頁\編于九點(diǎn)(五)頻率直方圖Y觀察值。如果Y是一個(gè)向量,則畫出一個(gè)頻率圖;
如果Y是一個(gè)m×p階矩陣,則對(duì)Y每一列分別作頻率圖nbins頻率圖分成nbins等分的區(qū)間段,默認(rèn)值為10。調(diào)用方式
n=hist(Y)n=hist(Y,nbins)[n,xout]=hist(Y,nbins)輸入?yún)?shù)n樣本落在區(qū)間段的頻率xout區(qū)間斷的刻度輸出參數(shù)目前四十三頁\總數(shù)一百零一頁\編于九點(diǎn)下面是一個(gè)例子。>>randn('seed',0)>>x=randn(1,200);>>hist(x)頻率直方圖如右圖所示目前四十四頁\總數(shù)一百零一頁\編于九點(diǎn)>>hist(x,min(x):0.3:max(x));其中min(x):0.3:max(x)表示頻率圖X軸的刻度起點(diǎn)是x最小元素,終點(diǎn)是x中最大元素,刻度間隔0.3。規(guī)定刻度間隔的頻率直方圖如下圖所示。目前四十五頁\總數(shù)一百零一頁\編于九點(diǎn)如果在頻率圖的基礎(chǔ)上加上正態(tài)分布擬合圖,則可以用histfit函數(shù)。>>randn('seed',0)>>x=randn(1,20)>>histfit(x)帶有密度函數(shù)的頻率直方圖如右圖所示。目前四十六頁\總數(shù)一百零一頁\編于九點(diǎn)(六)盒圖X樣本觀察值G各組的名稱Param1參數(shù)1的名稱val1參數(shù)1的值在Matlab中繪制樣本數(shù)據(jù)的盒圖函數(shù)是boxplot。調(diào)用方式
boxplot(X)boxplot(X,G)boxplot(X,'Param1',val1,'Param2',val2,…)輸入?yún)?shù)目前四十七頁\總數(shù)一百零一頁\編于九點(diǎn)各參數(shù)的名稱和內(nèi)容如下表所列參數(shù)名稱參數(shù)值notch‘on’生成有缺口的盒圖,‘off’生成矩形盒圖symbol線條類型,默認(rèn)值為‘r+’orientation‘vertical’(默認(rèn)值)為垂直型盒圖,‘horizontal’為水平型盒圖whisker盒圖須線的長(zhǎng)度,默認(rèn)值=1.5×四分位間距l(xiāng)abels盒圖行列的名稱標(biāo)簽colors線條顏色widths盒圖的寬度,默認(rèn)值=0.5positions盒圖的位置,默認(rèn)值為1:ngrouporder組的次序目前四十八頁\總數(shù)一百零一頁\編于九點(diǎn)>>x1=normrnd(5,1,100,1);>>x2=normrnd(6,1,100,1);>>boxplot([x1,x2],'notch','on')盒子的上下兩條線分別為樣本的25%和75%分位數(shù),盒子的上下底之間的距離為四分位的間距。盒子的中間線為樣本中值,如果樣本中值不在盒子的中間,表示存在一定的偏度。盒子的上方和下方有兩條虛線,顯示了樣本的范圍,野值(異常值)位于超過盒子頂端、底端1.5倍的四分位數(shù)。含有缺口的盒圖中齒形缺口表示樣本中值的置信區(qū)間。圖中的內(nèi)容說明如下:正態(tài)分布盒圖如右圖所示。目前四十九頁\總數(shù)一百零一頁\編于九點(diǎn)四、多元線性回歸分析在金融上常常需要對(duì)金融、經(jīng)濟(jì)數(shù)據(jù)進(jìn)行回歸,其中最簡(jiǎn)單的是多元線性回歸。(一)多元線性回歸
b=regress(Y,X)[b,bint]=regress(Y,X)[b,bint,r]=regress(Y,X)[b,bint,r,rint]=regress(Y,X)[b,bint,r,rint,stats]=regress(Y,X)
[b,bint,r,rint,stats]=regress(Y,X,alpha)假設(shè)因變量Y和自變量X之間服從以下的線性模型:式中:Y是因變量的觀察值,X是自變量回歸矩陣,β是參數(shù)向量,ε是白噪聲。β的最小二乘解是調(diào)用方式目前五十頁\總數(shù)一百零一頁\編于九點(diǎn)X自變量觀察值,注意如果模型中有常數(shù)項(xiàng),則X的第一列所有元素為1。Y因變量觀察值向量alpha參數(shù)的置信度輸入?yún)?shù)例1
首先按照下面模型生成一系列隨機(jī)數(shù),然后回歸。bβ的估計(jì)值,注意b中已經(jīng)包含了常數(shù)項(xiàng)bintβ的置信區(qū)間r殘值rint殘值的置信區(qū)間statsR2、F、概率p輸出參數(shù)目前五十一頁\總數(shù)一百零一頁\編于九點(diǎn)>>[b,bint,r,rint,stats]=regress(Y',[ones(10,1),X'],0.05)下面生成一組隨機(jī)數(shù)>>X=1:10;>>Y=0.1+0.4*X+normrnd(0,0.1,1,10);下面估計(jì)β:rint=-0.17940.1149-0.14350.1764-0.16250.1737-0.20050.1417-0.17950.1712-0.10460.2290-0.05690.2470-0.2559-0.0402-0.06670.2238-0.18890.1008stats=1.0e+003*0.00102.28370.00000.0000b=0.13030.3953bint=0.01200.24870.37620.4144r=-0.03230.01650.0056-0.0294-0.00410.06220.0950-0.14800.0785-0.0440目前五十二頁\總數(shù)一百零一頁\編于九點(diǎn)從b的估計(jì)值可以得知常數(shù)項(xiàng)和一次項(xiàng)的系數(shù)分別為0.1303,0.3953。在0.05置信水平下常數(shù)項(xiàng)系數(shù)估計(jì)區(qū)間為[0.01200.2487],X的系數(shù)置信區(qū)間為[0.37620.4144]。由于樣本數(shù)量非常少,參數(shù)估計(jì)并不穩(wěn)定。下圖是殘差及其置信區(qū)間圖。>>rcoplot(r,rint)目前五十三頁\總數(shù)一百零一頁\編于九點(diǎn)(二)多元正態(tài)回歸
在Matlab中mvnrmle函數(shù)可以進(jìn)行多元正態(tài)回歸,假設(shè)Yk為隨機(jī)變量,其分布如下:式中:N(g,g)為多元正態(tài)分布。調(diào)用方式
[Parameters,Covariance,Resid,Info]=mvnrmle(Y,Design,MaxIterations,TolParam,Tol0bj,Covar0)目前五十四頁\總數(shù)一百零一頁\編于九點(diǎn)Parameters參數(shù)Covariance協(xié)方差Resid殘差I(lǐng)nfo估計(jì)過程的相關(guān)系數(shù)Y觀察值矩陣,Yn×k中n是樣本的個(gè)數(shù),k是資產(chǎn)的數(shù)目Design自變量單元變量矩陣,如果Y只有一個(gè)資產(chǎn)時(shí),Design是一個(gè)矩陣,如果Y中的資產(chǎn)個(gè)數(shù)大于一個(gè)時(shí),Design是一個(gè)單元向量,每個(gè)元素都是一個(gè)矩陣。Y的k列和
Design第k個(gè)元素中的矩陣進(jìn)行回歸MaxIterationsTolParamTol0bjCovaro輸出參數(shù)輸入?yún)?shù)目前五十五頁\總數(shù)一百零一頁\編于九點(diǎn)(三)估計(jì)多元正態(tài)分布每個(gè)資產(chǎn)的標(biāo)準(zhǔn)差Data觀察值矩陣,Yn×k中n樣本的個(gè)數(shù),k是資產(chǎn)的數(shù)目Design自變量單元變量矩陣,如果Y只有一個(gè)資產(chǎn)時(shí),Design
是一個(gè)單元向量,如果Y含有多于一個(gè)資產(chǎn)時(shí),Design
是一個(gè)單元變量矩陣Covariance回歸時(shí)的殘值調(diào)用方式
[StdParameters,StdCovariance]=mvnrstd(Data,Design,Covariance)輸入?yún)?shù)StdParameters每個(gè)資產(chǎn)的標(biāo)準(zhǔn)差StdCovariance協(xié)方差輸出參數(shù)目前五十六頁\總數(shù)一百零一頁\編于九點(diǎn)(四)嶺回歸線性回歸中參數(shù)估計(jì),如果觀察值X存在自相關(guān)性,則XTX是奇異矩陣,估計(jì)值就會(huì)出現(xiàn)非常大的誤差,這時(shí)矩陣XTX需要加上一個(gè)對(duì)角元素是常數(shù)k的單位陣,即。Matlab提供了嶺回歸ridge函數(shù)求解該問題。b模型估計(jì)參數(shù)調(diào)用方式
b1=ridge(Y,X,k)b0=ridge(Y,X,k,0)輸入?yún)?shù)Y因變量觀察值X自變量觀察值kk表示控制系數(shù),可以根據(jù)需要進(jìn)行選擇。輸出參數(shù)目前五十七頁\總數(shù)一百零一頁\編于九點(diǎn)k=0:0.01:1;b=ridge(heat,ingredients,k);plot(k,b');xlabel('Ridgeparameter');ylabel('Standardizedcoef.');title('RidgeTraceforHaldData')legend('x1','x2','x3','x4');例2對(duì)
hald文件中的數(shù)據(jù)進(jìn)行嶺回歸。>>load
hald查看工作區(qū)中的變量。>>whoYourvariablesare:haldheatingredients目前五十八頁\總數(shù)一百零一頁\編于九點(diǎn)五、主成分分析主成分分析是在各個(gè)變量之間相關(guān)關(guān)系研究的基礎(chǔ)上,用較少的新變量代替原來較多的變量,而且使這些較少的新變量盡可能多地保留原來較多的變量所反映的信息。(一)主成分分析基本原理首先對(duì)樣本進(jìn)行標(biāo)準(zhǔn)化處理,為簡(jiǎn)單起見,標(biāo)準(zhǔn)化后的樣本仍記為X1,X2,X3,…,Xp
。設(shè)樣本為X1,X2,X3,…,Xp,其對(duì)應(yīng)的樣本均值為對(duì)應(yīng)的標(biāo)準(zhǔn)差為S1
,S2,S3,…,Sp
。目前五十九頁\總數(shù)一百零一頁\編于九點(diǎn)設(shè)F1,F2,F3,…,Fp
是主成分,也即是X1,X2,X3,…,Xp
的線性表示,同時(shí)滿足下面的條件:主成分是原樣本的正交變換。各主成分之間互不相關(guān)。主成分的總方差不變。主成分按方差從大到小排序。主成分具有如下性質(zhì):這一性質(zhì)說明,主成分是原變量的線性組合,是對(duì)原變量信息的一種改良;主成分不增加總信息量,也不減少總信息量。
目前六十頁\總數(shù)一百零一頁\編于九點(diǎn)設(shè)為主成分的特征值,前k個(gè)方差累積貢獻(xiàn)率為一般當(dāng)累積貢獻(xiàn)率大于85%時(shí)不再增加新的主成分。保留多少個(gè)主成分取決于保留部分的累積方差在總方差中占的百分比(即累計(jì)貢獻(xiàn)率),它標(biāo)志著前幾個(gè)主成分概括的信息的多寡。在實(shí)踐中,粗略規(guī)定一個(gè)百分比就可以決定保留幾個(gè)主成分,如果多留一個(gè)主成分,但累積方差增加無幾,便不再多留。目前六十一頁\總數(shù)一百零一頁\編于九點(diǎn)(二)主成分分析函數(shù)COEFF主成分系數(shù)SCORE新坐標(biāo)系latentX的協(xié)方差矩陣的特征值tsquareHotelling統(tǒng)計(jì)量的值在Matlab中提供了兩個(gè)主成分分析函數(shù)princomp和pcacov。
[COEFF,SCORE]=princomp(X)[COEFF,SCORE,latent]=princomp(X)[COEFF,SCORE,latent,tsquare]=princomp(X)輸入?yún)?shù)X觀察變量輸出參數(shù)調(diào)用方式目前六十二頁\總數(shù)一百零一頁\編于九點(diǎn)>>corrcoef(ingredients)ans=1.00000.2286-0.8241-0.24540.22861.0000-0.1392-0.9730-0.8241-0.13921.00000.0295-0.2454-0.97300.02951.0000例3用Matlab自帶數(shù)據(jù)進(jìn)行主成分分析。Matlab中自帶了數(shù)據(jù)文件hald,可以直接調(diào)用進(jìn)行主成分分析。hald數(shù)據(jù)考慮影響溫度的4個(gè)因素,溫度保存在heat變量中,4個(gè)因素的觀察值保存在ingredients中。由于4個(gè)因素之間存在相關(guān)性,無法直接回歸,為解決這個(gè)問題,首先進(jìn)行主成分分析,生成四個(gè)主成分變量,主成分之間互不相關(guān),而且和觀察值的信息是同樣的。第一步:載入數(shù)據(jù),考察變量之間的相關(guān)性。>>loadhald%載入Matlab自帶的數(shù)據(jù)文件考察相關(guān)性目前六十三頁\總數(shù)一百零一頁\編于九點(diǎn)發(fā)現(xiàn)自變量2與變量3之間的高度相關(guān),所以需要剔除相關(guān)性。第二步:主成分分析。>>[pc,score,latent,tsquare]=princomp(ingredients)主成分系數(shù)pc=0.06780.6460-0.56730.50620.67850.02000.54400.4933-0.0290-0.7553-0.40360.5156-0.73090.10850.46840.4844目前六十四頁\總數(shù)一百零一頁\編于九點(diǎn)主成分的方差貢獻(xiàn)率score=-36.82186.87094.59090.3967-29.6073-4.61092.2476-0.395812.98184.2049-0.9022-1.1261-23.71476.6341-1.8547-0.37860.55324.46176.08740.142410.81253.6466-0.9130-0.135032.5882-8.97981.60630.0818-22.6064-10.7259-3.23650.32439.2626-8.98540.0169-0.54373.284014.1573-7.04650.3405-9.2200-12.3861-3.42830.435225.58492.78170.38670.446826.90322.93102.44550.4116目前六十五頁\總數(shù)一百零一頁\編于九點(diǎn)協(xié)方差的特征值latent=517.796967.496412.40540.2372tsquare=5.68033.07586.00022.61983.36810.56683.48183.97942.60867.48184.18302.23272.7216目前六十六頁\總數(shù)一百零一頁\編于九點(diǎn)由此可以得到4個(gè)主成分如下:從特征值可以看出前面兩個(gè)主成分可以很好的解釋98%的方差:(517.7969+67.4964)/(517.7969+67.4964+12.4054+0.2372)=98%目前六十七頁\總數(shù)一百零一頁\編于九點(diǎn)>>covx=cov(ingredients);>>[pc,latent,explain]=pcacov(covx)采用pcacov函數(shù)計(jì)算主成分的結(jié)果同princomp函數(shù)的結(jié)果是一樣的。>>loadhald然后計(jì)算觀察變量ingredients協(xié)方差。>>new=ingredients*pc在確定主成分后對(duì)主成分進(jìn)行回歸。將生成的4個(gè)主成分,保存在變量new中,變量new中的每列就是一個(gè)主成分。
目前六十八頁\總數(shù)一百零一頁\編于九點(diǎn)>>regress(heat,new(:,1:2))ans=2.18431.0894驗(yàn)證主成分之間的相關(guān)性:>>corrcoef(new)ans=1.00000.00000.00000.00000.00001.00000.00000.00000.00000.00001.00000.00000.00000.00000.00001.0000發(fā)現(xiàn)主成分之間是不相關(guān)的。
第三步:用前兩個(gè)主成分進(jìn)行回歸。目前六十九頁\總數(shù)一百零一頁\編于九點(diǎn)
>>2.1843*pc(:,1)+1.0894*pc(:,2)ans=0.85191.5039-0.8862-1.4783這樣溫度和主成分之間的關(guān)系如下:還原成線性回歸形式:這樣溫度和自變量之間的關(guān)系如下:目前七十頁\總數(shù)一百零一頁\編于九點(diǎn)第四步:驗(yàn)證主成分分析優(yōu)點(diǎn)。下面計(jì)算heat和ingredients中各個(gè)分量的相關(guān)系數(shù)。>>corr(heat,ingredients(:,1))ans=0.7307>>corr(heat,ingredients(:,2))ans=0.8163>>corr(heat,ingredients(:,3))ans=-0.5347>>corr(heat,ingredients(:,4))ans=-0.8213目前七十一頁\總數(shù)一百零一頁\編于九點(diǎn)相關(guān)系數(shù)表明前兩個(gè)自變量和因變量之間是正相關(guān),后兩個(gè)自變量和因變量之間負(fù)相關(guān)。式(1)和實(shí)際結(jié)果相印證。從式(2)可以看出自變量和因變量之間都是正相關(guān),顯然和實(shí)際結(jié)果不相印證。自變量和因變量之間的函數(shù)關(guān)系如下:>>c0=regress(heat,ingredients)c0=2.19301.15330.75850.4863如果不用主成分回歸,而是直接對(duì)自變量和因變量進(jìn)行回歸。目前七十二頁\總數(shù)一百零一頁\編于九點(diǎn)六、因子分析因子分析法(factoranalysis)是一種用來分析隱藏在表象背后的因子作用的一類統(tǒng)計(jì)模型和方法,它起源于心理度量學(xué),最初是研究如何使用少數(shù)幾個(gè)變量來解釋眾多原始變量,同時(shí)又盡量避免信息丟失的多元統(tǒng)計(jì)分析方法。在實(shí)際問題的分析過程中,常用因子分析去除重疊信息,將原始的眾多指標(biāo)綜合成較少的幾個(gè)因子變量來分析。1.因子分析法相關(guān)概念設(shè)樣本為
,其對(duì)應(yīng)的樣本均值為
,對(duì)應(yīng)的標(biāo)準(zhǔn)差為。目前七十三頁\總數(shù)一百零一頁\編于九點(diǎn)因子分析的核心問題有兩個(gè),一是確定因子的個(gè)數(shù),二是對(duì)因子變量進(jìn)行命名。首先對(duì)樣本進(jìn)行標(biāo)準(zhǔn)化處理,為簡(jiǎn)單起見,標(biāo)準(zhǔn)化后的樣本仍記為。因子分析的數(shù)學(xué)模型如下:
X=fX+s式中:X是經(jīng)過正交處理的樣本值,f是負(fù)荷矩陣,表示公共因子部分,s是其他特殊因子。要求f,s之間不相關(guān)而且不可觀察。目前七十四頁\總數(shù)一百零一頁\編于九點(diǎn)lambda負(fù)荷矩陣估計(jì)值psi特殊因素矩陣估計(jì)值T因素負(fù)荷旋轉(zhuǎn)矩陣stats假設(shè)檢驗(yàn)FF是n×m維因子的分矩陣2.因子分析函數(shù)調(diào)用方式調(diào)用方式
lambda=factoran(X,m)[lanmba,psi]=factoran(X,m)[lanmba,psi,T]=factoran(X,m)[lanmba,psi,T,stats]=factoran(X,m)[lanmba,psi,T,stats,F]=factoran(X,m)輸入?yún)?shù)X觀察值矩陣,每列屬于同一個(gè)變量m公共因素的個(gè)數(shù)輸出參數(shù)目前七十五頁\總數(shù)一百零一頁\編于九點(diǎn)下面用一個(gè)例子說明例4在Matlab中自帶了10個(gè)公司100周的收益率數(shù)據(jù),10家公司分成3個(gè)行業(yè),4家屬于科技公司,3家屬于金融公司,另外3家屬于零售類公司。一般來講,同一行業(yè)內(nèi)上市公司同質(zhì)性強(qiáng),走勢(shì)也相同,不同行業(yè)內(nèi)之間股票受不同風(fēng)險(xiǎn)因素影響,走勢(shì)差別較大。下面驗(yàn)證該結(jié)論。>>loadstockreturns>>m=3;%考慮3個(gè)行業(yè)的因素>>[LoadingsPM,specificVarPM]=factoran(stocks,m,'rotate','promax')目前七十六頁\總數(shù)一百零一頁\編于九點(diǎn)從上述結(jié)果可以明顯看出第1到第4家公司屬于同一類公司,第5家到第7家屬于同一類公司,第8家到第10家屬于同一類公司,說明不同行業(yè)間的股票收益率存在不同。LoadingsPM=0.94520.1214-0.06170.7064-0.01780.20580.3885-0.09940.09750.4162-0.0148-0.12980.10210.90190.07680.08730.7709-0.0821-0.16160.5320-0.08880.21690.28440.66350.0016-0.18810.7849-0.22890.06360.6475specificVarPM=0.09910.34310.80970.85590.14290.36910.69280.31620.33110.6544目前七十七頁\總數(shù)一百零一頁\編于九點(diǎn)七、方差分析方差分析主要用來檢驗(yàn)兩個(gè)以上樣本的平均值差異的顯著程度,由此判斷樣本究竟是否抽自具有同一均值的總體。(一)單因素方差分析一般地,假定所檢驗(yàn)的結(jié)果受同一因素A的影響,可以取k個(gè)不同的水平1,2,3,…,k。對(duì)于因素的每一個(gè)水平i都進(jìn)行n次試驗(yàn),結(jié)果分別為,一般把這一組樣本記作Xi。假定,即對(duì)于因素的每一個(gè)水平,所得到的結(jié)果都服從正態(tài)分布,且方差相等。在方差分析中,通常把對(duì)實(shí)驗(yàn)結(jié)果發(fā)生影響和起作用的自變量稱為因素。如果分析一個(gè)因素對(duì)于試驗(yàn)結(jié)果的影響和作用,就稱為單因素方差分析。目前七十八頁\總數(shù)一百零一頁\編于九點(diǎn)(二)方差分析步驟方差分析一方面確定因素的不同水平下均值之間的方差,作為所有試驗(yàn)數(shù)據(jù)所組成的全部總體方差的一個(gè)估計(jì)值;另一方面,再考慮同一水平下不同試驗(yàn)數(shù)據(jù)對(duì)于這一水平的均值的方差。由此,計(jì)算出全部數(shù)據(jù)的總體方差的第二個(gè)估計(jì)值;最后,比較上述兩個(gè)估計(jì)值。如果這兩個(gè)方差的估計(jì)值比較接近就說明因素的差異并不大,則接受零假設(shè);否則接受備擇假設(shè)。根據(jù)上述思路可以得到方差分析的方法和步驟。1.提出假設(shè)H0:μ1=μ2=…=μk,即因素的不同水平對(duì)試驗(yàn)結(jié)果無顯著影響。H1:不是所有的μi都相等(i=1,2,…,k),即因素的不同水平對(duì)試驗(yàn)結(jié)果有顯著影響。目前七十九頁\總數(shù)一百零一頁\編于九點(diǎn)2.方差分解下面先定義總離差平方和為各樣本觀察值與總均值的離差平方和。記將總離差平方和分解為兩部分:N=nk為樣本觀察值總數(shù)目前八十頁\總數(shù)一百零一頁\編于九點(diǎn)記表示同一樣本組內(nèi),由于隨機(jī)因素影響所產(chǎn)生的離差平方和,簡(jiǎn)稱組內(nèi)平方和。記表示不同的樣本組之間,由于變異因素的不同水平影響所產(chǎn)生的離差平方和,簡(jiǎn)稱為組間平方和。對(duì)應(yīng)于SST,SSR和SSE的自由度分別為n-1,k-1,n-k。由此可以得到:
SST=SSR+SSE目前八十一頁\總數(shù)一百零一頁\編于九點(diǎn)當(dāng)原假設(shè)H0:μ1=μ2=…=μk成立時(shí),E(MSE)=E(MSR)=σ2。此時(shí)MSR較小,F(xiàn)值也較小。反之H0不成立時(shí),MSR較大,F(xiàn)值也較大。對(duì)于給定的顯著性水平α查F分布表得到F1-α(k-1,n-k)。如果F>F1-α(k-1,n-k),則原假設(shè)不成立,即k個(gè)組的總體均值之間有顯著的差異,就拒絕H0。若F≤F1-α(k-1,n-k),則原假設(shè)成立,即k個(gè)組的總體均值之間沒有顯著的差異,就接受H0。3.F檢驗(yàn)將SSR和SSE分別除以自由度,即得各自的均方差:組間均方差
MSR=SSR/(k-1)組內(nèi)均方差
MSE=SSE/(n-k)檢驗(yàn)統(tǒng)計(jì)量
目前八十二頁\總數(shù)一百零一頁\編于九點(diǎn)由于方差分析表(見下表)概括了方差分析的統(tǒng)計(jì)量之間的關(guān)系,在進(jìn)行方差分析時(shí)就可以直接按照方差分析表來逐行、逐列地計(jì)算出有關(guān)的統(tǒng)計(jì)量,最后得到檢驗(yàn)量F的值,并把這一F值與查表所得到的一定顯著性水平下的F檢驗(yàn)的臨界值進(jìn)行比較,然后作出接受或拒絕原假設(shè)的結(jié)論。4.方差分析表上述方差分析的方法可以用一張標(biāo)準(zhǔn)形式的表格來實(shí)現(xiàn),稱為方差分析表。方差分析表分為五列:第一列表示方差的來源;第二列表示方差的離差的平方和;第三列表示自由度;第四列表示均方差;第五列表示統(tǒng)計(jì)檢驗(yàn)量F。表格又分為三行:第一行是組間的方差SSR和均方差MSR,表示因素的不同水平的影響所產(chǎn)生的方差,其值作為計(jì)算統(tǒng)計(jì)檢驗(yàn)量F時(shí)的分子;第二行是組內(nèi)方差SSE和均方差MSE,表示隨機(jī)誤差所引起的方差,其值作為計(jì)算統(tǒng)計(jì)檢驗(yàn)量F的分母;第三行是檢驗(yàn)行,表示總的方差SST。目前八十三頁\總數(shù)一百零一頁\編于九點(diǎn)單因素方差分析表方差來源離差平方和自由度均方差統(tǒng)計(jì)檢驗(yàn)量F組間差SSRk-1MSRF=MSR/MSE組內(nèi)差SSEn-kMSE總方差SSTn-1(三)單因素方差分析函數(shù)
p=anova1(X)p=anova1(Y,group)p=anova1(Y,group,'displayopt')[p,table]=anova1(Y,group,'displayopt')[p,table,stats]=anova1(Y,group,'displayopt')
單因素方差分析是比較兩組和多組樣本的均值,假設(shè)各組變量之間相互獨(dú)立,方差相等,且服從正態(tài)分布。原假設(shè)是各組均值全部相等。調(diào)用方式目前八十四頁\總數(shù)一百零一頁\編于九點(diǎn)輸入?yún)?shù)X樣本觀察值,
溫馨提示
- 1. 本站所有資源如無特殊說明,都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請(qǐng)下載最新的WinRAR軟件解壓。
- 2. 本站的文檔不包含任何第三方提供的附件圖紙等,如果需要附件,請(qǐng)聯(lián)系上傳者。文件的所有權(quán)益歸上傳用戶所有。
- 3. 本站RAR壓縮包中若帶圖紙,網(wǎng)頁內(nèi)容里面會(huì)有圖紙預(yù)覽,若沒有圖紙預(yù)覽就沒有圖紙。
- 4. 未經(jīng)權(quán)益所有人同意不得將文件中的內(nèi)容挪作商業(yè)或盈利用途。
- 5. 人人文庫(kù)網(wǎng)僅提供信息存儲(chǔ)空間,僅對(duì)用戶上傳內(nèi)容的表現(xiàn)方式做保護(hù)處理,對(duì)用戶上傳分享的文檔內(nèi)容本身不做任何修改或編輯,并不能對(duì)任何下載內(nèi)容負(fù)責(zé)。
- 6. 下載文件中如有侵權(quán)或不適當(dāng)內(nèi)容,請(qǐng)與我們聯(lián)系,我們立即糾正。
- 7. 本站不保證下載資源的準(zhǔn)確性、安全性和完整性, 同時(shí)也不承擔(dān)用戶因使用這些下載資源對(duì)自己和他人造成任何形式的傷害或損失。
最新文檔
- 單板加工過程中的設(shè)備選型與布局考核試卷
- 專選個(gè)體工商戶貸款擔(dān)保協(xié)議樣本版B版
- 2025年度高校與企業(yè)共建文化創(chuàng)意產(chǎn)業(yè)人才培訓(xùn)合同2篇
- 個(gè)人住房房屋買賣合同(2024版)
- 2025年度海淀京張鐵路遺址公園景區(qū)文創(chuàng)產(chǎn)品銷售推廣合同3篇
- 2025年技術(shù)研發(fā)與顧問合同3篇
- 前交叉韌帶重建合并外側(cè)半月板后根部撕裂對(duì)髕股關(guān)節(jié)影響的相關(guān)研究
- 基于BOPPPS模式的高中數(shù)學(xué)交互式微課案例研究
- 建筑企業(yè)全要素生產(chǎn)率測(cè)度與優(yōu)化研究
- 面向智能印廠的生產(chǎn)排程關(guān)鍵技術(shù)研究
- 2024年公務(wù)員考試《公共基礎(chǔ)知識(shí)》全真模擬試題1000題及答案
- DB3301T 0382-2022 公共資源交易開評(píng)標(biāo)數(shù)字見證服務(wù)規(guī)范
- 幼兒教育專業(yè)國(guó)家技能人才培養(yǎng)工學(xué)一體化課程設(shè)置方案
- 2025年會(huì)計(jì)從業(yè)資格考試電算化考試題庫(kù)及答案(共480題)
- 江蘇省無錫市2023-2024學(xué)年八年級(jí)上學(xué)期期末數(shù)學(xué)試題(原卷版)
- DL-T 5876-2024 水工瀝青混凝土應(yīng)用酸性骨料技術(shù)規(guī)范
- GB/T 44889-2024機(jī)關(guān)運(yùn)行成本統(tǒng)計(jì)指南
- 2024年6月英語六級(jí)考試真題及答案(第2套)
- 職業(yè)院校技能大賽(高職組)市政管線(道)數(shù)字化施工賽項(xiàng)考試題庫(kù)(含答案)
- 危險(xiǎn)化學(xué)品目錄(2024版)
- 華為經(jīng)營(yíng)管理-華為的股權(quán)激勵(lì)(6版)
評(píng)論
0/150
提交評(píng)論